pandas dataframeのデータ量減らす関数2020.07.11 05:05備忘録pandas dataframeのデータ量を減らしたい時は、以下のkaggle_notebookの関数を使えば良い。load data (reduce memory usage)
M-5 Forecasting2020.07.03 03:10内容:アメリカ3州のウォルマート店舗の商品販売数の予測方針:8日間しかないので、以下の方針で進める目標:時系列データの分析方法、モデリング方法の学習時間配分:データ分析:3日間前処理、モデリング:5日間(※時間がないので、パラメータチューニングはあまり行わない)結果:Public...
House Prices: Advanced Regression Techniques2020.06.19 13:24内容:中古住宅価格の回帰分析目標:上位2割に入るまで以下の、各Versionは、notebookのバージョン(Ver1が一番古い)Ver5で、目標を達成したので、新しい案が出るまで一旦終了Ver5パブリックスコア:0.11915notebookリンク前回までの反省:外れ値処理:デ...
kaggle - Titanic2020.05.15 14:27■Titanicで作成したnotebook一覧notebook:新規特徴量作成実験_notebook飽きてきたので、グラフを眺めて思いつくままに変数を組み合わせて新しい特徴量を作成し、効果を検証モデルに利用する特徴量は、Wrapper Methodで一番訓練スコアが高い特徴量の組...
titanic - kaggle2020.03.24 21:30- Ver.2 -- Ver.1 -▶︎ 内容 特徴量の抽出は以下の方針で行った。 ・Cabin以外の全ての変数に対して、カテゴリ毎の生存率を求めて、その値をそのまま特徴量として利用した。 ・Age,Fareの数値データは、ビン分けして、ビンごとの生存率...