- 第2章:抽出
- データ列指定による抽出
- 条件指定による抽出
- データに基づかないサンプリング
- 集約IDに基づくサンプリング
- 第3章:集約
- データ数、種類数の算出
- 合計値の算出
- 極値、代表値の算出
- ばらつき具合の算出
- 最頻値の算出
- 順位の算出
- 第4章:結合
- マスタテーブルの結合
- 条件に応じた結合テーブルの切り替え
- 過去データの結合
- 全結合
- 第5章:分割
- 交差検証用のデータ分割
- 第6章:生成
- 不均衡データの是正方法(アンダーサンプリングとオーバーサンプリング)
- 第7章:展開
- 縦持ちへの変換
- スパースマトリックスへの変換
- 第8章:数値型への前処理
- ほとんど型変換なので省略
- 数値型の補完
- 第9章:カテゴリ型への処理
- カテゴリ型への変換
- ダミー変数化
- カテゴリ値の集約
- カテゴリ値の組み合わせ
- カテゴリ型の数値化
- カテゴリ型の補完
- 第10章:日時型の処理1
- 10-1 日時型、日付型への変換
- 10-2 年/月/日/時刻/分/秒/曜日への変換
- 10-3 日時差への変換
- 第10章:日時型の処理2
- 10-4 日時型の増減
- 10-5 季節への変換
- 10-6 時間帯への変換
- 10-7 平日/休日への変換
0コメント