前処理用SQL学習(by 『前処理大全』)

  • 第2章:抽出
    • データ列指定による抽出
    • 条件指定による抽出
    • データに基づかないサンプリング
    • 集約IDに基づくサンプリング

  コードリンク


  • 第3章:集約
    • データ数、種類数の算出
    • 合計値の算出
    • 極値、代表値の算出
    • ばらつき具合の算出
    • 最頻値の算出
    • 順位の算出

  ▶ コードリンク


  • 第4章:結合
    • マスタテーブルの結合
    • 条件に応じた結合テーブルの切り替え
    • 過去データの結合
    • 全結合

  ▶ コードリンク


  • 第5章:分割
    • 交差検証用のデータ分割

  ▶ コードリンク


  • 第6章:生成
    • 不均衡データの是正方法(アンダーサンプリングとオーバーサンプリング)

  ▶ コードリンク


  • 第7章:展開
    • 縦持ちへの変換
    • スパースマトリックスへの変換

  ▶ コードリンク


  • 第8章:数値型への前処理
    • ほとんど型変換なので省略
    • 数値型の補完

 ▶ コードリンク


  • 第9章:カテゴリ型への処理
    • カテゴリ型への変換
    • ダミー変数化
    • カテゴリ値の集約
    • カテゴリ値の組み合わせ
    • カテゴリ型の数値化
    • カテゴリ型の補完

 ▶ コードリンク


  • 第10章:日時型の処理1
    • 10-1 日時型、日付型への変換
    • 10-2 年/月/日/時刻/分/秒/曜日への変換
    • 10-3 日時差への変換

 ▶ コードリンク


  • 第10章:日時型の処理2
    • 10-4 日時型の増減
    • 10-5 季節への変換
    • 10-6 時間帯への変換
    • 10-7 平日/休日への変換

 ▶ コードリンク

機械学習Tips保管庫

データ解析、機械学習のための学習内容の保管庫。復習用。

0コメント

  • 1000 / 1000