参考サイト
- Log Transformations
- A Comprehensive Guide to Data Exploration
- Fundamental Techniques of Feature Engineering for Machine Learning
- Logarithmic Transformation in Linear Regression Models: Why & When
対数変換の効果
- 2変数間の関係の明確化
- 分布の偏りの是正
1. 2変数間の関係の明確化
スケールの大きな違いから、2変数の関係が読み取れない場合があるが、対数変換により関係が明確(線形関係)になる場合がある。
以下のグラフは、動物のボディサイズと脳のサイズの関係を図示したもの。このままでは、ボディサイズと脳のサイズの関係性は読み取れない。
しかし、上記グラフを対数変換すると以下のように動物のボディサイズと脳のサイズに線形関係があることが読み取れる。
また、対数化により線形関係になったことで、線形回帰モデルに適用できるようになる。
2. 分布の偏りの是正
裾が長い分布の偏りを対数変換で是正できる。下図は、左が対数変換前の分布、右が対数変換後の分布。極端な分布の偏りが是正されているのがわかる。
※ 特に、線形回帰分析では、残差が正規分布に則っていることが前提なので、回帰分析を行う時は、従属変数・独立変数ともに対数変換して正規分布に近づくか試したほうが良い。
- 回帰分析の復習は、以下の学習ノート参照
- 正規分布の確認方法は、『QQプロットで正規分布の確認』ページ参照
0コメント