日付(アクセス日時とか登録日とか)が特徴量に含まれている場合、どう前処理すべきか。
- そのまま使うことは少ない。理由は季節性・曜日の影響などが分からないので。解く問題によって変わるが、以下のようなやり方がある。
- 年・月・日にそれぞれ分ける。年は周期性が無いので、年単位の変化が重要で無いなら削除する。
- 曜日列を追加する
- 12月の次が1月であることがわかるように変換する。例えば、最初の年の12月の翌年の1月は13月のように、起点からの月数の列にする。それか場合によって起点からの日数にする。
日付(アクセス日時とか登録日とか)が特徴量に含まれている場合、どう前処理すべきか。