日々精進

新しく学んだことを書き留めていきます

日付の前処理について

日付(アクセス日時とか登録日とか)が特徴量に含まれている場合、どう前処理すべきか。

  • そのまま使うことは少ない。理由は季節性・曜日の影響などが分からないので。解く問題によって変わるが、以下のようなやり方がある。
  • 年・月・日にそれぞれ分ける。年は周期性が無いので、年単位の変化が重要で無いなら削除する。
  • 曜日列を追加する
  • 12月の次が1月であることがわかるように変換する。例えば、最初の年の12月の翌年の1月は13月のように、起点からの月数の列にする。それか場合によって起点からの日数にする。