日々精進

新しく学んだことを書き留めていきます

2017-01-29から1日間の記事一覧

pandas.qcutはcutする列の値に重複があると挙動がおかしくなることがある

AI

現象は以下。 TitanicのtrainデータのAgeの欠損値を22.0で埋める pd.qcut(train["Age"], 4, duplicates="drop").value_counts() を実行すると以下のようになり、要素数にかなり偏りができる (0.419, 22.0] 408 (24.0, 35.0] 220 (35.0, 80.0] 217 (22.0, 24.…