日々精進

新しく学んだことを書き留めていきます

テーブルデータの各カラムの欠損率を表示する

EDAやってて欠損率の高いカラムを除去したい場合などに便利。

null_count = dataset.isnull().sum()
null_rate = null_count / len(dataset)

null_table = pandas.DataFrame({
    'null_couunt': null_count,
    'null_rate': null_rate
})

null_table.sort_values(by='null_rate', ascending=False)

上記は以下より転載。

qiita.com