日々精進

新しく学んだことを書き留めていきます

2017-01-13から1日間の記事一覧

DataFrameの列の文字列から一部を切り出して別の列を作る

AI

pandas.Series.extract を使う。例えば、Titanicで名前から敬称を抽出して別の列にするコードは以下。 train["Title"] = train["Name"].str.extract("([^\s]+)\.", expand=False).astype("category") 参考: note.nkmk.me