日々精進

新しく学んだことを書き留めていきます

DataFrameの列の文字列から一部を切り出して別の列を作る

pandas.Series.extract を使う。例えば、Titanicで名前から敬称を抽出して別の列にするコードは以下。

train["Title"] = train["Name"].str.extract("([^\s]+)\.", expand=False).astype("category")

参考:

note.nkmk.me