状況は以下。
df = df.query("store_id == 'CA_1') # store_id はCA_1, CA_2などがある df.groupby('CA_1').sum() #=> dfにはCA_1しかないのにCA_2の集計結果の行もできてしまう
以下のようにobserved=Trueオプションを指定すると直る。この挙動をデフォルトにすべきでしょ。。
df.groupby('CA_1', observed=True).sum()
状況は以下。
df = df.query("store_id == 'CA_1') # store_id はCA_1, CA_2などがある df.groupby('CA_1').sum() #=> dfにはCA_1しかないのにCA_2の集計結果の行もできてしまう
以下のようにobserved=Trueオプションを指定すると直る。この挙動をデフォルトにすべきでしょ。。
df.groupby('CA_1', observed=True).sum()