Pandasの使い方についてです。
複数の列を指定してグループ化して平均を取る方法を確認します。
複数の列を指定してグループ化して平均を取る
1 |
df.groupby(['列名1','列名2'])[['列名3','列名4)']] .mean() |
列名1内の列名2のデータ毎に列名3と列名4の平均値を取ることができます。
例
こちらで取得できるデータを使います。
電力の日々の取引情報を掲載しているのですが、年月日と30分毎の時間帯によって決められた時刻コードのデータが含まれます。
1日の内の時刻コード事に約定総量とシステムプライスの平均を取ってみます。
1 2 3 4 |
import pandas as pd df = pd.read_csv('ファイル名') group=df.groupby(['年月日','時刻コード'])[['約定総量(kWh)','システムプライス(円/kWh)']] group.mean() |
実行結果
1日の内の時刻コード事に約定総量とシステムプライスの平均を取ることができました。
まとめ
次の記事:reset_indexで新しく0からインデックスをつける
参考
書籍
コメント