こんにちは。
Pythonのデータ分析に用いられるライブラリであるPandasを使って遊んでみます。
今回は日本卸電力取引所(JEPX)が公表しているデータを取得し、グラフ化してみます。
使用するデータ
日本卸電力取引所(JEPX)では、スポット市場取引結果として日々の取引情報を掲載しています。
データがとても見やすかったのでこちらを使わせていただくこととしました。
使用する環境
Google Colaboratoryを使用しています。
Pythonのインストールなど面倒な環境構築は不要で、ブラウザ上でそのままPythonでコーディングできてしまいます。最近Google Colaboratoryを知ったので、そのお試しも兼ねています。
Google Driveと連携して使用することができ、今回はJEPXから取得したデータをGoogle Driveに保存し、Google Colaboratoryからマウントしてデータを使用しています。
コーディング
Pandasのインポート
1 |
import pandas as pd |
CSVファイルの読み込み
1 |
spot = pd.read_csv('ファイルパス') |
不要列の削除
1 2 |
spot01=spot.drop(spot.columns[7:16],axis=1) spot01=spot.drop(spot.columns[8:],axis=1) |
エリアプライス北海道(円/kWh)の列のように、地域ごとのエリアプライスが表示されていたのですが、北海道を残してその他の地域は列ごと削除しました。
年月日のデータを取得
1 2 |
day = spot01['年月日'] day |
1列目に表示されている年月日のデータを取得しました。
システムプライスと北海道のエリアプライスを取得
1 2 3 4 |
system_price = spot01['システムプライス(円/kWh)'] area_price_hk = spot01['エリアプライス北海道(円/kWh)'] system_price area_price_hk |
システムプライスとエリアプライス北海道のデータを取得しました。
matplotlibのインストールとインポート
1 2 |
pip install japanize-matplotlib import matplotlib.pyplot as plt |
グラフで表示
1 2 3 |
plt.plot(day,system_price) plt.plot(day,area_price_hk) plt.show() |
システムプライスと北海道でのエリアプライスを日毎にグラフ化してみました。
縦軸が価格で横軸が日付ですが、縦軸は単位がなく、横軸はつぶれてしまっており、しかもラベルがないのでよくわからないグラフになってしまいました。
文字がつぶれていますが、2020年4月1日から2021年1月3日(今日は2日ですが3日までデータがあります)までの期間のグラフです。
グラフを見てみると、直近の価格が上昇していそうだということくらいしかわかりません。
しかも、元のデータを見てみると1日の中で時間帯ごとにコードを割り当てて取引情報を掲載しています。日時のグラフを作ったつもりでしたが、同じ日付のデータも大量に入ってしまっています。
色々と修正点が多いのですが、今回はPythonでデータを取り込んでグラフ化するところまでを目標としていたので、いったんここで終了とします。
まとめ
今回は、PythonのライブラリであるPandasを利用してデータを取り込み、Matplotlibを用いてグラフ化までを行ってみました。
また、Google Colaboratoryと呼ばれるブラウザ上でPythonのコーディングができるサービスを使っています。
今後、様々なデータを取り込んで分析ができるよう目指していきます。
Pythonについて学習した内容はこちらの記事にまとめていきます。
Pandasはこちらの書籍を参考にしています。
コメント