Pandasの使い方を確認します。
今回は複数行・複数行のデータの取得方法についてです。
複数行列の取得
複数の行と列を取得
複数の行と列を指定してそのデータを取得します。
この方法では指定した複数の行や列は離れていても問題ありません。
ただし、この方法では指定した範囲内の行と列のデータを取ることができません。
1 2 3 4 |
import pandas as pd df = pd.read_csv('ファイル名') df.loc[[0,4],['年月日','時刻コード']] #行名、列名を指定 #df.iloc[[0,4],[0,1]] 行列番号を指定 |
実行結果
指定範囲の行・指定範囲の列をまとめて取得
Excelで言う範囲選択のように、例えば1行目~10行目かつ1列目~5列目までの範囲にあるデータをまとめて取得したいときはこちらです。
1 2 |
df.loc[1:10,'時刻コード':'システムプライス(円/kWh)'] 行と列をインデックスで指定 #df.iloc[1:10,1:5] 行と列を数字で指定 |
実行結果
まとめ
今回は複数行・複数列のデータをまとめて取得する方法を確認しました。
次の記事:groupbyでデータをまとめる
前の記事:行列を指定して特定のデータを取得
Pandasについての公式なWebページです。
こちらは全て英語なので、日本語で体型的に学習するのであれば書籍が効率的です。
Pandasの基本的な使い方を辞書的に調べることができます。
業務でのデータ分析など、実践的なPandasの使い方まではこの本ではかばーしていないため、別途調べる必要があります。
しかし、実務で活用するための基礎的な内容がまとめられているので、遅かれ早かれ必要になります。どのようなコマンドがあるかをざっと目を通しておくだけでも良いので確認すると役に立つと考えます。
コメント