ある列で特定の条件に合うデータだけを抽出・フィルタする
1 2 3 |
変数[変数['列インデックス名']] 比較演算子 比較対象 例) df[df['kokugo']] > df[df['kokugo'].mean()] 詳細は後述 |
例
import pandas as pd
df = pd.read_csv(‘/content/drive/MyDrive/データ/統計化学研究所_サンプルデータ/成績のデータ.csv’)
df
1 2 3 |
import pandas as pd df = pd.read_csv('ファイルパス/成績のデータ.csv') df[df['kokugo'] > df['kokugo'].mean()] #kokugoの列で国語の平均点以上を抽出 |
データには統計化学研究所の「成績のデータ」を利用しています。
DataFrameの国語の列で、平均点以上の全行を抽出しています。
実行結果
元のデータは166行、9列のデータでしたが、
国語で平均点以上を得点している84の各科目の成績のデータが抽出されました。
まとめ
次の記事:
前の記事:ある列の各要素が特定の条件に合うか真偽値で確認する
他にもPythonの関する記事をまとめています。
参考
Pandas公式
pandas – Python Data Analysis Library (pydata.org)
参考書籍
コメント