ある列の各要素が真偽値で条件に合うか調べる
1 2 |
変数.列インデックス 【比較演算子】 比較対象 例) df.kokugo > df.kokugo.mean() |
dfはデータを格納した変数
kokugoはdf内のkokugoというインデックス名がつけられた列
kokugoの列内の各要素が、その平均より高いかを調べます。
例
1 2 3 |
import pandas as pd df = pd.read_csv('ファイルパス/成績のデータ.csv') df |
データの中身を確認すると166行、9列のデータであることがわかります。
9科目あるテストを166人が受験し、それぞれの点数が格納されています。
実行結果
続けてこちらを実行します。
1 |
df.kokugo>df.kokugo.mean() |
先ほどのデータの内、国語の列だけに絞って平均点より高いかを真偽値で確認します。
実行結果
平均点より高い要素(各受験者)はTrueで、平均点より低い要素はFalseで表示されています。
今回は国語と平均で行いましたが、条件を変えて真偽値を確認することができます。
まとめ
今回はPandasである列の各要素が条件に合うか真偽値で確認する方法についてまとめました。
次の記事:DataFrame内のある列で特定の条件に合うデータだけを抽出・フィルタする
前の記事:describe()で平均、最大、最小、中央値など基本統計量を調べる
他にもPythonの関する記事をまとめています。
参考
Pandas公式
pandas – Python Data Analysis Library (pydata.org)
参考書籍
コメント