pandas

pandas

Pandas チートシート・基本操作まとめ

Pandasの基本的な使い方をこの記事でまとめています。 PandasはExcelの操作から機械学習まで、応用の範囲はかなり広いです。 多くの使い方があるため覚えるのは大変ですが、使いこなすことができれば非常に役に立つ武器になり...
pandas

Pandas 欠損値の扱い

データフレーム内に欠損値がある場合、削除するか別の値で穴埋めするかどちらかを行うことが多いです。 今回は欠損値がある場合の扱いについてまとめました。 欠損値の確認 変数xの値が欠損値(NaN)であるかを確認する。 Tru...
pandas

【Pandas】DataFrame内のある列で特定の条件に合うデータだけを抽出・フィルタする

ある列で特定の条件に合うデータだけを抽出・フィルタする 例 import pandas as pd df = pd.read_csv('/content/drive/MyDrive/データ/統計化学研究所_サンプルデ...
pandas

【Pandas】ある列の各要素が特定の条件に合うか真偽値で確認する

ある列の各要素が真偽値で条件に合うか調べる dfはデータを格納した変数 kokugoはdf内のkokugoというインデックス名がつけられた列 kokugoの列内の各要素が、その平均より高いかを調べます。 例 データ...
pandas

【Pandas】describe()で平均、最大、最小、中央値など基本統計量を調べる

基本統計量を調べる 例 サンプルデータとして、統計化学研究所に掲載されている「成績のデータ」を使用しています。 実行結果 各項目の意味 count 個数 mean 平均 std 標準偏差 min...
pandas

【Python】PandasのCorr関数で相関を見つける

Corr関数で相関を見つける 例 各列と各行について、相関係数を確認することができます。 機械学習などの手法を用いてデータ分析をする際、データへの理解を深めるために行う探索的データ分析で用いられることがあります...
pandas

【Pandas】Seriesの最小値を求める

Seriesは1列のデータです。Seriesが集まることでDataFrameを構成します。 複数のデータを持つSeriesについて、最小値を求める方法を確認します。 Seriesの最小値を求める 例 実行結果 ...
pandas

【Pandas】順序をつけてDataFrameを作成する

順序をつけてDataFrameを作成する DataFrameは辞書型で作成するのが一般的です。 Pythonにおける辞書は{,,}と並びます。 インデックスにしたい値をindexに代入し、それ以外のキーをcolumns...
pandas

【Pandas】DataFrameを作成する

PandasにはDataFrameと呼ばれる、行と列からなるデータ構造があります。 Excelでも行と列からなるデータを扱いますが、同じものをイメージするとわかりやすいです。 今回はDataFrameを作成する方法を確認します。...
pandas

【Pandas】Seriesにインデックスを代入する

Seriesにインデックスを代入する 例 32歳男性の山田さんがいるとして、Seriesとしてデータを作成し、インデックスを付けます。 実行結果 左側の列に name , age , sex とありますが、イ...