ライブラリ

pandas

Pandas チートシート・基本操作まとめ

グループ化 groupby:グループ化 groupbyを使っただけでは実行しても何も表示されない。 ただし、コメント部分のように平均値などを取って実行すると結果が表示される。 表の結合 pd.concat() df1...
pandas

Pandas 欠損値の扱い

データフレーム内に欠損値がある場合、削除するか別の値で穴埋めするかどちらかを行うことが多いです。 今回は欠損値がある場合の扱いについてまとめました。 欠損値の確認 変数xの値が欠損値(NaN)であるかを確認する。 Tru...
Numpy

【Python】Numpyチートシート・基礎コマンド

Numpyの基礎的なコマンドをまとめました。 Numpyをインポート ベクトルの作成 ベクトルの中身を表示 行列を作成 行列の中身を表示 行列の要素を取得 型を調べる ...
pandas

【Pandas】DataFrame内のある列で特定の条件に合うデータだけを抽出・フィルタする

ある列で特定の条件に合うデータだけを抽出・フィルタする 例 import pandas as pd df = pd.read_csv('/content/drive/MyDrive/データ/統計化学研究所_サンプルデ...
pandas

【Pandas】ある列の各要素が特定の条件に合うか真偽値で確認する

ある列の各要素が真偽値で条件に合うか調べる dfはデータを格納した変数 kokugoはdf内のkokugoというインデックス名がつけられた列 kokugoの列内の各要素が、その平均より高いかを調べます。 例 データ...
pandas

【Pandas】describe()で平均、最大、最小、中央値など基本統計量を調べる

基本統計量を調べる 例 サンプルデータとして、統計化学研究所に掲載されている「成績のデータ」を使用しています。 実行結果 各項目の意味 count 個数 mean 平均 std 標準偏差 min...
pandas

【Python】PandasのCorr関数で相関を見つける

Corr関数で相関を見つける 例 各列と各行について、相関係数を確認することができます。 機械学習などの手法を用いてデータ分析をする際、データへの理解を深めるために行う探索的データ分析で用いられることがあります...
pandas

【Pandas】Seriesの最小値を求める

Seriesは1列のデータです。Seriesが集まることでDataFrameを構成します。 複数のデータを持つSeriesについて、最小値を求める方法を確認します。 Seriesの最小値を求める 例 実行結果 ...
pandas

【Pandas】順序をつけてDataFrameを作成する

順序をつけてDataFrameを作成する DataFrameは辞書型で作成するのが一般的です。 Pythonにおける辞書は{,,}と並びます。 インデックスにしたい値をindexに代入し、それ以外のキーをcolumns...
pandas

【Pandas】DataFrameを作成する

PandasにはDataFrameと呼ばれる、行と列からなるデータ構造があります。 Excelでも行と列からなるデータを扱いますが、同じものをイメージするとわかりやすいです。 今回はDataFrameを作成する方法を確認します。...