Pandasの使い方についてです。
今回は読み込んだデータの詳細情報や欠損値の有無を調べる方法を確認します。
コード:変数.info()で各列の欠損値の有無を調べる
1 2 3 4 |
import pandas as pd df = pd.read_csv('ファイル名') df.info() #データの詳細、各列の欠損値の有無を調べる |
実行結果
右端Dtypeとありますが、これは各列のデータ型です。
その一つ左隣りにnon-nullと書いていますが、これは各列の欠損値の有無を表しています。
13344とあるのは各列のデータの個数です。今回使用したデータは13344行、32列のデータなので、各列とも欠損値はなく、すべての行にデータが入力されています。
まとめ
今回はデータの詳細と、欠損値の有無を調べる方法を確認しました。
次の記事:指定した列のデータを全て取得する
前の記事:読み込んだデータの各列のデータ型を調べる
体型的に学習するのであれば書籍が効率的です。
Pandasの基本的な使い方を辞書的に調べることができます。
業務でのデータ分析など、実践的なPandasの使い方まではこの本ではかばーしていないため、別途調べる必要があります。
しかし、実務で活用するための基礎的な内容がまとめられているので、遅かれ早かれ必要になります。どのようなコマンドがあるかをざっと目を通しておくだけでも良いので確認すると役に立つと考えます。
コメント