Pandasの基本統計量
基本統計量はdescribe関数を利用する
import pandas as pd data = pd.read_csv("CSVファイル") data.describe() #出力結果
# | 項目名 | 意味 |
---|---|---|
1 | count | その項目の件数 |
2 | mean | 平均値 |
3 | std | 標準偏差(Standarddivision) |
4 | min | 最小値 |
5 | 25% | 別途 |
6 | 50% | 中央値 |
7 | 75% | 別途 |
8 | max | 最大値 |
標準偏差:ばらつきの大きさを表す数値
中央値:ど真ん中にある値
参考サイト
https://atarimae.biz/archives/5379
データ型はinfo関数で見られる
data.info()