ぶらりずむ

すきなものだけをあつめました

Pandasの基本統計量

基本統計量はdescribe関数を利用する

import pandas as pd
data = pd.read_csv("CSVファイル")
data.describe()
#出力結果
# 項目名 意味
1 count その項目の件数
2 mean 平均値
3 std 標準偏差(Standarddivision)
4 min 最小値
5 25% 別途
6 50% 中央値
7 75% 別途
8 max 最大値

標準偏差:ばらつきの大きさを表す数値
中央値:ど真ん中にある値


参考サイト
https://atarimae.biz/archives/5379

データ型はinfo関数で見られる

data.info()