博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Pandas库 数据的基本统计分析
阅读量:3958 次
发布时间:2019-05-24

本文共 1781 字,大约阅读时间需要 5 分钟。

类似Numpy库,可见此博文

1.0 适用于Series和DataFrame数据类型

函数名 描述
sum() 求和
mean() 求期望
count() 求非NaN值的个数
std() 求标准差
var() 求方差
max() 最大值
min() 最小值
median() 中位数

2.0 只适用于Series类型

方法名 描述
.argmin() .argmax() 计算数据的最小/大值所在位置的索引位置(自动索引)
.idxmin() .idxmax() 计算数据的最小/大值所在位置的索引位置(自定义索引)

#在Series类型当中用户可以使用自定义索引,而系统也会保存好自动索引

.describe() 针对0轴(各列)的统计汇总

案例代码如下:#注意下标真正对应的列 i=i+1

>>> import pandas as pd>>> a=pd.Series([9,8,5,1],index=['a','b','c','d'])>>> aa    9b    8c    5d    1dtype: int64>>> a.describe()count    4.000000mean     5.750000std      3.593976min      1.00000025%      4.00000050%      6.50000075%      8.250000max      9.000000dtype: float64>>> type(a.describe())
>>> a.describe()['count']4.0>>> a.describe()['max']9.0#以下为DataFrame数据类型>>> import numpy as np>>> b=pd.DataFrame(np.arange(20).reshape(4,5),index=['c','v','b','n'])>>> b 0 1 2 3 4c 0 1 2 3 4v 5 6 7 8 9b 10 11 12 13 14n 15 16 17 18 19>>> b.describe() 0 1 2 3 4count 4.000000 4.000000 4.000000 4.000000 4.000000mean 7.500000 8.500000 9.500000 10.500000 11.500000std 6.454972 6.454972 6.454972 6.454972 6.454972min 0.000000 1.000000 2.000000 3.000000 4.00000025% 3.750000 4.750000 5.750000 6.750000 7.75000050% 7.500000 8.500000 9.500000 10.500000 11.50000075% 11.250000 12.250000 13.250000 14.250000 15.250000max 15.000000 16.000000 17.000000 18.000000 19.000000>>> b.describe().ix['max']0 15.01 16.02 17.03 18.04 19.0Name: max, dtype: float64>>> b.describe()[2] #对地3列进行统计汇总,count 4.000000mean 9.500000std 6.454972min 2.00000025% 5.75000050% 9.50000075% 13.250000max 17.000000Name: 2, dtype: float64

转载地址:http://aamzi.baihongyu.com/

你可能感兴趣的文章
@Produces注解
查看>>
谈谈序列化—实体bean一定要实现Serializable接口?
查看>>
实用小技巧之电脑如何滚动截屏/截取长图
查看>>
Eclipse离线安装Java Decompiler插件
查看>>
Http预请求options
查看>>
未来设计师的工作模式?从室内设计领域的实时设计说起 | Mixlab趋势
查看>>
智能设计 | MixAI 知识库 No.69
查看>>
通过研究微信文章的相关推荐逻辑 ,尝试生成指南| Mixlab设计黑客
查看>>
浏览器低成本实现免手提的用户体验,使用人脸、手势、姿态追踪 | Mix群聊
查看>>
这个世界上肯定有另一个我,做着我不敢做的事,过着我想过的生活 | MixAI 知识库 No.70...
查看>>
表情包数据挖掘 | Mix群聊
查看>>
如何阅读科研论文
查看>>
理解本真的REST架构风格
查看>>
10款免费且开源的项目管理工具
查看>>
java调用javascript :js引擎rhino
查看>>
asp 中常用的文件处理函数
查看>>
ADO中sqlserver存储过程使用
查看>>
Linux KernelTech版FAQ 1.0
查看>>
ntfs分区iis故障的解决
查看>>
个人创业“六大死穴”
查看>>