Git 上Pandas学习教程,共有十章、4个板块:Pandas基础、四类操作、四类数据、例子。原文内容系统的讲解了Pandas库的使用方法,编排逻辑易懂,覆盖面广且含有相应练习,之前已经学习过pandas,但是感觉应用时有些费力,计划重新按照学习教程再梳理一遍,争取10天完成学习,ENJOY TIME.
https://github.com/datawhalechina/joyful-pandasgithub.comimport pandas as pd
import numpy as np
代码如下:
1.pandas基础.ipynb
119K
·百度网盘
- Series和DataFrame有哪些常见属性和方法?
Series 常用 values、index、name、dtype DataFrame 常用values、index、columns、dtype、shape、mean
2. value_counts会统计缺失值吗?
value_counts 返回元素和元素数量,不统计缺失值
3. 如果有多个索引同时取到最大值,idxmax会返回所有这些索引吗?如果不会,那么怎么返回这些索引?
不会,只会返回其中的最小索引值
4. 在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。
df.sum () 求和 (axis=0 按列计算,axis=1 按行计算,默认axis=0) df.mean() 平均值 df.median () 中位数 df.mad() 根据平均值计算平均绝对偏差 df.min() 最小值 df.max() 最大值 df.abs() 绝对值 df.std() 标准差 df.var() 方差 df.quantile () 计算分位数 df.cummax() 返回轴上的累积最大值 df.cumsum () 返回DataFrame轴上的累积和 df.cumprod() 返回DataFrame轴上的累积乘积
5. df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?问题四提到的函数也有axis参数吗?怎么使用?
对数据行求平均数,df.mean()默认axis=0,对数据列求平均数 axis=0对列操作,axis=1对行操作, 默认axis=0
6. 对值进行排序后,相同的值次序由什么决定?
相同的值,按索引小→大排序
7. Pandas中为各类基础运算也定义了函数,比如s1.add(s2)表示两个Series相加,但既然已经有了'+',是不是多此一举?
add不仅可以相加而且可以设置相关参数
版权声明:本文为weixin_42554162原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。