pandas简单使用

目錄

第一節 Series和DataFrame的排序
- 1.1 Series排序
- 1.2 DataFrame排序
第二節重命名DataFrame的index
- 2.1 csv文件的使用
- 2.2 重命名
第三節 DataFrame的merge操作

第一節 Series和DataFrame的排序

1.1 Series排序

Series由兩部分組成 values 和 index

s1 = Series(np.random.randn(10))
// 根據values值從小到大排序
s2 = s1.sort_values()
// 降序排序
s2 = s1.sort_values(ascending  = False)
s2.sort_index()

1.2 DataFrame排序

df1 = DataFrame(np.random.randn(40).reshape(8,5), columns = ['A', 'B', 'C', 'D', 'E'])
// 按A的值進行排序
df1.sort_values('A')
df1.sort_index()

第二節重命名DataFrame的index

2.1 csv文件的使用

// 生成一個測試用的csv文件
df2 = DataFrame(np.random.randn(20).reshape(5, 4), columns = ['BJ', 'SH', 'GZ','XT'])
df2.to_csv('test.csv')
// 處理並保存
csv_input = './test.csv'
pd.read_csv(csv_input).head()[["BJ", "SH", "GZ"]].sort_values('SH', ascending = False).to_csv('test2.csv')

2.2 重命名

df2 = DataFrame(np.arange(20).reshape(5, 4), index = ['A', 'B', 'C', 'D', 'E'], columns = ['BJ', 'SH', 'GZ','XT'])
// 批量講index 和 columns 改成小寫
df2.rename(index = str.lower, columns = str.lower)
// 通過字典進行改名
df2.rename(index = {'a' : 'AA'}, columns = {'bj' : 'beijing'})

第三節 DataFrame的merge操作

df1 = DataFrame({'key' : ['X', 'Y', 'Z'], 'DataSet_1' : [1, 2, 3]})
df2 = DataFrame({'key' : ['X', 'B', 'C'], 'DataSet_2' : [4, 5, 6]})
pd.merge(df1, df2)

版权声明：本文为jingtaohuang原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/jingtaohuang/article/details/107375334