pandas读取数据,得到Series,DataFrame,以及从这2种数据结构中获取数据的方法

#1.三种创建series的方法
import pandas as pd
import numpy as np
#1).仅有数据列表
s1=pd.Series([1,“A”,5.2,70])#中括号不能少
print(s1)
print(s1.index)#结果为:RangeIndex(start=0, stop=4, step=1);获取索引
print(s1.values)#结果为:[1 ‘A’ 5.2 70];获取数据

#2).创建具有标签索引
s2=pd.Series([1,“A”,5.2,70],index=[‘a’,‘d’,‘c’,‘b’])
print(s2)

#3).使用python字典创建
data={“A”:1,“D”:‘A’,“B”:5.2,“C”:70}
s3=pd.Series(data)
print(s3)

#2.DataFrame:表格型数据结构。每列可以是不同的值类型(字符串,布尔,数值等);既有行索引index,也有列索引columns;
#可看做由Series组成的字典。
#创建DataFrame的2种方法
#1.依据字典得到
data={‘Country’:[‘China’,‘China’,‘China’,‘USA’,‘USA’,‘Japan’],
‘Policy Key word’:[‘first case’,‘research, source tracing’,‘deregulation, economic incentives’,‘travel warning’,‘testing planned’,‘international travel ban’],
‘Cases’:[1,254,1456,23,47,8]}#[]后的","不能少
df=pd.DataFrame(data)
print(df)
print(df.dtypes) #每一列的数据类型
print(df.columns)#结果为:Index([‘Country’, ‘Policy Key word’, ‘Cases’], dtype=‘object’)
print(df.index) #结果为:RangeIndex(start=0, stop=6, step=1)

#从DataFrame中得到Series。查询一列,结果是一个Series,查询多列,结果是一个DataFrame(这是查询列的方法)
print(df[“Country”])#一定要用[]
print(df[[“Country”,“Cases”]])#[]数目要注意,要2组

#查询行的方法
print(df.loc[2])#查询第二行,只查询一行,就是一个Series
print(df.loc[0:5]) #查询第0行到第5行,结果是一个DataFrame


版权声明:本文为Kongjiangezi原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。