python读取sas数据集_Python sas7bdat包_程序模块 - PyPI - Python中文网

sas7bdat.py

此模块将使用纯Python(2.6+,3+)读取sas7bdat文件没有SAS软件

必修的!该模块最初作为同名r脚本的端口启动

在这里找到:https://github.com/BioStatMatt/sas7bdat但此后

完全重写

这个库中还包括一个简单的命令行脚本,

sas7bdat_to_csv,它将sas7bdat文件转换为csv文件它也会

使用--header选项打印头信息和元数据

也将批量转换文件有关详细信息,请使用--help选项

就目前而言,我已经成功地测试了脚本将近300个示例文件

在网上找到。在很大程度上,它工作得很好我们现在可以阅读了

压缩文件!

我相信还有更多的问题我还没有遇到。请让我

如果遇到不受支持的数据文件,我会查看是否可以

添加对文件的支持

用法

要安装,请运行:pip install sas7bdat

要创建sas7bdat对象,只需向构造函数传递一个文件路径。这个

对象是iterable,因此您可以读取如下内容:#!python

from sas7bdat import SAS7BDAT

with SAS7BDAT('foo.sas7bdat', skip_header=True) as reader:

for row in reader:

print row

每一行都是string,float,datetime.date类型的值列表,

datetime.datetime,或datetime.time。没有skip_header,第一行

返回的将是SAS变量名。

如果要获取pandas数据帧,请使用to_data_frame方法:#!python

df = reader.to_data_frame()

Variable

attributes

可从reader.columns获得这些列的顺序将相同

作为每个row中的对应值。每个Column都有以下内容

属性:col_id(int)-列号

name(bytes)

label(bytes)

format(str)

type(str)

length(int)

欢迎加入QQ群-->: 979659372

group.png

推荐PyPI第三方库