python读取sas数据集_Python sas7bdat包_程序模块 - PyPI - Python中文网

sas7bdat.py

此模块将使用纯Python（2.6+，3+）读取sas7bdat文件没有SAS软件

必修的！该模块最初作为同名r脚本的端口启动

在这里找到：https://github.com/BioStatMatt/sas7bdat但此后

完全重写

这个库中还包括一个简单的命令行脚本，

sas7bdat_to_csv，它将sas7bdat文件转换为csv文件它也会

使用--header选项打印头信息和元数据

也将批量转换文件有关详细信息，请使用--help选项

就目前而言，我已经成功地测试了脚本将近300个示例文件

在网上找到。在很大程度上，它工作得很好我们现在可以阅读了

压缩文件！

我相信还有更多的问题我还没有遇到。请让我

如果遇到不受支持的数据文件，我会查看是否可以

添加对文件的支持

用法

要安装，请运行：pip install sas7bdat

要创建sas7bdat对象，只需向构造函数传递一个文件路径。这个

对象是iterable，因此您可以读取如下内容：#!python

from sas7bdat import SAS7BDAT

with SAS7BDAT('foo.sas7bdat', skip_header=True) as reader:

for row in reader:

print row

每一行都是string，float，datetime.date类型的值列表，

datetime.datetime，或datetime.time。没有skip_header，第一行

返回的将是SAS变量名。

如果要获取pandas数据帧，请使用to_data_frame方法：#!python

df = reader.to_data_frame()

Variable

attributes

可从reader.columns获得这些列的顺序将相同

作为每个row中的对应值。每个Column都有以下内容

属性：col_id（int）-列号

name（bytes）

label（bytes）

format（str）

type（str）

length（int）

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库