sas7bdat.py
此模块将使用纯Python(2.6+,3+)读取sas7bdat文件没有SAS软件
必修的!该模块最初作为同名r脚本的端口启动
在这里找到:https://github.com/BioStatMatt/sas7bdat但此后
完全重写
这个库中还包括一个简单的命令行脚本,
sas7bdat_to_csv,它将sas7bdat文件转换为csv文件它也会
使用--header选项打印头信息和元数据
也将批量转换文件有关详细信息,请使用--help选项
就目前而言,我已经成功地测试了脚本将近300个示例文件
在网上找到。在很大程度上,它工作得很好我们现在可以阅读了
压缩文件!
我相信还有更多的问题我还没有遇到。请让我
如果遇到不受支持的数据文件,我会查看是否可以
添加对文件的支持
用法
要安装,请运行:pip install sas7bdat
要创建sas7bdat对象,只需向构造函数传递一个文件路径。这个
对象是iterable,因此您可以读取如下内容:#!python
from sas7bdat import SAS7BDAT
with SAS7BDAT('foo.sas7bdat', skip_header=True) as reader:
for row in reader:
print row
每一行都是string,float,datetime.date类型的值列表,
datetime.datetime,或datetime.time。没有skip_header,第一行
返回的将是SAS变量名。
如果要获取pandas数据帧,请使用to_data_frame方法:#!python
df = reader.to_data_frame()
Variable
attributes
可从reader.columns获得这些列的顺序将相同
作为每个row中的对应值。每个Column都有以下内容
属性:col_id(int)-列号
name(bytes)
label(bytes)
format(str)
type(str)
length(int)
欢迎加入QQ群-->: 979659372
推荐PyPI第三方库