【R语言学习笔记】一、 数据的读取与保存

1.读取文件

(1) getwd() 返回当前工作目录;
setwd() 更改工作目录
注: R语言中文件路径的分割符号为“/”或“\ \”
例:
getwd()
setwd("E:/DATA")

(2)read.table()
read.table()几个值得注意的参数的缺省值
file 当文件储存在工作目录下时,无需写出路径,写出文件名称即可
header=FALSE
sep=”” 表示分隔符为空格 (.csv文件中的分隔符为“,”所以读取csv文件时应修改该参数的值,或使用read.csv()函数)

另外与此 相似的指令还包括 read.csv和read.delim.

(3)scan()
更灵活 更适合读取大数据量矩阵
scan

scan(file = "", what = double(), nmax = -1, n = -1, sep = "",
     quote = if(identical(sep, "\n")) "" else "'\"", dec =".",skip = 0, nlines = 0, na.strings = "NA",
     flush = FALSE, fill = FALSE, strip.white = FALSE,
     quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,
     comment.char = "", allowEscapes = FALSE,
     fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

主要的几个参数 what 指定读取的数据类型
skip 可以跳过文件的开始不读行数
seq分隔符

(4)读取excel数据
① 利用剪贴板
在Excel中选中所需的数据复制,此时数据就被存放在剪贴板中,再

>data.excel<-read.delim("clipboard")

② RODBC包 通过它可以实现R与Access、Excel、dBASE和SQL Server等多中软件的连接.
其中连接excel 的函数为:
0dbcConnectExcel()和odbcConnectExcel2007()分别读取xls和xlsx后缀的文件
sqlFetch()直接读取Excel中的一个表

library(RODBC)
channel1<-odbcConnectExcel2007("Salary.xlsx")
data2<-sqlFetch(channel1,"sheet1")

③ readxl包
read_excel()函数

library(readxl)
l<-read_excel("E:\\length\\all.xlsx")

(5)读取数据库文件
①RODBC包
odbcDataSources()函数查看可用的数据源
odbcConnect()函数 如odbcConnectAccess()、odbcConnectAccess2007()

odbcConnectAccess2007(access.file,uid="",pwd="",...)

(uid 为用户名 pwd为用户密码)
一系列SQL语句的操作:
sqlFetch() 读取ODBC连接中的一个表到R的数据框中
sqlQuery() 在ODBC连接上执行查询语句 并返回结果
sqlTables() 给出ODBC连接对应的数据库的数据表
sqlCopy() 复制ODBC连接的查询结果到另一个ODBC连接中
sqlDrop() 删除ODBC连接中的一个表
sqlClear() 清空ODBC连接中的指定数据表内容
② RMySQL/DBI包
③RJDBC包 (以后再学)

(6) 读取网页数据
XML包中的readHTMLTable()
(7) 读入R格式的文件(.Rdata)
load()
(8)读SPSS数据 (.sav)
foreign包 read.spss()函数

2.数据保存
(1)cat()函数
(2)write或write.table()函数 保存为.txt文件
(3)save(data,file) 保存R格式文件


版权声明:本文为sinat_37500899原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。