R语言【数据集的导入导出】

2023年1月2日 183次阅读来源: 桜キャンドル淵

一、从键盘输入数据

mydata <- data.frame(age=numeric(0), gender=character(0),
                     weight=numeric(0))
mydata <- edit(mydata)

输入了我们的上述代码之后，我们就进入了一个编辑文本模式，我们可以使用vim的编辑文本的语法命令来编辑我们的数据

《R语言【数据集的导入导出】》

二、函数方法读取

1.读取数据文件

x<-scan(text = "1 2 3")
x

《R语言【数据集的导入导出】》

#输入需要读取的文件路径，并且将读取到的数据作为一个向量存储
w <- scan("/Users/Documents/R/city.txt")
w

《R语言【数据集的导入导出】》

w<-scan("/Users/Documents/R/data/weight.data")
w

《R语言【数据集的导入导出】》

2.从屏幕读取数据

1.scan

从屏幕读取数值型数据，当我们输入完了我们的数据之后，我们连续两下回车，就能够结束输入，生成一个数值型的向量。

x<-scan()
x

《R语言【数据集的导入导出】》

从屏幕读取字符串型数据

y <- scan(what="")

《R语言【数据集的导入导出】》

或者采用下面的方式

2.readline

readline能够支持读取从键盘输入的一行数据，按回车之后就将这一整行数据传入变量中

x=readline()

《R语言【数据集的导入导出】》

3. 读取固定宽度数据文件

第一个参数为我们文件的完整的路径名，宽度为一个向量，w1表示第一个变量的宽度，w2表示第二个变量的宽度，以此类推。
mydata <- read.fwf(“filename”,widths=c(W1,W2,…,Wn))

mydata1 <- read.fwf("/Users/Documents/R/city.txt",widths=c(4))
mydata1

《R语言【数据集的导入导出】》

mydata<-read.fwf("/Users/Documents/R/data/FixWideData.txt",widths=c(10,10,4,-1,4))

《R语言【数据集的导入导出】》

我们同样可以使用指定col.names的方法指定我们索引的名称，其中-1参数是指忽略两个年份之间的空格。（正如我们R语言入门博客中写的，-1表示忽略一列数据）

mydata2<-read.fwf("/Users/Documents/R/data/FixWideData.txt",widths=c(10,10,4,-1,4),col.names=c("Last","First","Born","Died"))

《R语言【数据集的导入导出】》

下面的图像时我们的数据文件，我们发现我们的数据虽然长长短短，但是通过空格进行对齐了，所以我们可以指定文件的宽度来读取到我们的具体的数据

《R语言【数据集的导入导出】》

但是我们发现这样的数据文件会出现如下的报错，这是因为我们在数据文件的最后一行结束的时候没有回车，我们的编译器找不到我们的结尾的标志，只要在文件的结尾加上一个回车，就不会报错了

《R语言【数据集的导入导出】》

三、读取csv文件

#这里将我们的文件路径传入
mydata0<-read.csv("/Users/Documents/R/city.csv")
mydata0

《R语言【数据集的导入导出】》

#当我们指定我们的header为F后，我们原本数据集中的列名就归入了数据中，然后会自动生成一组新的索引，如下图所示
mydata1<-read.csv("/Users/Documents/R/city.csv",header = F)
mydata1

《R语言【数据集的导入导出】》

as.is就是设置是否将字符型转化为因子型变量

mydata2 <- read.csv("/Users/Documents/R/data/TableData.txt", as.is=F)
mydata2

mydata2 <- read.csv("/Users/Documents/R/data/TableData.txt", as.is=T)
mydata2

四、读取表格数据文件

每一行数据是一个观测
在每个观测中，不同的变量由一个分隔符隔开，比如空格，tab，冒号，逗号
每个观测包含的变量数相同。
read.table( ).
mydata <- read.table(file, header= logical_value,sep=”delimiter”, rowname=”name”

mydata0 <- read.table("/Users/Documents/R/data/TableData.txt")

《R语言【数据集的导入导出】》

当然我们也可以指定我们的分隔符

mydata1 <- read.table("/Users/Documents/R/data/CommaData.txt", sep=",")
mydata1

《R语言【数据集的导入导出】》

添加了stringAsFactor=False之后，数据框不会把字符型转换为因子

mydata2 <- read.table("/Users/Documents/R/data/TableData.txt",stringsAsFactor=FALSE)
mydata2

《R语言【数据集的导入导出】》

当我们添加参数header=T以后，我们原来的数据集中的第一行的数据就会变成我们的索引

mydata3 <- read.table("/Users/Documents/R/data/TableData.txt",header=T,stringsAsFactor=F)
mydata3

《R语言【数据集的导入导出】》

五、从网络中读取表格或者CSV数据文件

read.csv()
read.table()
scan()
都可以获取远程服务器的数据
mydata0 <- read.csv(“http://www.example.com/download/data.csv”)
mydata1 <- read.table(“ftp://ftp.example.com/download/data.csv”)

    原文作者：桜キャンドル淵
    原文地址: https://blog.csdn.net/weixin_62684026/article/details/125540600
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。