R语言基础笔记1——关于数据处理的一些

双11买的米家电火锅到了,今天和老婆在家吃了火锅,吼吼吼!~排骨、羔羊肉、鱼丸、蟹足棒、老油条、生菜、土豆、豆腐还有各种菌菇,超级满足。

吃完当然要继续学习R语言了,因为最近的数据挖掘中,深感自己的基础太差,很多时候一行代码要查很多package的help文档,非常不流畅,所以要一边做生信挖掘,一边给自己的R语言补课(linux表示不服)。下面就一边学习,一遍罗列一些我之前搞不灵清的函数和package吧。

1.seq()函数

> seq(2,10)
[1]  2  3  4  5  6  7  8  9 10
#产生从2到10的向量,注意中间是‘,’而不是‘:’!
> seq(5,65,by=2)
 [1]  5  7  9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65
#以公差为2,去递增产生向量
> seq(5,65,length = 10)
 [1]  5.00000 11.66667 18.33333 25.00000 31.66667 38.33333 45.00000 51.66667 58.33333 65.00000
#从5到65递增,一共存在10个向量,公差函数自己帮忙算

体会:seq()很方便可以按照自己的方式取出想要的向量,比如取单双的时候,可以使用。

2.which()函数

> a <- c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> which.max(a) #变量a中最大的向量所处的位置
[1] 11
> which.min(a) #变量a中最小的向量所处的位置
[1] 6
> which(a==2) #变量a中,等于2的向量所处的位置
[1] 1 4 9
> a[which(a==2)] #将“变量a中等于2的向量所处的位置”上面的向量列出
[1] 2 2 2
> which(a>5) #变量a中大于5的向量所处的位置
[1]  7 11 13
> a[which(a>5)] #将“变量a中大于5的向量所处的位置”上面的向量列出
[1] 6 8 7

体会:which()函数可以明确变量中,具体条件的向量所处的位置。

3.rev()函数,sort()函数

> a=1:20
> a
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14
[15] 15 16 17 18 19 20
> rev(a)  #将变量a逆向排序
 [1] 20 19 18 17 16 15 14 13 12 11 10  9  8  7
[15]  6  5  4  3  2  1
> a=c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> sort(a)  #将变量a从小到大排序
 [1] 1 2 2 2 3 3 3 4 5 5 5 6 7 8
> rev(sort(a))  #将变量a从大到小排序
 [1] 8 7 6 5 5 5 4 3 3 3 2 2 2 1
> a=c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> rev(a)  #单纯逆向排列,并不排序
 [1] 3 7 5 8 5 2 3 6 1 5 2 4 3 2

体会:rev()函数简单说就是把数据集中的排列反过来;sort()函数简单说就是从小到大将数据集中的向量重新排序。

4.matrix()函数

> a1=c(1:12)
> matrix(a1,nrow = 3,ncol = 4)
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> matrix(a1,nrow = 4,ncol = 3,byrow = T)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

体会:matrix()函数,默认是按照列,依次排列的,如果需要按照行,依次排列,就需要“byrow = T”。

5.t()函数,矩阵加减

> a=matrix(1:12,nrow = 3,ncol = 4)
> a
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> t(a)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
> a=b=matrix(1:12,nrow = 3,ncol = 4)
> a+b
     [,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24
> a-b
     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

体会:t()函数,行和列互换。

6.diag()函数

> a=matrix(1:16,nrow = 4,ncol = 4)
> a
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    2    6   10   14
[3,]    3    7   11   15
[4,]    4    8   12   16
> diag(a)
[1]  1  6 11 16
> diag(diag(a))
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    6    0    0
[3,]    0    0   11    0
[4,]    0    0    0   16
> diag(4)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1

体会:从来没用过diag()函数,大概就是方阵(行和列相等的矩阵)取对角线的数据,或者列出方阵的对角线数据。

7.向量转化为数组,dim()函数

> x=c(1:6)
> x
[1] 1 2 3 4 5 6
> is.vector(x)
[1] TRUE
> is.array(x)
[1] FALSE
> dim(x) <- c(2,3)
> x
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> is.array(x)
[1] TRUE
> is.matrix(x)
[1] TRUE
> dim(x)
[1] 2 3

体会:dim()函数,可以直接看矩阵的行数和列数,也可以给予向量纵深,使其具有行和列,从而变成数组和矩阵。

好吧,今天先策到这里,明天继续,影像科~~~~~

    原文作者:SolomonTeng
    原文地址: https://www.jianshu.com/p/c17da472308b
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞