R语言基础笔记1——关于数据处理的一些

2024年2月16日 118次阅读来源: SolomonTeng

双11买的米家电火锅到了，今天和老婆在家吃了火锅，吼吼吼！~排骨、羔羊肉、鱼丸、蟹足棒、老油条、生菜、土豆、豆腐还有各种菌菇，超级满足。

吃完当然要继续学习R语言了，因为最近的数据挖掘中，深感自己的基础太差，很多时候一行代码要查很多package的help文档，非常不流畅，所以要一边做生信挖掘，一边给自己的R语言补课（linux表示不服）。下面就一边学习，一遍罗列一些我之前搞不灵清的函数和package吧。

1.seq()函数

> seq(2,10)
[1]  2  3  4  5  6  7  8  9 10
#产生从2到10的向量，注意中间是‘，’而不是‘：’！

> seq(5,65,by=2)
 [1]  5  7  9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65
#以公差为2，去递增产生向量

> seq(5,65,length = 10)
 [1]  5.00000 11.66667 18.33333 25.00000 31.66667 38.33333 45.00000 51.66667 58.33333 65.00000
#从5到65递增，一共存在10个向量，公差函数自己帮忙算

体会：seq()很方便可以按照自己的方式取出想要的向量，比如取单双的时候，可以使用。

2.which()函数

> a <- c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> which.max(a) #变量a中最大的向量所处的位置
[1] 11
> which.min(a) #变量a中最小的向量所处的位置
[1] 6
> which(a==2) #变量a中，等于2的向量所处的位置
[1] 1 4 9
> a[which(a==2)] #将“变量a中等于2的向量所处的位置”上面的向量列出
[1] 2 2 2
> which(a>5) #变量a中大于5的向量所处的位置
[1]  7 11 13
> a[which(a>5)] #将“变量a中大于5的向量所处的位置”上面的向量列出
[1] 6 8 7

体会：which()函数可以明确变量中，具体条件的向量所处的位置。

3.rev()函数，sort()函数

> a=1:20
> a
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14
[15] 15 16 17 18 19 20
> rev(a)  #将变量a逆向排序
 [1] 20 19 18 17 16 15 14 13 12 11 10  9  8  7
[15]  6  5  4  3  2  1

> a=c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> sort(a)  #将变量a从小到大排序
 [1] 1 2 2 2 3 3 3 4 5 5 5 6 7 8
> rev(sort(a))  #将变量a从大到小排序
 [1] 8 7 6 5 5 5 4 3 3 3 2 2 2 1

> a=c(2,3,4,2,5,1,6,3,2,5,8,5,7,3)
> rev(a)  #单纯逆向排列，并不排序
 [1] 3 7 5 8 5 2 3 6 1 5 2 4 3 2

体会：rev()函数简单说就是把数据集中的排列反过来；sort()函数简单说就是从小到大将数据集中的向量重新排序。

4.matrix()函数

> a1=c(1:12)
> matrix(a1,nrow = 3,ncol = 4)
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> matrix(a1,nrow = 4,ncol = 3,byrow = T)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12

体会：matrix()函数，默认是按照列，依次排列的，如果需要按照行，依次排列，就需要“byrow = T”。

5.t()函数，矩阵加减

> a=matrix(1:12,nrow = 3,ncol = 4)
> a
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> t(a)
     [,1] [,2] [,3]
[1,]    1    2    3
[2,]    4    5    6
[3,]    7    8    9
[4,]   10   11   12
> a=b=matrix(1:12,nrow = 3,ncol = 4)
> a+b
     [,1] [,2] [,3] [,4]
[1,]    2    8   14   20
[2,]    4   10   16   22
[3,]    6   12   18   24
> a-b
     [,1] [,2] [,3] [,4]
[1,]    0    0    0    0
[2,]    0    0    0    0
[3,]    0    0    0    0

体会：t()函数，行和列互换。

6.diag()函数

> a=matrix(1:16,nrow = 4,ncol = 4)
> a
     [,1] [,2] [,3] [,4]
[1,]    1    5    9   13
[2,]    2    6   10   14
[3,]    3    7   11   15
[4,]    4    8   12   16
> diag(a)
[1]  1  6 11 16
> diag(diag(a))
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    6    0    0
[3,]    0    0   11    0
[4,]    0    0    0   16
> diag(4)
     [,1] [,2] [,3] [,4]
[1,]    1    0    0    0
[2,]    0    1    0    0
[3,]    0    0    1    0
[4,]    0    0    0    1

体会：从来没用过diag()函数，大概就是方阵（行和列相等的矩阵）取对角线的数据，或者列出方阵的对角线数据。

7.向量转化为数组，dim()函数

> x=c(1:6)
> x
[1] 1 2 3 4 5 6
> is.vector(x)
[1] TRUE
> is.array(x)
[1] FALSE
> dim(x) <- c(2,3)
> x
     [,1] [,2] [,3]
[1,]    1    3    5
[2,]    2    4    6
> is.array(x)
[1] TRUE
> is.matrix(x)
[1] TRUE
> dim(x)
[1] 2 3

体会：dim()函数，可以直接看矩阵的行数和列数，也可以给予向量纵深，使其具有行和列，从而变成数组和矩阵。

好吧，今天先策到这里，明天继续，影像科~~~~~

    原文作者：SolomonTeng
    原文地址: https://www.jianshu.com/p/c17da472308b
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。