5. Q语言学习之路—字典

1. 字典基础

1. 定义
字典是key-values pairs, 但是在q中,字典是按照list来存储的。字典的创建使用操作符!,读作bang :) 所有的字典类型都是99h

q)10 20 30!1.1 2.2 3.3
10| 1.1
20| 2.2
30| 3.3

q)`a`b`c!100 200 300
a| 100
b| 200
c| 300

可以使用操作符key, value, count来分别获取字典的键、值和个数。

尽管q语言不强制键的唯一性(historical mistake),但是却对每个输入值都提供唯一的输出,只有第一次出现的key会被看到。

当你知道字典的键是unique的时候,可以使用命令`u#将字典转换为哈希表,这样与原来的线性搜索相比,会提高查找的速度。

q)(`u#`a`b`c)!10 20 30

注意:与传统语言不一样,不同顺序的字典在q中是不等的。

q)(`a`b`c!10 20 30)~`a`c`b!10 30 20
0b

2. 空和单例字典

空字典:

()!()

带类型的空字典:

`symbol$()!`float$()

单例字典,必须要使用enlist形式先生成一个list,否则会报错

q)(enlist `x)!enlist 42
x| 42

3. 查找
使用中括号或者并列的形式:

q)d:`a`b`c!10 20 30
q)d[`a]
10
q)d `b
20

当查找值不在字典的键表中时,返回值列表中初始值类型的Null值:

q)d[`x]
0N

4. 逆向查找 使用?
与列表类似,?返回在字典中对应的

q)d:`a`b`c`a!10 20 30 10
q)d?10
`a

当查找的值不在字典的值列表中时,返回键列表中初始值类型的Null值:

q)d:`a`b`c`a!10 20 30 10
q)d?40
`

5. 字典和列表
可以通过字典来表示一个稀疏列表:

q)d1:0 100 500000!10 20 30
q)d2:0 99 1000000!100 200 300
q)d1+d2
0      | 110
100    | 20
500000 | 30
99     | 200
1000000| 300

6. 不唯一的键和值
如之前所说,当键不唯一时,会返回第一个出现时的值:

q)ddup:`a`b`a`c!10 20 30 20
q)ddup[`a]
10

逆向查找同理:

q)ddup?30
`a
q)ddup?20
`b

7. Non-simple 键 和 值

键和值是嵌套的列表:

q)d:(`a`b; `c`d`e; enlist `f)!10 20 30
q)d `f
30
q)d?20
`c`d`e
q)d:`a`b`c!(10 20; 30 40 50; enlist 60)
q)d `b
30 40 50
q)d?30 40 50
`b
q)d?enlist 60

注意,对单个元素的键或值要单独对其生成一个列表(enlist),否则会有如下的问题:

q)dwhackey:(1 2; 3 4 5; 6; 7 8)!10 20 30 40 / atom 6 is whack
q)dwhackey 1 2
10
q)dwhackey 6
0N
q)dwhackval:10 20 30 40!(1 2; 3 4 5; 6; 7 8) / atom 6 is whack
q)dwhackval?3 4 5
20
q)dwhackval?6
0N

会导致查找失败,返回Null值。

2. 字典操作

1. Amend 和 Upsert

update:

q)d:`a`b`c!10 20 30
q)d[`b]:42

insert:

q)d:`a`b`c!10 20 30
q)d[`x]:42

在q语言中,update/insert操作被称为upsert操作。

2. 提取子字典
使用提取操作符#,左运算元为子字典的键,右运算元为原始字典。 另外,当原始字典有重复键时,只会提取第一次出现的键:

q)ddup:`a`b`a`c!10 20 30 20
q)`a`c#ddup
a| 10
c| 20

3. 删除
使用操作符_, 用法与#类似,但需要注意_前后要加空格

q)d:`a`b`c!10 20 30
q)`a`c _ d
b| 20
q)(enlist `b) _ d

删除全部键值对会得到一个带类型的空字典:

q)d:`a`b`c!10 20 30
q)`a`b`c _ d
q)-3!`a`b`c _ d
"(`symbol$())!`long$()"

操作符cut_在字典上的效果相同。

另外一个很少用的用法是,字典在_的左边,_右运算元为一个单一的键,表示字典删除这个键:

q)d _ `b
a| 10
c| 30

4. 字典上的基础运算
一些常见的基础运算如下例所示,非常容易理解

q)d:`a`b`c!10 20 30
q)neg d
a| -10
b| -20
c| -30

字典的加法: 相同键值进行加法操作,不同键值保留下来

q)d1:`a`b`c!1 2 3
q)d2:`b`c`d!20 30 40
q)d1+d2
a| 1
b| 22
c| 33
d| 40

5. join,
使用,进行合并字典的操作,由于q语言是right to left特性的,所以合并的两个字典如果有相同的键值,那么右边的会保留下来。

q)d1:`a`b`c!10 20 30
q)d2:`c`d!300 400
q)d1,d2
a| 10
b| 20
c| 300
d| 400

因此,字典合并时,前后顺序很重要

6. Coalesce ^
这种合并方式类似于,合并, 但与其不同的是,当^右边右边项值为Null时不覆盖左边项,见下例:

q)d1:`a`b`c!10 0N 30
q)d2:`b`c`d!200 0N 400

q)d1^d2
a| 10
b| 200
c| 30
d| 400

q)d1,d2
a| 10
b| 200
c|
d| 400

7. 算术和相等运算符
对于相等性比较,由于null代表缺失值,所以所有的null值会被认为是相等的。

q)(`a`b`c!10 20 30)=`b`c`d!20 300 400
a| 0
b| 1
c| 0
d| 0
q)(`a`b`c!0N 20 30)=`b`c`d!20 300 0N
a| 1
b| 1
c| 0
d| 1
q)(`a`b`c!10 20 30)<`b`c`d!20 300 400
a| 0
b| 0
c| 1
d| 1

3. 列字典

列字典(Column Dictionary)是表(Table)的基础。

1. 定义和术语
一个一般的列字典具有如下的形式:

c1...cn!(v1;...;vn)

其中cisymbol类型,vi是具有相同长度的列表。通常vi均为简单列表。

2. 简单例子

q)travelers:`name`iq!(`Dent`Beeblebrox`Prefect;42 98 126)
q)travelers
name| Dent Beeblebrox Prefect
iq  | 42   98         126

索引:

q)travelers[`name; 1]
`Beeblebrox
q)travelers[`iq; 2]
126

单列的字典:

q)dc1:(enlist `c)!enlist 10 20 30
q)dc1
c| 10 20 30

4. 列字典的翻转

q)dc:`c1`c2!(`a`b`c; 10 20 30)
q)dc
c1| a b c
c2| 10 20 30
q)t:flip dc
q)t
c1 c2
-----
a 10
b 20
c 30

索引:

q)dc[`c1; 0]
`a
q)dc[`c1; 1]
`b
q)dc[`c1; 2]
`c
q)t[0; `c1]
`a
q)t[1; `c1]
`b
q)t[2; `c1]
`c

Unlike the case of transposing rectangular lists, transposing a column dictionary does not physically re-arrange data.(翻转并不会改变数据的存储)

    原文作者:Sergeant
    原文地址: https://segmentfault.com/a/1190000018711233
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞