从“non uniform”python词典中选择随机元素

我有一个
python字典,其中值是整数列表:

key1 -> [1, 2, 3]
key2 -> [1, 2, 3, ... 17]
key3 -> [1, 2, 3, 4, 5]

我想选择一个随机元组(key,val),其中val是值列表中的随机值(例如:key2,8).随机选择在所有值中必须是一致的,因此,例如,此方法不一致:

random_key = random.choice(d.keys())
random_val = random.choice(d[random_key])

因为列表的长度不一样.
我知道列表串联的长度,n,所以我目前的方法如下:

idx = np.random.randint(n)
c = 0
found = False

for k in D:
    for v in D[k]:
        if c == idx:
            found = True
            do_something_with_val(k, v);
            break
        c += 1
    if found:
        break

我的问题是:有更好/更快的方法吗?

最佳答案 您可以尝试(在Python 3中使用Python 2,使用iteritems()):

idx = random.randint(0, n)
for k, v in D.items():
    if idx < len(v):
        do_something_with_val(k, v[idx])
        break
    else:
        idx -= len(v)

速度测量:

def ref():
    idx = random.randint(0, n)
    c = 0
    found = False
    for k in D:
        for v in D[k]:
            if c == idx:
                found = True
                # do_something_with_val(k, v);
                break
            c += 1
        if found:
            break


def uut():
    idx = random.randint(0, n)
    for k, v in D.items():
        if idx < len(v):
            # do_something_with_val(k, v[idx])
            break
        else:
            idx -= len(v)


if __name__ == '__main__':
    print(timeit.timeit('ref()', setup="from __main__ import ref", number=1000))
    print(timeit.timeit('uut()', setup="from __main__ import uut", number=1000))

结果:

1.7672173159990052
0.011254642000494641

我使用小D来检查分发,如{‘key2’:[3,4,5],’key1’:[0,1,2]},分布看起来对我很好:

0,166851
1,166141
2,166269
3,167094
4,167130
5,166515
点赞