集合乱序算法shuffle

引言

  最近在看underscore.js的源码,看到shuffle函数,想起Java集合工具中也有这么个函数,就顺便仔细研究了一下,思路非常简单:一个迭代下标i从后往前移动,每次取0~i之间的一个随机下标rand,将其对应元素和i所在的元素交换。i也可以从前往后迭代。

underscore.js的shuffle

_.shuffle = function(obj) {
  var set = isArrayLike(obj) ? obj : _.values(obj);//[]或{}类型
  var length = set.length;
  var shuffled = Array(length);
  for (var index = 0, rand; index < length; index++) {
    rand = _.random(0, index);//产生0index之间的整数,包含index
    if (rand !== index) shuffled[index] = shuffled[rand];//将随机取到的元素放入最后一个位置
    shuffled[rand] = set[index];//将新元素覆蓋过来
  }
  return shuffled;
};

underscore.js并没有使用打乱原集合方式的乱序,而是生成一个乱序后的新集合,这样可以省去元素交换的开销,毕竟赋值的开销比交换要小,但是会多消耗一些空间,不过underscore.js是函数式工具库,任何函数都不应该改变传入的参数值,而是应该返回一个新的值。

Java的shuffle

public static void shuffle(List<?> list, Random rnd) {
    int size = list.size();      //如果list的大小较小,或者是随机访问型list,比如ArrayList,则直接使用shuffle算法
    if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {
        for (int i=size; i>1; i--)
            swap(list, i-1, rnd.nextInt(i));
    } else {   //如果list较大,或者是顺序访问型list,比如LinkedList,那么先将其转换成数组。因为打乱一个LinkedList的所有结点的操作较麻烦,效率不好。
        Object arr[] = list.toArray();
        for (int i=size; i>1; i--)
            swap(arr, i-1, rnd.nextInt(i));
        ListIterator it = list.listIterator();
        for (int i=0; i<arr.length; i++) {
            it.next();
            it.set(arr[i]);//再把数组填回去
        }
    }
}

Java的shuffle就是和前面说的思路是一样的了,直接在原集合上操作,当需要乱序的集合比较大时有优势。

Python的shuffle

def shuffle(self, x, random=None, int=int):
    if random is None:
        random = self.random
    for i in reversed(xrange(1, len(x))):    //...9,8,7,6,4,3,2,1
        # pick an element in x[:i+1] with which to exchange x[i]
        j = int(random() * (i+1))
        x[i], x[j] = x[j], x[i]    //交换

可以看到这和Java是一样的。

参考

Fisher–Yates_shuffle

点赞