引言
最近在看underscore.js的源码,看到shuffle函数,想起Java集合工具中也有这么个函数,就顺便仔细研究了一下,思路非常简单:一个迭代下标i从后往前移动,每次取0~i之间的一个随机下标rand,将其对应元素和i所在的元素交换。i也可以从前往后迭代。
underscore.js的shuffle
_.shuffle = function(obj) {
var set = isArrayLike(obj) ? obj : _.values(obj);//[]或{}类型
var length = set.length;
var shuffled = Array(length);
for (var index = 0, rand; index < length; index++) {
rand = _.random(0, index);//产生0到index之间的整数,包含index
if (rand !== index) shuffled[index] = shuffled[rand];//将随机取到的元素放入最后一个位置
shuffled[rand] = set[index];//将新元素覆蓋过来
}
return shuffled;
};
underscore.js并没有使用打乱原集合方式的乱序,而是生成一个乱序后的新集合,这样可以省去元素交换的开销,毕竟赋值的开销比交换要小,但是会多消耗一些空间,不过underscore.js是函数式工具库,任何函数都不应该改变传入的参数值,而是应该返回一个新的值。
Java的shuffle
public static void shuffle(List<?> list, Random rnd) {
int size = list.size(); //如果list的大小较小,或者是随机访问型list,比如ArrayList,则直接使用shuffle算法
if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {
for (int i=size; i>1; i--)
swap(list, i-1, rnd.nextInt(i));
} else { //如果list较大,或者是顺序访问型list,比如LinkedList,那么先将其转换成数组。因为打乱一个LinkedList的所有结点的操作较麻烦,效率不好。
Object arr[] = list.toArray();
for (int i=size; i>1; i--)
swap(arr, i-1, rnd.nextInt(i));
ListIterator it = list.listIterator();
for (int i=0; i<arr.length; i++) {
it.next();
it.set(arr[i]);//再把数组填回去
}
}
}
Java的shuffle就是和前面说的思路是一样的了,直接在原集合上操作,当需要乱序的集合比较大时有优势。
Python的shuffle
def shuffle(self, x, random=None, int=int):
if random is None:
random = self.random
for i in reversed(xrange(1, len(x))): //...9,8,7,6,4,3,2,1
# pick an element in x[:i+1] with which to exchange x[i]
j = int(random() * (i+1))
x[i], x[j] = x[j], x[i] //交换
可以看到这和Java是一样的。