用python洗牌数组最简单的方法是什么?


当前回答

当处理常规的Python列表时,random.shuffle()将完成工作,就像前面的答案所显示的那样。

但当涉及到ndarray(numpy.array)时,随机。Shuffle似乎破坏了原始ndarray。这里有一个例子:

import random
import numpy as np
import numpy.random

a = np.array([1,2,3,4,5,6])
a.shape = (3,2)
print a
random.shuffle(a) # a will definitely be destroyed
print a

只需使用:np.random.shuffle(a)

像随机的。Shuffle, np.random.shuffle原地打乱数组。

其他回答

如果你想要一个新的数组,你可以使用sample:

import random
new_array = random.sample( array, len(array) )

注意random.shuffle()不应该用于多维数组,因为它会导致重复。

假设你想要沿着数组的第一个维度洗牌,我们可以创建以下测试示例,

import numpy as np
x = np.zeros((10, 2, 3))

for i in range(10):
   x[i, ...] = i*np.ones((2,3))

沿着第一个轴,第i个元素对应于一个2x3矩阵其中所有的元素都等于i。

如果我们对多维数组使用正确的洗牌函数,即np.random.shuffle(x),数组将按照需要沿着第一个轴洗牌。但是,使用random.shuffle(x)将导致重复。你可以在洗牌后运行len(np.unique(x))来检查这一点,使用np.random.shuffle()会得到10(正如预期的那样),但使用random.shuffle()时只有5左右。

另一种方法是使用sklearn

from sklearn.utils import shuffle
X=[1,2,3]
y = ['one', 'two', 'three']
X, y = shuffle(X, y, random_state=0)
print(X)
print(y)

输出:

[2, 1, 3]
['two', 'one', 'three']

优点:可以同时随机多个数组,而不会中断映射。'random_state'可以控制可复制行为的变换。

import random
random.shuffle(array)
import random
random.shuffle(array)