在对音频或图像数组进行一些处理后,需要在一个范围内对其进行规范化,然后才能将其写回文件。可以这样做:
# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()
# Normalize image to between 0 and 255
image = image/(image.max()/255.0)
有没有更简单,更方便的函数来做这个?matplotlib.colors.Normalize()似乎并不相关。
# Normalize audio channels to between -1.0 and +1.0
audio /= np.max(np.abs(audio),axis=0)
# Normalize image to between 0 and 255
image *= (255.0/image.max())
使用/=和*=可以消除中间临时数组,从而节省一些内存。乘法比除法便宜,所以
image *= 255.0/image.max() # Uses 1 division and image.size multiplications
略快于
image /= image.max()/255.0 # Uses 1+image.size divisions
由于我们在这里使用的是基本的numpy方法,所以我认为这是numpy中最有效的解决方案。
就地操作不会改变容器数组的dtype。由于所需的规范化值是浮点数,因此音频和图像数组在执行原地操作之前需要具有浮点点dtype。
如果它们不是浮点dtype,则需要使用astype对它们进行转换。例如,
image = image.astype('float64')
您还可以使用sklearn重新缩放。其优点是,除了对数据进行均值居中之外,还可以调整标准偏差的归一化,并且可以在任意一个轴上、通过特征或通过记录进行此操作。
from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )
关键字参数axis、with_mean、with_std是不言自明的,并以默认状态显示。如果参数副本被设置为False,则该参数副本就地执行操作。这里的文档。
你可以使用“i”(如idiv, imul..)版本,看起来还不错:
image /= (image.max()/255.0)
对于另一种情况,你可以写一个函数来规范一个n维数组的列:
def normalize_columns(arr):
rows, cols = arr.shape
for col in xrange(cols):
arr[:,col] /= abs(arr[:,col]).max()