在对音频或图像数组进行一些处理后,需要在一个范围内对其进行规范化,然后才能将其写回文件。可以这样做:
# Normalize audio channels to between -1.0 and +1.0
audio[:,0] = audio[:,0]/abs(audio[:,0]).max()
audio[:,1] = audio[:,1]/abs(audio[:,1]).max()
# Normalize image to between 0 and 255
image = image/(image.max()/255.0)
有没有更简单,更方便的函数来做这个?matplotlib.colors.Normalize()似乎并不相关。
您还可以使用sklearn重新缩放。其优点是,除了对数据进行均值居中之外,还可以调整标准偏差的归一化,并且可以在任意一个轴上、通过特征或通过记录进行此操作。
from sklearn.preprocessing import scale
X = scale( X, axis=0, with_mean=True, with_std=True, copy=True )
关键字参数axis、with_mean、with_std是不言自明的,并以默认状态显示。如果参数副本被设置为False,则该参数副本就地执行操作。这里的文档。
如果数组同时包含正数据和负数据,我将使用:
import numpy as np
a = np.random.rand(3,2)
# Normalised [0,1]
b = (a - np.min(a))/np.ptp(a)
# Normalised [0,255] as integer: don't forget the parenthesis before astype(int)
c = (255*(a - np.min(a))/np.ptp(a)).astype(int)
# Normalised [-1,1]
d = 2.*(a - np.min(a))/np.ptp(a)-1
如果数组包含nan,一种解决方案是将它们删除为:
def nan_ptp(a):
return np.ptp(a[np.isfinite(a)])
b = (a - np.nanmin(a))/nan_ptp(a)
但是,根据上下文的不同,您可能希望以不同的方式对待nan。例如,插入值,替换为0,或引发错误。
最后,值得一提的是,即使这不是OP的问题,标准化:
e = (a - np.mean(a)) / np.std(a)