ValueError: Input contains NaN, infinity or a value too large for dtype('float32'64).
一般处理方式
对于以上问题其原因一般是数据集中存在nan值,以下假设数据用numpy.ndarray
存储(type(positive)=<class 'numpy.ndarray'>)。
首先,我们知道 if np.isnan(x) 用于判断x是否为nan,为nan则返回true。
print(np.isnan(positive).any(), np.isnan(negative).any(), np.isnan(y).any())
该语句用来判断positive、negative、y中是否存在nan值,若返回值为true,
true,true,则可通过以下方式修改:
positive[np.isnan(positive)] = np.mean(positive[~np.isnan(positive)])
negative[np.isnan(negative)] = np.mean(negative[~np.isnan(negative)])
也就是将positive、negative中的nan值用非nan值的均值代替,当然也可以
用中位数median等代替。
再者,用print(np.isfinite(positive).all()) print(np.isfinite(negative).all())
语句来判断positive、negative是否为有限值,返回false则表示数据存在无
穷数,这个问题一般只要修改了nan值就不会报错了。
对于numpy.ndarray中的部分Nan的处理,例如,numpy.ndarray类型的
array=[[2,4,nan,6,nan],[4,45,3,nan,nan]],可以通过以下代码进行处理:
for i in range(len(array)):
sample=array[i]
for j in range(len(sample)):
if np.isnan(sample[j]):
sample[j]=0
则array中的Nan均用0代替了。