熊猫read_csv: low_memory和dtype选项

df = pd.read_csv('somefile.csv')

.．.给出一个错误:

熊猫…/网站/ / io / parsers.py: 1130: DtypeWarning:列(4,5,7,16)为混合类型。指定dtype 选项导入或设置low_memory=False。

为什么dtype选项与low_memory相关，为什么low_memory=False帮助?

当前回答

我在一个~400MB的文件中遇到了类似的问题。设置low_memory=False对我有用。首先做一些简单的事情，我会检查你的数据帧是否比你的系统内存大，重新启动，在继续之前清理RAM。如果你仍然遇到错误，请确保你的.csv文件是正确的，在Excel中快速查看并确保没有明显的损坏。损坏的原始数据会造成严重破坏。

2018-03-28 18:29:42

其他回答

2018-03-28 18:29:42

正如fireynx前面提到的，如果显式指定了dtype，并且存在与该dtype不兼容的混合数据，则加载将崩溃。我使用了这样的转换器作为变通方法来更改数据类型不兼容的值，这样数据仍然可以加载。

def conv(val):
    if not val:
        return 0    
    try:
        return np.float64(val)
    except:        
        return np.float64(0)

df = pd.read_csv(csv_file,converters={'COL_A':conv,'COL_B':conv})

2016-09-02 18:17:01

有时候，当其他方法都失败时，你只想告诉熊猫闭嘴:

# Ignore DtypeWarnings from pandas' read_csv                                                                                                                                                                                            
warnings.filterwarnings('ignore', message="^Columns.*")

2020-11-25 23:59:45

df = pd.read_csv('somefile.csv', low_memory=False)

这应该能解决问题。当从CSV中读取1.8M行时，我得到了完全相同的错误。

2015-10-16 03:12:36

它为我工作与low_memory = False同时导入一个数据帧。这就是所有对我有效的改变:

df = pd.read_csv('export4_16.csv',low_memory=False)

2019-04-17 14:40:40

熊猫read_csv: low_memory和dtype选项

推荐文章

最新文章

标签