我试图得到一个tsv文件加载到熊猫数据框架。

这是我正在尝试的和我得到的错误:

>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))

Traceback (most recent call last):
  File "<pyshell#28>", line 1, in <module>
    df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
    raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!

.read_csv函数的作用如下:

pd.read_csv('c:/~/trainSetRel3.txt', sep='\t')

如果你有一个头,你可以传递header=0。

pd.read_csv('c:/~/trainSetRel3.txt', sep='\t', header=0)

注意:在17.0之前,使用了pd.DataFrame.from_csv(现在已弃用,.from_csv文档链接重定向到pd.read_csv的页面)。


使用pandas.read_table (filepath)。默认分隔符为tab。


从17.0开始,不鼓励使用from_csv。

用pd。Read_csv (fpath, sep='\t')或pd.read_table(fpath)。


打开文件,另存为.csv,然后应用

df = pd.read_csv('apps.csv', sep='\t')

对于任何其他格式,也只需更改sep标记


试试这个

df = pd.read_csv("rating-data.tsv",sep='\t')
df.head()

实际上,您需要修复sep参数。


df = pd.read_csv('filename.csv', sep='\t', header=0)

您可以通过指定分隔符和报头直接将tsv文件加载到pandas数据帧中。


data = pd.read_csv('your_dataset.tsv', delimiter = '\t', quoting = 3)

您可以使用分隔符分隔数据,引号= 3有助于清除datasst中的引号


试试这个:

import pandas as pd
DataFrame = pd.read_csv("dataset.tsv", sep="\t")

使用这个

import pandas as pd
df = pd.read_fwf('xxxx.tsv')