有人知道一个简单的库或函数来解析csv编码的字符串并将其转换为数组或字典吗?
我不认为我需要内置csv模块,因为在我看到的所有例子中,它接受文件路径,而不是字符串。
有人知道一个简单的库或函数来解析csv编码的字符串并将其转换为数组或字典吗?
我不认为我需要内置csv模块,因为在我看到的所有例子中,它接受文件路径,而不是字符串。
当前回答
正如其他人已经指出的,Python包含一个模块来读写CSV文件。只要输入字符保持在ASCII限制范围内,它就能很好地工作。如果要处理其他编码,则需要做更多的工作。
csv模块的Python文档实现了csv的扩展。Reader,它使用相同的接口,但可以处理其他编码并返回unicode字符串。只需从文档中复制并粘贴代码。在此之后,您可以像这样处理CSV文件:
with open("some.csv", "rb") as csvFile:
for row in UnicodeReader(csvFile, encoding="iso-8859-15"):
print row
其他回答
这里有一个替代的解决方案:
>>> import pyexcel as pe
>>> text="""1,2,3
... a,b,c
... d,e,f"""
>>> s = pe.load_from_memory('csv', text)
>>> s
Sheet Name: csv
+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| a | b | c |
+---+---+---+
| d | e | f |
+---+---+---+
>>> s.to_array()
[[u'1', u'2', u'3'], [u'a', u'b', u'c'], [u'd', u'e', u'f']]
下面是文档
可以使用io将字符串转换为文件对象。StringIO,然后传递给csv模块:
from io import StringIO
import csv
scsv = """text,with,Polish,non-Latin,letters
1,2,3,4,5,6
a,b,c,d,e,f
gęś,zółty,wąż,idzie,wąską,dróżką,
"""
f = StringIO(scsv)
reader = csv.reader(f, delimiter=',')
for row in reader:
print('\t'.join(row))
在换行符上使用split()的简单版本:
reader = csv.reader(scsv.split('\n'), delimiter=',')
for row in reader:
print('\t'.join(row))
或者你可以简单地用\n作为分隔符将()这个字符串分割成行,然后将()每一行分割成值,但这样你必须知道引用,所以使用csv模块是首选。
在Python 2上,你必须导入StringIO为
from StringIO import StringIO
代替。
不是通用的CSV解析器,但可用于带逗号的简单字符串。
>>> a = "1,2"
>>> a
'1,2'
>>> b = a.split(",")
>>> b
['1', '2']
解析CSV文件。
f = open(file.csv, "r")
lines = f.read().split("\n") # "\r\n" if needed
for line in lines:
if line != "": # add other needed checks to skip titles
cols = line.split(",")
print cols
简单- csv模块也适用于列表:
>>> a=["1,2,3","4,5,6"] # or a = "1,2,3\n4,5,6".split('\n')
>>> import csv
>>> x = csv.reader(a)
>>> list(x)
[['1', '2', '3'], ['4', '5', '6']]
csv.reader() https://docs.python.org/2/library/csv.html的官方文档非常有用,它说
文件对象和列表对象都是合适的
import csv
text = """1,2,3
a,b,c
d,e,f"""
lines = text.splitlines()
reader = csv.reader(lines, delimiter=',')
for row in reader:
print('\t'.join(row))