我有一个有名称和数字的两列CSV。有些人的名字使用逗号,例如Joe Blow, CFA。这个逗号打破了CSV格式,因为它被解释为一个新列。
我已经读过了,最常见的处方似乎是替换字符,或替换分隔符,用一个新值(例如,这个|那个|the,其他)。
我真的希望保留逗号分隔符(我知道excel支持其他分隔符,但其他解释器可能不支持)。我还想在名字中保留逗号,因为Joe Blow| CFA看起来很傻。
是否有一种方法在CSV列中包含逗号而不破坏格式,例如通过转义它们?
我有一个有名称和数字的两列CSV。有些人的名字使用逗号,例如Joe Blow, CFA。这个逗号打破了CSV格式,因为它被解释为一个新列。
我已经读过了,最常见的处方似乎是替换字符,或替换分隔符,用一个新值(例如,这个|那个|the,其他)。
我真的希望保留逗号分隔符(我知道excel支持其他分隔符,但其他解释器可能不支持)。我还想在名字中保留逗号,因为Joe Blow| CFA看起来很傻。
是否有一种方法在CSV列中包含逗号而不破坏格式,例如通过转义它们?
当前回答
我面对同样的问题,引用,没有帮助。最终,我将,替换为+,完成了处理,将输出保存到outfile中,并将+替换为,。这可能看起来很丑,但对我来说很管用。
其他回答
你需要引用这些值。 这是一个更详细的规范。
要对包含逗号(,)或双引号(")字符的字段进行编码,请将字段用双引号括起来:
field1,"field, 2",field3, ...
文字双引号字符通常由一对双引号("")表示。例如,只包含一个双引号字符的字段被编码为""""。
例如:
Sheet: |Hello, World!|You "matter" to us.|
CSV: "Hello, World!","You ""matter"" to us."
更多示例(sheet→csv):
正则值→正则值 新鲜,棕色“鸡蛋”→“新鲜,棕色”“鸡蛋”“” →"""" ","→""",""" " …"→"…""" ,"",→",""""," """→""""""""
看到维基百科。
CSV格式的问题是,没有一个规范,有几个公认的方法,没有办法区分应该使用哪个(用于生成/解释)。我在另一篇文章中讨论了转义字符的所有方法(换行,但基本前提相同)。基本上,它可以归结为为预期用户使用CSV生成/转义过程,并希望其他人不介意。
参考规范文件。
我面对同样的问题,引用,没有帮助。最终,我将,替换为+,完成了处理,将输出保存到outfile中,并将+替换为,。这可能看起来很丑,但对我来说很管用。
首先,如果项目值有双引号字符("),则替换为2个双引号字符("")
item = item.ToString().Replace("""", """""")
最后,包装项值:
左:带有双引号字符(")
右:带有双引号(")和逗号(,)
csv += """" & item.ToString() & ""","