我有一个有名称和数字的两列CSV。有些人的名字使用逗号,例如Joe Blow, CFA。这个逗号打破了CSV格式,因为它被解释为一个新列。

我已经读过了,最常见的处方似乎是替换字符,或替换分隔符,用一个新值(例如,这个|那个|the,其他)。

我真的希望保留逗号分隔符(我知道excel支持其他分隔符,但其他解释器可能不支持)。我还想在名字中保留逗号,因为Joe Blow| CFA看起来很傻。

是否有一种方法在CSV列中包含逗号而不破坏格式,例如通过转义它们?


当前回答

首先,如果项目值有双引号字符("),则替换为2个双引号字符("")

item = item.ToString().Replace("""", """""")

最后,包装项值:

左:带有双引号字符(")

右:带有双引号(")和逗号(,)

csv += """" & item.ToString() & ""","

其他回答

我发现一些应用程序,如Mac中的Numbers,如果双引号前面有空格,就会忽略它。

A, b,c不行而A, b,c可以。

根据您的语言,可能有to_json方法可用。这将避免破坏csv的许多事情。

这不是一个完美的解决方案,但你可以把所有使用逗号的地方都换成,或者更低的引号。它看起来非常非常类似于逗号,并且在视觉上具有相同的目的。不需要报价

在JS中就是这样

stringVal.replaceAll(',', '‚')

不过,在需要直接比较数据的情况下,你需要非常小心

CSV格式的问题是,没有一个规范,有几个公认的方法,没有办法区分应该使用哪个(用于生成/解释)。我在另一篇文章中讨论了转义字符的所有方法(换行,但基本前提相同)。基本上,它可以归结为为预期用户使用CSV生成/转义过程,并希望其他人不介意。

参考规范文件。

首先,如果项目值有双引号字符("),则替换为2个双引号字符("")

item = item.ToString().Replace("""", """""")

最后,包装项值:

左:带有双引号字符(")

右:带有双引号(")和逗号(,)

csv += """" & item.ToString() & ""","