我有一个非常简单的东西,它只是输出一些CSV格式的东西,但它必须是UTF-8。我在TextEdit或TextMate或Dreamweaver中打开这个文件,它会正确地显示UTF-8字符,但如果我在Excel中打开它,它会做这种愚蠢的íÄ之类的事情。下面是我在我的文档头部得到的内容:

header("content-type:application/csv;charset=UTF-8");
header("Content-Disposition:attachment;filename=\"CHS.csv\"");

这一切似乎都达到了预期的效果,除了Excel (Mac, 2008)不想正确地导入它。Excel里没有“以UTF-8格式打开”之类的选项,所以……我有点烦了。

我似乎在任何地方都找不到任何明确的解决方案,尽管很多人都有同样的问题。我看到的最多的事情是包括BOM,但我不知道如何做到这一点。正如你所看到的,我只是回显这些数据,我没有写入任何文件。如果我需要,我可以这样做,我只是没有因为在这一点上似乎不需要这样做。任何帮助吗?

更新:我尝试将BOM作为回显包(“CCC”,0xef, 0xbb, 0xbf);这是我刚刚从一个试图检测BOM的网站上找到的。但Excel只是在导入时将这三个字符附加到第一个单元格,仍然会把特殊字符弄乱。


当前回答

下面是我怎么做的(这是提示浏览器下载csv文件):

header('Content-Description: File Transfer');
header('Content-Type: application/octet-stream');
header('Content-Disposition: attachment; filename=file.csv');
header('Content-Transfer-Encoding: binary');
header('Expires: 0');
header('Cache-Control: must-revalidate, post-check=0, pre-check=0');
header('Pragma: public');
echo "\xEF\xBB\xBF"; // UTF-8 BOM
echo $csv_file_content;
exit();

唯一的一件事,它修复了UTF8编码问题在CSV预览当你在Mac上按空格键。但不是在Excel Mac 2008…不知道为什么

其他回答

当我有一个导入数据的Excel VBA例程时,我也遇到了同样的问题。由于CSV是纯文本格式,我通过编程方式在简单的文件编辑器(如写字板)中打开数据,并将其重新保存为unicode文本,或者从那里将其复制到剪贴板并粘贴到Excel中来解决这个问题。如果excel不能自动地将CSV解析为单元格,可以使用内置的“文本到列”功能轻松地进行补救。

接下来:

问题似乎只是Mac上的Excel。这不是我生成文件的方式,因为即使从Excel生成csv也会破坏它们。我保存为CSV,然后重新导入,所有的字符都乱成一团。

所以,这个问题似乎没有正确答案。谢谢你的建议。

我想说,从我所读到的,@Daniel Magliola关于BOM的建议可能是其他计算机的最佳答案。但这还是解决不了我的问题。

你必须使用“Windows-1252”编码。

header('Content-Encoding: Windows-1252');
header('Content-type: text/csv; charset=Windows-1252');
header("Content-Disposition: attachment; filename={$filename}");

也许你需要转换你的字符串:

private function convertToWindowsCharset($string) {
  $encoding = mb_detect_encoding($string);

  return iconv($encoding, "Windows-1252", $string);
}

你可以在导出之前将3个字节附加到文件中,这对我来说是有效的。在此之前,该系统只能在Windows和HP -UX中工作,但在Linux中失败。

FileOutputStream fStream = new FileOutputStream( f );
final byte[] bom = new byte[] { (byte) 0xEF, (byte) 0xBB, (byte) 0xBF };
OutputStreamWriter writer = new OutputStreamWriter( fStream, "UTF8" );
fStream.write( bom );

有一个UTF-8 BOM(3字节,十六进制EF BB BF)在文件的开始。否则Excel将根据本地默认编码(例如cp1252)而不是utf-8来解释数据

为Excel生成CSV文件,如何在值中有换行符

你可以转换你的CSV字符串与iconv。 例如:

$csvString = "Möckmühl;in Möckmühl ist die Hölle los\n";
file_put_contents('path/newTest.csv',iconv("UTF-8", "ISO-8859-1//TRANSLIT",$csvString) );