我有一个非常简单的东西,它只是输出一些CSV格式的东西,但它必须是UTF-8。我在TextEdit或TextMate或Dreamweaver中打开这个文件,它会正确地显示UTF-8字符,但如果我在Excel中打开它,它会做这种愚蠢的íÄ之类的事情。下面是我在我的文档头部得到的内容:

header("content-type:application/csv;charset=UTF-8");
header("Content-Disposition:attachment;filename=\"CHS.csv\"");

这一切似乎都达到了预期的效果,除了Excel (Mac, 2008)不想正确地导入它。Excel里没有“以UTF-8格式打开”之类的选项,所以……我有点烦了。

我似乎在任何地方都找不到任何明确的解决方案,尽管很多人都有同样的问题。我看到的最多的事情是包括BOM,但我不知道如何做到这一点。正如你所看到的,我只是回显这些数据,我没有写入任何文件。如果我需要,我可以这样做,我只是没有因为在这一点上似乎不需要这样做。任何帮助吗?

更新:我尝试将BOM作为回显包(“CCC”,0xef, 0xbb, 0xbf);这是我刚刚从一个试图检测BOM的网站上找到的。但Excel只是在导入时将这三个字符附加到第一个单元格,仍然会把特殊字符弄乱。


当前回答

当我有一个导入数据的Excel VBA例程时,我也遇到了同样的问题。由于CSV是纯文本格式,我通过编程方式在简单的文件编辑器(如写字板)中打开数据,并将其重新保存为unicode文本,或者从那里将其复制到剪贴板并粘贴到Excel中来解决这个问题。如果excel不能自动地将CSV解析为单元格,可以使用内置的“文本到列”功能轻松地进行补救。

其他回答

不需要使用mb_convert_encoding转换已经经过utf-8编码的文本。只需要在原来的内容前面加上三个字:

$newContent = chr(239) . chr(187) . chr(191) . $originalContent

对我来说,这解决了csv文件中特殊字符的问题。

我也有同样(或类似)的问题。

在我的情况下,如果我添加一个BOM输出,它工作:

header('Content-Encoding: UTF-8');
header('Content-type: text/csv; charset=UTF-8');
header('Content-Disposition: attachment; filename=Customers_Export.csv');
echo "\xEF\xBB\xBF"; // UTF-8 BOM

我相信这是一个非常丑陋的黑客,但它对我有效,至少对Excel 2007 Windows有效。不确定在Mac上能不能用。

当我调查时,我发现UTF-8在MAC和Windows上工作得不好,所以我尝试了Windows-1252,它在两者上都支持得很好,但你必须在ubuntu上选择编码类型。 下面是我的代码$valueToWrite = mb_convert_encoding($value, 'Windows-1252');

$response->headers->set('Content-Type', $mime . '; charset=Windows-1252');
    $response->headers->set('Pragma', 'public');
    $response->headers->set('Content-Endcoding','Windows-1252');
    $response->headers->set('Cache-Control', 'maxage=1');
    $response->headers->set('Content-Disposition', $dispositionHeader);
    echo "\xEF\xBB\xBF"; // UTF-8 BOM

你可以转换你的CSV字符串与iconv。 例如:

$csvString = "Möckmühl;in Möckmühl ist die Hölle los\n";
file_put_contents('path/newTest.csv',iconv("UTF-8", "ISO-8859-1//TRANSLIT",$csvString) );

我在Mac上,在我的情况下,我只需要用“sep=;\n”指定分隔符,并像这样用UTF-16LE编码文件:

$data = "sep=;\n" .mb_convert_encoding($data, 'UTF-16LE', 'UTF-8');