我有一个PHP脚本处理各种各样的语言。不幸的是,每当我尝试使用json_encode时,任何Unicode输出都会转换为十六进制实体。这是预期的行为吗?是否有办法将输出转换为UTF-8字符?

以下是我所看到的一个例子:

输入

echo $text;

输出

База данни грешка.

输入

json_encode($text);

输出

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

当前回答

您喜欢设置字符集和未转义的unicode

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

其他回答

自PHP/5.4.0以来,有一个名为JSON_UNESCAPED_UNICODE的选项。看看吧:

https://php.net/function.json-encode

因此,你应该尝试:

json_encode( $text, JSON_UNESCAPED_UNICODE );

一种解决方案是先对数据进行编码,然后在同一个文件中解码:

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

下面是我针对各种PHP版本的组合解决方案。

在我的公司,我们使用不同版本的PHP服务器,所以我必须找到适用于所有服务器的解决方案。

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

荣誉应该颁给马可·加西和阿布。PHP >= 5.4的解决方案在json_encode文档中提供。

这是预期的行为吗?

json_encode()只适用于UTF-8编码的数据。

也许您可以在这里得到一个答案来转换它:cyrlic -characters-in-php -json-encode

上面的raw_json_encode()函数并没有解决我的问题(由于某种原因,回调函数在我的PHP 5.2.5服务器上引发了一个错误)。

但另一种方法确实有效。

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

功劳应该给马可·加西。我只是调用他的函数,而不是调用json_encode():

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}