我有一个PHP脚本处理各种各样的语言。不幸的是,每当我尝试使用json_encode时,任何Unicode输出都会转换为十六进制实体。这是预期的行为吗?是否有办法将输出转换为UTF-8字符?

以下是我所看到的一个例子:

输入

echo $text;

输出

База данни грешка.

输入

json_encode($text);

输出

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

当前回答

json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);

其他回答

您喜欢设置字符集和未转义的unicode

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

这是预期的行为吗?

json_encode()只适用于UTF-8编码的数据。

也许您可以在这里得到一个答案来转换它:cyrlic -characters-in-php -json-encode

json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);

一种解决方案是先对数据进行编码,然后在同一个文件中解码:

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

JSON_UNESCAPED_UNICODE在PHP Version 5.4或更高版本上可用。 下面的代码是5.3版的。

更新

Html_entity_decode比pack + mb_convert_encoding更有效。 (*SKIP)(*FAIL)跳过反斜杠本身和JSON_HEX_*标志指定的字符。

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}