考虑:
unicode=utf16是真的吗?
很多人说Unicode是一种标准,而不是一种编码,但实际上大多数编辑器都支持另存为Unicode编码。
考虑:
unicode=utf16是真的吗?
很多人说Unicode是一种标准,而不是一种编码,但实际上大多数编辑器都支持另存为Unicode编码。
当前回答
除了Trufa的注释之外,Unicode还明确不是UTF-16。当他们第一次研究Unicode时,人们推测16位整数可能足以存储任何代码,但实际上并非如此。然而,UTF-16是Unicode的另一种有效编码(除了8位和32位变体),我相信这是微软在nt派生操作系统运行时在内存中使用的编码。
其他回答
除了Trufa的注释之外,Unicode还明确不是UTF-16。当他们第一次研究Unicode时,人们推测16位整数可能足以存储任何代码,但实际上并非如此。然而,UTF-16是Unicode的另一种有效编码(除了8位和32位变体),我相信这是微软在nt派生操作系统运行时在内存中使用的编码。
Unicode的开发是有目的的 致力于创建映射的新标准 在绝大多数的字符 今天使用的语言, 和其他角色一起 不是那么重要,但可能是 创建文本所必需的。utf - 8 只是你众多方式中的一种 可以编码的文件,因为有 编码的方法有很多 文件中的字符转换为Unicode。
来源:
http://www.differencebetween.net/technology/difference-between-unicode-and-utf-8/
实际上,大多数编辑器都支持另存为“Unicode”编码。
这是Windows的一个不幸的错误命名。
因为Windows内部使用UTF-16LE编码作为Unicode字符串的内存存储格式,它认为这是Unicode文本的自然编码。在Windows世界中,有ANSI字符串(当前机器上的系统代码页,受限于完全不可移植性)和Unicode字符串(在内部存储为UTF-16LE)。
这些都是在Unicode的早期设计的,在我们意识到UCS-2是不够的,在UTF-8被发明之前。这就是为什么Windows对UTF-8的支持在各方面都很差。
这个错误的命名方案成为用户界面的一部分。使用Windows编码支持来提供一系列编码的文本编辑器会自动且不恰当地将UTF-16LE描述为“Unicode”,而将UTF-16BE(如果提供的话)描述为“Unicode大端典”。
(其他自己进行编码的编辑器,如notepad++,就没有这个问题。)
' ANSI '字符串也不是基于任何ANSI标准,如果这让你感觉更好的话。
UTF-16和UTF-8都是Unicode的编码。它们都是Unicode;一个并不比另一个更符合统一码。
不要被微软的一个不幸的历史文物所迷惑。
让我们首先记住,数据是以字节的形式存储的;Unicode是一个字符集,其中字符映射到代码点(唯一整数),我们需要一些东西来将这些代码点数据转换为字节。这就是UTF-8编码的由来——简单!