我试图在TextMate中输入一些UTF-8字符到LaTeX文件(它说它的默认编码是UTF-8),但LaTeX似乎不理解它们。

运行cat my_file.tex可以在Terminal中正确显示字符。运行ls -al会显示一些我以前从未见过的东西:文件列表旁边的“@”:

-rw-r--r--@  1 me      users      2021 Feb 11 18:05 my_file.tex

(并且,是的,我在LaTeX中使用\usepackage[utf8]{inputenc}。)

我找到了iconv,但这似乎不能告诉我编码是什么-它只会转换一旦我弄清楚。


当前回答

使用file命令和——mime-encoding选项(例如file——mime-encoding some_file.txt)而不是-I选项在OS X上工作,并且有一个额外的好处是省略mime类型“text/plain”,你可能不关心这个。

其他回答

Synalyze它!允许比较ICU库提供的所有编码中的文本或字节。使用该功能,您通常会立即看到哪个代码页对您的数据有意义。

使用file命令和——mime-encoding选项(例如file——mime-encoding some_file.txt)而不是-I选项在OS X上工作,并且有一个额外的好处是省略mime类型“text/plain”,你可能不关心这个。

您可以尝试将文件加载到firefox窗口中,然后转到“查看-字符编码”。在文件的编码类型旁边应该有一个复选标记。

在终端中输入文件myfile.tex有时可以使用一系列算法和神奇数字告诉您文件的编码和类型。它相当有用,但不要依赖它提供具体或可靠的信息。

可以定位的。字符串文件(在本地化的Mac OS X应用程序中找到)通常报告为utf - 16c源文件。

只使用:

file -I <filename>

就是这样。