我试图在TextMate中输入一些UTF-8字符到LaTeX文件(它说它的默认编码是UTF-8),但LaTeX似乎不理解它们。

运行cat my_file.tex可以在Terminal中正确显示字符。运行ls -al会显示一些我以前从未见过的东西:文件列表旁边的“@”:

-rw-r--r--@  1 me      users      2021 Feb 11 18:05 my_file.tex

(并且,是的,我在LaTeX中使用\usepackage[utf8]{inputenc}。)

我找到了iconv,但这似乎不能告诉我编码是什么-它只会转换一旦我弄清楚。


当前回答

使用file命令和——mime-encoding选项(例如file——mime-encoding some_file.txt)而不是-I选项在OS X上工作,并且有一个额外的好处是省略mime类型“text/plain”,你可能不关心这个。

其他回答

vim -c 'execute "silent !echo " . &fileencoding | q' {filename}

在我的bash配置中的某个地方别名为

alias vic="vim -c 'execute \"silent \!echo \" . &fileencoding | q'"

所以我就输入

vic {filename}

在我的香草OSX Yosemite上,它产生的结果比“file -I”更精确:

$ file -I pdfs/udocument0.pdf
pdfs/udocument0.pdf: application/pdf; charset=binary
$ vic pdfs/udocument0.pdf
latin1
$
$ file -I pdfs/t0.pdf
pdfs/t0.pdf: application/pdf; charset=us-ascii
$ vic pdfs/t0.pdf
utf-8

在Mac OS X中,命令文件-I(大写i)将为您提供适当的字符集,只要您正在测试的文件包含基本ASCII范围之外的字符。

例如,如果你进入终端,使用vi来创建一个文件。vi用法 然后插入一些字符,包括一个重音字符(尝试ALT-e后面跟着e) 然后保存文件。

他们输入file -I text.txt,你应该得到这样的结果:

用法:文本/平原;utf - 8字符集=

在file命令上使用-I(大写i)选项似乎可以显示文件编码。

file -I {filename}

在终端中输入文件myfile.tex有时可以使用一系列算法和神奇数字告诉您文件的编码和类型。它相当有用,但不要依赖它提供具体或可靠的信息。

可以定位的。字符串文件(在本地化的Mac OS X应用程序中找到)通常报告为utf - 16c源文件。

你用的是哪种乳胶?当我使用teTeX时,我必须手动下载unicode包,并将其添加到我的.tex文件中:

% UTF-8 stuff
\usepackage[notipa]{ucs}
\usepackage[utf8x]{inputenc}
\usepackage[T1]{fontenc}

现在,我已经从TeXlive 2008包切换到XeTeX(这里),它甚至更简单:

% UTF-8 stuff
\usepackage{fontspec}
\usepackage{xunicode}

至于检测文件的编码,您可以使用file(1)(但它相当有限),但就像其他人所说的那样,这很困难。