如何在python中找到文件的mime类型?

假设您想要在某个地方保存一堆文件，例如在blob中。假设您希望通过网页分发这些文件，并让客户端自动打开正确的应用程序/查看器。

假设:浏览器通过HTTP响应中的mime-type (content-type?)报头确定要使用哪个应用程序/查看器。

基于这个假设，除了文件的字节外，还需要保存MIME类型。

如何找到文件的MIME类型?我现在用的是Mac，但这应该也适用于Windows。

浏览器是否在将文件发布到网页时添加此信息?

是否有一个简洁的python库来查找这些信息?WebService还是(更好的)一个可下载的数据库?

当前回答

比使用mimetypes库更可靠的方法是使用python-magic包。

import magic
m = magic.open(magic.MAGIC_MIME)
m.load()
m.file("/tmp/document.pdf")

这相当于使用file(1)。

在Django中，还可以确保MIME类型与UploadedFile.content_type匹配。

2010-01-25 16:39:06

其他回答

标准库中的mimetypes模块将根据文件扩展名确定/猜测MIME类型。

如果用户正在上传文件，HTTP post将在数据旁边包含文件的MIME类型。例如，Django将此数据作为UploadedFile对象的属性提供。

2008-09-04 12:12:20

这似乎很简单

>>> from mimetypes import MimeTypes
>>> import urllib 
>>> mime = MimeTypes()
>>> url = urllib.pathname2url('Upload.xml')
>>> mime_type = mime.guess_type(url)
>>> print mime_type
('application/xml', None)

请参阅旧帖

更新-在python 3+版本中，现在更方便了:

import mimetypes
print(mimetypes.guess_type("sample.html"))

2014-02-13 13:09:49

在Python 3中。X和webapp的url文件不能有扩展名或假扩展名。您应该安装python-magic，使用

pip3 install python-magic

对于Mac OS X，你也应该使用libmagic

brew install libmagic

代码片段

import urllib
import magic
from urllib.request import urlopen

url = "http://...url to the file ..."
request = urllib.request.Request(url)
response = urlopen(request)
mime_type = magic.from_buffer(response.readline())
print(mime_type)

或者，您可以在read中输入一个大小

import urllib
import magic
from urllib.request import urlopen

url = "http://...url to the file ..."
request = urllib.request.Request(url)
response = urlopen(request)
mime_type = magic.from_buffer(response.read(128))
print(mime_type)

2016-09-06 19:55:29

对于可以使用的数组类型数据 magic.from_buffer (_byte_array mime = True)

2018-07-25 04:43:28

@toivotuo的方法在python3下工作得最好，最可靠。我的目标是识别那些没有可靠的.gz扩展名的gzip文件。我安装了python3-magic。

import magic

filename = "./datasets/test"

def file_mime_type(filename):
    m = magic.open(magic.MAGIC_MIME)
    m.load()
    return(m.file(filename))

print(file_mime_type(filename))

对于一个gzip文件，它返回: 应用程序/ gzip;charset =二进制

对于解压缩的TXT文件(iostat数据): 文本/平原;charset = us - ascii

对于tar文件: 应用程序/ x-tar;charset =二进制

对于bz2文件: 应用程序/ x-bzip2;charset =二进制

最后但并非最不重要的一个。zip文件: 应用程序/邮政编码;charset =二进制

2015-02-03 19:09:32

如何在python中找到文件的mime类型?

推荐文章

最新文章

标签