是否可以在Python中读取二进制MATLAB .mat文件?

我看到SciPy声称支持读取.mat文件,但我没有成功。我安装了SciPy 0.7.0版本,但找不到loadmat()方法。


当前回答

首先将.mat文件保存为:

save('test.mat', '-v7')

之后,在Python中,使用常用的loadmat函数:

import scipy.io as sio
test = sio.loadmat('test.mat')

其他回答

有一个很好的包叫做mat4py,可以很容易地安装使用

pip install mat4py

使用起来很简单(来自网站):

从mat文件加载数据

函数loadmat只使用Python的dict和list对象,将mat文件中存储的所有变量加载到一个简单的Python数据结构中。数值数组和单元格数组转换为行顺序的嵌套列表。压缩数组以消除只有一个元素的数组。生成的数据结构由与JSON格式兼容的简单类型组成。

示例:将mat文件加载到Python数据结构中:

from mat4py import loadmat

data = loadmat('datafile.mat')

变量数据是mat文件中包含变量和值的字典。

将Python数据结构保存到mat文件中

使用savemat函数,可以将Python数据保存到mat文件中。数据必须以与loadmat相同的方式结构化,即它应该由简单的数据类型组成,如dict, list, str, int和float。

示例:将Python数据结构保存到mat文件中:

from mat4py import savemat

savemat('datafile.mat', data)

参数数据应与变量一致。

也可以使用hdf5storage库。关于matlab版本支持的详细信息,这里是官方文档。

import hdf5storage

label_file = "./LabelTrain.mat"
out = hdf5storage.loadmat(label_file) 

print(type(out)) # <class 'dict'>

安装了MATLAB 2014b或更新版本后,可以使用MATLAB for Python引擎:

import matlab.engine
eng = matlab.engine.start_matlab()
content = eng.load("example.mat", nargout=1)
from os.path import dirname, join as pjoin
import scipy.io as sio
data_dir = pjoin(dirname(sio.__file__), 'matlab', 'tests', 'data')
mat_fname = pjoin(data_dir, 'testdouble_7.4_GLNX86.mat')
mat_contents = sio.loadmat(mat_fname)

你可以使用上面的代码来读取Python中默认保存的.mat文件。

还有MathWorks本身的Python MATLAB引擎。如果你有MATLAB,这可能值得考虑(我自己没有尝试过,但它有很多功能,而不仅仅是读取MATLAB文件)。然而,我不知道是否允许将其分发给其他用户(如果这些人拥有MATLAB,这可能不是问题。否则,也许NumPy才是正确的选择?)

此外,如果您想自己完成所有的基础工作,MathWorks提供了关于文件格式结构的详细文档(如果链接更改,请尝试谷歌获取matfile_format.pdf或其标题MAT-FILE Format)。这并不像我个人想的那么复杂,但显然,这不是最简单的方法。这也取决于你想要支持多少个.mat文件的特性。

我写了一个“小”(大约700行)的Python脚本,它可以读取一些基本的.mat文件。我既不是Python专家,也不是初学者,我花了大约两天时间来编写它(使用上面链接的MathWorks文档)。我学到了很多新东西,而且很有趣(大部分时间)。由于Python脚本是我在工作中编写的,恐怕我不能发布它…但我可以在这里给出一些建议:

首先阅读文档。 使用十六进制编辑器(如HxD)并查看您想要解析的引用.mat文件。 通过将字节保存到.txt文件中并注释每行来尝试找出每个字节的含义。 使用类保存每个数据元素(如miCOMPRESSED、miMATRIX、mxDOUBLE或miINT32) .mat-files的结构是保存树形数据结构中的数据元素的最佳结构;每个节点有一个类和一个子节点