我正在寻找一种方法将xlsx文件转换为Linux上的csv文件。

我不想使用PHP/Perl或类似的东西,因为我正在处理数百万行,所以我需要一些快速的东西。我在Ubuntu repos上找到了一个名为xls2csv的程序,但它只会转换xls (Office 2003)文件(我目前正在使用),但我需要对更新的Excel文件的支持。

什么好主意吗?


当前回答

使用csvkit

in2csv data.xlsx > data.csv

详情请查阅他们优秀的文档

其他回答

如果.xlsx文件有很多表,-s标志可以用来获得你想要的表。例如:

xlsx2csv "my_file.xlsx" -s 2 second_sheet.csv

Second_sheet.csv将包含my_file.xlsx中第二表的数据。

Gnumeric电子表格应用程序提供了一个名为ssconvert的命令行实用程序,可以在各种电子表格格式之间进行转换:

$ ssconvert Book1.xlsx newfile.csv
Using exporter Gnumeric_stf:stf_csv

$ cat newfile.csv 
Foo,Bar,Baz
1,2,3
123.6,7.89,
2012/05/14,,
The,last,Line

在Ubuntu上安装:

apt-get install gnumeric

在Mac上安装:

brew install gnumeric

您可以使用libreoffice将.xlsx文件转换为CSV

$ libreoffice --headless --convert-to csv ABC.xlsx

headless表示我们不需要GUI。

https://gist.github.com/scottming/99c09685360376d4cac2de7c891e8050

您可以使用这个脚本。先添加依赖项:

Pip3安装pandas XLRD openpyxl

然后调用脚本:python3 getsheets.py <file.xlsx>

使用csvkit

in2csv data.xlsx > data.csv

详情请查阅他们优秀的文档