我正在浏览一个包含卵的目录,以便将这些卵添加到sys.path。如果目录中有相同的.egg的两个版本,我只想添加最新的版本。
我有一个正则表达式r ^ (? P < eggName > \ w +) - (? P < eggVersion > (\ d \.]+)-.+\.Egg $从文件名中提取名称和版本。问题是比较版本号,它是一个像2.3.1这样的字符串。
因为我比较字符串,2排序超过10,但这是不正确的版本。
>>> "2.3.1" > "10.1.1"
True
我可以做一些拆分、解析、转换为int等,最终我将得到一个变通方法。但这是Python,不是Java。是否有一种优雅的方法来比较版本字符串?
使用packaging.version.parse。
>>> # pip install packaging
>>> from packaging import version
>>> version.parse("2.3.1") < version.parse("10.1.2")
True
>>> version.parse("1.3.a4") < version.parse("10.1.2")
True
>>> isinstance(version.parse("1.3.a4"), version.Version)
True
>>> isinstance(version.parse("1.3.xy123"), version.LegacyVersion)
True
>>> version.Version("1.3.xy123")
Traceback (most recent call last):
...
packaging.version.InvalidVersion: Invalid version: '1.3.xy123'
package .version.parse是一个第三方实用程序,但被setuptools使用(所以你可能已经安装了它),并且符合当前的PEP 440;如果版本兼容,它将返回package .version. version,如果不兼容,则返回package .version. legacyversion。后者总是在有效版本之前排序。
注意:setuptools最近提供了打包。
您可能遇到的一种古老且现在已弃用的方法是distutils。版本,它是无文档的,只符合取代的PEP 386;
>>> from distutils.version import LooseVersion, StrictVersion
>>> LooseVersion("2.3.1") < LooseVersion("10.1.2")
True
>>> StrictVersion("2.3.1") < StrictVersion("10.1.2")
True
>>> StrictVersion("1.3.a4")
Traceback (most recent call last):
...
ValueError: invalid version number '1.3.a4'
正如您所看到的,它将有效的PEP 440版本视为“不严格”,因此不符合现代Python对有效版本的定义。
distutils。版本没有文档,这里是相关的文档字符串。
假设你的语义版本是“干净的”(例如,x.x.x),并且你有一个需要排序的版本列表,这里有一些东西可以工作。
# Here are some versions
versions = ["1.0.0", "1.10.0", "1.9.0"]
# This does not work
versions.sort() # Result: ['1.0.0', '1.10.0', '1.9.0']
# So make a list of tuple versions
tuple_versions = [tuple(map(int, (version.split(".")))) for version in versions]
# And sort the string list based on the tuple list
versions = [x for _, x in sorted(zip(tuple_versions, versions))] # Result: ['1.0.0', '1.9.0', '1.10.0']
要获得最新版本,您只需选择列表版本[-1]中的最后一个元素,或者使用sorted()的reverse属性进行反向排序,将其设置为True,并获得[0]元素。
当然,您可以将所有这些打包到一个方便的函数中以供重用。
def get_latest_version(versions):
"""
Get the latest version from a list of versions.
"""
try:
tuple_versions = [tuple(map(int, (version.split(".")))) for version in versions]
versions = [x for _, x in sorted(zip(tuple_versions, versions), reverse=True)]
latest_version = versions[0]
except Exception as e:
print(e)
latest_version = None
return latest_version
print(get_latest_version(["1.0.0", "1.10.0", "1.9.0"]))
基于Kindall的解决方案发布我的完整功能。通过用前导零填充每个版本部分,我能够支持混合在数字中的任何字母数字字符。
虽然肯定不如他的一行函数漂亮,但它似乎可以很好地处理字母数字版本号。(如果您的版本控制系统中有较长的字符串,请确保适当地设置zfill(#)值。)
def versiontuple(v):
filled = []
for point in v.split("."):
filled.append(point.zfill(8))
return tuple(filled)
.
>>> versiontuple("10a.4.5.23-alpha") > versiontuple("2a.4.5.23-alpha")
True
>>> "10a.4.5.23-alpha" > "2a.4.5.23-alpha"
False
将版本字符串转换为元组并从那里开始有什么问题?对我来说已经够优雅了
>>> (2,3,1) < (10,1,1)
True
>>> (2,3,1) < (10,1,1,1)
True
>>> (2,3,1,10) < (10,1,1,1)
True
>>> (10,3,1,10) < (10,1,1,1)
False
>>> (10,3,1,10) < (10,4,1,1)
True
@kindall的解决方案是一个简单的例子,说明代码看起来有多好。
打包库包含用于处理版本和其他打包相关功能的实用程序。它实现了PEP 0440——版本标识,还能够解析不遵循PEP的版本。pip和其他常用的Python工具使用它来提供版本解析和比较。
$ pip install packaging
from packaging.version import parse as parse_version
version = parse_version('1.0.3.dev')
它从setuptools和pkg_resources中的原始代码中分离出来,以提供更轻量级和更快的包。
在打包库存在之前,这个功能在pkg_resources (setuptools提供的一个包)中可以找到(现在仍然可以找到)。然而,这不再是首选,因为setuptools不再保证被安装(存在其他打包工具),具有讽刺意味的是,pkg_resources在导入时使用了相当多的资源。然而,所有的文档和讨论仍然是相关的。
从parse_version()文档:
解析由PEP 440定义的项目版本字符串。返回值将是一个表示版本的对象。这些对象可以相互比较和排序。排序算法是由PEP 440定义的,添加的是,任何不是有效PEP 440版本的版本都将被视为小于任何有效PEP 440版本,无效版本将继续使用原始算法进行排序。
引用的“原始算法”是在PEP 440存在之前的旧版本文档中定义的。
从语义上讲,该格式是distutils的StrictVersion类和LooseVersion类之间的一个粗略的交叉;如果你给它一个与StrictVersion兼容的版本,那么它们会以同样的方式进行比较。否则,比较更像是一种“更聪明”的LooseVersion形式。可以创建病态的版本编码方案来欺骗这个解析器,但在实践中应该非常罕见。
文档提供了一些例子:
如果你想确定你选择的编号方案是否有效
您可以使用pkg_resources.parse_version()
函数比较不同版本号:
>>>从pkg_resources导入parse_version
> > > parse_version (1.9.a.dev) = = parse_version(“1.9 a0dev”)
真正的
> > > parse_version (2.1 rc2) < parse_version(“2.1”)
真正的
>>> parse_version('0.6a9dev-r41475') < parse_version('0.6a9')
真正的