我正在浏览一个包含卵的目录,以便将这些卵添加到sys.path。如果目录中有相同的.egg的两个版本,我只想添加最新的版本。

我有一个正则表达式r ^ (? P < eggName > \ w +) - (? P < eggVersion > (\ d \.]+)-.+\.Egg $从文件名中提取名称和版本。问题是比较版本号,它是一个像2.3.1这样的字符串。

因为我比较字符串,2排序超过10,但这是不正确的版本。

>>> "2.3.1" > "10.1.1"
True

我可以做一些拆分、解析、转换为int等,最终我将得到一个变通方法。但这是Python,不是Java。是否有一种优雅的方法来比较版本字符串?


当前回答

类似于标准strverscmp,类似于Mark Byers的解决方案,但使用findall而不是split来避免空大小写。

import re
num_split_re = re.compile(r'([0-9]+|[^0-9]+)')

def try_int(i, fallback=None):
    try:
        return int(i)
    except ValueError:
        pass
    except TypeError:
        pass
    return fallback

def ver_as_list(a):
    return [try_int(i, i) for i in num_split_re.findall(a)]

def strverscmp_lt(a, b):
    a_ls = ver_as_list(a)
    b_ls = ver_as_list(b)
    return a_ls < b_ls

其他回答

您可以使用semver包来确定一个版本是否满足语义版本需求。这与比较两个实际版本不同,但这是一种比较。

例如,3.6.0+1234版本应与3.6.0相同。

import semver
semver.match('3.6.0+1234', '==3.6.0')
# True

from packaging import version
version.parse('3.6.0+1234') == version.parse('3.6.0')
# False

from distutils.version import LooseVersion
LooseVersion('3.6.0+1234') == LooseVersion('3.6.0')
# False

打包库包含用于处理版本和其他打包相关功能的实用程序。它实现了PEP 0440——版本标识,还能够解析不遵循PEP的版本。pip和其他常用的Python工具使用它来提供版本解析和比较。

$ pip install packaging
from packaging.version import parse as parse_version
version = parse_version('1.0.3.dev')

它从setuptools和pkg_resources中的原始代码中分离出来,以提供更轻量级和更快的包。


在打包库存在之前,这个功能在pkg_resources (setuptools提供的一个包)中可以找到(现在仍然可以找到)。然而,这不再是首选,因为setuptools不再保证被安装(存在其他打包工具),具有讽刺意味的是,pkg_resources在导入时使用了相当多的资源。然而,所有的文档和讨论仍然是相关的。

从parse_version()文档:

解析由PEP 440定义的项目版本字符串。返回值将是一个表示版本的对象。这些对象可以相互比较和排序。排序算法是由PEP 440定义的,添加的是,任何不是有效PEP 440版本的版本都将被视为小于任何有效PEP 440版本,无效版本将继续使用原始算法进行排序。

引用的“原始算法”是在PEP 440存在之前的旧版本文档中定义的。

从语义上讲,该格式是distutils的StrictVersion类和LooseVersion类之间的一个粗略的交叉;如果你给它一个与StrictVersion兼容的版本,那么它们会以同样的方式进行比较。否则,比较更像是一种“更聪明”的LooseVersion形式。可以创建病态的版本编码方案来欺骗这个解析器,但在实践中应该非常罕见。

文档提供了一些例子:

如果你想确定你选择的编号方案是否有效 您可以使用pkg_resources.parse_version() 函数比较不同版本号: >>>从pkg_resources导入parse_version > > > parse_version (1.9.a.dev) = = parse_version(“1.9 a0dev”) 真正的 > > > parse_version (2.1 rc2) < parse_version(“2.1”) 真正的 >>> parse_version('0.6a9dev-r41475') < parse_version('0.6a9') 真正的

假设你的语义版本是“干净的”(例如,x.x.x),并且你有一个需要排序的版本列表,这里有一些东西可以工作。

# Here are some versions
versions = ["1.0.0", "1.10.0", "1.9.0"]

# This does not work
versions.sort() # Result: ['1.0.0', '1.10.0', '1.9.0']

# So make a list of tuple versions
tuple_versions = [tuple(map(int, (version.split(".")))) for version in versions]

# And sort the string list based on the tuple list
versions = [x for _, x in sorted(zip(tuple_versions, versions))] # Result: ['1.0.0', '1.9.0', '1.10.0']

要获得最新版本,您只需选择列表版本[-1]中的最后一个元素,或者使用sorted()的reverse属性进行反向排序,将其设置为True,并获得[0]元素。

当然,您可以将所有这些打包到一个方便的函数中以供重用。

def get_latest_version(versions):
    """
    Get the latest version from a list of versions.
    """
    try:
        tuple_versions = [tuple(map(int, (version.split(".")))) for version in versions]
        versions = [x for _, x in sorted(zip(tuple_versions, versions), reverse=True)]
        latest_version = versions[0]
    except Exception as e:
        print(e)
        latest_version = None

    return latest_version

print(get_latest_version(["1.0.0", "1.10.0", "1.9.0"]))

将版本字符串转换为元组并从那里开始有什么问题?对我来说已经够优雅了

>>> (2,3,1) < (10,1,1)
True
>>> (2,3,1) < (10,1,1,1)
True
>>> (2,3,1,10) < (10,1,1,1)
True
>>> (10,3,1,10) < (10,1,1,1)
False
>>> (10,3,1,10) < (10,4,1,1)
True

@kindall的解决方案是一个简单的例子,说明代码看起来有多好。

setuptools的方法是使用pkg_resources。parse_version函数。它应该符合PEP440标准。

例子:

#! /usr/bin/python
# -*- coding: utf-8 -*-
"""Example comparing two PEP440 formatted versions
"""
import pkg_resources

VERSION_A = pkg_resources.parse_version("1.0.1-beta.1")
VERSION_B = pkg_resources.parse_version("v2.67-rc")
VERSION_C = pkg_resources.parse_version("2.67rc")
VERSION_D = pkg_resources.parse_version("2.67rc1")
VERSION_E = pkg_resources.parse_version("1.0.0")

print(VERSION_A)
print(VERSION_B)
print(VERSION_C)
print(VERSION_D)

print(VERSION_A==VERSION_B) #FALSE
print(VERSION_B==VERSION_C) #TRUE
print(VERSION_C==VERSION_D) #FALSE
print(VERSION_A==VERSION_E) #FALSE