我有这样的东西:

extensionsToCheck = ['.pdf', '.doc', '.xls']

for extension in extensionsToCheck:
    if extension in url_string:
        print(url_string)

我想知道在Python中更优雅的方法是什么(不使用for循环)?我在想类似这样的东西(比如从C/ c++中),但它不起作用:

if ('.pdf' or '.doc' or '.xls') in url_string:
    print(url_string)

编辑:我有点被迫解释这与下面被标记为潜在重复的问题有什么不同(所以我猜它不会关闭)。

区别在于,我想检查字符串是否是某个字符串列表的一部分,而另一个问题是检查字符串列表中的字符串是否是另一个字符串的子字符串。相似,但不完全相同,当你在网上寻找答案时,语义很重要。这两个问题实际上是要解决彼此相反的问题。但两者的解决方案是一样的。


当前回答

extensionsToCheck = ('.pdf', '.doc', '.xls')

'test.doc'.endswith(extensionsToCheck)   # returns True

'test.jpg'.endswith(extensionsToCheck)   # returns False

其他回答

为了防止有人再次面临这样的任务,这里有另一个解决方案:

extensionsToCheck = ['.pdf', '.doc', '.xls']
url_string = 'file.doc'
res = [ele for ele in extensionsToCheck if(ele in url_string)]
print(bool(res))
> True
extensionsToCheck = ('.pdf', '.doc', '.xls')

'test.doc'.endswith(extensionsToCheck)   # returns True

'test.jpg'.endswith(extensionsToCheck)   # returns False

与任何发电机一起使用,在第一个True上短路:

if any(ext in url_string for ext in extensionsToCheck):
    print(url_string)

编辑:我看到这个答案已经被op接受了。虽然我的解决方案可能是他特定问题的“足够好”的解决方案,并且是一个很好的通用方法来检查列表中的任何字符串是否在另一个字符串中找到,但请记住,这就是这个解决方案所做的一切。它不关心字符串在哪里被找到,例如在字符串的结尾。如果这很重要,就像url的情况一样,你应该看看@Wladimir Palant的答案,否则你可能会得到假阳性。

最好正确地解析URL -这样你就可以正确地处理http://.../file.doc?foo和http://.../foo.doc/file.exe。

from urlparse import urlparse
import os
path = urlparse(url_string).path
ext = os.path.splitext(path)[1]
if ext in extensionsToCheck:
  print(url_string)

检查它是否匹配这个正则表达式:

'(\.pdf$|\.doc$|\.xls$)'

注意:如果你的扩展不在url的末尾,删除$字符,但它会稍微削弱它