假设如下:
>>> s = set([1, 2, 3])
我如何得到一个值(任何值)不做s.pop()?我希望将项目留在集合中,直到我确定可以删除它—只有在对另一个主机进行异步调用之后才能确定这一点。
又快又脏:
>>> elem = s.pop()
>>> s.add(elem)
但你知道更好的办法吗?理想情况是在常数时间内。
假设如下:
>>> s = set([1, 2, 3])
我如何得到一个值(任何值)不做s.pop()?我希望将项目留在集合中,直到我确定可以删除它—只有在对另一个主机进行异步调用之后才能确定这一点。
又快又脏:
>>> elem = s.pop()
>>> s.add(elem)
但你知道更好的办法吗?理想情况是在常数时间内。
当前回答
博士tl;
对于muh_set中的first_item: break仍然是Python 3.x中的最佳方法。诅咒你,圭多。
你这样做
欢迎来到另一套Python 3。X时序,由wr推断。的优秀Python 2。x-specific响应。不像champion同样有用的Python 3。x特定的响应,下面的时间以及上面建议的时间异常值解决方案-包括:
list(s)[0], John新颖的基于序列的解决方案。 随机的。样品(s, 1), dF。基于rng的折衷解决方案。
快乐的代码片段
打开,收听,计时:
from timeit import Timer
stats = [
"for i in range(1000): \n\tfor x in s: \n\t\tbreak",
"for i in range(1000): next(iter(s))",
"for i in range(1000): s.add(s.pop())",
"for i in range(1000): list(s)[0]",
"for i in range(1000): random.sample(s, 1)",
]
for stat in stats:
t = Timer(stat, setup="import random\ns=set(range(100))")
try:
print("Time for %s:\t %f"%(stat, t.timeit(number=1000)))
except:
t.print_exc()
快速过时的永恒时间
看哪!按最快到最慢的片段排序:
$ ./test_get.py
Time for for i in range(1000):
for x in s:
break: 0.249871
Time for for i in range(1000): next(iter(s)): 0.526266
Time for for i in range(1000): s.add(s.pop()): 0.658832
Time for for i in range(1000): list(s)[0]: 4.117106
Time for for i in range(1000): random.sample(s, 1): 21.851104
面向整个家庭的Faceplants
不出所料,手动迭代的速度至少是第二快的解决方案的两倍。虽然与Bad Old Python 2相比,差距有所缩小。x天(其中手动迭代的速度至少是它的四倍),最详细的解决方案是最好的,这让我这个PEP 20狂热者感到失望。至少将一个集合转换为一个列表只是为了提取集合的第一个元素是可怕的。感谢圭多,愿他的光芒继续指引我们。
令人惊讶的是,基于rng的解决方案非常糟糕。列表转换是糟糕的,但随机确实是糟糕的。随机数之神也就这么多了。
我只是希望无定形的They已经为我们PEP了一个set.get_first()方法。如果你在读这篇文章,他们会说:“拜托。做点什么。”
其他回答
在Python 3中还有另一种方法:
next(iter(s))
or
s.__iter__().__next__()
博士tl;
对于muh_set中的first_item: break仍然是Python 3.x中的最佳方法。诅咒你,圭多。
你这样做
欢迎来到另一套Python 3。X时序,由wr推断。的优秀Python 2。x-specific响应。不像champion同样有用的Python 3。x特定的响应,下面的时间以及上面建议的时间异常值解决方案-包括:
list(s)[0], John新颖的基于序列的解决方案。 随机的。样品(s, 1), dF。基于rng的折衷解决方案。
快乐的代码片段
打开,收听,计时:
from timeit import Timer
stats = [
"for i in range(1000): \n\tfor x in s: \n\t\tbreak",
"for i in range(1000): next(iter(s))",
"for i in range(1000): s.add(s.pop())",
"for i in range(1000): list(s)[0]",
"for i in range(1000): random.sample(s, 1)",
]
for stat in stats:
t = Timer(stat, setup="import random\ns=set(range(100))")
try:
print("Time for %s:\t %f"%(stat, t.timeit(number=1000)))
except:
t.print_exc()
快速过时的永恒时间
看哪!按最快到最慢的片段排序:
$ ./test_get.py
Time for for i in range(1000):
for x in s:
break: 0.249871
Time for for i in range(1000): next(iter(s)): 0.526266
Time for for i in range(1000): s.add(s.pop()): 0.658832
Time for for i in range(1000): list(s)[0]: 4.117106
Time for for i in range(1000): random.sample(s, 1): 21.851104
面向整个家庭的Faceplants
不出所料,手动迭代的速度至少是第二快的解决方案的两倍。虽然与Bad Old Python 2相比,差距有所缩小。x天(其中手动迭代的速度至少是它的四倍),最详细的解决方案是最好的,这让我这个PEP 20狂热者感到失望。至少将一个集合转换为一个列表只是为了提取集合的第一个元素是可怕的。感谢圭多,愿他的光芒继续指引我们。
令人惊讶的是,基于rng的解决方案非常糟糕。列表转换是糟糕的,但随机确实是糟糕的。随机数之神也就这么多了。
我只是希望无定形的They已经为我们PEP了一个set.get_first()方法。如果你在读这篇文章,他们会说:“拜托。做点什么。”
对于小型集合,我通常会创建类似这样的解析器/转换器方法
def convertSetToList(setName):
return list(setName)
然后我可以使用新的列表和访问索引号
userFields = convertSetToList(user)
name = request.json[userFields[0]]
作为一个列表,您将拥有所有其他可能需要使用的方法
最少的代码是:
>>> s = set([1, 2, 3])
>>> list(s)[0]
1
显然,这将创建一个包含集合中的每个成员的新列表,所以如果你的集合非常大,就不太好了。
看似最紧凑(6个符号),但非常慢的方法来获得一个集合元素(由PEP 3132实现):
e,*_=s
使用Python 3.5+,你也可以使用这个7符号表达式(感谢PEP 448):
[*s][0]
在我的机器上,这两个选项都比for循环方法慢大约1000倍。