今天,我遇到了dict方法get,它在字典中给定一个键,返回相关的值。
这个函数的用途是什么?如果我想在字典中找到一个与键相关的值,我可以只做dict[key],它返回相同的东西:
dictionary = {"Name": "Harry", "Age": 17}
dictionary["Name"]
dictionary.get("Name")
今天,我遇到了dict方法get,它在字典中给定一个键,返回相关的值。
这个函数的用途是什么?如果我想在字典中找到一个与键相关的值,我可以只做dict[key],它返回相同的东西:
dictionary = {"Name": "Harry", "Age": 17}
dictionary["Name"]
dictionary.get("Name")
当前回答
它允许你在缺少键时提供一个默认值:
dictionary.get("bogus", default_value)
返回default_value(不管你选择它是什么),而
dictionary["bogus"]
会引发一个KeyError。
如果省略,default_value为None,这样
dictionary.get("bogus") # <-- No default specified -- defaults to None
返回None
dictionary.get("bogus", None)
会。
其他回答
什么是dict.get()方法?
如前所述,get方法包含一个附加参数,用于指示缺少的值。来自文档
get(键(默认)) 如果key在字典中,则返回key的值,否则为default。如果没有给出default,则默认为None,因此该方法永远不会引发KeyError。
一个例子是
>>> d = {1:2,2:3}
>>> d[1]
2
>>> d.get(1)
2
>>> d.get(3)
>>> repr(d.get(3))
'None'
>>> d.get(3,1)
1
哪里有提高速度的地方吗?
正如这里提到的,
现在看来,这三种方法表现出相似的性能(彼此相差约10%),或多或少与单词列表的属性无关。
早期的get相当慢,但是现在的速度几乎是相当的,以及返回默认值的额外优势。但是为了清除所有的查询,我们可以在一个相当大的列表上进行测试(注意,测试只包括查找所有有效的键)
def getway(d):
for i in range(100):
s = d.get(i)
def lookup(d):
for i in range(100):
s = d[i]
现在使用timeit为这两个函数计时
>>> import timeit
>>> print(timeit.timeit("getway({i:i for i in range(100)})","from __main__ import getway"))
20.2124660015
>>> print(timeit.timeit("lookup({i:i for i in range(100)})","from __main__ import lookup"))
16.16223979
正如我们所看到的,查找比get快,因为没有函数查找。这可以通过这个看出
>>> def lookup(d,val):
... return d[val]
...
>>> def getway(d,val):
... return d.get(val)
...
>>> dis.dis(getway)
2 0 LOAD_FAST 0 (d)
3 LOAD_ATTR 0 (get)
6 LOAD_FAST 1 (val)
9 CALL_FUNCTION 1
12 RETURN_VALUE
>>> dis.dis(lookup)
2 0 LOAD_FAST 0 (d)
3 LOAD_FAST 1 (val)
6 BINARY_SUBSCR
7 RETURN_VALUE
它在哪里有用?
当您在查找字典时希望提供一个默认值时,它将非常有用。这减少了
if key in dic:
val = dic[key]
else:
val = def_val
val = dic.get(key,def_val)
在哪里它是无用的?
当您希望返回一个KeyError,说明特定的键不可用时。返回默认值也有风险,即特定的默认值也可能是键!
是否可能在dict['key']中有get like特征?
是的!我们需要在dict子类中实现__missing__。
示例程序可以是
class MyDict(dict):
def __missing__(self, key):
return None
一个小小的示范就可以了
>>> my_d = MyDict({1:2,2:3})
>>> my_d[1]
2
>>> my_d[3]
>>> repr(my_d[3])
'None'
这样做的目的是,如果没有找到键,您可以给出一个默认值,这非常有用
dictionary.get("Name",'harry')
它允许你在缺少键时提供一个默认值:
dictionary.get("bogus", default_value)
返回default_value(不管你选择它是什么),而
dictionary["bogus"]
会引发一个KeyError。
如果省略,default_value为None,这样
dictionary.get("bogus") # <-- No default specified -- defaults to None
返回None
dictionary.get("bogus", None)
会。
另一个我没有看到提到的用例是作为sort, max和min等函数的key参数。get方法允许根据它们的值返回键。
>>> ages = {"Harry": 17, "Lucy": 16, "Charlie": 18}
>>> print(sorted(ages, key=ages.get))
['Lucy', 'Harry', 'Charlie']
>>> print(max(ages, key=ages.get))
Charlie
>>> print(min(ages, key=ages.get))
Lucy
感谢对不同问题的回答提供了这个用例!
我将给出一个使用python抓取web数据的实际示例,很多时候你会得到没有值的键,在这种情况下,如果你使用dictionary['key'],你会得到错误。Get ('key', ' return_else ')没有问题。
类似地,如果您试图从列表中捕获单个值,我将使用“.join(list)”而不是列表[0]。
希望能有所帮助。
下面是一个实际的例子:
假设,您正在调用一个API,该API返回一个需要解析的JOSN文件。第一个JSON如下所示:
{"bids":{"id":16210506,"submitdate":"2011-10-16 15:53:25","submitdate_f":"10\/16\/2011 at 21:53 CEST","submitdate_f2":"p\u0159ed 2 lety","submitdate_ts":1318794805,"users_id":"2674360","project_id":"1250499"}}
第二个JOSN是这样的:
{"bids":{"id":16210506,"submitdate":"2011-10-16 15:53:25","submitdate_f":"10\/16\/2011 at 21:53 CEST","submitdate_f2":"p\u0159ed 2 lety","users_id":"2674360","project_id":"1250499"}}
请注意,第二个JSON缺少“submitdate_ts”键,这在任何数据结构中都是非常正常的。
因此,当你试图在循环中访问该键的值时,你可以用下面的方法调用它:
for item in API_call:
submitdate_ts = item["bids"]["submitdate_ts"]
您可以这样做,但它会为第二个JSON行提供一个回溯错误,因为键根本不存在。
正确的编码方式如下:
for item in API_call:
submitdate_ts = item.get("bids", {'x': None}).get("submitdate_ts")
{'x': None}的存在是为了避免第二级出错。当然,如果您正在进行抓取,您可以在代码中构建更多的容错性。比如首先指定一个if条件