今天,我遇到了dict方法get,它在字典中给定一个键,返回相关的值。
这个函数的用途是什么?如果我想在字典中找到一个与键相关的值,我可以只做dict[key],它返回相同的东西:
dictionary = {"Name": "Harry", "Age": 17}
dictionary["Name"]
dictionary.get("Name")
今天,我遇到了dict方法get,它在字典中给定一个键,返回相关的值。
这个函数的用途是什么?如果我想在字典中找到一个与键相关的值,我可以只做dict[key],它返回相同的东西:
dictionary = {"Name": "Harry", "Age": 17}
dictionary["Name"]
dictionary.get("Name")
当前回答
它允许您提供一个默认值,而不是在没有找到该值时得到一个错误。像这样的劝说代码:
class dictionary():
def get(self,key,default):
if self[key] is not found :
return default
else:
return self[key]
其他回答
Get接受第二个可选值。如果指定的键在您的字典中不存在,则将返回此值。
dictionary = {"Name": "Harry", "Age": 17}
dictionary.get('Year', 'No available data')
>> 'No available data'
如果不提供第二个参数,则返回None。
如果使用dictionary['Year']中的索引,则不存在键将引发KeyError。
什么是dict.get()方法?
如前所述,get方法包含一个附加参数,用于指示缺少的值。来自文档
get(键(默认)) 如果key在字典中,则返回key的值,否则为default。如果没有给出default,则默认为None,因此该方法永远不会引发KeyError。
一个例子是
>>> d = {1:2,2:3}
>>> d[1]
2
>>> d.get(1)
2
>>> d.get(3)
>>> repr(d.get(3))
'None'
>>> d.get(3,1)
1
哪里有提高速度的地方吗?
正如这里提到的,
现在看来,这三种方法表现出相似的性能(彼此相差约10%),或多或少与单词列表的属性无关。
早期的get相当慢,但是现在的速度几乎是相当的,以及返回默认值的额外优势。但是为了清除所有的查询,我们可以在一个相当大的列表上进行测试(注意,测试只包括查找所有有效的键)
def getway(d):
for i in range(100):
s = d.get(i)
def lookup(d):
for i in range(100):
s = d[i]
现在使用timeit为这两个函数计时
>>> import timeit
>>> print(timeit.timeit("getway({i:i for i in range(100)})","from __main__ import getway"))
20.2124660015
>>> print(timeit.timeit("lookup({i:i for i in range(100)})","from __main__ import lookup"))
16.16223979
正如我们所看到的,查找比get快,因为没有函数查找。这可以通过这个看出
>>> def lookup(d,val):
... return d[val]
...
>>> def getway(d,val):
... return d.get(val)
...
>>> dis.dis(getway)
2 0 LOAD_FAST 0 (d)
3 LOAD_ATTR 0 (get)
6 LOAD_FAST 1 (val)
9 CALL_FUNCTION 1
12 RETURN_VALUE
>>> dis.dis(lookup)
2 0 LOAD_FAST 0 (d)
3 LOAD_FAST 1 (val)
6 BINARY_SUBSCR
7 RETURN_VALUE
它在哪里有用?
当您在查找字典时希望提供一个默认值时,它将非常有用。这减少了
if key in dic:
val = dic[key]
else:
val = def_val
val = dic.get(key,def_val)
在哪里它是无用的?
当您希望返回一个KeyError,说明特定的键不可用时。返回默认值也有风险,即特定的默认值也可能是键!
是否可能在dict['key']中有get like特征?
是的!我们需要在dict子类中实现__missing__。
示例程序可以是
class MyDict(dict):
def __missing__(self, key):
return None
一个小小的示范就可以了
>>> my_d = MyDict({1:2,2:3})
>>> my_d[1]
2
>>> my_d[3]
>>> repr(my_d[3])
'None'
在Python 3.8及以后版本中,字典get()方法可以与赋值表达式中的walrus操作符:=一起使用,以进一步减少代码:
if (name := dictonary.get("Name")) is not None
return name
使用[]而不是get()将需要将代码包装在try/except块中并捕获KeyError(未显示)。如果没有walrus操作符,您将需要另一行代码:
name = dictionary.get("Name")
if (name is not None)
return name
有一个区别,这可能是一个优势,如果我们正在寻找一个不存在的键,我们将得到None,不像我们使用括号符号时,在这种情况下,我们将得到一个错误抛出:
print(dictionary.get("address")) # None
print(dictionary["address"]) # throws KeyError: 'address'
get方法最后一个很酷的地方是,它接收了一个额外的可选参数作为默认值,也就是说,如果我们试图获取学生的分数值,但学生没有分数键,我们可以得到0。
所以与其这样做(或类似的事情):
score = None
try:
score = dictionary["score"]
except KeyError:
score = 0
我们可以这样做:
score = dictionary.get("score", 0)
# score = 0
我将给出一个使用python抓取web数据的实际示例,很多时候你会得到没有值的键,在这种情况下,如果你使用dictionary['key'],你会得到错误。Get ('key', ' return_else ')没有问题。
类似地,如果您试图从列表中捕获单个值,我将使用“.join(list)”而不是列表[0]。
希望能有所帮助。
下面是一个实际的例子:
假设,您正在调用一个API,该API返回一个需要解析的JOSN文件。第一个JSON如下所示:
{"bids":{"id":16210506,"submitdate":"2011-10-16 15:53:25","submitdate_f":"10\/16\/2011 at 21:53 CEST","submitdate_f2":"p\u0159ed 2 lety","submitdate_ts":1318794805,"users_id":"2674360","project_id":"1250499"}}
第二个JOSN是这样的:
{"bids":{"id":16210506,"submitdate":"2011-10-16 15:53:25","submitdate_f":"10\/16\/2011 at 21:53 CEST","submitdate_f2":"p\u0159ed 2 lety","users_id":"2674360","project_id":"1250499"}}
请注意,第二个JSON缺少“submitdate_ts”键,这在任何数据结构中都是非常正常的。
因此,当你试图在循环中访问该键的值时,你可以用下面的方法调用它:
for item in API_call:
submitdate_ts = item["bids"]["submitdate_ts"]
您可以这样做,但它会为第二个JSON行提供一个回溯错误,因为键根本不存在。
正确的编码方式如下:
for item in API_call:
submitdate_ts = item.get("bids", {'x': None}).get("submitdate_ts")
{'x': None}的存在是为了避免第二级出错。当然,如果您正在进行抓取,您可以在代码中构建更多的容错性。比如首先指定一个if条件