给定一个列表[“foo”、“bar”、“baz”]和列表“bar”中的一个项,如何获取其索引1?


当前回答

使用字典,首先处理列表,然后将索引添加到其中

from collections import defaultdict

index_dict = defaultdict(list)    
word_list =  ['foo','bar','baz','bar','any', 'foo', 'much']

for word_index in range(len(word_list)) :
    index_dict[word_list[word_index]].append(word_index)

word_index_to_find = 'foo'       
print(index_dict[word_index_to_find])

# output :  [0, 5]

其他回答

可以使用zip()函数获取列表中值的索引。代码可以是:;

list1 = ["foo","bar","baz"]
for index,value in zip(range(0,len(list1)),list1):
    if value == "bar":
        print(index)

正如@TerryA所指出的,许多答案讨论了如何找到一个索引。

moreintertools是一个第三方库,它提供了在可迭代文件中查找多个索引的工具。

鉴于

import more_itertools as mit


iterable = ["foo", "bar", "baz", "ham", "foo", "bar", "baz"]

Code

查找多个观测值的索引:

list(mit.locate(iterable, lambda x: x == "bar"))
# [1, 5]

测试多个项目:

list(mit.locate(iterable, lambda x: x in {"bar", "ham"}))
# [1, 3, 5]

另请参阅more_itertools.locate的更多选项。通过>pip Install more_itertools安装。

在Python中查找给定列表中包含项的索引对于列表[“foo”、“bar”、“baz”]和列表“bar”中的项,在Python中获取其索引(1)的最干净方法是什么?

当然,有index方法,它返回第一次出现的索引:

>>> l = ["foo", "bar", "baz"]
>>> l.index('bar')
1

这种方法有几个问题:

如果该值不在列表中,您将得到ValueError如果列表中有多个值,则只获取第一个值的索引

没有值

如果值可能丢失,则需要捕获ValueError。

您可以这样使用可重用定义:

def index(a_list, value):
    try:
        return a_list.index(value)
    except ValueError:
        return None

然后这样使用:

>>> print(index(l, 'quux'))
None
>>> print(index(l, 'bar'))
1

这样做的缺点是,您可能需要检查返回的值是否为None:

result = index(a_list, value)
if result is not None:
    do_something(result)

列表中有多个值

如果您可能会出现更多情况,则无法通过list.index获得完整信息:

>>> l.append('bar')
>>> l
['foo', 'bar', 'baz', 'bar']
>>> l.index('bar')              # nothing at index 3?
1

您可以在列表中列举索引:

>>> [index for index, v in enumerate(l) if v == 'bar']
[1, 3]
>>> [index for index, v in enumerate(l) if v == 'boink']
[]

如果没有出现,则可以通过结果的布尔检查进行检查,或者在循环结果时不执行任何操作:

indexes = [index for index, v in enumerate(l) if v == 'boink']
for index in indexes:
    do_something(index)

使用熊猫更好地处理数据

如果您有熊猫,您可以通过Series对象轻松获取此信息:

>>> import pandas as pd
>>> series = pd.Series(l)
>>> series
0    foo
1    bar
2    baz
3    bar
dtype: object

比较检查将返回一系列布尔值:

>>> series == 'bar'
0    False
1     True
2    False
3     True
dtype: bool

通过下标符号将该系列布尔值传递给该系列,您将得到匹配的成员:

>>> series[series == 'bar']
1    bar
3    bar
dtype: object

如果只需要索引,index属性将返回一系列整数:

>>> series[series == 'bar'].index
Int64Index([1, 3], dtype='int64')

如果您希望它们在列表或元组中,只需将它们传递给构造函数:

>>> list(series[series == 'bar'].index)
[1, 3]

是的,你也可以将列表理解与enumerate一起使用,但在我看来,这并不是那么优雅——你在Python中进行等式测试,而不是让用C编写的内置代码来处理:

>>> [i for i, value in enumerate(l) if value == 'bar']
[1, 3]

这是XY问题吗?

XY问题是询问您尝试的解决方案,而不是实际问题。

为什么您认为需要列表中给定元素的索引?

如果你已经知道它的价值,为什么你会在意它在列表中的位置?

如果值不存在,则捕获ValueError相当冗长,我更希望避免这种情况。

无论如何,我通常都会遍历列表,所以我通常会保留一个指向任何有趣信息的指针,用enumerate获取索引。

如果你在处理数据,你可能应该使用panda,它的工具比我展示的纯Python解决方案要优雅得多。

我不记得自己需要list.index。然而,我已经浏览了Python标准库,并看到了它的一些优秀用途。

它在idlelib中有很多用途,用于GUI和文本解析。

关键字模块使用它在模块中查找注释标记,以通过元编程自动重新生成其中的关键字列表。

在Lib/mailbox.py中,它似乎像有序映射一样使用它:

key_list[key_list.index(old)] = new

and

del key_list[key_list.index(key)]

在Lib/html/cookiejar.py中,似乎用于获取下一个月:

mon = MONTHS_LOWER.index(mon.lower())+1

在Lib/tarfile.py中,类似于distutils,获取一个项目的切片:

members = members[:members.index(tarinfo)]

在Lib/pickletools.py中:

numtopop = before.index(markobject)

这些用法的共同点是,它们似乎对大小受限的列表进行操作(这一点很重要,因为list.index的查找时间为O(n)),并且它们主要用于解析(在Idle的情况下为UI)。

虽然有它的用例,但它们相当罕见。如果您发现自己正在寻找这个答案,请问问自己,您所做的是否是该语言为您的用例提供的工具的最直接使用。

获取列表中一个或多个(相同)项的所有出现次数和位置

使用enumerate(list),您可以存储第一个元素(n),当元素x等于您查找的值时,该元素是列表的索引。

>>> alist = ['foo', 'spam', 'egg', 'foo']
>>> foo_indexes = [n for n,x in enumerate(alist) if x=='foo']
>>> foo_indexes
[0, 3]
>>>

让我们让函数findindex

此函数将项和列表作为参数,并返回项在列表中的位置,就像我们之前看到的那样。

def indexlist(item2find, list_or_string):
  "Returns all indexes of an item in a list or a string"
  return [n for n,item in enumerate(list_or_string) if item==item2find]

print(indexlist("1", "010101010"))

输出


[1, 3, 5, 7]

易于理解的

for n, i in enumerate([1, 2, 3, 4, 1]):
    if i == 1:
        print(n)

输出:

0
4

如果性能令人担忧:

在许多答案中都提到,list.index(item)方法的内置方法是一个O(n)算法。如果您需要执行一次,这是很好的。但是,如果您需要多次访问元素的索引,那么首先创建一个项目索引对的字典(O(n)),然后在每次需要时访问O(1)处的索引更有意义。

如果您确定列表中的项目从未重复,您可以轻松地:

myList = ["foo", "bar", "baz"]

# Create the dictionary
myDict = dict((e,i) for i,e in enumerate(myList))

# Lookup
myDict["bar"] # Returns 1
# myDict.get("blah") if you don't want an error to be raised if element not found.

如果您可能有重复的元素,并且需要返回它们的所有索引:

from collections import defaultdict as dd
myList = ["foo", "bar", "bar", "baz", "foo"]

# Create the dictionary
myDict = dd(list)
for i,e in enumerate(myList):
    myDict[e].append(i)

# Lookup
myDict["foo"] # Returns [0, 4]