这是我一开始的资料。
我的清单
L = [0, 23, 234, 89, None, 0, 35, 9]
当我运行这个:
L = filter(None, L)
我得到了这个结果
[23, 234, 89, 35, 9]
但这不是我需要的,我真正需要的是:
[0, 23, 234, 89, 0, 35, 9]
因为我计算的是数据的百分位数0有很大的不同。
如何从列表中删除无值而不删除0值?
这是我一开始的资料。
我的清单
L = [0, 23, 234, 89, None, 0, 35, 9]
当我运行这个:
L = filter(None, L)
我得到了这个结果
[23, 234, 89, 35, 9]
但这不是我需要的,我真正需要的是:
[0, 23, 234, 89, 0, 35, 9]
因为我计算的是数据的百分位数0有很大的不同。
如何从列表中删除无值而不删除0值?
当前回答
@jamylak的回答非常好,但是如果你不想导入几个模块来完成这个简单的任务,就在原地写你自己的lambda:
>>> L = [0, 23, 234, 89, None, 0, 35, 9]
>>> filter(lambda v: v is not None, L)
[0, 23, 234, 89, 0, 35, 9]
其他回答
假设列表如下
iterator = [None, 1, 2, 0, '', None, False, {}, (), []]
这将只返回bool(item)为True的项目
print filter(lambda item: item, iterator)
# [1, 2]
这相当于
print [item for item in iterator if item]
只过滤None:
print filter(lambda item: item is not None, iterator)
# [1, 2, 0, '', False, {}, (), []]
等价于:
print [item for item in iterator if item is not None]
获取所有值为False的项
print filter(lambda item: not item, iterator)
# Will print [None, '', 0, None, False, {}, (), []]
对于Python 2.7(参见Raymond的回答,Python 3的等效内容):
想知道一些“不是None”的东西在python(和其他OO语言)中是否如此常见,所以在我的common .py(我用“from common import *”导入到每个模块中)中,我包含了这些行:
def exists(it):
return (it is not None)
然后从列表中删除None元素,只需执行以下操作:
filter(exists, L)
我发现这比对应的列表理解式(Raymond在Python 2版本中展示的)更容易阅读。
列表理解可能是最干净的方式:
>>> L = [0, 23, 234, 89, None, 0, 35, 9
>>> [x for x in L if x is not None]
[0, 23, 234, 89, 0, 35, 9]
还有一种函数式编程方法,但它更复杂:
>>> from operator import is_not
>>> from functools import partial
>>> L = [0, 23, 234, 89, None, 0, 35, 9]
>>> list(filter(partial(is_not, None), L))
[0, 23, 234, 89, 0, 35, 9]
如果列表中有NoneType和pandas._lib .missing. list。NAType对象比使用:
[i for i in lst if pd.notnull(i)]
迭代vs空间,使用可能是一个问题。在不同的情况下,分析可能会显示“更快”和/或“内存更少”。
# first
>>> L = [0, 23, 234, 89, None, 0, 35, 9, ...]
>>> [x for x in L if x is not None]
[0, 23, 234, 89, 0, 35, 9, ...]
# second
>>> L = [0, 23, 234, 89, None, 0, 35, 9]
>>> for i in range(L.count(None)): L.remove(None)
[0, 23, 234, 89, 0, 35, 9, ...]
第一种方法(@jamylak、@Raymond Hettinger和@Dipto也建议)在内存中创建一个重复的列表,对于一个没有几个None条目的大列表来说,这可能会占用大量内存。
第二种方法遍历列表一次,然后每次都重复,直到到达None。这样可以减少内存密集型,并且列表将随着它的运行而变小。列表大小的减小可以加速前面的大量None条目,但最坏的情况是后面有大量None条目。
第二种方法可能总是比第一种方法慢。但这并不意味着对价无效。
并行化和就地技术是另一种方法,但每种方法在Python中都有自己的复杂性。了解数据和运行时用例,以及对程序进行概要分析,可以从哪里开始进行密集操作或大数据。
在一般情况下,选择任何一种方法都可能无关紧要。这更像是一种符号偏好。事实上,在这些不常见的情况下,numpy(例如,如果L是numpy。array: L = L[L != numpy.array(None)(从这里开始))或cython可能是值得的替代方案,而不是尝试微管理Python优化。