如何将列表分成大小相等的块？

如何将任意长度的列表拆分为大小相等的块？

请参阅如果数据结果将直接用于循环，并且不需要存储，则如何以块形式遍历列表。

对于字符串输入的同一问题，请参见每n个字符拆分字符串？。相同的技术通常适用，但也有一些变化。

当前回答

就像@AaronHall我来这里找的是大小大致均匀的大块。对此有不同的解释。在我的例子中，如果期望的大小是N，我希望每个组的大小>=N。因此，在上述大多数情况下产生的孤儿应重新分配给其他群体。

这可以通过以下方式完成：

def nChunks(l, n):
    """ Yield n successive chunks from l.
    Works for lists,  pandas dataframes, etc
    """
    newn = int(1.0 * len(l) / n + 0.5)
    for i in xrange(0, n-1):
        yield l[i*newn:i*newn+newn]
    yield l[n*newn-newn:]

（通过将列表拆分为N个长度大致相等的部分），只需将其称为nChunks（l，l/N）或nChunk（l，floor（l/N））

2014-09-03 17:43:15

其他回答

这是一个生成大小均匀的块的生成器：

def chunks(lst, n):
    """Yield successive n-sized chunks from lst."""
    for i in range(0, len(lst), n):
        yield lst[i:i + n]

import pprint
pprint.pprint(list(chunks(range(10, 75), 10)))
[[10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
 [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
 [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
 [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
 [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
 [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
 [70, 71, 72, 73, 74]]

对于Python 2，使用xrange代替range：

def chunks(lst, n):
    """Yield successive n-sized chunks from lst."""
    for i in xrange(0, len(lst), n):
        yield lst[i:i + n]

下面是一行理解列表。不过，上面的方法更可取，因为使用命名函数使代码更容易理解。对于Python 3：

[lst[i:i + n] for i in range(0, len(lst), n)]

对于Python 2：

[lst[i:i + n] for i in xrange(0, len(lst), n)]

2008-11-23 12:33:53

我创建了这两个漂亮的一行程序，它们既高效又懒惰，输入和输出都是可迭代的，而且它们不依赖于任何模块：

首先，一行是完全懒惰的，这意味着它返回迭代器生成迭代器（即，生成的每个块都是迭代器对块的元素进行迭代），如果块非常大或元素一个接一个地缓慢生成，并且在生成时应立即可用，则此版本适用于这种情况：

在线试用！

chunk_iters = lambda it, n: ((e for i, g in enumerate(((f,), cit)) for j, e in zip(range((1, n - 1)[i]), g)) for cit in (iter(it),) for f in cit)

第二行返回生成列表的迭代器。一旦整个块的元素通过输入迭代器变得可用，或者到达最后一个块的最后一个元素，就会生成每个列表。如果输入元素快速生成或立即全部可用，则应使用此版本。应该使用其他明智的第一个更懒惰的一行代码版本。

在线试用！

chunk_lists = lambda it, n: (l for l in ([],) for i, g in enumerate((it, ((),))) for e in g for l in (l[:len(l) % n] + [e][:1 - i],) if (len(l) % n == 0) != i)

此外，我还提供了第一个chunk_iter的多行版本一行，它返回迭代器生成另一个迭代器（遍历每个chunk的元素）：

在线试用！

def chunk_iters(it, n):
    cit = iter(it)
    def one_chunk(f):
        yield f
        for i, e in zip(range(n - 1), cit):
            yield e
    for f in cit:
        yield one_chunk(f)

2020-09-24 07:01:48

用户@tzot的解决方案zip_langest（*[iter（lst）]*n，fillvalue=padvalue）非常优雅，但如果lst的长度不能被n整除，它会填充最后一个子列表，以保持其长度与其他子列表的长度匹配。然而，如果这不可取，那么只需使用zip（）生成类似的循环zip，并将lst的剩余元素（不能生成“完整”子列表）附加到输出即可。

输出示例为ABCDEFG，3->ABC DEF G。

单线版本（Python>=3.8）：

list(map(list, zip(*[iter(lst)]*n))) + ([rest] if (rest:=lst[len(lst)//n*n : ]) else [])

A函数：

def chunkify(lst, chunk_size):
    nested = list(map(list, zip(*[iter(lst)]*chunk_size)))
    rest = lst[len(lst)//chunk_size*chunk_size: ]
    if rest:
        nested.append(rest)
    return nested

生成器（尽管每个批次都是一个元组）：

def chunkify(lst, chunk_size):
    for tup in zip(*[iter(lst)]*chunk_size):
        yield tup
    rest = tuple(lst[len(lst)//chunk_size*chunk_size: ])
    if rest:
        yield rest

它比这里的一些最流行的答案产生相同的输出更快。

my_list, n = list(range(1_000_000)), 12

%timeit list(chunks(my_list, n))                                         # @Ned_Batchelder
# 36.4 ms ± 1.6 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit [my_list[i:i+n] for i in range(0, len(my_list), n)]              # @Ned_Batchelder
# 34.6 ms ± 1.12 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit it = iter(my_list); list(iter(lambda: list(islice(it, n)), []))  # @senderle
# 60.6 ms ± 5.36 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit list(mit.chunked(my_list, n))                                    # @pylang
# 59.4 ms ± 4.92 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

%timeit chunkify(my_list, n)
# 25.8 ms ± 1.84 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

同样，从Python 3.12开始，这个功能将作为itertools模块中的批处理方法来实现（目前是一个配方），因此这个答案很可能会被Python 3.12淘汰。

2022-07-13 03:38:10

def chunks(iterable,n):
    """assumes n is an integer>0
    """
    iterable=iter(iterable)
    while True:
        result=[]
        for i in range(n):
            try:
                a=next(iterable)
            except StopIteration:
                break
            else:
                result.append(a)
        if result:
            yield result
        else:
            break

g1=(i*i for i in range(10))
g2=chunks(g1,3)
print g2
'<generator object chunks at 0x0337B9B8>'
print list(g2)
'[[0, 1, 4], [9, 16, 25], [36, 49, 64], [81]]'

2012-02-13 04:50:38

>>> def f(x, n, acc=[]): return f(x[n:], n, acc+[(x[:n])]) if x else acc
>>> f("Hallo Welt", 3)
['Hal', 'lo ', 'Wel', 't']
>>>

如果你在括号里-我拿起了一本关于Erlang的书：）

2009-11-03 16:45:31

如何将列表分成大小相等的块？

推荐文章

最新文章

标签