何时在Java中使用LinkedList over ArrayList？

我一直是一个简单使用的人：

List<String> names = new ArrayList<>();

我使用接口作为可移植性的类型名称，这样当我问类似这样的问题时，我就可以修改代码。

LinkedList何时应用于ArrayList，反之亦然？

当前回答

TL；DR由于现代计算机体系结构，ArrayList对于几乎所有可能的用例都将显著提高效率，因此除了一些非常独特和极端的情况外，应避免使用LinkedList。

理论上，LinkedList的add（E元素）有一个O（1）

此外，在列表中间添加元素应该非常有效。

实践非常不同，因为LinkedList是一个缓存敌对数据结构。从性能POV来看，LinkedList很少比缓存友好的ArrayList性能更好。

以下是在随机位置插入元素的基准测试结果。如您所见，数组列表效率更高，但理论上，每次在列表中间插入都需要“移动”数组后面的n个元素（值越低越好）：

使用新一代硬件（更大、更高效的缓存），结果更为确凿：

LinkedList需要更多的时间来完成相同的任务。源源代码

这主要有两个原因：

主要是LinkedList的节点在内存中随机分布。RAM（“随机存取存储器”）不是真正随机的，需要将内存块提取到缓存中。此操作需要时间，并且当此类提取频繁发生时，缓存中的内存页需要一直被替换->缓存未命中->缓存效率不高。ArrayList元素存储在连续内存中——这正是现代CPU架构正在优化的目标。Secondary LinkedList需要保留/转发指针，这意味着与ArrayList相比，每个存储值的内存消耗是3倍。

顺便说一句，DynamicIntArray是一个自定义ArrayList实现，它保存Int（原始类型）而不是Object，因此所有数据都是相邻存储的，因此效率更高。

需要记住的一个关键因素是，获取存储块的成本比访问单个存储单元的成本更重要。这就是为什么读卡器1MB的顺序存储器比从不同内存块读取此数据量快x400倍的原因：

Latency Comparison Numbers (~2012)
----------------------------------
L1 cache reference                           0.5 ns
Branch mispredict                            5   ns
L2 cache reference                           7   ns                      14x L1 cache
Mutex lock/unlock                           25   ns
Main memory reference                      100   ns                      20x L2 cache, 200x L1 cache
Compress 1K bytes with Zippy             3,000   ns        3 us
Send 1K bytes over 1 Gbps network       10,000   ns       10 us
Read 4K randomly from SSD*             150,000   ns      150 us          ~1GB/sec SSD
Read 1 MB sequentially from memory     250,000   ns      250 us
Round trip within same datacenter      500,000   ns      500 us
Read 1 MB sequentially from SSD*     1,000,000   ns    1,000 us    1 ms  ~1GB/sec SSD, 4X memory
Disk seek                           10,000,000   ns   10,000 us   10 ms  20x datacenter roundtrip
Read 1 MB sequentially from disk    20,000,000   ns   20,000 us   20 ms  80x memory, 20X SSD
Send packet CA->Netherlands->CA    150,000,000   ns  150,000 us  150 ms

来源：每个程序员都应该知道的延迟数

为了让这一点更加清晰，请检查在列表开头添加元素的基准。这是一个用例，从理论上讲，LinkedList应该非常出色，而ArrayList应该呈现出糟糕甚至更糟糕的用例结果：

注意：这是C++标准库的一个基准测试，但我以前的经验表明C++和Java的结果非常相似。源代码

复制连续的大量内存是一种由现代CPU改变理论优化的操作，实际上也使ArrayList/Vector更加高效

致谢：这里发布的所有基准都是由Kjell Hedström创建的。在他的博客上可以找到更多的数据

2018-10-19 02:53:16

其他回答

ArrayList是可随机访问的，而LinkedList扩展和删除元素非常便宜。在大多数情况下，ArrayList都可以。

除非您创建了大量列表并测量了瓶颈，否则您可能永远不需要担心差异。

2008-11-27 01:41:47

与LinkedList相比，Summary ArrayList和ArrayDeque在更多的用例中更可取。如果您不确定，请从ArrayList开始。

TLDR，在ArrayList中，访问元素需要恒定的时间[O（1）]，添加元素需要O（n）时间[最坏情况]。在LinkedList中，插入元素需要O（n）时间，访问也需要O（n）时间，但LinkedList比ArrayList使用更多内存。

LinkedList和ArrayList是List接口的两种不同实现。LinkedList使用双链接列表实现它。ArrayList通过动态调整数组大小来实现它。

与标准的链表和数组操作一样，不同的方法将有不同的算法运行时。

对于LinkedList＜E＞

get（int index）为O（n）（平均步数为n/4），但当index=0或index=list.size（）-1时为O（1）（在这种情况下，还可以使用getFirst（）和getLast（））。LinkedList的主要优点之一add（int index，E元素）为O（n）（平均步数为n/4），但当index=0或index=list.size（）-1时为O（1）（在这种情况下，还可以使用addFirst（）和addLast（）/add（））。LinkedList的主要优点之一remove（int index）为O（n）（平均步数为n/4），但当index=0或index=list.size（）-1时为O（1）（在这种情况下，还可以使用removeFirst（）和removeLast（））。LinkedList的主要优点之一Iterator.remove（）为O（1）。LinkedList的主要优点之一ListIterator.add（E元素）为O（1）。LinkedList的主要优点之一

注：许多操作平均需要n/4步，在最佳情况下（例如索引=0）需要恒定的步数，在最坏情况下（列表中间）需要n/2步

对于ArrayList＜E＞

get（int索引）为O（1）。ArrayList的主要优势<E>add（E元素）是O（1）摊销，但O（n）最坏情况，因为数组必须调整大小并复制add（int索引，E元素）为O（n）（平均n/2步）remove（int索引）为O（n）（平均n/2步）Iterator.remove（）为O（n）（平均为n/2步）ListIterator.add（E元素）为O（n）（平均n/2步）

注：许多操作平均需要n/2步，在最佳情况下（列表末尾）需要恒定的步数，在最坏情况下（开始列表）需要n步

LinkedList＜E＞允许使用迭代器进行恒定时间的插入或删除，但只能对元素进行顺序访问。换句话说，您可以向前或向后遍历列表，但在列表中找到位置所需的时间与列表的大小成正比。Javadoc表示“索引到列表中的操作将从开始或结束遍历列表，以较近者为准”，因此这些方法平均为O（n）（n/4步），尽管索引=0时为O（1）。

另一方面，ArrayList＜E＞允许快速随机读取访问，因此您可以在恒定时间内获取任何元素。但是，除了末端之外，任何地方的添加或删除都需要将后面的所有元素转换过来，要么打开，要么填补空白。此外，如果添加的元素超过了基础数组的容量，则会分配一个新数组（大小的1.5倍），并将旧数组复制到新数组，因此在最坏的情况下，添加到ArrayList是O（n），但平均来说是常量。

因此，根据您打算执行的操作，您应该相应地选择实现。对这两种列表进行迭代实际上都是同样便宜的。（在ArrayList上迭代在技术上更快，但除非您正在做一些对性能非常敏感的事情，否则不必担心这一点——它们都是常量。）

使用LinkedList的主要好处是重用现有迭代器来插入和删除元素。然后，这些操作可以在O（1）中通过仅本地更改列表来完成。在阵列列表中，需要移动（即复制）阵列的其余部分。另一方面，在LinkedList中查找意味着在最坏情况下遵循O（n）（n/2步）中的链接，而在ArrayList中，所需位置可以通过数学计算并在O（1）中访问。

使用LinkedList的另一个好处是在列表的开头添加或删除，因为这些操作是O（1），而ArrayList是O（n）。请注意，ArrayDeque可能是LinkedList的一个很好的替代方案，用于添加和删除头部，但它不是List。

此外，如果您有大量列表，请记住内存使用情况也不同。LinkedList的每个元素都有更多的开销，因为指向下一个和上一个元素的指针也会被存储。ArrayList没有这个开销。然而，ArrayList占用的内存与为容量分配的内存一样多，而不管是否实际添加了元素。

ArrayList的默认初始容量非常小（Java 1.4-1.8中为10）。但由于底层实现是一个数组，如果添加大量元素，则必须调整数组的大小。为了避免在知道要添加大量元素时调整大小的高昂成本，请使用更高的初始容量构建ArrayList。

如果使用数据结构透视图来理解这两个结构，LinkedList基本上是一个包含头节点的顺序数据结构。Node是两个组件的包装器：一个类型为T的值[通过泛型接受]，另一个对链接到它的Node的引用。因此，我们可以断言它是一个递归数据结构（一个Node包含另一个节点，该节点具有另一个Node等等…）。如上所述，在LinkedList中添加元素需要线性时间。

ArrayList是一个可增长的数组。它就像一个常规数组。在后台，当添加了一个元素，并且ArrayList已经满了容量时，它将创建另一个大小大于先前大小的数组。然后将元素从先前的数组复制到新的数组，并且将要添加的元素也放置在指定的索引处。

2008-11-27 01:49:42

见原始答案下方作者的2021更新。

原答案（2011年）

作为一个在非常大规模的SOA web服务上做了大约十年操作性能工程的人，我更喜欢LinkedList而不是ArrayList的行为。虽然LinkedList的稳态吞吐量更差，因此可能会导致购买更多硬件，但ArrayList在压力下的行为可能会导致集群中的应用程序以近乎同步的方式扩展其阵列，而对于较大的阵列大小，可能会导致应用程序缺乏响应能力，在压力下停机，这是灾难性的行为。

类似地，您可以从默认的吞吐量固定垃圾收集器中获得更好的应用吞吐量，但一旦您获得了具有10GB堆的java应用程序，您就可以在完全GC期间锁定应用程序25秒，这会导致SOA应用程序超时和失败，如果太频繁，还会破坏SLA。尽管CMS收集器占用了更多的资源，并且没有实现相同的原始吞吐量，但它是一个更好的选择，因为它具有更可预测性和更小的延迟。

如果您所指的性能是吞吐量，并且可以忽略延迟，那么ArrayList只是性能的更好选择。根据我的工作经验，我不能忽视最坏情况下的延迟。

更新（2021 8月27日——10年后）

这个答案（也是我在SO问题上最受欢迎的答案）很可能是错误的（原因在下面的评论中概述）。我想补充一点，ArrayList将优化内存的顺序读取，并最小化缓存线和TLB未命中等。相比之下，当阵列增长超过边界时的复制开销可能无关紧要（可以通过高效的CPU操作完成）。考虑到硬件趋势，随着时间的推移，这个答案可能会变得更糟。LinkedList可能有意义的唯一情况是，如果您有数千个列表，其中任何一个都可能增长到GB大小，但在分配列表时无法做出正确的猜测，并且将它们全部设置为GB大小，则会炸毁堆。如果你发现了这样的问题，那么无论你的解决方案是什么，都需要重新设计（我不想轻率地建议重新设计旧代码，因为我自己维护了一堆又一堆的旧代码，但这是一个很好的例子，因为原始设计已经过时，确实需要扔掉）。尽管如此，我还是会把我几十年来的糟糕观点留在那里，让你读一读。简单、合乎逻辑，而且非常错误。

2011-01-01 20:23:52