在Java中增加Map值的最有效方法

我希望这个问题对这个论坛来说不是太基本的，但我们会看到的。我想知道如何重构一些代码以获得更好的性能，这是运行了很多次。

假设我正在使用Map(可能是HashMap)创建一个词频列表，其中每个键都是一个包含要统计的单词的String，值是一个Integer，该Integer在每次找到单词的标记时递增。

在Perl中，增加这样一个值非常简单:

$map{$word}++;

但在Java中，这要复杂得多。下面是我目前的做法:

int count = map.containsKey(word) ? map.get(word) : 0;
map.put(word, count + 1);

这当然依赖于新Java版本中的自动装箱特性。我想知道您是否可以建议一种更有效的方法来增加这个值。是否有更好的性能理由避开Collections框架而使用其他框架呢?

更新:我已经对几个答案做了测试。见下文。

当前回答

可以使用Java 8提供的Map接口中的computeIfAbsent方法。

final Map<String,AtomicLong> map = new ConcurrentHashMap<>();
map.computeIfAbsent("A", k->new AtomicLong(0)).incrementAndGet();
map.computeIfAbsent("B", k->new AtomicLong(0)).incrementAndGet();
map.computeIfAbsent("A", k->new AtomicLong(0)).incrementAndGet(); //[A=2, B=1]

方法computeIfAbsent检查指定的键是否已经与某个值关联?如果没有关联值，则尝试使用给定的映射函数计算其值。在任何情况下，它都会返回与指定键关联的当前值(现有值或计算值)，如果计算值为空则返回null。

另一方面，如果你遇到多个线程更新一个公共和的情况，你可以看看LongAdder类。在高争用情况下，该类的预期吞吐量显著高于AtomicLong，但代价是更高的空间消耗。

2016-05-25 14:21:13

其他回答

使用流和getOrDefault计数:

String s = "abcdeff";
s.chars().mapToObj(c -> (char) c)
 .forEach(c -> {
     int count = countMap.getOrDefault(c, 0) + 1;
     countMap.put(c, count);
  });

2021-06-28 07:48:45

与其调用containsKey()，不如直接调用map更快。获取并检查返回值是否为空。

    Integer count = map.get(word);
    if(count == null){
        count = 0;
    }
    map.put(word, count + 1);

2008-09-17 10:14:32

2016年一点研究:https://github.com/leventov/java-word-count，基准源代码

每种方法的最佳效果(越小越好):

                 time, ms
kolobokeCompile  18.8
koloboke         19.8
trove            20.8
fastutil         22.7
mutableInt       24.3
atomicInteger    25.3
eclipse          26.9
hashMap          28.0
hppc             33.6
hppcRt           36.5

时间、空间的结果:

2014-08-17 23:13:53

你确定这是瓶颈吗?你做过性能分析吗?

尝试使用NetBeans分析器(它是免费的，内置在NB 6.1中)来查看热点。

最后，JVM升级(比如从1.5升级到>1.6)通常是一种廉价的性能增强。即使是版本号的升级也能提供良好的性能提升。如果您在Windows上运行，并且这是一个服务器类应用程序，请在命令行上使用-server来使用server Hotspot JVM。在Linux和Solaris机器上，这是自动检测到的。

2008-09-17 12:12:33

查看谷歌Collections Library总是一个好主意。在这种情况下，Multiset将做的伎俩:

Multiset bag = Multisets.newHashMultiset();
String word = "foo";
bag.add(word);
bag.add(word);
System.out.println(bag.count(word)); // Prints 2

有类似map的方法用于遍历键/条目等。在内部实现目前使用HashMap<E, AtomicInteger>，所以您不会产生装箱成本。

2008-09-17 16:58:25

在Java中增加Map值的最有效方法

推荐文章

最新文章

标签