在Java中增加Map值的最有效方法

我希望这个问题对这个论坛来说不是太基本的，但我们会看到的。我想知道如何重构一些代码以获得更好的性能，这是运行了很多次。

假设我正在使用Map(可能是HashMap)创建一个词频列表，其中每个键都是一个包含要统计的单词的String，值是一个Integer，该Integer在每次找到单词的标记时递增。

在Perl中，增加这样一个值非常简单:

$map{$word}++;

但在Java中，这要复杂得多。下面是我目前的做法:

int count = map.containsKey(word) ? map.get(word) : 0;
map.put(word, count + 1);

这当然依赖于新Java版本中的自动装箱特性。我想知道您是否可以建议一种更有效的方法来增加这个值。是否有更好的性能理由避开Collections框架而使用其他框架呢?

更新:我已经对几个答案做了测试。见下文。

当前回答

MutableInt方法的一个变体可能更快，如果有点hack，是使用一个单元素int数组:

Map<String,int[]> map = new HashMap<String,int[]>();
...
int[] value = map.get(key);
if (value == null) 
  map.put(key, new int[]{1} );
else
  ++value[0];

如果您可以使用此变体重新运行性能测试，那将非常有趣。这可能是最快的。

编辑:上面的模式对我来说很好，但最终我改变使用Trove的集合来减少我正在创建的一些非常大的地图的内存大小——作为奖励，它也更快。

一个非常好的特性是TObjectIntHashMap类有一个单独的adjustOrPutValue调用，根据该键是否已经有一个值，它将放置一个初始值或增加现有值。这对于增量来说是完美的:

TObjectIntHashMap<String> map = new TObjectIntHashMap<String>();
...
map.adjustOrPutValue(key, 1, 1);

2012-07-02 03:29:28

其他回答

作为我自己评论的后续:Trove看起来是可行的。如果出于某种原因，您希望坚持使用标准JDK，那么ConcurrentMap和AtomicLong可以使代码稍微好一点，不过使用YMMV。

    final ConcurrentMap<String, AtomicLong> map = new ConcurrentHashMap<String, AtomicLong>();
    map.putIfAbsent("foo", new AtomicLong(0));
    map.get("foo").incrementAndGet();

将在foo的map中保留1作为值。实际上，增加线程的友好性是这种方法所推荐的。

2008-09-17 09:40:23

函数Java库的TreeMap数据结构在最新的主干头中有一个更新方法:

public TreeMap<K, V> update(final K k, final F<V, V> f)

使用示例:

import static fj.data.TreeMap.empty;
import static fj.function.Integers.add;
import static fj.pre.Ord.stringOrd;
import fj.data.TreeMap;

public class TreeMap_Update
  {public static void main(String[] a)
    {TreeMap<String, Integer> map = empty(stringOrd);
     map = map.set("foo", 1);
     map = map.update("foo", add.f(1));
     System.out.println(map.get("foo").some());}}

这个程序输出“2”。

2009-05-12 22:18:35

有几种方法:

使用袋子算法，比如谷歌集合中包含的集合。创建可变容器，你可以在Map中使用:


    class My{
        String word;
        int count;
    }

并使用put(“word”，new My(“word”));然后您可以检查它是否存在，并在添加时增加。

避免使用列表来滚动您自己的解决方案，因为如果您使用内循环搜索和排序，您的性能将会非常糟糕。第一个HashMap解决方案实际上相当快，但在谷歌Collections中找到的合适的解决方案可能更好。

使用谷歌集合计数单词，看起来像这样:



    HashMultiset s = new HashMultiset();
    s.add("word");
    s.add("word");
    System.out.println(""+s.count("word") );

使用HashMultiset是非常优雅的，因为在计数单词时，袋算法正是您所需要的。

2008-09-17 09:19:50

现在在Java 8中使用Map::merge有一个更短的方法。

myMap.merge(key, 1, Integer::sum)

myMap.merge(key, 1L, Long::sum)

分别为长。

它的作用:

如果key不存在，则将1作为值否则，sum 1等于链接到key的值

更多信息请点击这里。

2017-03-07 12:49:26

MutableInt方法的一个变体可能更快，如果有点hack，是使用一个单元素int数组:

Map<String,int[]> map = new HashMap<String,int[]>();
...
int[] value = map.get(key);
if (value == null) 
  map.put(key, new int[]{1} );
else
  ++value[0];

如果您可以使用此变体重新运行性能测试，那将非常有趣。这可能是最快的。

编辑:上面的模式对我来说很好，但最终我改变使用Trove的集合来减少我正在创建的一些非常大的地图的内存大小——作为奖励，它也更快。

TObjectIntHashMap<String> map = new TObjectIntHashMap<String>();
...
map.adjustOrPutValue(key, 1, 1);

2012-07-02 03:29:28

在Java中增加Map值的最有效方法

推荐文章

最新文章

标签