在Java中增加Map值的最有效方法

我希望这个问题对这个论坛来说不是太基本的，但我们会看到的。我想知道如何重构一些代码以获得更好的性能，这是运行了很多次。

假设我正在使用Map(可能是HashMap)创建一个词频列表，其中每个键都是一个包含要统计的单词的String，值是一个Integer，该Integer在每次找到单词的标记时递增。

在Perl中，增加这样一个值非常简单:

$map{$word}++;

但在Java中，这要复杂得多。下面是我目前的做法:

int count = map.containsKey(word) ? map.get(word) : 0;
map.put(word, count + 1);

这当然依赖于新Java版本中的自动装箱特性。我想知道您是否可以建议一种更有效的方法来增加这个值。是否有更好的性能理由避开Collections框架而使用其他框架呢?

更新:我已经对几个答案做了测试。见下文。

当前回答

番石榴是你的朋友…

.．.至少在某些情况下是这样。他们有这个很好的AtomicLongMap。特别好，因为你在地图上处理的是长值。

E.g.

AtomicLongMap<String> map = AtomicLongMap.create();
[...]
map.getAndIncrement(word);

也可以在值上增加多于1的值:

map.getAndAdd(word, 112L);

2012-09-04 15:08:39

其他回答

作为我自己评论的后续:Trove看起来是可行的。如果出于某种原因，您希望坚持使用标准JDK，那么ConcurrentMap和AtomicLong可以使代码稍微好一点，不过使用YMMV。

    final ConcurrentMap<String, AtomicLong> map = new ConcurrentHashMap<String, AtomicLong>();
    map.putIfAbsent("foo", new AtomicLong(0));
    map.get("foo").incrementAndGet();

将在foo的map中保留1作为值。实际上，增加线程的友好性是这种方法所推荐的。

2008-09-17 09:40:23

MutableInt方法的一个变体可能更快，如果有点hack，是使用一个单元素int数组:

Map<String,int[]> map = new HashMap<String,int[]>();
...
int[] value = map.get(key);
if (value == null) 
  map.put(key, new int[]{1} );
else
  ++value[0];

如果您可以使用此变体重新运行性能测试，那将非常有趣。这可能是最快的。

编辑:上面的模式对我来说很好，但最终我改变使用Trove的集合来减少我正在创建的一些非常大的地图的内存大小——作为奖励，它也更快。

一个非常好的特性是TObjectIntHashMap类有一个单独的adjustOrPutValue调用，根据该键是否已经有一个值，它将放置一个初始值或增加现有值。这对于增量来说是完美的:

TObjectIntHashMap<String> map = new TObjectIntHashMap<String>();
...
map.adjustOrPutValue(key, 1, 1);

2012-07-02 03:29:28

另一种方法是创建一个可变整数:

class MutableInt {
  int value = 0;
  public void inc () { ++value; }
  public int get () { return value; }
}
...
Map<String,MutableInt> map = new HashMap<String,MutableInt> ();
MutableInt value = map.get (key);
if (value == null) {
  value = new MutableInt ();
  map.put (key, value);
} else {
  value.inc ();
}

当然，这意味着创建一个额外的对象，但与创建一个Integer(即使是Integer. valueof)相比，开销不应该那么多。

2008-09-17 09:47:03

希望我正确理解了你的问题，我从Python来到Java，所以我可以同情你的挣扎。

如果你有

map.put(key, 1)

你会这么做

map.put(key, map.get(key) + 1)

希望这能有所帮助!

2019-02-03 20:25:41

内存旋转在这里可能是一个问题，因为对大于或等于128的int进行装箱都会导致对象分配(参见Integer.valueOf(int))。尽管垃圾收集器非常有效地处理存在时间很短的对象，但性能会在一定程度上受到影响。

如果您知道增量的数量将大大超过键的数量(在本例中为=words)，请考虑使用int holder。Phax已经为此提供了代码。这里又是一次，有两个变化(holder类是静态的，初始值设置为1):

static class MutableInt {
  int value = 1;
  void inc() { ++value; }
  int get() { return value; }
}
...
Map<String,MutableInt> map = new HashMap<String,MutableInt>();
MutableInt value = map.get(key);
if (value == null) {
  value = new MutableInt();
  map.put(key, value);
} else {
  value.inc();
}

如果需要极致的性能，请寻找直接针对基本值类型定制的Map实现。jrudolph提到了GNU Trove。

顺便说一下，这个主题的一个很好的搜索词是“直方图”。

2008-09-17 16:25:48

在Java中增加Map值的最有效方法

推荐文章

最新文章

标签