不区分大小写的字符串作为HashMap键

出于以下原因，我想使用不区分大小写的字符串作为HashMap键。

在初始化过程中，我的程序用用户定义的字符串创建HashMap 在处理事件(在我的情况下是网络流量)时，我可能会在不同的情况下收到字符串，但我应该能够定位<键，值>从HashMap忽略我从流量收到的情况。

我采用了这种方法

CaseInsensitiveString.java

    public final class CaseInsensitiveString {
            private String s;

            public CaseInsensitiveString(String s) {
                            if (s == null)
                            throw new NullPointerException();
                            this.s = s;
            }

            public boolean equals(Object o) {
                            return o instanceof CaseInsensitiveString &&
                            ((CaseInsensitiveString)o).s.equalsIgnoreCase(s);
            }

            private volatile int hashCode = 0;

            public int hashCode() {
                            if (hashCode == 0)
                            hashCode = s.toUpperCase().hashCode();

                            return hashCode;
            }

            public String toString() {
                            return s;
            }
    }

LookupCode.java

    node = nodeMap.get(new CaseInsensitiveString(stringFromEvent.toString()));

因此，我为每个事件创建了CaseInsensitiveString的新对象。因此，它可能会影响性能。

有没有其他办法解决这个问题?

当前回答

我喜欢使用ICU4J的CaseInsensitiveString包装Map键，因为它照顾哈希\等于和问题，它适用于unicode\i18n。

HashMap<CaseInsensitiveString, String> caseInsensitiveMap = new HashMap<>();
caseInsensitiveMap.put("tschüß", "bye");
caseInsensitiveMap.containsKey("TSCHÜSS"); # true

2020-08-11 15:15:21

其他回答

继承HashMap的子类，并创建一个在put和get(可能还有其他面向键的方法)时小写键的版本。

或者将HashMap合成到新类中，并将所有内容委托给映射，但要转换键。

如果需要保留原始键，可以维护双映射，或者将原始键与值一起存储。

2011-11-23 03:26:40

正如Guido García在他们的回答中所建议的:

import java.util.HashMap;

public class CaseInsensitiveMap extends HashMap<String, String> {

    @Override
    public String put(String key, String value) {
       return super.put(key.toLowerCase(), value);
    }

    // not @Override because that would require the key parameter to be of type Object
    public String get(String key) {
       return super.get(key.toLowerCase());
    }
}

https://commons.apache.org/proper/commons-collections/apidocs/org/apache/commons/collections4/map/CaseInsensitiveMap.html

2011-11-23 03:36:10

因此，我为每个事件创建了CaseInsensitiveString的新对象。因此，它可能会影响性能。

创建包装器或在查找前将键转换为小写都会创建新对象。编写自己的java.util.Map实现是避免这种情况的唯一方法。这并不难，而且在我看来是值得的。我发现下面的哈希函数工作得很好，最多几百个键。

static int ciHashCode(String string)
{
    // length and the low 5 bits of hashCode() are case insensitive
    return (string.hashCode() & 0x1f)*33 + string.length();
}

2016-05-23 11:39:35

根据其他答案，基本上有两种方法:继承HashMap或包装String。第一个需要多做一些工作。事实上，如果您想正确地执行它，您必须重写几乎所有的方法(containsKey、entrySet、get、put、putAll和remove)。

不管怎样，它有一个问题。如果希望避免将来出现问题，必须在String大小写操作中指定Locale。因此，您将创建新的方法(get(String, Locale)，…)。一切都更简单，更清晰的包装字符串:

public final class CaseInsensitiveString {

    private final String s;

    public CaseInsensitiveString(String s, Locale locale) {
        this.s = s.toUpperCase(locale);
    }

    // equals, hashCode & toString, no need for memoizing hashCode
}

关于你对性能的担忧:过早的优化是万恶之源:)

2013-08-21 14:10:13

我发现需要你改变键的解决方案(例如，toLowerCase)非常不受欢迎，需要TreeMap的解决方案也不受欢迎。

由于TreeMap改变了时间复杂度(与其他hashmap相比)，我认为简单地使用O(n)的实用方法更可行:

public static <T> T getIgnoreCase(Map<String, T> map, String key) {
    for(Entry<String, T> entry : map.entrySet()) {
        if(entry.getKey().equalsIgnoreCase(key))
            return entry.getValue();
    }
    return null;
}

这就是那个方法。由于牺牲性能(时间复杂度)看起来是不可避免的，至少不需要更改底层映射以适应查找。

2022-04-04 04:19:25

不区分大小写的字符串作为HashMap键

推荐文章

最新文章

标签