我有一个关于Java中字符串的简单问题。下面这段简单的代码只是连接两个字符串,然后用==比较它们。

String str1="str";
String str2="ing";
String concat=str1+str2;

System.out.println(concat=="string");

比较表达式concat=="string"显然返回false(我理解equals()和==之间的区别)。


当这两个字符串被声明为final时,

final String str1="str";
final String str2="ing";
String concat=str1+str2;

System.out.println(concat=="string");

比较表达式concat=="string",在这种情况下返回true。为什么期末考试很重要?这和实习生的数量有关系吗还是我被误导了?


当你将一个String(不可变的)变量声明为final,并用一个编译时常量表达式初始化它时,它也会变成一个编译时常量表达式,它的值会被使用它的编译器内联。因此,在你的第二个代码示例中,在内联值之后,字符串连接被编译器翻译为:

String concat = "str" + "ing";  // which then becomes `String concat = "string";`

当与"string"比较时,你会得到true,因为字符串字面量是被拘禁的。

从JLS§4.12.4 -最终变量:

基元类型或String类型的变量,是final的,并由编译时常量表达式初始化(§15.28),称为常量变量。

也来自JLS§15.28 -常量表达式:

String类型的编译时常量表达式总是被“实习”,以便使用String#intern()方法共享唯一的实例。


在第一个代码示例中不是这样,其中String变量不是final变量。因此,它们不是编译时常数表达式。那里的连接操作将延迟到运行时,从而导致创建一个新的String对象。您可以通过比较两段代码的字节代码来验证这一点。

第一个代码示例(非最终版本)被编译为以下字节代码:

  Code:
   0:   ldc     #2; //String str
   2:   astore_1
   3:   ldc     #3; //String ing
   5:   astore_2
   6:   new     #4; //class java/lang/StringBuilder
   9:   dup
   10:  invokespecial   #5; //Method java/lang/StringBuilder."<init>":()V
   13:  aload_1
   14:  invokevirtual   #6; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
   17:  aload_2
   18:  invokevirtual   #6; //Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
   21:  invokevirtual   #7; //Method java/lang/StringBuilder.toString:()Ljava/lang/String;
   24:  astore_3
   25:  getstatic       #8; //Field java/lang/System.out:Ljava/io/PrintStream;
   28:  aload_3
   29:  ldc     #9; //String string
   31:  if_acmpne       38
   34:  iconst_1
   35:  goto    39
   38:  iconst_0
   39:  invokevirtual   #10; //Method java/io/PrintStream.println:(Z)V
   42:  return

显然,它将str和ing存储在两个单独的变量中,并使用StringBuilder执行连接操作。

然而,你的第二个代码示例(最终版本)看起来像这样:

  Code:
   0:   ldc     #2; //String string
   2:   astore_3
   3:   getstatic       #3; //Field java/lang/System.out:Ljava/io/PrintStream;
   6:   aload_3
   7:   ldc     #2; //String string
   9:   if_acmpne       16
   12:  iconst_1
   13:  goto    17
   16:  iconst_0
   17:  invokevirtual   #4; //Method java/io/PrintStream.println:(Z)V
   20:  return

因此,它直接内联最后一个变量,在编译时创建String String,由第0步中的ldc操作加载。然后第7步中的ldc操作加载第二个字符串字面值。它不涉及在运行时创建任何新的String对象。String在编译时就已经知道了,它们会被存储。


根据我的研究,所有最终的字符串都是在Java中存储的。其中一篇博文写道:

因此,如果你真的需要使用==或!=来比较两个String,请确保在进行比较之前调用String.intern()方法。否则,总是首选String.equals(String)进行字符串比较。

这意味着如果你调用String.intern(),你可以使用==运算符比较两个字符串。但这里String.intern()不是必需的,因为在Java中final String是内部实习的。

你可以使用==操作符和Javadoc for String.intern()方法找到更多的字符串比较信息。

更多信息请参考这篇Stackoverflow文章。


如果你看一下这个方法

public void noFinal() {
    String str1 = "str";
    String str2 = "ing";
    String concat = str1 + str2;

    System.out.println(concat == "string");
}

public void withFinal() {
    final String str1 = "str";
    final String str2 = "ing";
    String concat = str1 + str2;

    System.out.println(concat == "string");
}

并使用javap -c ClassWithTheseMethods反编译 你将看到的版本

  public void noFinal();
    Code:
       0: ldc           #15                 // String str
       2: astore_1      
       3: ldc           #17                 // String ing
       5: astore_2      
       6: new           #19                 // class java/lang/StringBuilder
       9: dup           
      10: aload_1       
      11: invokestatic  #21                 // Method java/lang/String.valueOf:(Ljava/lang/Object;)Ljava/lang/String;
      14: invokespecial #27                 // Method java/lang/StringBuilder."<init>":(Ljava/lang/String;)V
      17: aload_2       
      18: invokevirtual #30                 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
      21: invokevirtual #34                 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      ...

and

  public void withFinal();
    Code:
       0: ldc           #15                 // String str
       2: astore_1      
       3: ldc           #17                 // String ing
       5: astore_2      
       6: ldc           #44                 // String string
       8: astore_3      
       ...

所以如果字符串不是最终的编译器将不得不使用StringBuilder连接str1和str2

String concat=str1+str2;

将被编译为

String concat = new StringBuilder(str1).append(str2).toString();

这意味着concat将在运行时创建,因此不会来自String池。


同样,如果字符串是final,那么编译器可以假设它们永远不会改变,而不是使用StringBuilder,它可以安全地连接它的值

String concat = str1 + str2;

可更改为

String concat = "str" + "ing";

并连接成

String concat = "string";

这意味着concate将变成sting字面量,它将被存储在字符串池中,然后在if语句中与该池中的相同字符串字面量进行比较。


让我们看看最后一个示例的一些字节代码

Compiled from "Main.java"
public class Main {
  public Main();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]) throws java.lang.Exception;
    Code:
       0: ldc           #2                  // String string
       2: astore_3
       3: getstatic     #3                  // Field java/lang/System.out:Ljava/io/PrintStream;
       6: aload_3
       7: ldc           #2                  // String string
       9: if_acmpne     16
      12: iconst_1
      13: goto          17
      16: iconst_0
      17: invokevirtual #4                  // Method java/io/PrintStream.println:(Z)V
      20: return
}

在0:和2:,字符串“String”被压入堆栈(从常量池),并直接存储到本地变量concat中。你可以推断编译器在编译时创建(连接)String " String "本身。

非最终字节码

Compiled from "Main2.java"
public class Main2 {
  public Main2();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]) throws java.lang.Exception;
    Code:
       0: ldc           #2                  // String str
       2: astore_1
       3: ldc           #3                  // String ing
       5: astore_2
       6: new           #4                  // class java/lang/StringBuilder
       9: dup
      10: invokespecial #5                  // Method java/lang/StringBuilder."<init>":()V
      13: aload_1
      14: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/Stri
ngBuilder;
      17: aload_2
      18: invokevirtual #6                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/Stri
ngBuilder;
      21: invokevirtual #7                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
      24: astore_3
      25: getstatic     #8                  // Field java/lang/System.out:Ljava/io/PrintStream;
      28: aload_3
      29: ldc           #9                  // String string
      31: if_acmpne     38
      34: iconst_1
      35: goto          39
      38: iconst_0
      39: invokevirtual #10                 // Method java/io/PrintStream.println:(Z)V
      42: return
}

这里有两个String常量,"str"和"ing",需要在运行时用StringBuilder连接起来。


堆栈和字符串包含池的概念


但是,当您使用Java的String文字表示法进行创建时,它会自动调用intern()方法将该对象放入String池中,前提是该对象还没有出现在池中。

为什么期末考试很重要?

编译器知道最终变量永远不会改变,当我们添加这些最终变量输出到字符串池,因为str1 + str2表达式输出也永远不会改变,所以最后编译器调用inter方法后,上述两个最终变量的输出。对于非final变量,编译器不调用intern方法。