JDK9对String字符串的新一轮优化，不可不知

本文转载自微信公众号「程序新视界」，作者二师兄。转载本文请联系程序新视界公众号。

创新互联专注为客户提供全方位的互联网综合服务，包含不限于网站制作、做网站、河曲网络推广、小程序开发、河曲网络营销、河曲企业策划、河曲品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等，从售前售中售后，我们都将竭诚为您服务，您的肯定，是我们最大的嘉奖；创新互联为所有大学生创业者提供河曲建站搭建服务，24小时服务热线：18980820575，官方网址：www.cdcxhl.com

String类可以说是Java编程中使用最多的类了，如果能对String字符串的性能进行优化，那么程序的性能必然能大幅提升。

这不JDK9就对String字符串进行了改进升级，在某些场景下可以让String字符串内存减少一半，进而减少JVM的GC次数。

String的底层存储

在面试的时候我们通常会说String字符串有不可变的特性，每次都要创建新的字符串。那么，为什么String字符串是不可变的呢?

先来看一下String字符串的底层存储结构：

 
 
 
  
  
  public final class String   
  
      implements java.io.Serializable, Comparable, CharSequence {   
  
         
  
      private final char value[];   
  
     
  
      public String() {   
  
          this.value = "".value;   
  
      }   
  
     
  
      public String(String original) {   
  
          this.value = original.value;   
  
          this.hash = original.hash;   
  
      }   
  
      // ...   
  
  }

看到什么了?当我们new一个String对象时，对应的字符串其实是以char数组的形式存储在String对象内部。而这个char数组是final的，也就是说不可变的。

这也就是为什么我们说String字符串拥有不可变的特性，当字符串改变了，char数组不可变，就只能创建一个新的对象，新的char数组了。

底层存储的优化

上面说的情况是JDK8及以前版本，到了JDK9，String中字符串的存储不再用char数组了，改用byte数组。

 
 
 
  
  
  public final class String   
  
      implements java.io.Serializable, Comparable, CharSequence {   
  
     
  
      @Stable   
  
      private final byte[] value;   
  
     
  
      private final byte coder;   
  
         
  
      @Native static final byte LATIN1 = 0;   
  
      @Native static final byte UTF16  = 1;   
  
         
  
      static final boolean COMPACT_STRINGS;   
  
       
  
      public String() {   
  
          this.value = "".value;   
  
          this.coder = "".coder;   
  
      }   
  
     
  
      @HotSpotIntrinsicCandidate   
  
      public String(String original) {   
  
          this.value = original.value;   
  
          this.coder = original.coder;   
  
          this.hash = original.hash;   
  
      }   
  
         
  
      // ...   
  
  }

不仅将char数组改为byte数组，而且新增了一个coder的成员变量。

在程序中，绝大多数字符串只包含英文字母数字等字符，使用Latin-1编码，一个字符占用一个byte。如果使用char，一个char要占用两个byte，会占用双倍的内存空间。

但是，如果字符串中使用了中文等超出Latin-1表示范围的字符，使用Latin-1就没办法表示了。这时JDK会使用UTF-16编码，那么占用的空间和旧版(使用char[])是一样的。

coder变量代表编码的格式，目前String支持两种编码格式Latin-1和UTF-16。Latin-1需要用一个字节来存储，而UTF-16需要使用2个字节或者4个字节来存储。

据说这一改进方案是JDK的开发人员用大数据和人工能智能，调研了成千上万的应用程序的heapdump信息后，得出：大部分的String都是以Latin-1字符编码来表示的，只需要一个字节存储就够了，两个字节完全是浪费。

COMPACT_STRINGS属性则是用来控制是否开启String的compact功能。默认情况下是开启的。可以使用-XX:-CompactStrings参数来对此功能进行关闭。

改进的好处

改进的好处是非常明显的，首先如果项目中使用Latin-1字符集居多，内存的占用大幅度减少，同样的硬件配置可以支撑更多的业务。

当内存减少之后，进一步导致减少GC次数，进而减少Stop-The-World的频次，同样会提升系统的性能。

小结

随着JDK的迭代String字符串的内存结构及方法等也在不断地进行演变。这是因为String字符串往往是JVM中占用内存最多的类，通过对它的改造升级，对性能的提升会更加明显。

名称栏目：JDK9对String字符串的新一轮优化，不可不知
网页网址：http://www.36103.cn/qtweb/news12/8012.html

网站建设、网络推广公司-创新互联，是专注品牌与效果的网站制作，网络营销seo公司；服务项目有等

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容