您的位置:首页 >> 编程开发 >> Java >> Java基础 >> Eclipse >> 正文
Eclipse RSS
 

Eclipse 的字符串分区共享优化机制

http://www.rdxx.com 05年01月31日 12:12 Blog 我要投稿

关键词: 字符串 , 优化机制 , Eclipse , 分区 , 共享 , IP , 优化 , 字符
 
原文:http://www.blogcn.com/User8/flier_lu/blog/6018564.html

Java/C# 这样基于引用语义处理字符串的语言中,作为不可变对象存在的字符串,如果内容相同,则可以通过某种机制实现重用。因为对这类语言来说,指向内存中两块内存位置不同内容相同的字符串,与同时指向一个字符串并没有任何区别。特别是对大量使用字符串的 XML 文件解析类似场合,这样的优化能够很大程度上降低程序的内存占用,如 SAX 解析引擎标准中就专门定义了一个 http://xml.org/sax/features/string-interning 特性用于字符串重用。
在语言层面,Java/C# 中都直接提供了 String.Intern 的支持。其中 C# 中优化的相关信息,可以参考我另外一篇文章《CLR中字符串不变性的优化》
而对 Java 来说,实现上的非常类似。由 String.intern 方法,将当前字符串以内容为键,对象引用为值,放入一个全局性的哈希表中。
java代码: 


//
// java/lang/String.java
//
public final class String
{
  //...

  public native String intern(); // 使用 JNI 函数实现以保障效率
}

//
// hotspot/src/share/vm/prims/jvm.cpp
//
JVM_ENTRY(jstring, JVM_InternString(JNIEnv *env, jstring str))
  JVMWrapper("JVM_InternString");
  if (str == NULL) return NULL;
  oop string = JNIHandles::resolve_non_null(str);       // 将引用解析为内部句柄
  oop result = StringTable::intern(string, CHECK_0);    // 进行实¼实淖址® intern 操作
  return (jstring) JNIHandles::make_local(env, result); // 获取内部句柄的引用
JVM_END

//
// hotspot/src/share/vm/memory/symbolTable.cpp
//
oop StringTable::intern(oop string, TRAPS)
{
  if (string == NULL) return NULL;
  ResourceMark rm(THREAD)// 保护线程资源区域
  int length;
  Handle h_string (THREAD, string);
  jchar* chars = java_lang_String::as_unicode_string(string, length); // 获取实际字符串内容
  oop result = intern(h_string, chars, length, CHECK_0);              // 完成字符串 intern 操作
  return result;
}

oop StringTable::intern(Handle string_or_null, jchar* name, int len, TRAPS)
{
  int hashValue = hash_string(name, len);           // 首先根据字符串内容计算哈希值
  stringTableBucket* bucket = bucketFor(hashValue); // 根据哈希值获取目标容器

  oop string = bucket->lookup(name, len);           // 然后检测字符串是否已经存在

  // Found
  if (string != NULL) return string;

  // Otherwise, add to symbol to table
  return basic_add(string_or_null, name, len, hashValue, CHECK_0)// 将字符串放入哈希表
}


对全局字符串表中的字符串,是没有办法显式手动清除的。只能在不使用此字符串后,由垃圾回收线程在进行不可达对象标记时进行分析,并最终调用 StringTable::unlink 方法去遍历清除。
java代码: 


//
// hotspot/src/share/vm/memory/genMarkSweep.cpp
//
void GenMarkSweep::mark_sweep_phase1(...)
{
  //...

  StringTable::unlink();
}

//
// hotspot/src/share/vm/memory/symbolTable.cpp
//
void StringTable::unlink() {
  // Readers of the string table are unlocked, so we should only be
  // removing entries at a safepoint.
  assert(SafepointSynchronize::is_at_safepoint(), "must be at safepoint")
  for (stringTableBucket* bucket = firstBucket(); bucket <= lastBucket(); bucket++) {
    for (stringTableEntry** p = bucket->entry_addr(); *p != NULL;) {
      stringTableEntry* entry = *p;
      assert(entry->literal_string() != NULL, "just checking");
      if (entry->literal_string()->is_gc_marked()) { // 字符串对象是否可达
        // Is this one of calls those necessary only for verification? (DLD)
        entry->oops_do(&MarkSweep::follow_root_closure);
        p = entry->next_addr();
      } else { // 如不可达则将其内存块回收到内存池中
        *p = entry->next();
        entry->set_next(free_list);
        free_list = entry;
      }
    }
  }
}


通过上面的代码,我们可以直观了解到,对 JVM (Sun JDK 1.4.2) 来说,String.intern 提供的是全局性的基于哈希表的共享支持。这样的实现虽然简单,并能够在最大限度上进行字符串共享;但同时也存在共享粒度太大,优化效果无法度量,大量字符串可能导致全局字符串表性能降低等问题。

共5页  1 2 3 4 5


 
 
标签: 字符串 , 优化机制 , Eclipse , 分区 , 共享 , IP , 优化 , 字符 打印本文
 
 
  热点搜索
 
 
 



Valid XHTML 1.0 Transitional
Copyright ©2005 - 2008 Rdxx.Com,All Rights Reserved
收藏本页
收藏本站