python如何实现驻留字符串?

python如何实现驻留字符串?
python如何实现驻留字符串?

驻留字符串的原因

字符串驻留提高了字符串比较的速度。若未驻留,则当我们要比较两个字符串是否相等时,其时间复杂度会升至O(n),也就是说,需要检查两个字符串中的每一个字符,以确定它们是否相等。

驻留字符串的原理

如果字符串是固定的,那么因为相同的字符串将使用相同的对象引用,所以只要检查指针是否相同,就可以确定两个字符串是否相等,而不必再逐个检查每个字符。因为这是一种非常常见的操作,所以通常会将它作为指针相等检查来实现,只使用一条完全没有内存引用的机器指令。

String驻留可以减少内存占用。Python避免了内存中充满过多的字符串对象,并通过共享和重用已定义对象来优化内存占用。

实现驻留字符串:使用PyUnicode_InternInPlace函数

  void
  PyUnicode_InternInPlace(PyObject **p)
  {
      PyObject *s = *p;
 
      .........
 
      // Lazily build the dictionary to hold interned Strings
      if (interned == NULL) {
          interned = PyDict_New();
          if (interned == NULL) {
              PyErr_Clear();
              return;
          }
      }
 
      PyObject *t;
 
      // Make an entry to the interned dictionary for the
      // given object
      t = PyDict_SetDefault(interned, s, s);
 
      .........
 
      // The two references in interned dict (key and value) are
      // not counted by refcnt.
      // unicode_dealloc() and _PyUnicode_ClearInterned() take
      // care of this.
      Py_SET_REFCNT(s, Py_REFCNT(s) - 2);
 
      // Set the state of the string to be INTERNED
      _PyUnicode_STATE(s).interned = SSTATE_INTERNED_MORTAL;
  }

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注