Python中哈希结构有哪几种?

Python中哈希结构有哪几种?
Python中哈希结构有哪几种?

在对哈希结构的讨论上,我们对于已经在数组中有所使用,简单的来说就是通过下标定位某一种数据的方法。那么,我们学习的一些python知识点,也会体现出一些哈希结构。本篇所要讲的是字典和集合这两种,关于具体的哈希结构会就这两个方面分别展开介绍,大季家一起来看看内容。

1、字典

PyDictKeysObject定义了字典哈希表的一些字段。其中有两个数组 dk_indices[] 和 dk_entries[],这两个便是真正的存储数据的数组。kv 数据保存在dk_entries[]数组中,dk_indices[]来存储 kv 数据在dk_enties数组中保存的索引。其中每个 kv 数据以entry的数据结构来存储,如下:

typedef struct {
    /* Cached hash code of me_key. */
    Py_hash_t me_hash;
    PyObject *me_key;
    PyObject *me_value; /* This field is only meaningful for combined tables */
} PyDictKeyEntry;

me_hash缓存存 key 的哈希值,防止哈希值的重复计算。me_key和me_value便是 key 和 value 的真正数据了。

2、集合

集合和字典一样,底层也是哈希结构,和字典相比,可理解为只有 key,没有 values。

相比字典,集合简单了不少。在PySetObject中直接保存了存储数据的数组。

根据集合的底层数据结构分析,它解决哈希冲突也是使用的「开发寻址法」。

集合的一些常用操作:

# 初始化
s1 = {'1', '2', '3'}  # 不推荐,当元素中有字典时,会报错
s2 = set(['1', '4', '5'])
print(s1)  # {'3', '1', '2'}
print(s2)  # {'3', '1', '2'}
 
# 交集
print(s1&s2)  # {'1'}
# 并集
print(s1|s2)  # {'3', '5', '4', '2', '1'}
# 差集
print(s1 - s2)  # {'3', '2'}
# 判断子集和超集
s2.issubset(s1)   # s2 是否为s1 的子集
s1.issuperset(s2)  # s1 是否为 s2 的超集
 
# 集合的一些内建方法
# set.add(obj) 添加集合元素
# set.remove(obj) 删除集合元素
# set.update(set) 合并集合
# set.pop() 随机删除一个元素,并返回该元素

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注