列表中元素位置的索引用的是L.index

本文实例讲述了Python去除列表中重复元素的方法。分享给大家供大家参考。具体如下:

比较容易记忆的是用内置的set

l1 = ['b','c','d','b','c','a','a']
l2 = list(set(l1)) 
print (l2)

还有一种据说速度更快的,没测试过两者的速度差别

l1 = ['b','c','d','b','c','a','a']
l2 = {}.fromkeys(l1).keys() 
print (l2)

这两种都有个缺点,祛除重复元素后排序变了:

['a', 'c', 'b', 'd']

如果想要保持他们原来的排序:

用list类的sort方法

l1 = ['b','c','d','b','c','a','a']
l2 = list(set(l1)) 
l2.sort(key=l1.index) 
print (l2)

也可以这样写

#Python学习交流群:711312441
l1 = ['b','c','d','b','c','a','a'] 
l2 = sorted(set(l1),key=l1.index) 
print (l2)

也可以用遍历

l1 = ['b','c','d','b','c','a','a']
l2 = [] 
for i in l1: 
  if not i in l2: 
    l2.append(i) 
print (l2)

上面的代码也可以这样写

l1 = ['b','c','d','b','c','a','a']
l2 = [] 
[l2.append(i) for i in l1 if not i in l2] 
print (l2)

这样就可以保证排序不变了

在pythoncook里边提到的一种面向可哈希数据的取出相同元素的方法是:利用到了集合与生成器set、yield

def dedupe(items):
seen = set()
for item in items:
if item not in seen:
yield item
seen.add(item) 

不可变类型可哈希,可变类型不可哈希,对于不可哈希的数据
上述代码改成:

def dedupe(items, key=None):
seen = set()
for item in items:
val = item if key is None else key(item)
if val not in seen:
yield item
seen.add(val)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。