Python3的Counter类
1.Counter類
Counter類的目的是用來跟蹤值出現的次數。它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數作為value。計數值可以是任意的Interger(包括0和負數)。Counter類和其他語言的bags或multisets很相似。
1.1 創建
下面的代碼說明了Counter類創建的四種方法:
Counter類的創建
Python
| 1 2 3 4 5 | >>> c = Counter()??# 創建一個空的Counter類 >>> c = Counter('gallahad')??# 從一個可iterable對象(list、tuple、dict、字符串等)創建 >>> c = Counter({'a': 4, 'b': 2})??# 從一個字典對象創建 >>> c = Counter(a=4, b=2)??# 從一組鍵值對創建 ? |
1.2 計數值的訪問與缺失的鍵
當所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數。
計數值的訪問
Python
| 1 2 3 4 5 6 7 8 | >>> c = Counter("abcdefgab") >>> c["a"] 2 >>> c["c"] 1 >>> c["h"] 0 ? |
1.3 計數器的更新(update和subtract)
可以使用一個iterable對象或者另一個Counter對象來更新鍵值。
計數器的更新包括增加和減少兩種。其中,增加使用update()方法:
計數器的更新(update)
Python
| 1 2 3 4 5 6 7 8 9 | >>> c = Counter('which') >>> c.update('witch')??# 使用另一個iterable對象更新 >>> c['h'] 3 >>> d = Counter('watch') >>> c.update(d)??# 使用另一個Counter對象更新 >>> c['h'] 4 ? |
減少則使用subtract()方法:
計數器的更新(subtract)
Python
| 1 2 3 4 5 6 7 8 9 | >>> c = Counter('which') >>> c.subtract('witch')??# 使用另一個iterable對象更新 >>> c['h'] 1 >>> d = Counter('watch') >>> c.subtract(d)??# 使用另一個Counter對象更新 >>> c['a'] -1 ? |
1.4 鍵的刪除
當計數值為0時,并不意味著元素被刪除,刪除元素應當使用del。
鍵的刪除
Python
| 1 2 3 4 5 6 7 8 9 10 | >>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> c["b"] = 0 >>> c Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0}) >>> del c["a"] >>> c Counter({'c': 2, 'b': 2, 'd': 1}) ? |
1.5 elements()
返回一個迭代器。元素被重復了多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數小于1的元素不被包含。
elements()方法
Python
| 1 2 3 | >>> c = Counter(a=4, b=2, c=0, d=-2) >>> list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b'] |
1.6 most_common([n])
返回一個TopN列表。如果n沒有被指定,則返回所有元素。當多個元素計數值相同時,排列是無確定順序的。
most_common()方法
Python
| 1 2 3 4 5 | >>> c = Counter('abracadabra') >>> c.most_common() [('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)] >>> c.most_common(3) [('a', 5), ('r', 2), ('b', 2)] |
1.7 fromkeys
未實現的類方法。
1.8 淺拷貝copy
淺拷貝copy
Python
| 1 2 3 4 5 6 | >>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> d = c.copy() >>> d Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) |
1.9 算術和集合操作
+、-、&、|操作也可以用于Counter。其中&和|操作分別返回兩個Counter對象各元素的最小值和最大值。需要注意的是,得到的Counter對象將刪除小于1的元素。
Counter對象的算術和集合操作
Python
| 1 2 3 4 5 6 7 8 9 10 | >>> c = Counter(a=3, b=1) >>> d = Counter(a=1, b=2) >>> c + d??# c[x] + d[x] Counter({'a': 4, 'b': 3}) >>> c - d??# subtract(只保留正數計數的元素) Counter({'a': 2}) >>> c & d??# 交集:??min(c[x], d[x]) Counter({'a': 1, 'b': 1}) >>> c | d??# 并集:??max(c[x], d[x]) Counter({'a': 3, 'b': 2}) |
2.常用操作
下面是一些Counter類的常用操作,來源于Python官方文檔
Counter類常用操作
Python
| 1 2 3 4 5 6 7 8 9 | sum(c.values())??# 所有計數的總數 c.clear()??# 重置Counter對象,注意不是刪除 list(c)??# 將c中的鍵轉為列表 set(c)??# 將c中的鍵轉為set dict(c)??# 將c中的鍵值對轉為字典 c.items()??# 轉為(elem, cnt)格式的列表 Counter(dict(list_of_pairs))??# 從(elem, cnt)格式的列表轉換為Counter類對象 c.most_common()[:-n:-1]??# 取出計數最少的n-1個元素 c += Counter()??# 移除0和負值 |
?下面這部分內容轉自:https://www.cnblogs.com/nisen/p/6052895.html
class collections.Counter([iterable-or-mapping])
Counter?是實現的?dict?的一個子類,可以用來方便地計數。
例子
舉個計數的例子,需要統計一個文件中,每個單詞出現的次數。實現方法如下
# 普通青年 d = {} with open('/etc/passwd') as f:for line in f:for word in line.strip().split(':'):if word not in d:d[word] = 1else:d[word] += 1# 文藝青年 d = defaultdict(int)with open('/etc/passwd') as f:for line in f:for word in line.strip().split(':'):d[word] += 1# 棒棒的青年 word_counts = Counter() with open('/etc/passwd') as f:for line in f: word_counts.update(line.strip().split(':'))使用實例
可以像下面例子一樣來創建一個?Counter:
>>> c = Counter() # 創建一個新的空counter >>> c = Counter('abcasdf') # 一個迭代對象生成的counter >>> c = Counter({'red': 4, 'yello': 2}) # 一個映射生成的counter >>> c = Counter(cats=2, dogs=5) # 關鍵字參數生成的counter# counter 生成counter, 雖然這里并沒有什么用 >>> from collections import Counter >>> c = Counter('abcasd') >>> c Counter({'a': 2, 'c': 1, 'b': 1, 's': 1, 'd': 1}) >>> c2 = Counter(c) >>> c2 Counter({'a': 2, 'c': 1, 'b': 1, 's': 1, 'd': 1})因為?Counter?實現了字典的?__missing__?方法, 所以當訪問不存在的key的時候,返回值為0:
>>> c = Counter(['apple', 'pear']) >>> c['orange'] 0counter?常用的方法:
# elements() 按照counter的計數,重復返回元素 >>> c = Counter(a=4, b=2, c=0, d=-2) >>> list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b']# most_common(n) 按照counter的計數,按照降序,返回前n項組成的list; n忽略時返回全部 >>> Counter('abracadabra').most_common(3) [('a', 5), ('r', 2), ('b', 2)]# subtract([iterable-or-mapping]) counter按照相應的元素,計數相減 >>> c = Counter(a=4, b=2, c=0, d=-2) >>> d = Counter(a=1, b=2, c=3, d=4) >>> c.subtract(d) >>> c Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})# update([iterable-or-mapping]) 不同于字典的update方法,這里更新counter時,相同的key的value值相加而不是覆蓋 # 實例化 Counter 時, 實際也是調用這個方法# Counter 間的數學集合操作 >>> c = Counter(a=3, b=1, c=5) >>> d = Counter(a=1, b=2, d=4) >>> c + d # counter相加, 相同的key的value相加 Counter({'c': 5, 'a': 4, 'd': 4, 'b': 3}) >>> c - d # counter相減, 相同的key的value相減,只保留正值得value Counter({'c': 5, 'a': 2}) >>> c & d # 交集: 取兩者都有的key,value取小的那一個 Counter({'a': 1, 'b': 1}) >>> c | d # 并集: 匯聚所有的key, key相同的情況下,取大的value Counter({'c': 5, 'd': 4, 'a': 3, 'b': 2})常見做法: sum(c.values()) # 繼承自字典的.values()方法返回values的列表,再求和 c.clear() # 繼承自字典的.clear()方法,清空counter list(c) # 返回key組成的list set(c) # 返回key組成的set dict(c) # 轉化成字典 c.items() # 轉化成(元素,計數值)組成的列表 Counter(dict(list_of_pairs)) # 從(元素,計數值)組成的列表轉化成Counter c.most_common()[:-n-1:-1] # 最小n個計數的(元素,計數值)組成的列表 c += Counter() # 利用counter的相加來去除負值和0的值接下來就是leetcode的實戰
內容轉自:https://zhuanlan.zhihu.com/p/37647540
本文的內容
先通過三道題了解Counter類的強大之處。在通過兩道稍微有些難度的題熟練掌握Counter的使用。
Leetcode242-有效的字母異位詞
-題目鏈接
題目分析:
如果兩個字符串所含的字符種類以及對應的個數都相同那么就是True,相當于統計詞頻。
代碼實現:
counter實例是支持==這種操作符的。
from collections import Counter return Counter(s) == Counter(t)Leetcode451-根據字符出現頻率排序
-題目鏈接
題目分析:
根據題目的詞頻進行排序,然后再從大到小根據字符以及字符的個數組合成新的字符串。
代碼實現:
使用most_common方法
return ''.join([c *freq for c, freq in Counter(s).most_common()])Leetcode350-兩個數組的交集 II
-題目鏈接
代碼實現:
Counter實例支持python中的各種集合操作符,比如交集&并集|差集-等等。elements方法可以將整個Counter根據頻率鋪平
return list((Counter(nums1) & Counter(nums2)).elements())?
49.字母異位詞分組
-題目鏈接
題目分析:
在前面中已經提到了類似的問題,用Counter可以判斷兩個字符串是否為異位詞。那么怎么分組呢?一個想法是創建一個dict,key存Counter實例,value是一個list存放所有與key是異位詞的字符串。但是有一個問題是Counter實例是不能哈希的,不能作為key使用,這時需要使用frozenset在保證值不變的情況下存儲這個Counter實例。將Counter的鍵值對以元組的方式放入frozenset,再將這個frozenset作為key。
代碼實現:
def groupAnagrams(self, strs):from collections import Counter, defaultdictres_map = defaultdict(list)for str in strs:res_map[frozenset((k, v) for k, v in Counter(str).items())].append(str)return list(res_map.values())?
447.回旋鏢的數量
-題目鏈接
題目分析:
以每個點為中心計算其他點到這個點的距離,根據每個距離的個數計算出該距離下總共有多少種點的組合,比如一個距離下總共有4個點,那么總共的組合就有4*3=12種。將每個點每個距離每種組和加在一起就是最終結果
代碼思路:
代碼實現:
def numberOfBoomerangs(self, points):from collections import Counterlen_points = len(points)res = 0# 步驟三for i in range(len_points):counter = Counter(self._eval_dis(points[i], points[j]) for j in range(len_points) if j != i)res += self._eval_sum(counter)return res# 步驟一 def _eval_dis(self, p1, p2):"""計算兩點間的距離,由于只用于比較,不開根號了"""return sum((p1[i] - p2[i]) ** 2 for i in range(len(p1)))# 步驟二 def _eval_sum(self, hash_map):"""根據每個點對應的不同距離由多少個不同的點計算出總共的個數,比如某個距離是3就能組成3*2情況"""return sum([i * (i - 1) for i in hash_map.values() if i >= 2])總結
Counter單獨使用的例子都非常簡單,只要有關頻率的使用,都應該先想到Counter,而不是自己用dict去構建,大部分你要用的方法Counter都實現了。
總結
以上是生活随笔為你收集整理的Python3的Counter类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AI cs5序列号 注册机
- 下一篇: SQL server 数据库查询语句的基