Python--unique()与nunique()函数
生活随笔
收集整理的這篇文章主要介紹了
Python--unique()与nunique()函数
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1 unique()
統計list中的不同值時,返回的是array.它有三個參數,可分別統計不同的量,返回的都是array.
當list中的元素也是list時,盡量不要用這種方法.
import numpy as np a = [1,5,4,2,3,3,5] # 返回一個array print(np.unique(a)) # [1 2 3 4 5]# 返回該元素在list中第一次出現的索引 print(np.unique(a,return_index=True)) # (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))# 返回原list中每個元素在新的list中對應的索引 print(np.unique(a,return_inverse=True)) # (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))# 返回該元素在list中出現的次數 print(np.unique(a,return_counts=True)) # (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))# 當加參數時,unique()返回的是一個tuple,這里利用了tuple的性質,即有多少個元素即可賦值給對應的多少個變量 p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True) print(p,q,m,n) # [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]# 注意當list中的元素不是數字而是list的時候,輸出的數據類型與list中元素的長度有關 # 利用這種方法對list中元素去重或求里面元素的個數都不是好方法,很容易出錯統計series中的不同值時,返回的是array,它沒有其它參數
''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:778463939 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' import pandas as pd se = pd.Series([1,3,4,5,2,2,3]) print(se.unique()) # [1 3 4 5 2]2.nunique()
可直接統計dataframe中每列的不同值的個數,也可用于series,但不能用于list.返回的是不同值的個數.
''' 遇到問題沒人解答?小編創建了一個Python學習交流QQ群:778463939 尋找有志同道合的小伙伴,互幫互助,群里還有不錯的視頻學習教程和PDF電子書! ''' df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]}) print(df) print(df.nunique()) # A B # 0 0 0 # 1 1 5 # 2 1 6 # A 2 # B 3 # dtype: int64也可與groupby結合使用,統計每個塊的不同值的個數.
all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index() # user_id nunique # 0 40 1 # 1 56 1 # 2 98 1 # 3 103 1 # 4 122 1總結
以上是生活随笔為你收集整理的Python--unique()与nunique()函数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python3中map()函数用法
- 下一篇: python 关于异常处理 try...