python数据框 命名_Python-根据列值将数据框分为多个数据框,并用这些值命名 - python...
我有一個(gè)大型數(shù)據(jù)集,列出了在全國不同地區(qū)銷售的競(jìng)爭(zhēng)對(duì)手產(chǎn)品。我希望通過使用這些新數(shù)據(jù)幀名稱中的列值的迭代過程,根據(jù)區(qū)域?qū)⒃摂?shù)據(jù)幀分成幾個(gè)其他區(qū)域,以便我可以分別處理每個(gè)數(shù)據(jù)幀-例如根據(jù)價(jià)格對(duì)每個(gè)地區(qū)的信息進(jìn)行排序,以了解每個(gè)地區(qū)的市場(chǎng)情況。我給出了以下數(shù)據(jù)的簡(jiǎn)化版本:
Competitor Region ProductA ProductB
Comp1 A £10 £15
Comp1 B £11 £16
Comp1 C £11 £15
Comp2 A £9 £16
Comp2 B £12 £14
Comp2 C £14 £17
Comp3 A £11 £16
Comp3 B £10 £15
Comp3 C £12 £15
我可以使用以下內(nèi)容創(chuàng)建區(qū)域列表:
region_list=df['Region'].unique().tolist()
我希望在產(chǎn)生大量數(shù)據(jù)幀的迭代循環(huán)中使用它,例如
df_A :
Competitor Region ProductA ProductB
Comp1 A £10 £15
Comp2 A £9 £16
Comp3 A £11 £16
我可以使用代碼針對(duì)每個(gè)區(qū)域手動(dòng)執(zhí)行此操作
df_A=df.loc[df['Region']==A]
但是實(shí)際情況是,該數(shù)據(jù)集包含大量區(qū)域,這會(huì)使此代碼變得乏味。有沒有一種方法可以創(chuàng)建可重復(fù)此過程的迭代循環(huán)?有一個(gè)類似的問題詢問有關(guān)拆分?jǐn)?shù)據(jù)幀的問題,但答案并未顯示如何根據(jù)每個(gè)列的值來標(biāo)記輸出。
我對(duì)Python還是很陌生,并且仍然在學(xué)習(xí),因此,如果實(shí)際上有另一種更明智的方法來解決此問題,那么我很樂意提出建議。
參考方案
通過不同值進(jìn)行子集稱為groupby,如果僅想通過for循環(huán)遍歷各個(gè)組,則語法為:
for region, df_region in df.groupby('Region'):
print(df_region)
Competitor Region ProductA ProductB
0 Comp1 A £10 £15
3 Comp2 A £9 £16
6 Comp3 A £11 £16
Competitor Region ProductA ProductB
1 Comp1 B £11 £16
4 Comp2 B £12 £14
7 Comp3 B £10 £15
Competitor Region ProductA ProductB
2 Comp1 C £11 £15
5 Comp2 C £14 £17
8 Comp3 C £12 £15
pandas DataFrame:根據(jù)另一列中的布爾值計(jì)算總和 - python
我對(duì)Python相當(dāng)陌生,我嘗試在pandas中模擬以下邏輯我目前正在循環(huán)拋出行,并希望對(duì)前幾行的AMOUNT列中的值求和,但只求和最后一次看到的“ TRUE”值。實(shí)際數(shù)據(jù)似乎效率低下(我的數(shù)據(jù)框大約有500萬行)?想知道用Python處理這種邏輯的有效方法是什么?邏輯:邏輯是,如果FLAG為TRUE,我想對(duì)前幾行的AMOUNT列中的值求和,但只求和最后一次…Pandas Dataframe:在越來越多的列上循環(huán)并計(jì)算均值和標(biāo)準(zhǔn)差 - python
基本上,我有一個(gè)包含20個(gè)屬性和一個(gè)值的表。我想找到std = 0-(即粒度級(jí)別完美允許1:1)所需的最少數(shù)量的屬性。我想建立一個(gè)循環(huán)如果使用列名進(jìn)行硬編碼,則看起來像這樣:for iter in range(1,21): dfcalc = df.groupby("LINE_NUM")["RATIO"].agg([np…pandas.DataFrame.replace更改列的dtype - python
因此,我試圖用np.nan替換數(shù)據(jù)框中的None值,并注意到在此過程中,即使數(shù)據(jù)框中的float列的數(shù)據(jù)類型不包含任何丟失的數(shù)據(jù),它們也都更改為object。舉個(gè)例子:import pandas as pd import numpy as np data = pd.DataFrame({'A':np.nan,'B':1…重命名默認(rèn)ID python - python
我想連接兩個(gè)dataFrames,但是兩個(gè)數(shù)據(jù)具有不同的ID,所以結(jié)果是錯(cuò)誤的這是我的代碼data=pd.DataFrame(df.columns) data1=data.drop(axis=1,index=[0,1,2,3]).transpose() data1 這是dataframe1另一個(gè)數(shù)據(jù)框:y=sma_algo(df.loc['H+L&…Python GPU資源利用 - python
我有一個(gè)Python腳本在某些深度學(xué)習(xí)模型上運(yùn)行推理。有什么辦法可以找出GPU資源的利用率水平?例如,使用著色器,float16乘法器等。我似乎在網(wǎng)上找不到太多有關(guān)這些GPU資源的文檔。謝謝! 參考方案 您可以嘗試在像Renderdoc這樣的GPU分析器中運(yùn)行pyxthon應(yīng)用程序。它將分析您的跑步情況。您將能夠獲得有關(guān)已使用資源,已用緩沖區(qū),不同渲染狀態(tài)上…
總結(jié)
以上是生活随笔為你收集整理的python数据框 命名_Python-根据列值将数据框分为多个数据框,并用这些值命名 - python...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: url获取网站信息不包含网页源文件内的标
- 下一篇: ttc转换ttf字体在线_R 语言画图中