“希希敬敬对”团队作业——敏捷冲刺5
生活随笔
收集整理的這篇文章主要介紹了
“希希敬敬对”团队作业——敏捷冲刺5
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
“希希敬敬對”百度貼吧小爬蟲任務計劃:今天的團隊討論照片:
今天討論照片:
?
?
? ?龍江騰(隊長) 201810775001
?完成“把10個頁面的數據整合到一個數據組中,并進行排序”的功能,明天完成爬下的發帖主題人信息進行圖形化顯示的review。
?? 楊希? ? ? ? ? ? ? ? ? ?201810812008
?完成“把10個頁面的數據整合到一個數據組中,并進行排序”的代碼review,明天完成爬下的發帖主題人信息進行圖形化顯示。
? 何敬上 201810812004
?完成“把10個頁面的數據整合到一個數據組中,并進行排序”的功能,明天完成爬下的發帖主題人信息進行圖形化顯示的review。
遇到的問題:
暫無
燃盡圖:
?
?
程序代碼(基于昨天代碼的基礎上的更新):
#分析獲取到的字符串????def?__analysis(self,?htmls):
????????#root_html獲取包含了主題作者和帖子回復數關鍵字的標簽
????????root_html?=?re.findall(BDTBCrawler.root_pattern,?htmls)
????????#用anchors這個列表來存放提取出來的主題作者和帖子回復數組成的字典
????????anchors?=?[]
????????for?html?in?root_html:
????????????#?提取主題作者(列表類型),并將其轉換成字符串
????????????name?=?re.findall(BDTBCrawler.name_pattern,?html)
????????????name?=?str(name[0])
????????????#?#提取回復數(列表類型),并將其轉換成整形數字
????????????number?=?re.findall(BDTBCrawler.num_pattern,?html)
????????????number?=?int(number[0])
????????????#用來記錄列表的遍歷過程中其子元素——字典中是否有與當前name相同的key值
????????????flag?=?False
????????????#?遍歷anchors列表,如果有相同的主題作者執行回復數累加操作
????????????for?i?in?anchors:
????????????????if?name?==?i['name']:
????????????????????number?=?i['number']?+?number
????????????????????#?print(number)
????????????????????i.update({'name':i['name'],?'number':number})
????????????????????flag?=?True?????#有與當前作者相同的主題作者
????????????????????break
????????????if?flag?==?False:
????????????????anchor?=?{'name':?name,?'number':?number}
????????????????anchors.append(anchor)
????????????#?print(anchors)
????????return?anchors
????#排序算法
????def?__sort(self,?anchors):
????????anchors?=?sorted(anchors,?key=lambda?d:?d['number'],?reverse=True)
????????return?anchors
程序運行結果部分截圖:
轉載于:https://www.cnblogs.com/xiaoyoushang/p/10030312.html
總結
以上是生活随笔為你收集整理的“希希敬敬对”团队作业——敏捷冲刺5的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux查看版本当前操作系统内核信息
- 下一篇: 软工1816 · Alpha冲刺(9/1