Automatic Summarization of Bug Reports
| ? |
| ?CONTENT: example : KDE bug report: https://bugs.kde.org/show_bug.cgi?id=188311 ? (其中還有很多comments沒顯示) 構(gòu)建分類器,對(duì)comments中的每一句話(sentence)進(jìn)行二分類。其中,0代表不選入summary,1代表選入summary。 最終,生成對(duì)bug report的答案: |
| 研究問題:
|
| 實(shí)驗(yàn)方法: 1.找一幫人(10個(gè)人),對(duì)5個(gè)開源項(xiàng)目(Eclipse,Platform,Gnome,Mozilla和KDE)的bug report進(jìn)行人工的總結(jié),最后對(duì)每個(gè)bug report,總結(jié)出所謂的gold standard summary(GSS)。 2.根據(jù)語料庫的不同(email,email&meeting data,bug report data),定義統(tǒng)一的特征,分別建立三個(gè)分類器。 為什么選擇email和meeting data,是因?yàn)?#xff0c;他們都屬于conversation(類似于對(duì)話的形式)的數(shù)據(jù)。 所謂的conversation features:
特別地,對(duì)于第一個(gè)分類器,基于email threads: 第二個(gè)分類器,基于email threads和meeting: 第三個(gè)分類器,基于bug report: 采用一部分bug report拿來做訓(xùn)練,每句話同時(shí)由三個(gè)人看過。0代表沒有一個(gè)人將這句話納入gold standard summary,1代表只有一個(gè)人將這句話納入gold standard summary,以此類推。。。 因此,2和3(≥2)表示為positive sentence。 3.對(duì)于同一個(gè)(新的)bug report,三個(gè)不同的分類器都會(huì)生成三個(gè)不同的summary。 將其與gold standard summary進(jìn)行比較,看看哪個(gè)更接近gold。 |
| ?個(gè)人觀點(diǎn): 對(duì)于bug report的summary,更多應(yīng)該針對(duì)于具體的內(nèi)容而言,而其中的一些feature,例如,word count,position等顯然沒有十分豐富的意義,更多應(yīng)該考慮一些語義方面的信息轉(zhuǎn)化成為可以量化的feature。 |
| ?備注:TSE2013 |
?
?
?
?
?
?
?
?
轉(zhuǎn)載于:https://www.cnblogs.com/XBWer/p/6417522.html
總結(jié)
以上是生活随笔為你收集整理的Automatic Summarization of Bug Reports的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: oracle case when及dec
- 下一篇: CloudStack学习-2