當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Automatic Summarization of Bug Reports

發(fā)布時(shí)間：2025/7/14 编程问答 24 豆豆

生活随笔收集整理的這篇文章主要介紹了 Automatic Summarization of Bug Reports 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

?CONTENT:

example : KDE bug report:

https://bugs.kde.org/show_bug.cgi?id=188311

(其中還有很多comments沒顯示) 構(gòu)建分類器，對(duì)comments中的每一句話（sentence）進(jìn)行二分類。其中，0代表不選入summary，1代表選入summary。最終，生成對(duì)bug report的答案：

研究問題：

實(shí)驗(yàn)方法：

1.找一幫人（10個(gè)人），對(duì)5個(gè)開源項(xiàng)目（Eclipse，Platform，Gnome，Mozilla和KDE）的bug report進(jìn)行人工的總結(jié)，最后對(duì)每個(gè)bug report，總結(jié)出所謂的gold standard summary(GSS)。

2.根據(jù)語料庫的不同（email，email&meeting data，bug report data），定義統(tǒng)一的特征，分別建立三個(gè)分類器。

為什么選擇email和meeting data，是因?yàn)?#xff0c;他們都屬于conversation（類似于對(duì)話的形式）的數(shù)據(jù)。

所謂的conversation features：

特別地，對(duì)于第一個(gè)分類器，基于email threads:

第二個(gè)分類器，基于email threads和meeting：

第三個(gè)分類器，基于bug report：

采用一部分bug report拿來做訓(xùn)練，每句話同時(shí)由三個(gè)人看過。0代表沒有一個(gè)人將這句話納入gold standard summary，1代表只有一個(gè)人將這句話納入gold standard summary，以此類推。。。

因此，2和3（≥2）表示為positive sentence。

3.對(duì)于同一個(gè)（新的）bug report，三個(gè)不同的分類器都會(huì)生成三個(gè)不同的summary。

將其與gold standard summary進(jìn)行比較，看看哪個(gè)更接近gold。

?個(gè)人觀點(diǎn)：

對(duì)于bug report的summary，更多應(yīng)該針對(duì)于具體的內(nèi)容而言，而其中的一些feature，例如，word count，position等顯然沒有十分豐富的意義，更多應(yīng)該考慮一些語義方面的信息轉(zhuǎn)化成為可以量化的feature。

?備注：TSE2013

轉(zhuǎn)載于:https://www.cnblogs.com/XBWer/p/6417522.html

總結(jié)

以上是生活随笔為你收集整理的Automatic Summarization of Bug Reports的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： oracle case when及dec
下一篇： CloudStack学习-2