HistCite 的使用方法
摘要
讀文獻自然要讀精品,在面對一個陌生領域,如何才能以最快速度定位精品文獻呢?本文將詳細介紹 HistCite 的使用方法,結合 Web of Science 和 Endnote ,演示如何在幾個小時之內,對某個陌生領域的文獻進行宏觀的梳理,并快速定位重要文獻。
前言
作為科研工作者,我們常常需要對一個陌生領域進行文獻調研。我們通常使用 Web of Science(WOS) 或者 Google Scholar 進行文獻檢索,并認為引用頻次較高的文章,就是該領域的重要文章。但是,大多數情況下,其搜索結果都不會太理想。因為所統計的引用既包括同行的,也包括外行的,而我們真正想尋找的是那些被同行引用頻次最高的文獻。同時,進入陌生領域最快速的方式無疑是看最新的綜述,但是最新綜述的引用頻次往往很低,因為發表年限太短,人們往往還沒來得及引用。所以,使用引用頻次排序的方法往往會把最新的綜述文章漏掉。再次,既然是一個陌生領域,我們很可能不知道其熱門研究方向,因此往往連用什么關鍵詞都不太清楚,在這種情況下該如何進行文獻檢索呢?
事實上,上述問題早就有了很好的解決方案——使用 HistCite 軟件,它可以幫助我們在短短幾個小時之內對陌生領域大量文獻,進行引證關聯分析,從而快速描繪出陌生領域的發展脈絡,鎖定重要文獻,找出該領域的明星科學家。
HistCite 簡介
關于 HistCite 的介紹參考羅昭鋒老師寫的《引文分析軟件 histcite 簡介》。
HistCite = History of Cite ,意為引文歷史,或者叫引文圖譜分析軟件。該軟件系SCI的發明人加菲爾德開發,能夠用圖示的方式展示某一領域不同文獻之間的關系。軟件的最新版本可以從http://www.histcite.com?網站下載。
圖1 HistCite 的界面
從?http://www.histcite.com?網站下載軟件,安裝之后,點擊 HistCite 圖標即可開啟軟件,軟件使用IE作為其界面,顯得很簡陋(圖1)。
圖2 HistCite 給出的文獻引證關系圖
但是, HistCite 的功能十分強大,最酷炫的功能就是能夠給出引證關系圖(圖2),有了這個功能,我們甚至連文章標題都不用看,就可以判斷哪些文章值得一讀。
接下來,我們用一個實例,演示如何使用 HistCite 對某個領域的文獻進行分析。例如:我最近在調研火星的地球化學研究。
從WOS獲取數據
圖3 WOS 檢索關鍵詞 “Mars”
登錄?http://www.webofknowledge.com?網站,并檢索關鍵詞 “Mars”(圖3)。需要注意的是,數據庫必須選擇 “Web of ScienceTM核心合集”。否則,檢索結果無法導出全部引文記錄,也就無法使用 HistCite 進行分析。
圖4 關鍵詞 “Mars” 的檢索結果
檢索結果有 34797 條(圖4),文獻有點多,考慮到我只關心火星的地球化學特征,所以,我們使用 “GEOCHEMISTRY GEOPHYSICS” 精煉一下,這樣就只剩下 4439 條記錄。此時,我們并不需要找全所有文獻,只需要包含大部分文獻即可。后續通過 HistCite 進行分析,重要文獻基本都跑不掉。
圖5 導出檢索結果
選擇“保存為其他文件格式”(圖5上),在彈出的對話框中(圖5下),“記錄內容”選擇“全記錄與引用的參考文獻”,“文件格式”選擇“純文本”。由于一次最多只能下載 500 條記錄,所以我們先下載第 1 至 500 條。共 4439 條記錄,共需要下載 9 次。
在 HistCite 導入數據
打開 HistCite 軟件,選擇 File -- Add File ,選擇下載的文件,點擊 Add File 按鈕導入文件(圖6)。
圖6 導入數據文件
注意:如果無法導入,(1)請把下載的 txt 文件用記事本打開,將第一行的 "FN Thomson Reuters Web of Science?VR" 替換成 "FN ISI Export FormatVR",另存為 txt 文件,編碼選擇 ANSI ;(2)確保文件的路徑中沒有中文(如圖6)。
圖7 導入成功后的界面
導入數據后,可以見到上方的 Records 中已經有了 500 條記錄(圖7)。接下來,我們依次導入其它8個數據文件。全部導入成功之后,我們可以用File -- Save As ,把所有數據存在一個(*.hci)文件中(圖8)。這樣下次導入數據就不必挨個打開 txt 文件了,直接打開此 hci 文件即可。
圖8 將所有數據另存到一個 hci 文件中
HistCite 參數介紹
圖9 HistCite 分析界面
從上方的數據可知,我們一共導入文獻 4433 條,由 7721 位作者完成,發表在 107 種雜志上,這些都好理解。需要詳細說明的是右邊的4個參數:
簡而言之, LCS 和 LCR 更重要,它們分別代表了與本領域相關聯的被引用數和引用數, LCS 值高的文章一般是重要的新發現或者新解釋, LCR 值高的一般是綜述類文章。
補充漏網文獻
在檢索文獻的時候,無論怎樣設置關鍵詞,一定會存在漏網的重要文獻。使用 HistCite ,重要文獻基本上都跑不掉。
通過界面上方的 “Cited References” (圖10),我們知道有 86924 篇文獻被全部 4433 篇文章所引用。通過點擊該鏈接,我們可以進入這 86924 篇被引文獻的列表。在這個列表中,我們發現很多文獻后面都有個綠色的“+”號,這表明這篇文獻并沒有被本地數據集收錄,也就是說通過關鍵詞搜索并沒有檢索到的文獻。每篇文獻最后有個 Recs 值,表示這篇文獻在當前數據集中被引頻次,通過 Recs 排序,我們很快就可以定位重要的被遺漏的文獻。實際上,“漏網之魚”還真不少,排名前9的文獻,有 6 篇都沒有被收錄進來。
圖10 HistCite “Cited References” 界面
接下來,我們需要把這些重要的“漏網之魚”的數據補全。首先,拷貝這篇文獻的 DOI 值,到 WOS 網站搜索(圖11)。
圖11 使用 WOS 檢索漏網文獻
然后勾選搜索到的文獻,選擇“添加到標記結果列表”(圖12)。
圖12 將搜索結果添加到標記結果列表
然后,繼續搜索下一篇文獻,并添加到標記結果列表。等完成所有搜索之后,點擊右上角的“標記結果列表”,一次性把所有結果導出來。導出時,與圖5所示一樣,“記錄內容”選擇“全記錄與引用的參考文獻”,“文件格式”選擇“純文本”。最后,再將 txt 文件導入到 HistCite 中,導入方法與前面介紹的一樣。
尋找專家大牛
圖13 HistCite “Author” 界面'
通過點擊界面上方的 “Author” 鏈接(圖13),可以進入作者列表,總共有 7736 位作者。 Recs 代表文章數, TLCS = Total LCS , TGCS = Total GCS 。通過這個列表很容易找出該領域內最高產和最具有學術影響力的專家。
收集關鍵詞
圖14 HistCite “Word” 界面
通過點擊界面上方的 “Word” 鏈接(圖14),我們可以進入關鍵詞列表,從而了解這個領域目前的研究焦點,記住這些關鍵詞,在后續對某個特定問題進行搜索時會比較方便。
生成引證關系圖
圖15 HistCite 開啟 “Graph Maker”
選擇Tools -- Graph maker(圖15),軟件開啟一個新窗口(圖16)。
圖16 HistCite “Graph Maker” 界面
作圖界面并不復雜,關鍵選擇是參與做圖的文獻數量,其余參數都是調整圖片中方塊、線條和字體的大小。這里選擇的是 LCS 排名前 50 的文獻。如果對圖中某篇文獻感興趣,可以直接點擊它,軟件會在一個新窗口中打開該文獻的詳細信息,我們可以預覽一下論文的標題和摘要(圖17)。
圖17 HistCite 文獻詳細信息界面
選擇感興趣的文獻導出
圖18 HistCite 開啟 “Mark & Tag”
首先,Tools -- Mark & Tag(圖18),然后界面會有一些變化,出現了一個 Marking and Tagging Tool 工具條,并且每篇文獻前面多了一個小方框可以勾選(圖19)。
圖19 HistCite “Marking and Tagging Tool”界面
勾選上感興趣的文獻,然后點擊右邊的 Mark 按鈕進行標記。界面上方會出現一個 “Marks” 鏈接(圖20)。把所有要導入 Endnote 的文獻,全部標記,然后點擊此 Marks 鏈接,可顯示全部被標記的 23 篇文獻的列表(圖20)。
圖20 HistCite 的 Marks 列表
然后,File -- Export -- Records (圖21),將標記文獻導出至一個 hci 文件。
圖21 從 HistCite 導出被標記的文獻
將文獻導入至 Endnote
首先,把導出的 hci 文件的后綴改成 txt,然后打開 Endnote,File -- Import -- File(圖22)。
圖22 Endnote 導入文獻選項
在彈出的對話框中,選擇導入的文件,Import Option 選擇 “Multi-Filter (Special)” (圖23),這樣可以保留文獻的 DOI 信息,方便后續自動下載文獻。
圖23 Endnote 導入文獻對話框
在 Endnote 界面,可以看到已經成功導入全部 23 篇文獻,并且 Endnote 立刻開始自動查找,并下載文獻全文,短短幾分鐘已經找到了 17 篇(圖24)。
圖24 Endnote 自動下載文獻全文
結語
HistCite 作為文獻分析工具,其功能非常強大,本文并未全部介紹,比如可以查看文獻的逐年引用率,有些文獻早期被引用很多,但是近期無人引用,說明熱點已經過去,而有些文獻早期無人引用,但是近期卻很火爆,等等。感興趣可以自行摸索,軟件使用非常簡單。
我使用 HistCite 已經有2-3年,但是使用頻率并不高,因為我也不經常去調研陌生的研究領域,而對于自己熟悉的領域,則不必用 HistCite 。盡管如此,每次使用的時候,我都非常有收獲。 HistCite 就像是地圖,游覽熟悉的城市,我們不需要地圖。但是游覽陌生的城市,地圖在手無疑事半功倍。哪些是不容錯過的景點?各個景點之間的路線如何聯通?節省時間倒還是次要的,重要的是地圖能夠幫助我們從整體上、從全局上去理解一個陌生城市。
也許很多科研工作者還沒有聽說這個實用工具,特此分享。
總結
以上是生活随笔為你收集整理的HistCite 的使用方法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 剑指offer(刷题21-30)--c+
- 下一篇: 深度学习(02)-- ANN学习