作为硬通货的学术引用,何以统治学术圈?
C.R.E.A.M.是美國嘻哈樂隊Wu Tang Clan所演繹的說唱歌曲,其歌名為“Cash Rule Everything Around Me”的縮寫,意在感嘆金錢統治一切的社會風氣。如今Matter主編Steve Cranford借用這個歌名,感嘆學術界的一切已被‘引用’統治!文章將引用比作‘學術界的通貨’,從一個全新的角度來看待、評論那些構建在學術引用基礎之上的學術評價指標。此外,作者還從知名期刊主編的視角出發,將學術引用分類厘定,闡明了哪些引用是好的,而哪些不好。作者行文生動有趣,觀點新穎而發人深省。知社特翻譯全文,以饗讀者。
>>>>
引用數儼然成了衡量學術生涯亨通與否的標準。就像商品一樣,引用數也經歷了生產、分配的過程,而在這些過程中出現不均衡現象亦是常事。成功(或者說失敗)是憑借引用數來衡量的,但我們不禁要問,學者引用他人成果的動機是什么?引用行為本身又在怎樣的實際情景下發生?在這篇文章里,我們將從一個全新的視角討論引用的生產、分配、類型以及引用作為學術評價體系其可能的未來。
h指數是推特圈里一個老生常談的話題,人們的討論往往著眼于h指數的重要性、作用、根本價值及其與論文引用次數的本質聯系。但無論對這些“h指數類”的指標支持還是反對,論文引用數都是一個無法回避的基礎所在。這促使我從更普遍的層面上來看待學術引用——即把引用視作一種通貨,進而考慮其生產、分配和類型等等方面。在這個“不出版,毋寧死”的學術紀元,引用等用于衡量出版物受認可程度的指標,成為了事實意義上的學術硬通貨。我們卷入到了一場“引用經濟”當中。借用Wu Tang Clan在C.R.E.A.M.里的歌詞來說就是:Citations Rule Everything Around Me(引用統治了我周圍的一切)。
學術引用 · 商品經濟?
科學家偏好將一切事物加以量化、測量,這使得他們更加易于比較、評估潛在的價值和數據。但如何為學術出版設定一個評價體系呢?若單看作者的文章數量,則文章的質量無從評價。看論文的作者數量?這更是不著邊際了。至于出版物總頁數的平方根云云,大抵也同樣不靠譜。或許依據論文的獨立合著者的數量來評判?之所以有人主張以論文的獨立合著者的數量作為出版物質量指標,是因為他們認為:和單打獨斗比起來,與其他機構的同事協作研究更有可能做出高質量的成果。無論如何,在考慮了一眾指標后,引用及其派生的評價體系成為了衡量學術出版物影響力的一項明晰選擇。正如一個古老的思想實驗所質問的那樣:如果一篇論文出版了卻無人引用,那么它真的有助于科學發展嗎?
也可從另一角度印證引用在學術評價領域的重要地位。比如,當下最受歡迎的兩項學術指標——期刊的影響因子和研究者的h指數,它們就是筑基于引用數之上的。而其他評價指標也不同程度地依賴引用數,如CiteScore、Source Normalized Impact per Paper (SNIP)、Eigenfactor ,還有谷歌學術的i10-index、h指數派生系列(m-index、g-index等等)。我個人十分喜愛“卡戴珊指數”(K-index),該指數主要評估科學家在社交媒體上的聲望與其實際論文引用數之間的差異。
截至我動筆寫下此文,我的卡戴珊指數大約在2.1。也就是說,我所享有的科學家聲譽已經略微有些名盛于實(這毫無疑問是因為我擔任《Matter》總編的緣故)。所有這些評估指標的共性為何?正是我們前文提到的——他們都是引用數量的指標性應用。某一年限的期刊影響因子被定義為:被評價期刊在前兩年發表的可被引文獻在統計年的被引用總次數與該期刊在前兩年內發表的可被引文獻總量之比。因此,IF最大值取決于總引用量(下文將總引用量記作N)。至于研究者層面,h指數被定義為某一作者至多有h篇論文分別被引用了至少h次。從定義來看,h指數也和總引用量緊密相關,它的最大值被限制在√N;且實際上,基于引用量的分布情況,它通常可以被近似地估計為(√N)/2。這里的兩個N指的都是研究者的學術出版物的總引用量。
由此可見,這些流行指標均受總引用量制約,這是十分明確的。指出這一點并非旨在討論引用作為學術出版物評估指標的正當性,而是為了說明引用作為學術界硬通貨的有效性。引用量既表現出分散性,又表現出聚集性。學術界的學術出版物是有限的(它們需要引用文獻,故可視作引用量的生產者/供應方), “引用的供應”也是有限的,這些有限的引用量在被引期刊和被引作者之間進行分配;而反過來看,期刊和作者一方則對引用有著強大的需求。這種供求關系構成了“引用經濟體系”的基礎,形成了一個高度競爭市場。在這個體系中也存在上流階級,甚至存在類似于“洗錢”的方案,只不過利益對象變成了引用量。
引用的供求關系
在討論本節之前,我們需要先為每篇論文估定它們平均引用的參考文獻數量,以便進行后續計算。二十世紀開創了學術出版的現代紀元,而在該世紀的大部分時間里,文獻對參考資料的引用數目平均維持在10左右。而自八十年代中期起,由于引用數日益為學界所重視,所有學科的參考文獻數目都開始出現攀升趨向。與過去相比,引用者在文獻中對被引文獻作出了更詳細的討論,這一趨勢在論文所有章節都表現出來(包括簡介、方法、結果、討論、結論等部分)。目前來看,論文的總引用數在不同領域之間往往差異巨大,且通常與論文篇幅等因素高度相關。綜合類期刊《Nature》允許論文最高引用的參考文獻篇數是30篇,我們可以將其定作一個粗略的基準,因為該期刊幾乎對科學界的所有領域都開放,具有一定代表意義。而《Matter》在2020年一月出版物上的研究性文章的平均文獻引用量為50,這可部分地歸因于更長的文章篇幅(相較Nature)。為了方便此處論述,我們取中間值40篇,作為一篇典型的物理學論文所引用的參考文獻量。
如果一個作者每篇文章大約需要引用40篇文獻(亦即生產出40引用量),且他每年發布3到4篇文章,那么他將每年貢獻120到160的引用量到整個“市場”當中。如果他每年發布10到12篇文章,那么則會貢獻400到500的引用量。但是,每位作者每年發表的論文量存在著相當大的變動。一項新近的研究表明,有數百名作者獲得了所謂的“高產”稱號,這些作家在每個自然年將產出超過72篇論文(折算下來接近每五天發表一篇), 按每篇40引用的量來算,這些高產作者每人每年產生的引用量竟高達3000!不過,總引用量從“消費”角度來看還有細分,這取決于人們是從期刊層面還是個人層面來談論引用。例如,如果期刊的一篇的論文被他人引用,那么對于該期刊來說,就計作被引用一次。然而一篇論文卻可以同時被多位作者署名,如果該篇論文由6位作者合著,那么當該論文被引用時,則每位作者都算作被引用了一次。這樣一來,在同一篇論文被引用時,從期刊層面和作者個人層面來計算出的總引用量則往往不同。后者通常是前者的成倍增加。
另一方面,每篇論文的作者數量也被發現正在出現持續增加的趨勢。物理科學論文的平均作者人數從2012年的9人逐步增加到了2016年的39人,增長幅度超過三倍。“超多作者現象(超過50乃至100位作者)”是21世紀的新興趨勢,在物理學和生物醫學領域尤其如此。在過去的五年中,自然指數(Nature Index)上作者超過1000名的論文數量從0暴漲到100。由此可見,隨著大型科學的進一步擴大,這種規模成長也越來越多地反映在學術論文的作者名單中。這些擁有上千名作者的論文,其中大多數都是在物理科學領域發表的。人們每引用這些論文一次,就會為這上千名作者分別貢獻一次論文引用。
最后還需要注意的是,人們發表的論文速度正在增加(在過去的幾十年中,年增長從4%到9%,簡直可以與紐約證券交易所相爭衡)。這引發的直接后果是,有待分配的總引用量——也就是供應出的“資金流”異常雄健,如果將其類比為“貨幣”供應,則過度供應的引用量當然會引發引用量的“通貨膨脹”——單個引用的價值會隨著時間的推移而不斷下降。這種趨勢將會導致兩個后果:(1)使用基于引用量的學術評價指標,來比較不同歷史時期的論文是沒有意義的。這就類似于將上世紀六十年代的汽油價格(每加侖0.30美元)拿來與今天的油價相比較一樣。[作者注:這篇文章的草稿寫于COVID疫情危機之前,眼下看來,1960年的油價倒是極有可能重現了。]
?(2)與不斷擴張的股票市場一樣,基于引用的學術評價指標也在不斷膨脹。即使引用的分配情形并未改變,期刊的影響因子和研究者個人的h指數也依然會隨著時間的推移而自然上升。20年前(2000年)《Nature》的影響因子為25.8,而今天這一數值已經變成43.1。這難道說明了《Nature》相較以前聲譽更隆嗎?顯然不是。這僅僅是因為學術界生產并分配了更多的引用量而已。同樣地,在Jorge Hirsch介紹h指數的原始論文里,他聲稱“若非特殊情況,美國國家科學院(National Academy of Sciences,NAS)的院士資格通常要求h指數達45或更高。”但到了今天,雖然h指數達45仍是一個值得稱贊的成績,但要據此提名NAS院士,已是遠為不夠了。
學術引用的馬太效應
引用“通貨膨脹”所導致的另一個問題是,由于引用分配上的不均衡,將導致富者愈富的馬太效應。其內在邏輯是,如果某文獻被認為質量低下,那么即使它實際上具有科學價值,人們也不太可能閱讀和引用該文獻。引用行為會自發地匯聚在從“最佳期刊”中挑出來的“最佳研究”里。可作如是想:發表在影響力較低的期刊上的論文,更有可能引用Science或Nature(或Matter)上發表的研究。這種不均衡使高引用內容更加受益。盡管自2000年以來Nature的影響因子增長了67%,但并非所有期刊都享受了相同的“增長紅利”。以《Journal of the Mechanics and Physics of Solids》為例,該期刊影響因子的增長比例看起來還較Nature略大,為78%(從2000年的2.3增長到目前4.1)。但是,Nature影響因子的絕對增量將近18,JMPS的絕對增量僅為1.8,這意味著Nature每篇文章的平均被引量增加了近18條,這跟JMPS的變化差了一個數量級!在引用數據可以開放獲取的年代,作者傾向于引用那些出版后接收他們初始引用非常迅速的文獻。當一篇文獻被引用,研究人員會觀察這一點,從而增加他們對該文獻的興趣以及引用意愿。此外,盡管發表的文獻汗牛充棟,但是作者們依然更偏好瀏覽那些在學科領域出類拔萃的少數期刊。
引用的類型 · 好引用和壞引用
激勵科學家對同行成果進行引用的動機,部分是出于他們對學術正義抱有信念,因而愿意對同行成果給予信任和肯定;另一方面,這也是因為他們希望從同行那里獲取同樣的信任認可。
引用類型——好引用
盡管研究人員對同行們的引用行為確實存在,但是這種引用下潛藏的原因卻紛繁復雜。一個優良的經驗法則是,只引用最少的、必要的工作。然而科學本身的多學科性質、前置工作的廣泛程度以及其他諸多動機仍然促成了一篇篇長長的參考文獻清單。有鑒于此,有人歸納出了“學術引用的正面理由”,來說明那些動機正當的學術引用:
規范型引用(又稱經典型、創始人型):如果參考文獻在論文主題、方法論或技術等方面有著首要的重大貢獻,或者參考文獻的作者是涉及理論、方法或技術的創始人,被引用的可能性就會增加。引用者傾向于引用首篇實質性著作。一個很好的例子是飯島澄男(S. Iijima)在1991年所著的文章‘Helical microtubules of graphitic carbon’,該文章主要關于碳納米管,引用次數超過50000。
說服力增強型引用:說服性的引用被定義為通過引用文獻來輔助建立知識主張,主要是依靠引用有聲望的作者,以借用其影響力來佐證自己的觀點。這類型的引用被發現是最為常見的引用類型,部分可歸因于超級大刊上的頂級論文們引發的引用分布不均。用最簡單的話說,如果您引用文獻的是諾貝爾獎獲獎文章,那么這就暗示著您的文章也與該諾獎文章質量相近。
進展型引用:此類引用是那些構成了現有工作的發展框架的基座式參考文獻,換言之,正是這些參考文獻為論文的發現奠定了基礎。這類引用囊括那些與論文主題沒有直接聯系、但對于論文完成必不可少的參考文獻。
肯定型引用:引用的參考文獻中包含作者支持的獨立觀察、觀點或發現。
批評型引用:作者出于糾正自己或他人的工作成果而引用論文,可能是部分糾正,也可能是全盤推翻。這項引用成果可能是一個富于爭議性的案例,作者通過引用對其結果加以反駁,或者是作者對所引文獻中的數據闡釋提出質疑,也可能是作者不同意所引文獻中的觀點或事實陳述。這些批評的重點可能是——方法論上的弱點、欠缺可重復性、實驗可靠性不足或者實驗結果的闡釋未盡人意。
方法論型引用(操作技術型引用):通過引用文獻以揭示工作所依據的方法、理論等。此類引用是為了指出工作所運用的二手理論、實用技術、材料、設備、分析方法、程序或研究設計等。比如說,我作為PI所發表的每篇論文都引用了Plimpton的“Fast Parallel Algorithms for Short-Range Molecular Dynamics”,這是LAMMPS軟件的必引文獻。
背景型引用(歷史沿革型引用):引用文獻以追蹤觀點的歷史沿革及其學術影響。因此,作者引用文獻是為了進一步指出其工作的學理淵源,以闡明這項工作何以成為某學術主張歷史性的一部分;或者是因為某項知識主張提供討論和閱讀賴以發生的背景。文獻綜述即在此例。
概念型引用:引用該類文獻是因其為論文提供了概念、定義、詮釋、理論。通常是引入關于某種思想、概念或理論的原始文獻。
對比型引用:對比型引用通常可以在論文的討論部分中見到,作者通過引用文獻來進行成果對比。這一類型也不完全是對比,有時作者也干脆將其論文成果視作所引文獻成果的變體形式。
如果你牢記這些引用類型,那么參考文獻的數量將十分可觀。盡管論文并不總是能用上所有類別的引用,但往往只需要一到三種類型的引用就能湊出30篇參考文獻。想要達到前文所估計的40篇引用文獻,也是易如反掌。
引用類型——壞引用
負面引用的定義非常簡單——它指那些可以將其刪除而不會造成任何損失的引用文獻。對讀者而言,這些引用文獻并非了解任何附加詳情的必要途徑,亦不提供任何關鍵信息或背景。但這些文獻卻通常與主題相關聯,因而乍一看像那么回事。在這里,要注意的幾個“引文陷阱”包括:
鏈條效應:這類現象通常在成群成組的引用中出現。例如,當你需要引用Abbott教授(A教授)的一篇優秀文獻,但這篇文獻的關鍵信息卻仰賴Bailey教授(B教授)和Cooper教授(C教授)的論文提供,這時難道要把ABC三者的文獻都引用進來嗎?顯然引用A的文獻已經足夠。倘使你真的引用了ABC的文獻,那么按照這種“鏈條式”的引用來鋪陳下去,則下一篇引用你工作的論文則可添上ABC,則引用文獻的鏈條就越引越長了。
?
趨附名望:有時人們為了增強論文說服力,對權威論文的引用到了泛濫成災的地步。大量多余且無用的引用涌向那些名位尊崇的學者和高影響因子文獻。這類引用最常見于引言和結論部分,有些作者恨不得每個關鍵詞都引用一篇文獻。
?
貪求時髦:不知為何,明明是近兩三年完成的工作,引用文獻卻都是最近三個月內才發布的。誠然作者應當跟緊最新的參考文獻,但這并非意味著挖空心思去蹭時下的研究熱點。
?
討好審稿人:試圖通過引用審稿人的文章來討取他們的歡心。在任一分支領域,足以膺任審稿人的專家往往有限。如果重點引用的文獻是來自于推薦審稿人,企圖就更加明顯了。請不要這樣做,我們是會做相關審查的。
?
過多自引:項目、專業知識和方法技術的自然發展歷程,要求一定程度的自我引用。這是預料之中的。但如果前著與工作相關性并非那么高,那么則應將引用位置留給更好的參考文獻。需要避免過多的自我引用。
?
迎合審稿意見:囊括過多審稿人建議的參考文獻,而且還都是“高度相關”。這并無必要。任何時候皆是如此。必要時可向責任編輯咨詢相關問題。
?
迎合編輯:在目標期刊中引用了數量夸張的文獻,以期搏得編輯注意。這種行為還很新鮮,但是我們并不建議這樣做。
請快速瀏覽一下自己的引用文獻列表,如果確有屬于上述類別的引用文獻,那是沒必要的。
引用經濟的未來 · 多元化
顯然,通過上述的類型劃分,每個引用出現的理由都不盡相同。然而正如貨幣一樣,它們是眼下的可交易資產。引用就是引用,與環境無關。現狀必該如此嗎?也不盡然。比如對引用文獻的共同作者問題,我們還是可以找到一些可探索的方向:當一篇具有多個作者的論文被引用,合理的做法是,將這個引用數據分配給作者中的某一個,還是將它均分為1/n分配給每位作者(如果是n位作者的話)?是否應當設立不同的貢獻級別,來實現引用的回報性分配?
但令人寬慰的是,隨著學者指標化的日益普及,以及對文獻元數據的重視(比如設立更精細化的貢獻級別),引用的分配可能變得更加公平合理。引用意味著一種學術聲譽,未來科研界如何進行聲譽分配?這或許是一件十分有趣的事情。而當下也有人正在努力改進“引用體系”的整體效用,他們將引用分成了支持引用、反駁引用和中立引用三類。位于布魯克林的一家初創公司Scite正試圖通過引入“智能引用(smart citation)”來對引用體系進行改進,他們開發了一種工具從學術論文中提取引文的相關陳述,進而將這些引用分類為支持引用、反駁引用和中立提及。這些引用信息被解析出來之后,將被添加到數據庫中供人檢索。這些信息使得Scite的用戶得以快速了解感興趣的研究是否已被著手進行,如果已有研究開展,則可了解其結果如何。值得注意的是,按照這三類分類,中立引用眼下是最為普遍的,這也許表明了引言和結語中引用的某種傾向性。
可以相信的是,在更多的數據(和更多的努力)的幫助下,我們可以為引用賦予更精細的含義和結果,而非是一個簡單粗暴的數字。這或許會為學界擺脫學術引用的怪圈開具良方。不過在那一天到來之前,學界將依然是:Citations rule everything around me, Dollar, dollar bill y’all.(譯注:此二句均系C.R.E.A.M.歌詞)
原文鏈接:
https://doi.org/10.1016/j.matt.2020.04.025
編輯?∑Gemini
來源:知社學術圈
文章推薦
?物理實驗設備與新冠病毒研究
?如何畫出優秀的架構圖?
?你已選中了添加鏈接的內容
?機器學習中需要了解的 5 種采樣方法
?北大讀博手記:怎樣完成自己的博士生涯?非常具有指導性!
?我拿過數學競賽的獎項,然后我會很厲害嗎?
總結
以上是生活随笔為你收集整理的作为硬通货的学术引用,何以统治学术圈?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: “天才”少年!4位90后摘得全球顶尖数学
- 下一篇: 官宣!“一流大学”,异地落户!