文献计量之洛特卡定律
推導(dǎo)主要來自于對(duì)信息論課堂和相關(guān)資料的思考和整理,課上也沒有系統(tǒng)地講解,只是簡(jiǎn)單帶過了,沒有講解底層邏輯,所以筆者試圖整理出簡(jiǎn)單的推導(dǎo)過程。內(nèi)容中如果有不對(duì)的地方歡迎指正和交流!
洛特卡定律的推導(dǎo)
碎碎念:由于課上講得比較快,沒有涉及底層邏輯的推導(dǎo),因此又在網(wǎng)上找了資料,理解后整理如下。
二十世紀(jì)中期,美國科學(xué)研究昌盛,文獻(xiàn)呈現(xiàn)爆炸式增長(zhǎng),因此如何管理文獻(xiàn),或者說如何在海量文獻(xiàn)中發(fā)現(xiàn)具有價(jià)值的文獻(xiàn)及作者更顯得重要。
洛特卡受到植物學(xué)文獻(xiàn)的啟發(fā),該文獻(xiàn)發(fā)現(xiàn)以縱坐標(biāo)為動(dòng)植物的“屬”,以橫坐標(biāo)為動(dòng)植物的“種”,該曲線呈現(xiàn)出冪級(jí)遞減趨勢(shì),同時(shí)取對(duì)數(shù),可以近似的擬合成直線。
模型的建立:
初步判斷x和y有反比的關(guān)系,不能確定y隨x的遞減速度,因此
設(shè) x(y^a)=D(D為常數(shù))
則x=D/(y^a)
兩邊同時(shí)取對(duì)數(shù),得
log(x)=log(D)-log(y^a)
log(x)+alog(y)=log(D)=B(B為常數(shù))
令log(x)=s, log(y)=t,
得 s+at=B
可以擬合出線性的關(guān)系。
洛特卡將X軸作為作者所寫的論文數(shù)目的對(duì)數(shù),Y軸表示寫了X篇論文的作者的頻率的對(duì)數(shù)
設(shè)N為某領(lǐng)域文獻(xiàn)總數(shù),y(x)為發(fā)表x篇論文的作者數(shù),則有y(1)+y(2)+…+y(t)=N,
設(shè)f(x)=y(x)/N
由于猜測(cè)y(x)與x有反比關(guān)系,故推測(cè)y(x)/N與x有反比關(guān)系,由于f(x)<1,故照上面的方法,可設(shè)
(x^n)*f(x)=C(C為常數(shù))
f(x)=C/(x^n)
即為廣義洛特卡定律。
n為某主題領(lǐng)域的特征常數(shù),洛特卡統(tǒng)計(jì)的常數(shù)n=2,得到科學(xué)生產(chǎn)率的平方反比定律表達(dá)式——f(x)=C/(x^2)
根據(jù)該數(shù)學(xué)表達(dá)式也易于得到f(1):f(2):f(3):…:f(n)=1/(22)/(32)/…/(n^2),因此洛特卡定律也叫“倒數(shù)平方定律”。
簡(jiǎn)要理解就是,發(fā)表1篇論文的作者占作者總數(shù)的60.79%,發(fā)表2篇論文的作者數(shù)量是發(fā)表1篇論文作者數(shù)量的1/4…發(fā)表n篇論文的作者數(shù)量是發(fā)表1篇論文作者數(shù)量的1/n2。
參考資料:上課課件、豆丁網(wǎng)——第六章 洛特卡定律PPT
總結(jié)
以上是生活随笔為你收集整理的文献计量之洛特卡定律的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算时间戳之差
- 下一篇: mysql 时间差统计