這是學術史上一個有趣的老故事。僅憑一篇論文,《晶體學報 A》的影響因子暴漲二十多倍,超過了Nature、Science。這背後沒有任何舞弊和學術不端行為。甚至可以說,這是個在當前學術評價體系下早晚會發生的“趣事”……
2010年6月,湯森路透公佈的2009年期刊影響因子列表在學術圈激起了一場不小的波瀾:前一年影響因子還只有2.051的《晶體學報 A》(Acta Crystallographica Section A),居然躍升至49.926,位列全榜第二!而同年 Nature、Science 的影響因子分別是34.480和29.747。
一時間,Nature 新聞組、TheScientist 等各大科學媒體競相此事進行報道。在深究之後,人們發現該期刊“暴發”的直接原因只有一個——2008年發表於該期刊的文章《SHELX 簡史》(A short history of SHELX),被引次數高達5624次,貢獻了2008年72篇文章總被引次數的94.3%。(資料以 Nature 報道為準)
“神文”誕生
這篇《SHELX 簡史》有何特別之處呢?原來,SHELX 是這篇論文作者、哥廷根大學教授 George M. Sheldrick 編寫的一個晶體分析軟體,這篇文章即是該軟體的簡史。關鍵在於,作者在論文摘要中寫道:
This paper could serve as a general literature citation when one or more of the open-source SHELX programs (and the Bruker AXS version SHELXTL) are employed in the course of a crystal-structure determination.對於晶體結構確定過程中用到一個或若干個開源 SHELX 程式(或Bruker AXS版本 SHELXTL)的研究,都可以引用本文獻。
在這個軟體的安裝協議中,也有類似的說明:
The following reference should be cited whenever a program beginning with the letters "SHELX..." is used, including the Bruker SHELXTL system: G.M. Sheldrick, "A short history of SHELX", Acta. Cryst. (2008) A64, 112-122.您只要使用了 SHELX 開頭的軟體(包括 Bruker AXS 版本 SHELXTL),就應引用發表於《晶體學報 A》的《SHELX 簡史》。
軟體安裝協議中的口吻相對論文中要強硬一些(畢竟自己的軟體),不過兩者的意思並無差別:只要用了 SHELX 軟體,就請引用這篇文獻。而這個軟體做得實在經典,全球晶體學研究者幾乎人手一份。時至今日,該論文的引用次數還在不斷增長。
谷歌學術上的《SHELX 簡史》:十年之後,文章的引用總次數是2009年的十倍。
曇花一現
講接下來的故事之前,我們先來回顧下影響因子的定義式:
影響因子 = 期刊前兩年發表的論文在該報告年份(JCR year)中被引用總次數/該期刊在這兩年內發表的論文總數
直觀來說,影響因子就是期刊過去兩年內所有文章的平均被引次數。影響因子某種程度上反映了期刊論文對後續研究者的貢獻程度。問題在於兩點:
期刊編輯無法完美統一期刊中文章的質量水平:鶴立雞群的文章會被拉低,濫竽充數的文章則被拉高;時間規定過於死板:一篇好論文如果三年之後才為人們認識到重要性,那麼即使被引用數萬次,也不會被計入影響因子。
晶體學並非生物、醫學這樣的大熱學科,該領域的頂級期刊《晶體生長與設計》(Crystal Growth & Design)影響因子也只有4分左右,《晶體學報 A》原本2分出頭也並不算很差。但2009、2010兩年50分上下的影響因子,顯然超出了該期刊的原有實力。上文提到,影響因子的計算只計入前兩年的論文,因而縱然《晶體學報 A》在那兩年風光無限,許多學者都“唱衰”該刊。2011年影響因子榜單公佈,該刊果然無力延續奇蹟,暴跌至原有水平——2.076,以及以後的數年中也只是在2.0~2.4範圍波動。
《晶體學報 A》十年影響因子。在這個座標刻度下,幾乎看不出其他年份的影響因子波動。
那兩年間,研究者們戲言:發到《晶體學報 A》太走運了,一篇普普通通的文章就達到了畢業/升職/申請基金的標準;2011年後在該刊發文的研究者,只得感嘆“君生我未生,我生君已老”。
山外有山
《晶體學報 A》的遭遇是或許稱得上神奇,但憑藉一篇文章得到高影響因子的期刊並非獨此一家。2009年,以87.925力壓《晶體學報 A》這個暴發戶、奪得影響因子榜榜首的期刊,其實也有賴於單篇“神文”的貢獻。只不過,該期刊的“神文”,每年都會有。
這個常年穩坐影響因子榜頭名的期刊 CA (CA-A Cancer Journal for Clinicians),是癌症研究領域的權威期刊之一。2009年的87.925還不是其影響因子的最高峰——2013年,該期刊的影響因子一度衝到了162.5。
CA 每年都會發布 Cancer statistics,即有關美國的各種癌症發病率、死亡率等資料的調查、統計結果,這篇資料庫一樣的文章每年都會為 CA 掙來數千次引用。而 CA 每年發文僅有二十多篇,兩相結合之下,製造出影響因子界傳說也就不足為奇了。
CA 於今年年初發布的 Cancer statistics 目前被引已破千。
值得一提的是,中國版的癌症資料統計現已加入 CA 豪華陣容。根據谷歌學術統計,今年一月底剛剛發表的中國版資料統計現已被引四百餘次。如果這一趨勢繼續保持,兩年之後的 CA 或可創下影響因子突破200的新紀錄。
與資料庫型文章類似的還有綜述類文章,在近幾年的影響因子榜單中,XX Review 超過 Nature、Science 也不是什麼稀罕事。一般來說,綜述的被引機率遠高於研究論文,然而這兩者的質量之間並不存在可比性。
誰主沉浮
影響因子這種評定方式,除了上文列出的“原罪”外,還有自引、協商互引等人為操縱風險。因而,科學界也一直在探索可以取代影響因子的評價標準。
在評價單個科研人員方面,h 指數(h index)的認可度較高。h 指數的含義是一名科研人員至多有 h 篇論文分別被引用了至少 h 次。這個指標綜合了發文數量和發文質量,但年輕科研人員很難拿到高分,體系的引用統計也繼承了影響因子的缺陷。同樣評價科研人員的還有國外科研社交平臺 ResearchGate 推出的 RG 指數,但該指數較依賴研究者在該平臺的表現,也很難客觀反映所有人的研究水平。
2014年底誕生的 Altmetric 指數則旨在評價單篇論文在媒體、社交平臺等地被“引用”的次數。如果一篇論文在全社會引起廣泛反響,按理說應該是重大突破無疑。但前不久2016年 Altmetric 榜單出爐,位居榜首的居然是奧馬巴發表於 JAMA 的醫改評估及後續展望,奮戰在實驗室的廣大科研人員大呼不公的同時,也只得感嘆此乃意料之外、情理之中。
2016年7月5日,Nature、Science、PLoS 等多家出版方的權威人物在 BioRxiv 上聯合發文呼籲採用引用分佈曲線(Citation Distribution),引入調節係數,削弱單篇“爆文”對整個期刊的影響。2016年12月8日,學術出版巨頭 Elsevier 拿出自己的期刊影響因子評分系統 CiteScore,與傳統的影響因子相比,該指標擴大期刊覆蓋面、微調計算方法、區分各領域,但也有學者指出,CiteScore 總體來說並未“脫胎換骨”,有可能只是為擴大該集團影響力的手段而已。
層出不窮的指標,其實正說明我們依舊沒有解決最深層次的問題:一篇論文的質量並不能與所在期刊的質量劃等號,一項研究對科學程序的貢獻也不應該用一個蒼白的數字來評價。
看似合理的指標到最後總是生出讓人啼笑皆非的故事,不禁讓人想起經濟學界的古德哈特定律(Goodhart's Law):“當經濟的某個特徵被拿來當作經濟指標,那麼它就註定會失去指標的功能,因為人們會只顧追逐這個指標。”從高考分數到 GDP,再到學術界的影響因子,莫不如此。這些清晰的量化指標,曾幫助我們實現公平、提高效率。但是隨著這些指標的僵硬化、符號化,人們必然要開發更為靈活、更為全面的評價標準。這些指標雖然都未能取代影響因子,但仍不失為解決這一問題的征途上一次次可貴的嘗試。
最後,這裡有碗“趣聞”裡的雞湯,致所有堅持科研道路的朋友們。
SHELX 統治晶體學研究領域長達四十年,應用於 Windows、Linux、MacOSX 等多個平臺,從最早的 SHELX76一直到如今的 SHELX2014,陪伴、培養了幾代晶體學工作者。《SHELX 簡史》與其說是吸納引用的“奇文”,不如說是 Sheldrick 教授數十年如一日的辛勤耕耘史——他無愧於這份榮譽。
Sheldrick 教授將自己開發的學術軟體,無償提供給了全世界的晶體學研究者(商用除外),而研究者們也秉持科學家的嚴謹態度和感恩之心,認真閱讀了軟體安裝協議並踐行了作者的要求。這篇論文為 Sheldrick 教授帶來千金難買的榮譽和聲望,背後是全世界晶體學工作者對老先生的致敬。