中國高被引論文全球第一,是靠中國科學家抱團嗎?
圖源:pexels
隨著中國科技迅速發展,中國的論文產量和高被引論文占比已經排名第一。
今年6月,《經濟學人》的封面專題「崛起的中國科學」引起各方關註,專題中一篇文章標題很直白地提出「中國已經成為科學超級大國」。根據這篇文章的報道,對於引用次數前1%的高被引論文,在2003年,美國的論文數是中國的20倍。而2022年以來的最新數據表明,中國的高被引論文占比已經超過歐盟和美國,躍居第一。
實際上,在論文被引次數這個指標上,中國也在飛速增長。
根據科技部中國科學技術信息研究所2023年度的《中國科技論文統計報告》,2013 年至 2023 年,十年間中國國際科技論文共被引用 6748.23 萬次,相比上次統計引用數增加了 18.3%,排在世界第 2 位,美國仍然排名第 1 位。在 22 個學科中,中國在農業科學、材料科學、化學、計算機科學和工程技術 5 個領域論文的被引次數排名世界第 1 位[1]。
2007年至2017年,中國國際科技論文被引總數首次超越英國和德國,排名被引次數第二[2]。7年之後,中國總引用數已經是英國和德國的4倍左右。以現在的增長速度,中國國際科技論文被引次數成為第一,只是時間問題[2]。
然而,對於中國論文引用次數快速增長的勢頭,去年日本的一份報告潑了潑冷水。根據日本文部科學省的科學技術與學術政策研究所的《科學技術指標2023》報告,中國研究人員有很強的相互引用論文傾向。中國國際科技論文引用數量迅速增長背後的驅動力之一,可能就是這種本國學者之間的相互引用。
數據顯示,在對引用國際論文的研究者所屬機構進行國別分析時,中國的研究者在本國機構的論文引用中占比最高,達到61%。美國緊隨其後,其研究者在本國機構的論文引用中占比為29%。相較之下,日本為19%,英國、德國、法國和韓國的研究者在本國機構的論文引用中所占比例較低,大約在10%左右[3]。
今年,發表在NBER上的一篇工作論文(working paper)也提出了類似觀點:中國在科學文獻引用方面的增長被高估了。在所有國家中,中國有著最明顯的本土偏見(home bias)。
中國論文高引用數量,難道真是靠本國學者之間相互引用、抱團撐起來的嗎?
中國科學家偏愛抱團嗎?
這項研究由華東理工大學商學院講師邱姝敏、麻省理工學院斯隆管理學院皮埃爾·阿祖萊(Pierre Azoulay),慕尼黑大學經濟系的克勞迪婭·斯坦文德(Claudia Steinwender)共同完成。通過科睿唯安的期刊引文報告(JCR),作者選出了2000到2021年,各領域前十分之一的461種頂級期刊,衡量這些期刊發表論文的引用情況。
研究發現,所有主要國家和幾乎所有研究的科學領域中,中國在論文引用中都出現了明顯的本土偏見,也就是說,即使在考慮了各國科研論文產出規模的基礎上,本國研究論文更可能過度地被本國研究人員引用的現象。
按照作者們的統計,中國論文在中國本土的引用中所占比例最大,為 57.2%。美國的引用也有很大一部分來自國內,占 37.1%。這個分布和前述日本的報告相似。然而,中國和美國研究人員眾多,從規模上考慮也有更大的自引可能性。要正確衡量本土偏見,就要衡量論文「引用比例」偏離了論文「生產比例」(一國論文發表占世界的比例)的部分。
經過調整,中國本土偏見為 42.3%,仍是各國中最明顯的,美國為15.9%。這種現象不僅限於某個特定的學科領域,在20個科學分類中的18個,中國均顯示出最強的本土偏見。從時間上看,中國的論文引用從2000年開始就有明顯的本土偏見,而且20年來本土偏見還在一直增加,到2018年已經超過美國一倍。
如果說引文的本土偏見影響了總的被引數量,這個影響有多大?從論文引用總數來看,調整本土偏見後中國頂刊論文的總引用數排在世界第四位,前三位是美國、英國、德國。
邱姝敏補充,如果和《中國科技論文統計報告》一樣統計十年間的論文被引次數,2007到2017年中國總被引數仍然能夠成為世界第二,只是在調整本土偏見後和引用數第一名美國的差距更大,是美國的23%。
具體到研究領域,美國在各領域的引用數都保持領先,而中國在化學、材料、工程、計算機科學和農業科學方面是第二名,還沒有成為第一。中國的篇均引用數則一直在第12至15名之間徘徊,離第一梯隊有較大距離[4]。
但今天,中國的科研產出無論在數量還是高質量論文方面都已位居世界前列。然而,中國擁有最明顯的本土偏見,意味著相比中國學者在頂刊上的產出體量和質量,他們在國際學術界的影響力明顯更低。
至於中國的本土偏見為什麽高,本國學者願意抱團互相引用可能是一個答案,也比較符合大家對於中國學術界看重關系的第一印象。但邱姝敏解釋,這個問題背後有兩種可能的邏輯。
第一種是抱團的邏輯,就是中國學者們太願意引用圈子裏的「自己人」了。另一種邏輯是,外國學者對中國學者的論文引用太少了。這樣即使國內學者並沒有過度自引,從引用的比例來看也會呈現出研究成果國際流動性不足,集中在本國內部傳播的現象。
哪一種邏輯影響更大?邱姝敏做了一個數據補充。美國學者的頂刊論文參考文獻中有34.6%都來自本國。反觀中國科學家的頂刊論文,參考文獻中本國學者論文的比例只占14.8%,這個比例只排在世界第五。
也就是說,其實每位中國學者引用的本國同行論文的比例並不高,但因為沒有太多國外學者引用中國學者的學術成果,「引用池」相對淺,導致中國的自引比例在統計上異常突出。而盡管美國學者在參考文獻中引用了34.6%的本國學者,但考慮到全世界都在引用美國學者的論文,這種自引比例在整體上得到了稀釋,美國學者的自引現象看起來也就不那麽顯著。
不過,外國學者更少引用中國學者,到底是因為論文的質量問題,或者是其他文化和語言上的原因?如果說論文質量相近的情況下,中國學者的成果在國際上的引用會不會打折扣,會打多少折扣?為了解決這些問題,作者們進行了另一項研究。
國外科學家為什麽更少引用中國成果?
這次的研究專註化學領域,作者們首先統計了2000至2018年間在三本化學頂刊至少發過一篇的PI,再在其中選出前1%的明星科學家,去掉美國科學家後,收集751份非美國明星科學家的簡歷。其中有21%即156人來自於中國大陸,其余595人來自美國之外的其他國家和地區。作者收集了這些明星科學家成為獨立PI後的所有文章。
作者采用了精細的匹配方法,以控製潛在的論文質量差異。通過多個變量進行匹配,包括期刊、發表年份、作者數量、非美國來源的引用次數、科學家獲得博士學位的年份等,以求在質量相同的情況下,比較中國PI的論文和其他非美國PI的論文在美國這個第三方被引情況如何。
研究發現,即使在控製了研究質量之後,中國PI的文章平均收到的來自美國學者引用比其他非美國PI少28%。幾乎在所有年份,都出現了這種引用上的折扣[5]。
對於這種引用上的折扣,團隊檢驗了許多解釋。首先這種折扣並非出於歧視,邱姝敏介紹,她和合作者調查了40名海外(美國除外)和香港華人PI的論文引用情況,發現他們的文章並沒有區別對待,相比非華人的海外學者,這些華人甚至得到了美國學術界更多的引用。
其次,在學術聲譽上,一些領域國外學者可能因為考慮到中國頻繁出現的撤稿問題,而對引用中國作者的論文持觀望態度。然而,數據並不支持這種假設,盡管因為頻繁撤稿受到質疑,但那些撤稿頻繁的領域中,中國科學家的論文引用率並未受到顯著的負面影響。
另外,有猜測認為是中國學者集中的領域過於小眾,導致國際上的引用比較少。但作者們檢驗了中國特定子領域的專精是否會影響其研究在美國的引用率,結果並沒有顯著的影響。
作者自己最支持的假設是,美國學者對中國的研究成果不夠了解,中國學者在國際上的認知度(awareness)還不夠。
持續深耕、專註於自身領域的研究,能幫助中國學者減少引用上的折扣。不過這僅限於那些在子領域重要性分布中處於最頂端的、極度專註的PI,也就是那些在自己專業領域內達到頂尖水平的研究者。
更明顯的影響來自學術網絡。研究發現,受過美國訓練的海歸中國科學家在美國引用更高,雖然不能將引用折扣完全消除,但是能消除掉一半的引用折扣。另外一項發現是,如果引用文章的作者之一有中國名字,那麽他們引用中國科研成果的頻率與引用其他國家的科研成果相當,不會出現顯著地引用次數減少的情況。
這可能意味著,中國研究人員在美國有更多機會與華裔研究者接觸,這樣的交流增強了華裔學者對他們學術成果的了解。然而,與更廣泛的美國研究社群的互動似乎還不夠充分。這種學術網絡的局限性,可能限製了中國學者在國際學術界的認知度。
「海歸科學家以及在海外的華人,在中國學術知識擴散的過程中起了很重要的作用。從美國歸國的華人科學家會更少地受到負面影響。另一方面,在海外工作的華人學者也更多促進了中國學術知識向外的擴散和流動。」邱姝敏說。
但在2018年中國行動計劃後,中國之間以海外華人和海歸科學家為橋梁的學術網絡,變得更加脆弱。
邱姝敏進行了一個AI領域中國論文合作者的研究,發現2018年到2021年期間,AI領域美國雖然和中國之間的合作比例出現了下降,但和OECD國家以及其他國家的合作比例上升,維持了整個領域的國際合作比例。同樣是這段時間,中國和美國、OECD國家以及其他國家的合作全面下降。中美在科學合作方面的緊張關系,給中國學術成果在國際上的影響力帶來了更多的不確定性。
AI領域中國論文合作者的變化。作者提供
而在中國論文發表數量及其中的高質量論文數量都迅速增長的今天,相對不足的國際影響力,應該是學術界接下來關註的重點。
邱姝敏向《知識分子》解釋,從創新經濟學的角度講,知識的價值來自於知識的積累和擴散。中國現在確實在科學上投入了大量的人力和資金,也有了相應的產出。但只是生產大量的知識是不夠的,知識需要擴散才能發揮出經濟和學術上的價值。
在一次討論中,邱姝敏的合作者曾經這樣說過:「中國有很多頂尖科學家,在科學上的投入和產出也都很多。但是誰站在中國學者的肩膀上做研究?如果只是生產了大量的知識,但沒有人去運用這些知識,這也是一個問題。」
她和合作者選擇開展這幾項研究,就是為了探究在近年來中國論文發表總數及其中的高質量論文數量迅速攀升的背景下,這些知識多大程度上擴散到了全球的科學社區,多大程度上推動人類認知前沿向前發展?
「現在中國論文數量也達到了,質量也提高了,接下來應該關註的是你的研究有沒有獲得相應的影響力和話語權?對整個全球科學社區的發展和對人類認知前沿的推動做出了多少貢獻?」邱姝敏說。---[知識分子The Intellectual*撰文: 張天祁/來源: 知識分子]
參考文獻:
[1]科學技術信息研究所. (2023).中國科技論文統計報告2023.
[2]劉詩瑤. (2017, November 1).中國際論文被引用數排名上升至全球第二位.人民網
[3](2023, August 9).中國科研論文繼續三冠王,本國引用多.日經中文網
[4]Qiu, S., Steinwender, C., & Azoulay, P. (2024).Paper Tiger? Chinese Science and Home Bias in Citations(No. w32468). National Bureau of Economic Research.
[5]Qiu, S., Steinwender, C., & Azoulay, P. (2022).Who stands on the shoulders of Chinese (scientific) giants? Evidence from chemistry(No. w30772). National Bureau of Economic Research.