為什麼顛覆性研究越來越少?科學家從4千萬篇論文找答案|Nature
顛覆性研究正在衰落,人類重大科技進步正放緩。
上述觀點來自本周Nature封面文,主標題:NET LOSS(淨虧損),頗為醒目。
文章作者認為,儘管近幾十年來創新和科學研究呈爆炸式增長,但是,知識的增加並未帶來重大進展。
通過分析過去60年來4500萬篇論文及390萬項專利數據,作者發現,這些研究對現有科技的顛覆性越來越少。
他們進一步指出,此種現象可能預示着——科學技術的性質發生了根本轉變。
目前,該觀點及內容已被經濟學人、福布斯等主流媒體介紹,推特、Reddit及Hacker News上亦有不少關注。
所以,這個結論是怎麼得出的?
答案還得從研究本身里找。
*如何判斷論文開拓性?
研究主要通過兩類方法,來衡量論文創新程度的變化。
第一種方法是根據論文引用情況判斷。
這種方法會將新研究分成兩類。
一類在現有理論基礎上實現突破,本質上鞏固了已有研究理論(Consolidation);另一類則是顛覆已有理論,本質上是開拓性的新工作(Destabilization)。
舉個栗子,DNA雙螺旋結構和密度泛函理論(DFT,Density Functional Theory)都獲得了諾貝爾獎。
如果按上面的方式進行分類,DNA雙螺旋結構顯然是顛覆性的研究,因為它否定了生物界權威鮑林的「三螺旋結構」研究。
但密度泛函理論,卻是建立在之前研究的基礎上提出來的,與DNA雙螺旋結構的開拓性程度並不相同。
如何判斷一篇論文更具開拓性?
作者們採用了一種叫CD指數的方法(CD index)。
如下圖,黑色代表目前待判斷的研究,白色代表前人的研究,灰色是後來的新研究,CD指數範圍在±1之間。
如果一篇論文(黑色)是基於已有研究做出改進,那麼新研究(灰色)在引用這篇論文時,肯定也會引用前人的研究(白色),CD指數為負:
反之,這篇論文顛覆了之前的研究,那麼新研究都會以這篇論文為基底,而不會再去引用之前的研究,CD指數為正:
所以,雖然DNA雙螺旋結構和密度泛函理論的論文引用量都非常大,但它們的CD指數卻分別是0.62和-0.22。下面這張圖顯示了論文和專利CD指數的分布:
第二種方法,則是通過論文中的詞彙多樣性來判斷。
一方面觀察論文中出現新詞的情況。
注意,這裡的造新詞並非老詞新造(給已有的定義換個說法),而是新出現的、在後來的論文內容和標題中會重複使用的詞彙。
另一方面統計與「創造」相關的動詞數量。
例如,與創造、發現相關的動詞通常包括produce、form、prepare和make,類似的還包括determine、report以及measure等。
與之相反,偏向改進、優化乃至應用一類的動詞,則包括improve、enhance、increase,以及use和include等等。
作者們採用這兩種方法,分別計算了4500萬篇論文和390萬項專利的CD指數和詞彙多樣性。
*仍然有新突破出現
具體來說,研究得出的結論如下。
先看創新性隨年份的變化。如下圖,從1945年到2010年間,左側各年份論文平均CD5指數(統計時間範圍為論文發表後5年)有明顯下降。不同領域降幅略有不同,社科為91.9%,物理為100%。
技術專利創新性也呈下降趨勢。根據美國國家經濟研究所(NBER)數據,從1980年到2010年間,計算機與通信領域CD5降幅達93.5%,藥物與醫療領域降幅為96.4%。
從「語言措辭」變化中也能看到相關跡象。
在1945-2010年論文中,其內容所使用的獨特詞彙及新造詞彙均呈下降態勢。
有意思的是,措辭上50年前後論文中「創新性」的相關動詞的出現頻率也更占主導,排在前面的高頻動詞包括:產出、報告、確定、測量……
與之對應,2010年論文,排在前列的高頻動詞為:基於、改善、聯繫、增強……
上述動詞同既有科學發現成果的「聯繫意味」更強。
同樣的情況,也發生在專利內容統計中。
△ 1950年及2010年論文每百個動詞中的高頻詞統計
但值得明確的是,儘管論文創新性的比例在下降,但從絕對數量看,創新成果產出量趨於穩定。
如下圖所示,左側針對1950-2010論文統計,右側針對1980-2010專利數量,不同顏色的線條,代表了不同CD5指數區間。
能看出,儘管藍色線條隨年份變化快速上升,但該部分代表創新性較弱的論文及專利數。相對而言,高創新性的論文及專利,絕對數量趨於平穩:
數據統計外,本文作者也列舉了一些近年重大突破,諸如引力波、新冠疫苗。
他們指出,整體的創新性下降並不能讓我們忽視許多高創新性的研究成果及發明。
那麼,是什麼導致了整體創新性的下降?
研究者推測,該趨勢與各研究領域的知識增長相關。
為此,他們統計了數十年論文及專利的引用多樣性、自引均值、被引作品平均年份。
結果顯示,無論論文還是專利,幾十年來引用多樣性在下降,自引均值上升,且引文中平均發表年份也在增加。
通過上述統計結果,研究者推斷,科學家與發明家們更多依賴熟悉的現有知識技術,且這些知識高度同源。
這可能導致創新性成果的不足。
目前,這項研究引來了不少相關從業者及科技愛好者的關注。
一位生物醫學家認為這毫不驚訝,並表示研究內容挺有意思。
還有網友認為,資本也是導致上述現象的一大因素。
他補充道,在過去50年中,更多資金從產出顛覆變化的基礎研究,轉向收益直接可見的應用研究。
對此,你怎麼看?
論文地址:
https://www.nature.com/articles/s41586-022-05543-x
參考鏈接:
https://pubsonline.informs.org/doi/epdf/10.1287/mnsc.2015.2366
[量子位:QbitAI*頭條號簽約*詹士.蕭簫發自:凹非寺*量子位*公眾號:QbitAI/來源:量子位]