01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

ChatGPT們,正在汙染學術圈

2024080115:34



智東西7月31日消息,根據頂級學術期刊《自然》(Nature)昨日報導,生成式AI在學術寫作中的使用已迎來爆發式增長。相關研究顯示生物醫學領域最大數據庫PubMed上10%的論文摘要都有AI寫作嫌疑,相當於每年15萬篇論文中都有AI的參與。

德國柏林應用科技大學的研究表明,主流AIGC檢測工具的平均準確率僅有50%,還很容易將人類寫作內容判定為AI生成。而不少AI生成的論文卻能輕易地通過轉述、同義詞替換等方式瞞天過海。此外,英語母語者的AI工具使用更難被檢測出來。

雖然AI工具此前就在學術界廣泛應用,但利用生成式AI直接輸出論文或者代筆寫作仍引起爭議。AI工具讓剽竊行為更容易了,還有可能造成版權內容的濫用。

AI輔助寫作並非一無是處,不少學者因為使用生成式AI輔助寫作而避免了用不熟悉的語言發表論文的麻煩,能將精力專註於科研本身。有不少期刊都允許了生成式AI工具的使用,但要求作者必須在論文中詳細披露使用情況。

一、AI可能參與15萬篇摘要寫作,非英語母語者更易被發現

自ChatGPT於2022年底發布以來,AI在學術寫作中的使用呈爆發式增長。來自德國圖賓根大學的研究顯示,2024年上半年生物醫學論文中至少有10%的摘要使用了AI進行寫作,按年計算約為每年15萬篇論文。

這一研究團隊分析了2010年-2024年生物醫學領域數據庫PubMed中1400萬篇論文的摘要,他們發現以ChatGPT為代表的生成式AI工具的出現後,特定修飾性文體詞匯的使用量出現異常的激增。研究團隊用這些詞匯的出現頻率估計了使用AI寫作的摘要的比例。

研究人員還發現,AI寫作工具的使用在不同國家間也有差異。他們的數據顯示,來自中國和韓國等國家的論文使用AI寫作工具的頻率比英語國家的論文更高。



▲學術寫作中文體詞匯使用量激增(圖源:《自然》)

據該研究團隊分析,英語國家的論文作者使用AI的頻率可能也和其它國家接近,但他們的使用方式可能更難以發現。

其實在這波生成式AI浪潮出現之前,AI已經在藥物發現、蛋白質結構預測等領域投入使用,這些使用並未引起過大的爭議,其背後原因可能是在這類應用中,AI很明顯扮演的還是輔助的角色。

生成式AI在學術寫作中的應用帶來了兩大問題。一方面,剽竊因生成式AI而變得更容易了。剽竊者可以讓生成式AI用學術期刊的風格轉述他人研究,而轉述後的文本與原文相似程度一般都較低,因此很難被判定為抄襲。

此外,AI模型在訓練過程中消耗了大量版權內容,而模型極有可能將版權內容在沒有任何提示的情況下輸出給用戶。《紐約時報》就曾發現OpenAI的AI聊天機器人ChatGPT曾直接輸出過《紐約時報》報道中的原話,並未標註來源。他們也因此起訴OpenAI侵權。

二、貓鼠遊戲中檢測工具落敗,可輕易規避還容易誤判

為應對日益泛濫的AI工具使用,有不少企業推出了AIGC內容檢測工具,但這些工具在和生成式AI的「貓鼠遊戲」中紛紛落敗。

去年年底,德國柏林應用科技大學的幾名學者發表研究,他們發現學術界中經常使用的14種AI檢測工具中只有5個實現超過70%的正確率。而平均識別正確率僅有50%-60%。



▲市面上主流AIGC檢測工具表現不佳(圖源:Weber‑Wulf et al. )

這些AIGC檢測工具在面對人工編輯、機器轉述後的AI生成內容時表現更差。僅需經過同義詞替換和調整語序等簡單操作,AIGC檢測工具的正確率就將降低至50%以下。研究認為AIGC檢測工具的綜合識別準確率僅有50%。



▲圖中05、06分別為AI生成後人類編輯和機器轉述後的文本,AIGC檢測工具在這兩類文本上的表現很差(圖源:Weber‑Wulf et al. )

數據顯示,市面上的AIGC識別工具在識別人類寫作論文時的準確率很高。但如果作者先用自己熟悉的語言撰寫原創論文,然後讓翻譯軟件翻譯為另外一個語言,就有可能被識別工具誤判為AIGC。這可能對學者和學生的學術聲譽造成極為負面的影響。

三、輔助寫作與學術不端界限模糊,AI寫作工具也有其價值

不過,生成式AI工具的使用確實給部分研究者帶來了便利。利雅得沙特國王大學(King Saud University)的信息技術研究員亨德·哈利法(Hend Al-Khalifa)分享道,在生成式AI工具出現前,許多不精通英語的同事在論文寫作時都面臨很大的障礙,而現在,這些學者可以專註於研究本身,不必再寫作上耗費太多時間。

AI輔助寫作與學術不端行為之間的界限很難劃定。馬里蘭大學計算機科學家索海爾·費茲(Soheil Feizi)認為,使用生成式AI來轉述現有論文的內容顯然是抄襲。

但使用AI工具來輔助表達觀點的行為不應該受到懲罰。在主動披露AI工具使用的前提下,研究者可以使用詳細的提示詞生成文本,或是利用AI工具編輯草稿。

多本期刊也規範了AI工具在學術寫作中的使用,並未直接禁止。頂級學術期刊《科學》(Science)規定AI不可被列為合著者,而作者應披露所使用的AI系統和提示詞,並對內容準確性和是否涉嫌抄襲負責。



▲學術期刊《科學》對AI使用的相關規定(圖源:學術期刊《科學》官網)

學術期刊《自然》則規定研究者應該在「研究方法」部分記錄生成式AI工具的使用。統計數據顯示,截至2023年10月,100本排名靠前的期刊中,有87本都製定了使用生成式AI工具的指南。

結語:AI工具並非洪水猛獸,改變學術導向才能治本

在剛剛過去的大學畢業季中,有不少國內高校也在畢業論文答辯和評審過程中引入了AIGC檢測工具。然而,這一指標的引入並未有效遏製與AI工具相關的學術不端行為。市面上還出現了專門降AI率的各種服務,在被誤判為AI生成後,不少學生的論文因降AI率而變得面目全非。

對學術研究中的生成式AI工具采取對抗性態度或許很難根治這一問題。來自德國柏林應用科技大學的學者在總結研究時也強調,AI在學術寫作中的濫用問題光靠AIGC檢測很難完成,調整以論文和結果為導向的學術風氣才是解決這一問題的關鍵。---[來源:自然/智東西/編譯: 陳駿達*編輯: Panken]