人類會被AI淘汰嗎？專家有不同看法；AI翻唱涉多項侵權

2023051518:17

AIGC（AI Generated Content）即人工智能生成內容。近期爆火的 AI 聊天機器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生圖模型，都屬於 AIGC 的典型案例，它們通過借鑑現有的、人類創造的內容來快速完成內容創作。

「新晉流量」ChatGPT的背後，AIGC是「曇花一現」？還是將引領人工智能進入新的時代？「AIGC 周報」將從【技術前瞻】【企業動態】【政策法規】【專家觀點】帶你快速跟進 AIGC 世界。

技術前瞻

1.VideoChat:：基於聊天的視頻理解系統

近日，上海人工智能實驗室、香港大學等聯合推出了一個端到端、基於聊天的視頻理解系統——VideoChat。它通過一個可學習的神經接口整合了視頻基礎模型和大型語言模型，在時空推理、事件定位和因果關係推理方面表現出色。

此外，研究團隊也提出了一個以視頻為中心的指令數據集，其中包含數千個視頻，配有詳細的描述和對話。這一數據集強調了時空推理和因果關係，為訓練基於聊天的視頻理解系統提供了有價值的資源。

初步的定性實驗顯示，該系統在各種視頻應用領域的潛力，並為未來的研究設定了標準。

參考鏈接：https://arxiv.org/abs/2305.06355

2.ImageBind：橫跨6種模態的開源大模型

日前，Meta公布了名為ImageBind的開源模型，該模型能夠同時從文本、圖像/視頻、音頻、深度（3D）、熱能（紅外輻射）和慣性測量單元（IMU）6種不同的模態中學習。據介紹，ImageBind還能夠超越之前的單一模態模型，具有更好的性能，並能夠更好地分析多種形式的信息，它的目標是使機器具備類似於人類的全面理解能力。

參考鏈接：https://arxiv.org/abs/2305.05665

3.OpenAI新研究：用AI解釋A

近日，OpenAI使用GPT-4對GPT-2中307200個神經元進行了解釋。從結果來看，絕大多數的解釋評分並不高，但有超過1000個神經元的解釋得分高於0.8。雖然從目前的結果來看，通過GPT-4解釋GPT-2的效果並不完美，但這一階段性的成果給AI可解釋性研究提供了思路。

參考鏈接：https://openai.com/research/language-models-can-explain-neurons-in-language-models

4.類似GPT-4，這個LLM有了多模態能力

近日，為了賦予LLMs多模態能力，，來自中科院、華南理工大學未來技術學院、中國科學院大學的研究團隊提出了X-LLM——使用X2L接口將多模態（圖像、語音、視頻）轉換為外語，並將其輸入到開源的雙語對話語言模型ChatGLM中。

實驗表明，X-LLM表現出了優異的多模態聊天能力，有時甚至會在未見過的圖像/指令上表現出多模態GPT-4的行為。與GPT-4相比，X-LLM在合成的多模態指令跟隨數據集上取得了84.5%的相對得分。

參考鏈接：https://arxiv.org/abs/2305.04160

5.新型Prompting讓大模型推理能力狂升

近日，華為聯合港中文提出Progressive-Hint Prompting（PHP），用來模擬人類做題過程。在PHP框架下，LLMs能夠利用前幾次生成的推理答案作為之後推理的提示，逐步靠近最終的正確答案。

這種PHP與LLMs交互的新方法，具有以下優點：1）PHP在數學推理任務上實現了顯著的性能提升，在多個推理基準測試上領先於最先進的結果；2）使用更強大的模型和提示，PHP可以更好地使LLMs受益；3）PHP可以與CoT和SC輕鬆結合，進一步提高性能。

參考鏈接：https://arxiv.org/abs/2304.09797

企業動態

1.OpenAI將向所有ChatGPT Plus用戶開放網絡功能和插件

OpenAI發推文稱，將在下周向所有ChatGPT Plus用戶推出網絡瀏覽和插件，這一舉措將允許ChatGPT訪問互聯網並使用70多個第三方插件。按照OpenAI的計劃，聯網和插件等新功能權限開放，共分為3個階段：Alpha階段：只有一小部分用戶能搶先試用。在這個階段，OpenAI的主要目標是收集不同群體用戶的反饋，不斷對新功能進行調整；Beta階段：向ChatGPT Plus用戶開放新功能測試；一般可用階段：在Beta測試完成後，OpenAI會評估新功能是否能面向所有人推出。如果一切順利，所有ChatGPT用戶都能體驗聯網和第三方插件。

2.HuggingFace上線新API，一鍵控制10萬多個AI模型

近日，HuggingFace推出了HuggingFace Transformers Agents，通過這一API，用戶可以控制10萬多個HuggingFace模型完成各種多模態任務。例如，如果你想讓Transformers Agents大聲解釋圖片上描繪了什麼內容，它就會嘗試理解你的指令，然後將其轉化為prompt，並挑選合適的模型、工具來完成你指定的任務。

3.Claude再升級，上下文窗口擴大為100k

Anthropic推出了100K Context Windows——將Claude的上下文窗口從9k token擴展到了100k，相當於75000個單詞。這意味着用戶可以提交數百頁材料讓Claude消化和解釋，且對話可以持續數小時甚至數天。現在可以通過Anthropic API訪問100K context windows。

4.谷歌將為AI生成圖片內嵌標記，Midjourney等將跟進支持

近日，谷歌在開發者大會上表示，將確保公司的每一張AI生成圖片都內嵌標記，這種標記無法被肉眼識別，但能被谷歌搜索引擎等軟件讀取出來，從而提示用戶該圖片由AI生成。此外，谷歌還會提供有關AI生成圖片的額外信息來防範詐騙，包括：該圖片首次上傳至搜索引擎的時間，以及該圖片是否曾被新聞網站引用過。未來幾個月內，Shutterstock、Midjourney等公司也將支持這種新的標記方法。

5.Stability AI發布動畫生成SDK

近日，為幫助藝術家和開發人員運用最先進的Stable Diffusion模型生成動畫，Stability AI發布了Stable Animation SDK。藉助這一工具，用戶可以使用所有Stable Diffusion模型，包括Stable Diffusion 2.0、Stable Diffusion XL等。

據介紹，目前有三種生成動畫的方式：1）文本輸入：使用文本形式的prompt，調整各種參數後生成動畫，這一功能與之前的Stable Diffusion、Midjourney或DALL-E 2類似；2）文本輸入+初始圖像輸入：用戶提供一個初始圖像，作為動畫的起點，再配合文本prompt，生成最終的動畫效果；3）初始視頻輸入+文本輸入：用戶提供一個初始視頻，以作為動畫基礎。在通過參數調整與文本prompt指導，最終可輸出動畫。

6.Spotify刪除數萬首AI歌曲

近日，流媒體音樂服務平台Spotify刪除了數萬首由AI初創公司Boomy生成的歌曲，希望通過加大審查力度來回應日益嚴重的流量欺詐等問題。最近幾個月，AI歌曲在音樂行業大肆泛濫，大量湧入各大流媒體平台。知情人士表示，唱片巨頭環球唱片已經向各大流媒體平台發出警告稱，他們看到Boomy的歌曲中存在可疑的流量。

7.360宣布上線「360AI商店」，將集成全球AI工具

近日，360集團創始人周鴻禕宣布上線AI商店。360AI商店作為AI導航，將集成全球AI工具，一方面利用流量優勢為研發AI垂直應用的創業公司提供展示窗口，一方面讓普通用戶使用AI工具更加便捷。目前，360AI商店匯集了AI作圖、AI寫作、AI音頻製作等十餘類幾百種工具，統一陳列和導航。

8.科大訊飛：訊飛星火大模型「套殼OpenAI的ChatGPT」是謠言

近日，科大訊飛接受機構調研表示，訊飛星火認知大模型為公司自主研發，使用了海量數據訓練，但由於ChatGPT比較火，訓練數據中出現了較多OpenAI、ChatGPT等詞彙，因而在有些問答中會錯誤地出現以上信息。網上有謠言說訊飛星火大模型「套殼OpenAI的ChatGPT」既不符合事實，也不符合邏輯：如果是套殼ChatGPT，就不可能出現訊飛星火大模型的響應速度比ChatGPT還快；更不會出現訊飛星火大模型在文本生成、知識問答、數學能力等方面的結果均優於ChatGPT的情況。

9.三星電子和Naver擬聯手打造生成式AI與AI芯片

韓國兩大科技巨頭——三星電子和Naver將聯合開發一款用於企業的生成式AI，計劃最早於10月份發布，與ChatGPT等工具競爭。根據雙方的AI合作關係，作為韓國最大的在線和搜索引擎運營商，Naver將從三星獲得半導體相關數據，以此創建生成式AI，再由三星進一步強化該工具。知情人士稱，一旦開發成功，這款可支持韓語的AI工具將被提供給三星電子設備解決方案（DS）部門使用，其應用範圍包括其半導體業務。而在實際測試後，三星計劃將該工具的使用範圍擴大到公司其他業務，包括負責智能手機和家電業務的設備體驗（DX）部門。

10.IBM發布針對基礎模型和生成式AI的IBM watsonx平台

IBM在2023年度Think大會上宣布，將推出針對基礎模型和生成式AI的全新平台IBM watsonx。該平台由三個產品集組成，其中，企業級AI開發平台IBM watsonx.ai和基於開放式湖倉一體架構的IBM watsonx.data預計會在2023年7月正式發布。
政策法規

1.歐盟立法者委員會同意更嚴格的AI規則草案

據路透社報道，在上周的投票中，歐洲議會議員同意禁止在公共場所使用面部識別工具，並對OpenAI的ChatGPT等生成式AI應用程序實施新的透明度措施。歐盟備受期待的AI法案將成為第一個管理該技術的全面立法，其中包含有關面部識別、生物識別監控和其他AI應用程序使用的新規則。經過兩年的談判，該法案現在有望進入下一階段，立法者將與歐盟委員會和各個成員國最終確定法律的細節。

2.Sam Altman將首次出席美國國會聽證會

ChatGPT這一突破性的生成式AI工具引發了人們對AI的新一輪投資熱潮，促使美國政策制定者紛紛呼籲加強監管和規範，以應對其巨大的潛力和風險。當地時間5月16日，OpenAI聯合創始人兼CEO Sam Altman將首次出席美國國會聽證會。據介紹，預計在聽證會上，討論議題將聚焦「可能需要哪些法律來保障普通人的利益」。IBM副總裁兼首席隱私和信任官Christina Montgomery，以及前紐約大學教授、對AI「炒作」持批評態度的Gary Marcus也將出席。
專家觀點

1.Demis Hassabis：AGI有望在幾年內到來

近日，谷歌旗下Google DeepMind CEO Demis Hassabis表示，通用人工智能（AGI）大概再過幾年就可能出現。他說，「AI過去數年的進展驚人，未來沒理由會慢下來，甚至可能加快。有鑑於此，我認為只要再花幾年、也許是十年內（就會出現AGI）。」

2.AI歌手翻唱或涉多項侵權行為

據央視新聞報道，近段時間，通過模型訓練和後期處理，模擬真人歌手聲音進行翻唱的「AI歌手」走紅網絡。專家提示，「AI歌手」可能涉及多項侵權問題：民法典明確參照肖像權的規定保護自然人聲音，不允許以偽造方式侵害他人肖像權；原詞曲作者、演唱者、錄音製作者的著作權，也不容忽視。目前，對於生成式AI的發展與管理，業界正在討論，我國也即將有規範可依。

3.周鴻禕：不會用GPT的人未來會被淘汰

近日，360集團創始人周鴻禕表示，ChatGPT-4.0已經是地球上最聰明的「人」了，不會用GPT的人未來會被淘汰掉。「大家不要把它看成一個新時代的搜索或者是新的聊天機器人，這只是它第一個版本的包裝而已。我覺得在三到五年裡，各種行業都要被GPT重塑一遍，所以現在誰不擁抱AI，誰就要被淘汰。

4.蔡崇信：不用過於擔心AI機器人未來會取代人類

對於飛速發展的AI及其可能的負面性，阿里巴巴集團董事會執行副主席蔡崇信表示，不用過於擔心AI機器人比人類更聰明、甚至取代人類。他認為，人類的大腦還有成千上億的細胞未被認識和探索，人類的潛能還有很多未被認知和開發。另外，此前的機器人只能做一些重複性工作，雖然當前已經可以做簡單的創意性工作，但很難複製人類相互之間的關係、情商、感情、欲望等。機器人不擁有人類之間諸如父子、夫妻及朋友等這樣的關係，機器人也很難產生像人類的一樣的「下一代」。

5.IDC：預計中國AI市場規模將在2023年超過147億美元

IDC預計，中國AI市場規模將在2023年超過147億美元，在2026年超過263億美元。IDC中國副總裁鍾振山認為，市場增量將主要源於基於大模型的應用替換過去幾年建設的AI應用、生成式AI帶來的增量市場和全新AI賦能的企業級應用。未來，不具備大模型能力的廠商將難以維持競爭優勢。

6.《復仇者聯盟》導演：兩年後或出現完全由AI製作的電影

日前，《復仇者聯盟》導演Joe Russo表示，AI不會消失，所有人都應該害怕AI。Russo指出，AI應該是為人類提供服務的工具，而不是人類為AI服務。他預計，大約兩年後就會出現完全由AI製作的電影，並稱Z世代將是引領AI時代的關鍵，任何人都能在AI工具的協助下講述故事或製造出大型遊戲。

7.台積電總裁魏哲家：AI已帶來革命性發展

近日，魏哲家在台積電技術論壇上表示，AI已帶來革命性發展，並開玩笑地表示，「AI持續演進，今年我的演講不是由ChatGPT生成來的，但明年一定會。」此外，魏哲家透露，公司有一家AI芯片龍頭客戶，其利用台積電代工售價600-700美元的AI芯片，完成開發AI方案設備並賣回給台積電，售價20萬美元，「這就是AI的強大價值」。

8.民生證券：「小型化」和「離線化」模型出現，邊緣側終端和芯片迭代有望加速

民生證券研報指出，作為谷歌最新發布的大模型PaLM 2的最輕量版本，Gecko可在移動設備端運行快速運行，提供每秒處理20個token的能力，能夠提供AIGC更為定製化、時延更低，安全性、隱私性更好的應用，開拓AI模型在終端芯片推理的場景，邊緣側智能終端以及SoC有望全面升級，進入新的更新換代周期。輕量級AI模型未來將持續提升智能終端邊緣算力需求，智能硬件的能力邊界將在AI的助力下不斷拓寬。
其他

1.美國網站公司擔心谷歌AI搜索降低原網站流量

日前，谷歌宣布將使用AI模型來整合網上信息，提供「生成式搜索」，在搜索結果頁面頂部向用戶直接展示AI生成的文本段落和一些鏈接，而非傳統的藍色鏈接列表形式。但多家網站公司表示，如果這種搜索形式成為谷歌搜索的默認方式，用戶可能只會停留在Google.com，降低其他網站的訪問量。一些公司開始探尋，是否可以阻止谷歌等公司抓取自家網站內容來訓練他們的模型。

2.能聽懂英語指令並執行家務的機器人

普林斯頓大學、斯坦福大學和谷歌的一組研究人員利用GPT-3 Davinci模型，研發出了一款能聽懂英語指令並執行家務的機器人，名為TidyBot。這款機器人可以根據用戶的喜好，自動完成如分類洗衣服、撿起地上的垃圾、收拾玩具等任務。

3.摩根士丹利：大多數個人投資者認為AI將對金融服務產生革命性影響

日前，摩根士丹利財富管理（MSWM）公布季度散戶調查問卷結果，透露了個人投資者對AI的看法。大多數人認為，AI將對金融服務產生革命性影響，但不會取代人類顧問的指導，且年輕投資者對AI的熱情最為明顯。63%的受訪者表示，有意向與利用AI的財務顧問合作。MSWM分析、數據和創新主管Jeff McMillan指出，AI不應被視為人類的替代品，而應被視為輔助財務顧問業務管理、與客戶互動強大工具。

4.日本藝人協會稱AI會剝奪工作機會

近日，由自由聲優、音樂家等組成的日本藝人協會稱「AI的發展導致表達的技術被剝奪」，許多人面臨失業風險，並向日本文化廳等送交請願書，要求完善法律加強權利保護措施。

5.一男子因用ChatGPT編造虛假信息被採取刑事強制措施

近日，平涼市公安局崆峒分局網安大隊對「今晨甘肅一火車撞上修路工人致9人死亡」的文章，初步判斷為信息虛假不實。經審訊，洪姓男子先搜尋了近年來中國討論度廣泛的社會新聞，隨後利用ChatGPT將特定元素例如時間、地點、日期或性別等進行修改，重新撰成一篇假新聞，藉由上傳這些文章讓帳號賺取流量再加以變現。警方表示，洪姓男子編造假新聞並散布在網絡上供人大量瀏覽的行為，已涉嫌尋釁滋事罪，目前已被採取刑事強制措施，最高可判處五年有期徒刑。

6.女網紅用AI複製自己，同時交往千名男友

一位23歲的女網紅Caryn Marjorie發布了AI版本的自己「Caryn AI」。據了解，Caryn AI是一款聊天機器人，可以作為用戶的「虛擬女友」，每分鐘收費一美元。根據《財富》雜誌的消息，在過去一周的beta階段，Caryn AI獲得了7.16萬美元（折合人民幣近50萬元）的收益，已經吸引了超過1000名付費粉絲，其中99%的用戶是男性。-(學術頭條/AIGC周報)

我要留言

人類會被AI淘汰嗎？專家有不同看法；AI翻唱涉多項侵權

天道天意傳承演生命本體皈依虔宇宙天國永生連靈魂清淨神身轉龍紀元神人類衍*彌勒金線聖火傳

腦機接口、腦波和fMRI，AI正在掌握讀心術

天道天意傳承演生命本體皈依虔宇宙天國永生連靈魂清淨神身轉龍紀元神人類衍*彌勒金線聖火傳

腦機接口、腦波和fMRI，AI正在掌握讀心術

人類會被AI淘汰嗎？專家有不同看法；AI翻唱涉多項侵權

天道天意傳承演*生命本體皈依虔*宇宙天國永生連*靈魂清淨神身轉*龍紀元神人類衍*彌勒金線聖火傳

腦機接口、腦波和fMRI，AI正在掌握讀心術

天道天意傳承演*生命本體皈依虔*宇宙天國永生連*靈魂清淨神身轉*龍紀元神人類衍*彌勒金線聖火傳

腦機接口、腦波和fMRI，AI正在掌握讀心術

天道天意傳承演生命本體皈依虔宇宙天國永生連靈魂清淨神身轉龍紀元神人類衍*彌勒金線聖火傳

天道天意傳承演生命本體皈依虔宇宙天國永生連靈魂清淨神身轉龍紀元神人類衍*彌勒金線聖火傳