人類會被AI淘汰嗎?專家有不同看法;AI翻唱涉多項侵權
AIGC(AI Generated Content)即人工智能生成內容。近期爆火的 AI 聊天機器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生圖模型,都屬於 AIGC 的典型案例,它們通過借鑑現有的、人類創造的內容來快速完成內容創作。
「新晉流量」ChatGPT的背後,AIGC是「曇花一現」?還是將引領人工智能進入新的時代?「AIGC 周報」將從【技術前瞻】【企業動態】【政策法規】【專家觀點】帶你快速跟進 AIGC 世界。
技術前瞻
1.VideoChat::基於聊天的視頻理解系統
近日,上海人工智能實驗室、香港大學等聯合推出了一個端到端、基於聊天的視頻理解系統——VideoChat。它通過一個可學習的神經接口整合了視頻基礎模型和大型語言模型,在時空推理、事件定位和因果關係推理方面表現出色。
此外,研究團隊也提出了一個以視頻為中心的指令數據集,其中包含數千個視頻,配有詳細的描述和對話。這一數據集強調了時空推理和因果關係,為訓練基於聊天的視頻理解系統提供了有價值的資源。
初步的定性實驗顯示,該系統在各種視頻應用領域的潛力,並為未來的研究設定了標準。
參考鏈接:https://arxiv.org/abs/2305.06355
2.ImageBind:橫跨6種模態的開源大模型
日前,Meta公布了名為ImageBind的開源模型,該模型能夠同時從文本、圖像/視頻、音頻、深度(3D)、熱能(紅外輻射)和慣性測量單元(IMU)6種不同的模態中學習。據介紹,ImageBind還能夠超越之前的單一模態模型,具有更好的性能,並能夠更好地分析多種形式的信息,它的目標是使機器具備類似於人類的全面理解能力。
參考鏈接:https://arxiv.org/abs/2305.05665
3.OpenAI新研究:用AI解釋A
近日,OpenAI使用GPT-4對GPT-2中307200個神經元進行了解釋。從結果來看,絕大多數的解釋評分並不高,但有超過1000個神經元的解釋得分高於0.8。雖然從目前的結果來看,通過GPT-4解釋GPT-2的效果並不完美,但這一階段性的成果給AI可解釋性研究提供了思路。
參考鏈接:https://openai.com/research/language-models-can-explain-neurons-in-language-models
4.類似GPT-4,這個LLM有了多模態能力
近日,為了賦予LLMs多模態能力,,來自中科院、華南理工大學未來技術學院、中國科學院大學的研究團隊提出了X-LLM——使用X2L接口將多模態(圖像、語音、視頻)轉換為外語,並將其輸入到開源的雙語對話語言模型ChatGLM中。
實驗表明,X-LLM表現出了優異的多模態聊天能力,有時甚至會在未見過的圖像/指令上表現出多模態GPT-4的行為。與GPT-4相比,X-LLM在合成的多模態指令跟隨數據集上取得了84.5%的相對得分。
參考鏈接:https://arxiv.org/abs/2305.04160
5.新型Prompting讓大模型推理能力狂升
近日,華為聯合港中文提出Progressive-Hint Prompting(PHP),用來模擬人類做題過程。在PHP框架下,LLMs能夠利用前幾次生成的推理答案作為之後推理的提示,逐步靠近最終的正確答案。
這種PHP與LLMs交互的新方法,具有以下優點:1)PHP在數學推理任務上實現了顯著的性能提升,在多個推理基準測試上領先於最先進的結果;2)使用更強大的模型和提示,PHP可以更好地使LLMs受益;3)PHP可以與CoT和SC輕鬆結合,進一步提高性能。
參考鏈接:https://arxiv.org/abs/2304.09797
企業動態
1.OpenAI將向所有ChatGPT Plus用戶開放網絡功能和插件
OpenAI發推文稱,將在下周向所有ChatGPT Plus用戶推出網絡瀏覽和插件,這一舉措將允許ChatGPT訪問互聯網並使用70多個第三方插件。按照OpenAI的計劃,聯網和插件等新功能權限開放,共分為3個階段:Alpha階段:只有一小部分用戶能搶先試用。在這個階段,OpenAI的主要目標是收集不同群體用戶的反饋,不斷對新功能進行調整;Beta階段:向ChatGPT Plus用戶開放新功能測試;一般可用階段:在Beta測試完成後,OpenAI會評估新功能是否能面向所有人推出。如果一切順利,所有ChatGPT用戶都能體驗聯網和第三方插件。
2.HuggingFace上線新API,一鍵控制10萬多個AI模型
近日,HuggingFace推出了HuggingFace Transformers Agents,通過這一API,用戶可以控制10萬多個HuggingFace模型完成各種多模態任務。例如,如果你想讓Transformers Agents大聲解釋圖片上描繪了什麼內容,它就會嘗試理解你的指令,然後將其轉化為prompt,並挑選合適的模型、工具來完成你指定的任務。
3.Claude再升級,上下文窗口擴大為100k
Anthropic推出了100K Context Windows——將Claude的上下文窗口從9k token擴展到了100k,相當於75000個單詞。這意味着用戶可以提交數百頁材料讓Claude消化和解釋,且對話可以持續數小時甚至數天。現在可以通過Anthropic API訪問100K context windows。
4.谷歌將為AI生成圖片內嵌標記,Midjourney等將跟進支持
近日,谷歌在開發者大會上表示,將確保公司的每一張AI生成圖片都內嵌標記,這種標記無法被肉眼識別,但能被谷歌搜索引擎等軟件讀取出來,從而提示用戶該圖片由AI生成。此外,谷歌還會提供有關AI生成圖片的額外信息來防範詐騙,包括:該圖片首次上傳至搜索引擎的時間,以及該圖片是否曾被新聞網站引用過。未來幾個月內,Shutterstock、Midjourney等公司也將支持這種新的標記方法。
5.Stability AI發布動畫生成SDK
近日,為幫助藝術家和開發人員運用最先進的Stable Diffusion模型生成動畫,Stability AI發布了Stable Animation SDK。藉助這一工具,用戶可以使用所有Stable Diffusion模型,包括Stable Diffusion 2.0、Stable Diffusion XL等。
據介紹,目前有三種生成動畫的方式:1)文本輸入:使用文本形式的prompt,調整各種參數後生成動畫,這一功能與之前的Stable Diffusion、Midjourney或DALL-E 2類似;2)文本輸入+初始圖像輸入:用戶提供一個初始圖像,作為動畫的起點,再配合文本prompt,生成最終的動畫效果;3)初始視頻輸入+文本輸入:用戶提供一個初始視頻,以作為動畫基礎。在通過參數調整與文本prompt指導,最終可輸出動畫。
6.Spotify刪除數萬首AI歌曲
近日,流媒體音樂服務平台Spotify刪除了數萬首由AI初創公司Boomy生成的歌曲,希望通過加大審查力度來回應日益嚴重的流量欺詐等問題。最近幾個月,AI歌曲在音樂行業大肆泛濫,大量湧入各大流媒體平台。知情人士表示,唱片巨頭環球唱片已經向各大流媒體平台發出警告稱,他們看到Boomy的歌曲中存在可疑的流量。
7.360宣布上線「360AI商店」,將集成全球AI工具
近日,360集團創始人周鴻禕宣布上線AI商店。360AI商店作為AI導航,將集成全球AI工具,一方面利用流量優勢為研發AI垂直應用的創業公司提供展示窗口,一方面讓普通用戶使用AI工具更加便捷。目前,360AI商店匯集了AI作圖、AI寫作、AI音頻製作等十餘類幾百種工具,統一陳列和導航。
8.科大訊飛:訊飛星火大模型「套殼OpenAI的ChatGPT」是謠言
近日,科大訊飛接受機構調研表示,訊飛星火認知大模型為公司自主研發,使用了海量數據訓練,但由於ChatGPT比較火,訓練數據中出現了較多OpenAI、ChatGPT等詞彙,因而在有些問答中會錯誤地出現以上信息。網上有謠言說訊飛星火大模型「套殼OpenAI的ChatGPT」既不符合事實,也不符合邏輯:如果是套殼ChatGPT,就不可能出現訊飛星火大模型的響應速度比ChatGPT還快;更不會出現訊飛星火大模型在文本生成、知識問答、數學能力等方面的結果均優於ChatGPT的情況。
9.三星電子和Naver擬聯手打造生成式AI與AI芯片
韓國兩大科技巨頭——三星電子和Naver將聯合開發一款用於企業的生成式AI,計劃最早於10月份發布,與ChatGPT等工具競爭。根據雙方的AI合作關係,作為韓國最大的在線和搜索引擎運營商,Naver將從三星獲得半導體相關數據,以此創建生成式AI,再由三星進一步強化該工具。知情人士稱,一旦開發成功,這款可支持韓語的AI工具將被提供給三星電子設備解決方案(DS)部門使用,其應用範圍包括其半導體業務。而在實際測試後,三星計劃將該工具的使用範圍擴大到公司其他業務,包括負責智能手機和家電業務的設備體驗(DX)部門。
10.IBM發布針對基礎模型和生成式AI的IBM watsonx平台
IBM在2023年度Think大會上宣布,將推出針對基礎模型和生成式AI的全新平台IBM watsonx。該平台由三個產品集組成,其中,企業級AI開發平台IBM watsonx.ai和基於開放式湖倉一體架構的IBM watsonx.data預計會在2023年7月正式發布。
政策法規
1.歐盟立法者委員會同意更嚴格的AI規則草案
據路透社報道,在上周的投票中,歐洲議會議員同意禁止在公共場所使用面部識別工具,並對OpenAI的ChatGPT等生成式AI應用程序實施新的透明度措施。歐盟備受期待的AI法案將成為第一個管理該技術的全面立法,其中包含有關面部識別、生物識別監控和其他AI應用程序使用的新規則。經過兩年的談判,該法案現在有望進入下一階段,立法者將與歐盟委員會和各個成員國最終確定法律的細節。
2.Sam Altman將首次出席美國國會聽證會
ChatGPT這一突破性的生成式AI工具引發了人們對AI的新一輪投資熱潮,促使美國政策制定者紛紛呼籲加強監管和規範,以應對其巨大的潛力和風險。當地時間5月16日,OpenAI聯合創始人兼CEO Sam Altman將首次出席美國國會聽證會。據介紹,預計在聽證會上,討論議題將聚焦「可能需要哪些法律來保障普通人的利益」。IBM副總裁兼首席隱私和信任官Christina Montgomery,以及前紐約大學教授、對AI「炒作」持批評態度的Gary Marcus也將出席。
專家觀點
1.Demis Hassabis:AGI有望在幾年內到來
近日,谷歌旗下Google DeepMind CEO Demis Hassabis表示,通用人工智能(AGI)大概再過幾年就可能出現。他說,「AI過去數年的進展驚人,未來沒理由會慢下來,甚至可能加快。有鑑於此,我認為只要再花幾年、也許是十年內(就會出現AGI)。」
2.AI歌手翻唱或涉多項侵權行為
據央視新聞報道,近段時間,通過模型訓練和後期處理,模擬真人歌手聲音進行翻唱的「AI歌手」走紅網絡。專家提示,「AI歌手」可能涉及多項侵權問題:民法典明確參照肖像權的規定保護自然人聲音,不允許以偽造方式侵害他人肖像權;原詞曲作者、演唱者、錄音製作者的著作權,也不容忽視。目前,對於生成式AI的發展與管理,業界正在討論,我國也即將有規範可依。
3.周鴻禕:不會用GPT的人未來會被淘汰
近日,360集團創始人周鴻禕表示,ChatGPT-4.0已經是地球上最聰明的「人」了,不會用GPT的人未來會被淘汰掉。「大家不要把它看成一個新時代的搜索或者是新的聊天機器人,這只是它第一個版本的包裝而已。我覺得在三到五年裡,各種行業都要被GPT重塑一遍,所以現在誰不擁抱AI,誰就要被淘汰。
4.蔡崇信:不用過於擔心AI機器人未來會取代人類
對於飛速發展的AI及其可能的負面性,阿里巴巴集團董事會執行副主席蔡崇信表示,不用過於擔心AI機器人比人類更聰明、甚至取代人類。他認為,人類的大腦還有成千上億的細胞未被認識和探索,人類的潛能還有很多未被認知和開發。另外,此前的機器人只能做一些重複性工作,雖然當前已經可以做簡單的創意性工作,但很難複製人類相互之間的關係、情商、感情、欲望等。機器人不擁有人類之間諸如父子、夫妻及朋友等這樣的關係,機器人也很難產生像人類的一樣的「下一代」。
5.IDC:預計中國AI市場規模將在2023年超過147億美元
IDC預計,中國AI市場規模將在2023年超過147億美元,在2026年超過263億美元。IDC中國副總裁鍾振山認為,市場增量將主要源於基於大模型的應用替換過去幾年建設的AI應用、生成式AI帶來的增量市場和全新AI賦能的企業級應用。未來,不具備大模型能力的廠商將難以維持競爭優勢。
6.《復仇者聯盟》導演:兩年後或出現完全由AI製作的電影
日前,《復仇者聯盟》導演Joe Russo表示,AI不會消失,所有人都應該害怕AI。Russo指出,AI應該是為人類提供服務的工具,而不是人類為AI服務。他預計,大約兩年後就會出現完全由AI製作的電影,並稱Z世代將是引領AI時代的關鍵,任何人都能在AI工具的協助下講述故事或製造出大型遊戲。
7.台積電總裁魏哲家:AI已帶來革命性發展
近日,魏哲家在台積電技術論壇上表示,AI已帶來革命性發展,並開玩笑地表示,「AI持續演進,今年我的演講不是由ChatGPT生成來的,但明年一定會。」此外,魏哲家透露,公司有一家AI芯片龍頭客戶,其利用台積電代工售價600-700美元的AI芯片,完成開發AI方案設備並賣回給台積電,售價20萬美元,「這就是AI的強大價值」。
8.民生證券:「小型化」和「離線化」模型出現,邊緣側終端和芯片迭代有望加速
民生證券研報指出,作為谷歌最新發布的大模型PaLM 2的最輕量版本,Gecko可在移動設備端運行快速運行,提供每秒處理20個token的能力,能夠提供AIGC更為定製化、時延更低,安全性、隱私性更好的應用,開拓AI模型在終端芯片推理的場景,邊緣側智能終端以及SoC有望全面升級,進入新的更新換代周期。輕量級AI模型未來將持續提升智能終端邊緣算力需求,智能硬件的能力邊界將在AI的助力下不斷拓寬。
其他
1.美國網站公司擔心谷歌AI搜索降低原網站流量
日前,谷歌宣布將使用AI模型來整合網上信息,提供「生成式搜索」,在搜索結果頁面頂部向用戶直接展示AI生成的文本段落和一些鏈接,而非傳統的藍色鏈接列表形式。但多家網站公司表示,如果這種搜索形式成為谷歌搜索的默認方式,用戶可能只會停留在Google.com,降低其他網站的訪問量。一些公司開始探尋,是否可以阻止谷歌等公司抓取自家網站內容來訓練他們的模型。
2.能聽懂英語指令並執行家務的機器人
普林斯頓大學、斯坦福大學和谷歌的一組研究人員利用GPT-3 Davinci模型,研發出了一款能聽懂英語指令並執行家務的機器人,名為TidyBot。這款機器人可以根據用戶的喜好,自動完成如分類洗衣服、撿起地上的垃圾、收拾玩具等任務。
3.摩根士丹利:大多數個人投資者認為AI將對金融服務產生革命性影響
日前,摩根士丹利財富管理(MSWM)公布季度散戶調查問卷結果,透露了個人投資者對AI的看法。大多數人認為,AI將對金融服務產生革命性影響,但不會取代人類顧問的指導,且年輕投資者對AI的熱情最為明顯。63%的受訪者表示,有意向與利用AI的財務顧問合作。MSWM分析、數據和創新主管Jeff McMillan指出,AI不應被視為人類的替代品,而應被視為輔助財務顧問業務管理、與客戶互動強大工具。
4.日本藝人協會稱AI會剝奪工作機會
近日,由自由聲優、音樂家等組成的日本藝人協會稱「AI的發展導致表達的技術被剝奪」,許多人面臨失業風險,並向日本文化廳等送交請願書,要求完善法律加強權利保護措施。
5.一男子因用ChatGPT編造虛假信息被採取刑事強制措施
近日,平涼市公安局崆峒分局網安大隊對「今晨甘肅一火車撞上修路工人致9人死亡」的文章,初步判斷為信息虛假不實。經審訊,洪姓男子先搜尋了近年來中國討論度廣泛的社會新聞,隨後利用ChatGPT將特定元素例如時間、地點、日期或性別等進行修改,重新撰成一篇假新聞,藉由上傳這些文章讓帳號賺取流量再加以變現。警方表示,洪姓男子編造假新聞並散布在網絡上供人大量瀏覽的行為,已涉嫌尋釁滋事罪,目前已被採取刑事強制措施,最高可判處五年有期徒刑。
6.女網紅用AI複製自己,同時交往千名男友
一位23歲的女網紅Caryn Marjorie發布了AI版本的自己「Caryn AI」。據了解,Caryn AI是一款聊天機器人,可以作為用戶的「虛擬女友」,每分鐘收費一美元。根據《財富》雜誌的消息,在過去一周的beta階段,Caryn AI獲得了7.16萬美元(折合人民幣近50萬元)的收益,已經吸引了超過1000名付費粉絲,其中99%的用戶是男性。-(學術頭條/AIGC周報)