李彥宏:沒有應用,基礎模型將一文不值
7月4日,百度創始人李彥宏再度回應大模型開源閉源之爭。
他在2024世界人工智能大會上表示,激烈競爭環境中,商業化閉源模型最能打。但比開源閉源之爭更重要的是,「卷」應用才是當前更具價值的話題,「沒有應用,基礎模型將一文不值」。
百度創始人李彥宏在2024世界人工智能大會演講。
今年3月以來的開源閉源爭議中,李彥宏稱「有些外行甚至混淆了模型開源和代碼開源這兩個概念」。模型開源的情況下,使用者得到的是基礎參數,還需進一步做監督微調(SFT)、安全對齊。
但由於不清楚參數來源,就無法做到「眾人拾柴火焰高」。即使拿到對應的源代碼,也無法獲知大模型開發者使用了哪些數據去訓練模型。所以,使用開源模型並不意味著可以站在巨人的肩膀上去開發叠代。
李彥宏認為,同樣參數規模之下,閉源模型的能力優於開源模型。如果開源模型想要追平閉源模型的能力,需要有更大的參數,那麽推理成本會更高,反應速度會更慢。一個激烈競爭的市場環境中,比拼的是業務效率和更低的成本,對此,「商業化的閉源模型是最能打的」。
此前4月中旬,李彥宏的一份內部講話內容流出,給開源路線潑冷水。他說,模型開源的意義不大,閉源才有真正的商業模式,能夠賺到錢並聚集算力和人才。
李彥宏隨後在4月18日的百度AI開發者大會進一步斷言:「開源模型會越來越落後。」其理由在於,通過文心4.0降維裁剪出來的更小尺寸模型,比直接拿開源模型調出來的模型,在同等尺寸下效果明顯更好;同等效果下,成本明顯更低。
但李彥宏也承認開源模型在某些場景下存在價值,比如學術研究、教學領域,可以借助開源模型研究大模型的運作機製。
與開源閉源之爭相比,李彥宏認為關註大模型的應用層更為重要,「沒有應用,光有一個基礎模型,不管是開源還是閉源,一文不值。」他呼籲業界不要繼續「卷」底層模型——此前的「百模大戰」造成了巨大的算力資源浪費,而應當去「卷」應用。
李彥宏說,隨著基礎模型的日益強大,開發應用變得越來越簡單,他最看好AI Agent(智能體)的應用方向。製作一個有價值的智能體,通常並不需要代碼,只需用自然語言把智能體的工作流程表述清楚,再配上專有的知識庫,比互聯網時代製作一個網頁還要簡單。
他預測,未來在醫療、金融、教育、製造、交通、農業等等各個領域,都會依據特定場景下的經驗、規則、數據等,打造出各種各樣的智能體,「將來會有數以百億的智能體出現,形成龐大的智能體生態」。搜索則是智能體分發最大的入口。
百度創始人李彥宏在2024世界人工智能大會演講。
李彥宏還回應了AI對就業市場影響的外界擔憂。他說,AI大模型更多扮演Copilot(副駕駛)的角色,只是輔助人,讓人的工作效率更高、質量更好,而不是替代人。
另一方面,大模型也催生了一些全新的工作機會。比如,過去幾年,百度在全國二十多個城市落地了數據標註中心,提供了大量的數據標註師就業崗位。
此外,隨著智能體的大量湧現,提示詞工程師的工作需求也會飆升——無需編程能力,但要有很強的邏輯性,用提示詞對模型進行調教。
「從石器時代的石斧,到移動時代的手機,再到AI時代的大模型,人類不斷創造各種工具來改善生活,來提高生產力。但是它們永遠只是工具,只有在被人類所使用的時候才有價值。」李彥宏說,AI不是人類的競爭對手,構建和應用AI技術是為了滿足人的需求,增強人的能力。
---[采寫:南都見習記者- 楊柳*記者: 王子黎*發自上海/來源: 南方都市報]