萬字記錄谷歌I/O全球專訪:劈柴說「我有一個十年的路線圖」
在今年I/O的第二天,谷歌在美國總部(Googleplex 2000)組織了一場小範圍專訪,包括谷歌母公司Alphabet兼谷歌CEO桑達爾·劈柴(Sundar Pichai)在內的四位核心管理層,接受了包括科技行者Techwalker、CNBC、《朝鮮日報》、意大利紙媒《La Repubblica》、巴西紙媒《Folha de S. Paulo》、英國電視臺等全球媒體的提問。
采訪中,劈柴回應「OpenAI的截胡式發布」時說道:「當我們正處於AI的拐點上時,我看到的是機會,所以如果把這個時間線拉長,那麽某一天發生的某一件事就都無關緊要了。這意味著,有一個正確的遠見很重要,因為大家討論的是這項人類有史以來最深奧的技術之一。」
他繼續說道,「我喜歡看到創新,創新對世界各地的人都有好處。看到其他公司也在創新是件好事,谷歌也和你們一樣為創新感到高興,這促使我們所有人做得更好,也對整個世界更好。」「所以對我來說,這是科技領域最棒的一周。」(下文將附上劈柴的完整回答)
在整場約45分鐘的采訪中,四位谷歌發言人回答了包括如何看待競爭與合作、谷歌業務發展、AI倫理與監管、AI教育與就業等一共19個問題。
從左到右依次為:谷歌全球傳播副總裁Lily Lin(本場主持人)、Alphabet兼谷歌CEO桑達爾·皮查伊(Sundar Pichai)、谷歌搜索副總裁伊麗莎白·裏德(Elizabeth Reid)、谷歌研究、技術和社會事務高級副總裁詹姆斯·馬尼卡(James Manyika)、Deepmind首席技術官科拉伊·卡夫丘格魯(Koray Kavukcuoglu)。
其中,伊麗莎白·裏德是最早構建谷歌核心產品Google Local(谷歌地圖的前身)的工程師之一;詹姆斯·馬尼卡曾在NASA噴氣推進實驗室的人機系統組工作,研究AI在火星探測器任務的應;科拉伊·卡夫丘格魯主要掌管Gemini項目,他曾經是一名航空工程師,因為對數學的熱愛,才轉行到AI領域。
以下是采訪全錄(內容由科技行者聽譯編輯):
01 談競爭與發展:創新是件好事
問:在I/O的前一天,OpenAI 推出了GPT-4o,很多媒體都把它描述為:OpenAI 與谷歌分庭抗禮。相信大家都好奇,你對此有何感想?另外你如何反擊?
劈柴:從我的角度來看,當我想到正處於AI的拐點上時,我看到的是機會,所以如果把這個時間線拉長,那麽某一天發生的某一件事就都無關緊要了。
因此,有一個正確的遠見很重要,因為大家討論的是這項人類有史以來最深奧的技術之一。
谷歌對AI的投資由來已久。我們正在開發最先進的模型,並努力將其應用到數十億人的生活中,從而改變他們的生活。這就是谷歌的使命,過去十年、兩年、去年,我們一直專註於此。
在某些微小的時刻,總會有這樣或那樣的事情發生。但就我個人而言,我喜歡看到創新,創新對世界各地的每個人都有好處。看到其他公司也在創新是件好事,谷歌也和你們一樣為創新感到高興,這促使我們所有人做得更好,也對整個世界更好。
所以對我來說,這是科技領域最棒的一周。
問:在忙完I/O之後,最讓你期待的下一件事是什麽?
劈柴:在回答之前,我想先回顧現狀。從很久之前,谷歌就踏上了AI之旅,相信大家從今年的谷歌I/O也能看出來,谷歌正在把所有產品註入AI,讓AI對每個人都有幫助。鑒於谷歌的產品規模效應,我們認為也能真正幫助大規模用戶。
技術的進步是相當驚人的。我要談的是三個趨勢(昨天在I/O也已講過)。
第一,Gemini天生就是多模態的。當你看到我們推出Project Astra項目時,這一點才真正開始浮出水面。這是谷歌的願景,從頭開始訓練一個多模態模型,谷歌也是第一批這麽做的公司之一。
第二,長上下文。100 萬token是現階段最長的上下文,但我們昨天宣布 200 萬token預覽版,我們正在挑戰極限。而且,這些模型可以根據上下文進行調整,我認為這將具有開創性的意義。
第三,我們正在推動它們向AI Agent(AI智能體)發展。相信大家已經看到一些演示片段,無論是做復雜的查詢,還是Gemini為你計劃一次旅行,或是Chrome在後臺幫你做一些事情,都是為了幫助你解決問題。
所以未來有無限可能。基於谷歌的技術積累,我們已經做好了充分準備,包括領先的基礎設施、創新和搜索、以及我們的全球產品布局,我們所做的一切,都是為全世界的人們(提供價值)。
我對未來充滿期待,謝謝。
問:我覺得在谷歌,大家經常談論的是「搜索」,而不是「解決問題」。在這個AI時代,你怎麽看待搜索?你覺得我們離「解決問題」更近了嗎?
伊麗莎白·裏德:我認為一點都不近,我們還有很長的路要走。大家常說,人類的好奇心是無限的,你可以從一個3歲小孩的「十萬個為什麽」中看到這點。真正受限的是獲取信息的途徑。
「你能用自然語言訪問搜索嗎?你能以你所理解的方式提問嗎?」
我認為,Gemini時代和AI時代真正讓人興奮的是,它有能力解鎖更多的問題,讓我們更容易開展更多工作。當你試圖獲取信息和探索自己的好奇心時,讓AI盡可能做更多的工作,你自己可以做更少的工作。
問詹姆斯·馬尼卡:你職業生涯的大部分時間,都在思考科學、技術和經濟的交叉學科問題,AI的一個領域現在可能還沒有被每個人註意到,那就是科學發現。你認為AI會給科學帶來什麽樣的變化?
詹姆斯·馬尼卡:我們現在用航空科學做的事情,是令人驚嘆的。谷歌在去年取得了很多進展,這裏我講講過去三周發生的事。
三周前,谷歌發布了 MedGemini,這是一個基於Gemini模型,專為醫療保健行業量身定製,並根據健康數據進行微調的模型。這將對醫療領域產生巨大影響,它可以處理圖像、DNA 序列和通用信息,為醫生提供幫助。
一周前,AlphaFold 3發布,這個模型從最初只研究蛋白質結構,到現在能夠預測蛋白質、DNA、RNA、小分子等的幾乎所有生物分子結構和相互作用。想想這會對研究人員和科學家提供多大價值。
同期,谷歌開啟了一項研究人類大腦如何思考的征程。谷歌與哈佛大學合作,展示了人類大腦目前最高清人腦局部圖譜。盡管該圖僅是人腦的一微小部分(整個大腦要大一百萬倍),但其中已經包含了約57000個細胞、約230毫米長的血管和近1.5億個神經突觸,是目前有史以來分辨率最高的人腦圖像。該圖譜重點關註細胞之間的連接,這個領域被稱為「連接組學(connectomics)」。
當然,上述也只是最近三周的動態。
如果再往前追溯,你就會發現,谷歌正在以一種真正讓世界各地研究人員真正受益的方式,最大程度地推動科學發展。在,我們現在有全球 180 萬生物學家,來自 119 個國家,在訪問AlphaFold 系統。他們中的很多人所研究的,是被忽視的疾病,而這些疾病本來很難研究。
所以,AI+科學會創造出極大可能性。
問:就像劈柴昨天說的,我們現在正處於Gemini時代。當你終於能夠將自己的勞動成果帶給全世界的用戶和開發者時,最讓你興奮的是什麽?
科拉伊·卡夫丘格魯:Gemini的整個組合都相當令人興奮。作為谷歌的研究人員,我們在這方面已經研究了很長時間。
當你回顧AI的歷史,看它是如何建立起來的,很多創新實際上是今天實現的根本創新。在谷歌和不同的團隊中,Gemini的能力其實已經發揮作用了。
谷歌正處於這樣一個階段,所有谷歌的團隊、產品和項目,其實都是在內化Gemini,我們正在重新思考如何做事,重新思考如何解決問題,我認為這真的很鼓舞人心,因為當我們為未來的道路做準備時,當我們在開發智能時,與用戶合作是非常重要的。
對我們來說很重要的是,能夠從用戶那裏得到反饋,然後找出需要解決的正確問題,並指導我們的研究。
02 談AI倫理:持謹慎樂觀立場
問:昨天在I/O之後,我在文章裏寫,AI將越來越成為有用的生活助手,但《紐約時報》最近也寫道,AI的《她》時代已來,你相信未來會有人真的愛上AI嗎?你在職業生涯中何時對AI產生了熱愛?
劈柴:首先申明,我愛我的妻子。(說完臺下笑聲一片)
我在印度長大,互聯網和谷歌吸引我的部分原因是,意識到那是技術民主化的過程。互聯網可以觸及每一個人,而這在很大程度上是通過人來實現的。要知道,我們已經從最初的5億人使用計算機發展到現在的40多億人,只要你有電腦和網絡連接,你的指尖就能觸及世界任何地方的知識。
我認為AI具有同樣的潛力。
要知道,今天很少有人能請得起家教、保安、私人醫生,在這些事情上確實存在不平等,而AI為大多數人提供這些能力的機會,影響是非常深遠的。
至於我是什麽時候愛上AI的?也許是當我看到神經網絡識別貓圖像的那一刻,那是我腦中第一次出現 "啊哈"的瞬間,我在想,AI發揮作用了。
再回答前面的問題,未來是否有人會真正愛上AI?每項技術都有兩面性,積極的一面是,有人用AI來保存對親人的記憶,有人用它來突破語言障礙。的確,隨著技術的進步,人們會與這些智能助手、AI智能體等,建立深厚的關系。
但同時,我們也應該為所有可能性做好準備。這就是為什麽谷歌希望以大膽而負責任的方式開發AI。我們希望取得技術成果,但在此過程中,要考慮清楚會有哪些保護措施來避免一些不利因素。
一個很好的例子是谷歌的水印工具Synt ID,我們把它引入到文本和視頻中。所以這些工作都是相輔相成的。
問:有一個問題是關於AI深度偽造和合成內容,它可能會影響民眾的投票決策。
劈柴:谷歌已將投票「信息真實」作為公司的最高優先事項之一,特別是在我們的搜索和YouTube等產品中,以及在我們部署AI時。我們之所以要開發 Synt ID 或AI輔助紅隊測試(名為AI-assisted red teaming,該技術利用DeepMind在AlphaGo等遊戲方面的突破以改進谷歌的模型),部分原因就是要走在這些問題的前面。
我們還通過Jigsaw(谷歌母公司Alphabet旗下專註於網絡安全的部門) 開展大量研究,了解世界上的模式,在必要時我們會與相關部門等共享信息。起碼在目前,在我們所處的環境中,現在還很容易判斷什麽是真實的、什麽是虛假的。
話雖如此,考慮到技術進步的速度,我們依然會擔心AI深度偽造等問題。結合我們正在開展的工作,我持謹慎樂觀的立場。我們將盡我們所能,處理好這一切。
我認為未來的賭註會越來越大(情況會更復雜),但就今年而言,我對現狀持謹慎樂觀立場。
問:許多國家正試圖對生成式AI實施嚴格的監管。那麽,你如何看待當前形勢,以及如何應對安全和數據隱私方面的監管?
劈柴:對於管理部門來說,在它們考慮到AI對社會的影響時,監管對於安全和數據隱私發揮了重要作用。但同時,取得平衡也很重要。
AI將帶來大量機遇,經濟機遇將全面影響產業,所以讓AI創新在各國實現也很重要,否則就有可能被甩在後面。
總結來說,如何在促進創新和擁抱創新的同時減少危害,是各國正在努力尋求的平衡點。隨著時間推移,我們將需要更多的全球框架。我知道現在還為時尚早,但我們已經看到了令人鼓舞的進展。
選擇擁抱AI創新,對世界會更好,互聯網之所以能成為今天的重要力量,部分原因就在於它是一種全球性的技術,我們願意踐行共同的標準和合作,希望AI時代也能如此。
問:印度一直是個消費型經濟體,尤其是在技術方面。但在過去的十年中,隨著支付和其他行業在AI方面的發展,情況發生了變化。你是否希望印度也能扮演創新型經濟體的角色?
劈柴:對於印度和其他新興國家而言,技術變革始終是一次追趕或飛躍的機會。沒錯,印度是一個很好的例子,它永遠不會在某些事情跨越發達國家,比如個人電腦的普及。
但與上一代人相比,印度有更多的人可以使用移動電話。人們或許沒有固定電話,但大多數人都有手機。因此,我認為隨著每一次技術的轉變,都有更好的機會來推動這種普及。
AI也一樣。谷歌有很多AI工具,就我們的用戶群而言,印度是排名第一的國家。所以為了能夠為他們服務,我們致力於提供同樣的AI工具。在谷歌的AI平臺上,我們已經看到了大量來自印度的開發者活動。
所以,我認為印度將在AI變革中占據有利位置。
03 談就業:AI與人類是「有效合作」
問:看到谷歌的發展時,我想問下就業問題。鑒於AI已經是幾乎所有公司的起點,谷歌或其他大型科技公司,現在需要什麽樣的專業人才?因為比如說在拉丁美洲,我還沒有看到大學設立AI相關的課程。
詹姆斯·馬尼卡:首先,包括公司的程序員在內,都發現AI系統為他們的工作,提供了難以置信的幫助。
舉例來說,在谷歌,很多員工都會「結對兒編程」,也就是他們並肩坐在一起工作。越來越多人發現,AI實際上是一種「有效合作」,所以AI系統有能力幫助人們,尤其是擁有最少技能的員工。現在有一項讓人難以置信的研究表明,如果技能較低的人使用這些AI工具,他們會做的更好。
所以我們花了很多時間思考,如何既讓我們團隊、又讓更多人培養AI技能,最近我們搞了一個叫做「與谷歌一起成長(growth google)」 的項目,教大家學習AI技能。我們還推出了「AI Essentials(人工智能必需品)」的項目,正是為了幫助職場人、學生使用這些AI技能。我們已經與大學合作,也許我們需要找機會與哥倫比亞的大學和其他機構開展合作。
STEM技能仍然很重要。了解STEM與其他學科的交叉也很重要。所以我們的團隊成員既有計算機科學家,也有社會科學家,但其實能把這些學科聯系起來的人,才是最有趣的人才,我們需要更多這樣的人才。
問:我來自哥倫比亞,是一名技術內容創作者,這是我第一次來I/O,很高興見到大家。我想知道一個年輕的拉美男孩,他熱愛技術,想做你所做的,走你所走的路。你對他的建議是什麽?
劈柴:我很樂意分享,因為我就是那樣的男孩,我會記下來的是詹姆斯·惠特尼給我的職業建議。
我對這個男孩的建議是,要有遠大的夢想,要專註於你的好奇心。現在比較好的是,對於很多像那個孩子來說,學習的途徑其實有很多。
我看到巴西薩爾瓦多的孩子們,經常會冒出一些不可思議的想法。還有其他很多地區的孩子們,他們有很好的想法,但沒有人真正教他們編程,沒有人教他們科學。但好在,當他們使用AI工具時,AI可以讓他們起草這些想法,勾勒出這些文化的想法。
當我看到AI系統開始處理更多的語言,讓信息更容易獲取時,我認為AI實際正在幫助消除一些準入障礙。
所以,我會告訴那個孩子,訪問這些系統,讓我們幫助他用自己的語言進入這些系統,我們很樂意為此提供幫助,助力他實現自己的夢想。
問:你是否認為關於AI的問題,很多答案都是用哲學而不僅僅是技術和工程學來解決的?
劈柴:我始終認為,隨著AI取得更大的進步,我們必須將更多的視角引入該領域。
所以,AI是需要社會科學家、哲學家等人參與進來的領域,谷歌一直都是這樣做的,尤其是考慮到「負責任的AI」這件事情時。
而且,這是谷歌團隊在開發AI早期時,就開始思考的問題。當你看谷歌做的第一篇大語言模型論文時,我們就分析了其中的AI倫理問題。事實上,我們是與哲學家和倫理學家合作,因為理解「AI如何影響社會」對我們來說相當重要。這樣,我們就能了解哪些是要解決的正確問題,哪些是要在這些領域引入的正確解決方案。
04 談谷歌:我腦中有一個10年路線圖
問:有些人認為,我們所熟知的互聯網正在消亡,正在因為AI的防禦、流程自動化程度的提高、機器人的發展等。你認為生成式AI將如何影響今天的互聯網?它會完全改變我們今天的認知嗎?
伊麗莎白·裏德:這是我們在搜索業務中經常思考的問題。我們將AI Overviews(AI概述)設計成一個起點,讓用戶可以從這個起點開始,深入挖掘。
我們確實專註於優先考慮發送有價值流量的方法。對我們來說,保持網絡的健康發展非常重要,這不僅是生態系統的重要性,也是產品的重要性。這也是我們傾聽用戶需求得出的,用戶希望聽到他人的生活經驗、觀點、某領域的專業知識。
所以,我們希望幫人們更有效地連接到網絡。AI有很多機會可以更深入地進入網絡,在你有專業知識的地方連接到更多的好奇者。
以前,人們搜索簡單的問題,所以搜索結果的靠前位置,都是泛泛而談的網站。但現在,當人們開始問新的問題時,問更豐富的問題時,實際上能夠將他們與真正讓他們產生共鳴的人聯系起來。
我們還看到,AI Overviews(AI概述)讓人們搜索更多,它帶來了新的問題類型,帶來了更多的問題,這些都是人們在網絡上的額外機會。
問:越來越多的年輕人用 TikTok 和社交媒體,這也是谷歌會關註的領域嗎,谷歌打算如何應對當前和未來的挑戰?
伊麗莎白·裏德:谷歌的研究發現,年輕用戶對於直接聽取他人意見非常感興趣,想要聽聽他人的經驗、觀點等,他們不想只是將這些問題交給幾個權威機構或網上一個不知名的聲音。
所以在過去幾年裏,我們一直在投資「如何讓人們更容易找到這些體驗」,讓人們更容易找到討論論壇,為那些正在搜索短視頻的人整合短視頻。我們做了很多事情,也會持續做下去。
這種不斷詢問用戶需求很重要,我們尋找它、觀察它、然後針對它們進行創新,我們會持續這樣做下去。
問:很多人擔心AI Overviews(AI概述)會對廣告業產生影響,你們對此怎麽看?
伊麗莎白·裏德:這個問題,或許是未來兩年內會出現的真實擔憂。但從商業模式來看,谷歌一直以來處理搜索廣告的方式是,考慮廣告何時對用戶有幫助。有鑒於此,我們在廣告對用戶有幫助時才會展示廣告,我們發現,即使我們引入了AI Overviews(AI概述),用戶仍會繼續與廣告互動。
我們還發現,當人們在使用AI概述時,會更多地使用搜索。因為人們帶著新的應用案例來搜索,他們發現以前認為在谷歌上不可能解決的問題,現在卻可以解決了。
每次谷歌在搜索領域啟用新的應用案例時,廣告團隊都會發現新的盈利機會。當用戶看到有幫助的廣告時,這是廣告觸及用戶的新方式。所以,期待廣告團隊與我們一起繼續創新。
問:順著這個問題,從商業角度看,谷歌認為「AI概述」將如何改變搜索產業?首先申明,我個人作為用戶很喜歡這些功能,但如果用戶不再點擊網站,或者像這次谷歌演示的那樣,只是讓Gemini告訴他們,某支視頻具體講了什麽,根本不用點開這些視頻,那麽未來網站或內容創作者又如何從工作中賺錢呢?
劈柴:這是我們非常關心的問題。谷歌比任何其他公司都更想說的是,我們經常思考,以及團隊在過去一年中所做的是,投入了大量時間和精力來優先考慮創造價值、交換回報和創造流量的方法。YouTube也是一樣。
人們短期內往往會低估某項技術,當智能手機出現時,人們也問過同樣的問題,如果屏幕很小,就看不到那麽多內容,我們早在2014年就給出了答案,我們從回答問題開始。
我記得有人說,如果你是在回答問題,為什麽會創造流量,我想我們已經證明,隨著時間的推移,你已經增加了流量。我認為這遠不是一個零和遊戲。
順便說一句,我們一直在改善用戶體驗,因為這很重要。
伊麗莎白·裏德:我補充一點。人們有時候會提出固定數量的問題,但通常情況是,人們帶著一個問題來搜索,然後他們被答案所吸引,然後他們就會深入挖掘。
實際上我們發現,那些出現在「AI概述」中的網站,它們比傳統的藍色鏈接獲得了更多的流量,所以AI概述突然提供了額外的價值,而且這個價值在不斷增長。
問:谷歌的Android、Pixel 和 Gemini Nano,可以說,谷歌在移動智能領域完全處於領先地位。那麽,你認為谷歌要保持這一地位,還需要做哪些努力或投資?
劈柴:在安卓系統上,我對操作系統的發展感到非常興奮,這是一條不可思議的科技曲線,而且每年谷歌都會在移動設備上裝載更多技術。今天的 Gemini Flash 是什麽?是否會在未來的某個時刻出現在 Gemini Nano 中?所以,那條技術曲線總是成立的。
給設備帶來這麽多智能能力,確實會對很多能力產生影響。你會發現它有一些很棒的功能,比如可以檢測這是否是欺詐。你可以要求它們幫你接電話,在任何時候都能幫你處理電話上的事情。
在我腦中,有一個10年路線圖,上面有我希望團隊建立的所有東西。
問:在Project Astra的第二段演示中,用戶戴著智能眼鏡,我想知道谷歌如今對這類設備的重視程度?因為隨著生成式AI的發展,它可能是有意義的。
劈柴:Project Astra是手機中的一項強大技術,但在眼鏡這樣的外形設計中,它才真正栩栩如生。
谷歌一直致力於走在計算技術的最前沿,我們正在投資AR 眼鏡生態系統,相信在未來,會有一些有趣的產品值得討論。
問:谷歌在AI領域取得了顯著進展,你認為谷歌在AI方面還有哪些不足?在未來12個月內,哪些方面需要改進?
科拉伊·卡夫丘格魯:正如劈柴所說,我們的任務是開發智能,所以還有很多緊迫的問題要解決。
在AI漫長的歷史中,問題和各種能力已經被考慮了很多,比如最重要的事情之一「推理」。但就像我們討論人類如何推理復雜問題一樣,我們該如何生成推理。
生成式AI模型,來到了一個非常激動人心的階段。在這個階段,模型實際上可以創造新想法、新假設、並由此進行研究,尤其是能夠通過這些進行推理。
在這方面,AI Agent(AI智能體)非常重要,因為我們希望人們能夠與這些模型互動,讓人們自主決定想讓技術為他們做什麽。
AI智能體為用戶完成任務,需要對環境有所了解,需要了解用戶的所見所聞,這方面相信你已經從谷歌的Project Astra中窺見一斑。就像你自己的「眼睛」看到和「耳朵」聽到的一樣,AI智能體可以幫助你了解環境,並與環境互動。我認為這是我們本周最令人興奮的話題。
劈柴:也許我們已經推動了現代AI技術的大部分突破。從我們的出發點來看,我們的Gemini 1.0也是原生多模態的模型,它最終會成為大多數模型的終極形態。
我們正在推動的方向也是其他人正在做的,所以我由衷地感到,大家都走在技術的最前沿。
谷歌在 2016 年設計了張量處理單元,你會發現幾乎所有其他大公司都在試圖復製這種做法。所以當我審視我們所處的位置時,我所看到的一切都告訴我,我們正處於前沿,並在努力向前推進。
05. 後記 : 約三周前,谷歌母公司Alphabet兼谷歌CEO桑達爾·劈柴(Sundar Pichai)在個人Instagram上慶祝自己的「Googleversary」,今年是他在谷歌工作的第20年。
他寫道:「2004年4月26日是我在谷歌的第一天。從那以後發生了很多變化——科技、使用谷歌產品的人數……以及我的頭發。但沒有改變的是,在這家了不起的公司工作帶給我的興奮。20年過去了,我仍然覺得很幸運。」---[作者:周雅*配圖:周雅/來源: 科技行者]