AI 搜索,已經在汙染互聯網了
讓用戶吃石頭,給披薩塗膠水,Google AI 搜索翻車的事情還近在眼前。
號稱要顛覆 Google 的 Perplexity,緊接著也出了狀況。
AI 搜索比起 ChatGPT,能聯網,引用信源,不那麽容易胡說八道了。
但如果,信源本身就是垃圾呢?
AI 搜索,已經在引用另一個 AI 搜索了
「林黛玉倒拔垂楊柳」的梗很多人都聽過,最近在重溫水滸傳,我靈機一動,用中文問 Perplexity,「林黛玉的性格和魯智深的性格有什麽相似之處」。
回答得平平無奇,但引用來源出現了一個意想不到的角色:字節豆包,抖音旗下的 AI 助手。
這難道是什麽新奇的商戰形式嗎?點進去發現,內容就是用戶和豆包的聊天記錄,AI 回復得還很八股文。如果質量寫得比營銷號好就罷了,寫成這樣是罪加一等。
當我直接在 Google 搜索同一個問題,豆包又來刷存在感了,並且高居第二,和 Perplexity 引用的不是同一條,但點進去還是「首先」「其次」打頭的廢話連篇。
之前 The Information 報導過,Perplexity 使用 API 訪問有關 Bing 和 Google 搜索排名的數據,這些數據決定了網頁的相關性、質量和權威性。
換言之,如果豆包容易被 Google 搜到,可能也就更容易被 Perplexity 引用。這就讓人好奇了,為什麽豆包可以出現在搜索引擎?
等我登錄豆包網頁版的最新版本,答案出現了,它默認勾選了一個選項:允許分享內容被搜索引擎收錄,在搜索結果頁顯示。
以上體驗發生在 5 月 31 日下午 2 點。6 月 1 日 19 點,字節回應愛範兒,豆包已更新,內容分享到搜索引擎,不是默認勾選,是用戶主動選擇可以被搜索引擎抓取。
同時,字節表示,針對一些問答內容被搜索收錄,實際是有人使用虛擬賬號創建的高質量問答內容,不是真實用戶。目前已經 clean,現在 Google 搜索時,只有 5 條站內結果。
讓用戶和 AI 的聊天記錄被索引,豆包似乎是開了先例。Perplexity、天工、秘塔、360 AI 都可以將聊天記錄以鏈接形式分享,但沒有看到類似豆包的選項。
ChatGPT 也支持以鏈接分享對話,但承諾只是用於個人之間的共享,不會出現在互聯網的公共搜索結果。
早年的「內容農場」,盜取或拼湊他人文章,快速生產內容,憑借關鍵詞優化、頻繁更新等 SEO(搜索引擎優化)策略,搶占搜索頁面的前排,賺取流量和廣告費。
那時候,內容貢獻者還是真人,每天生產數篇文章,但現在輪到了 AI,復製、粘貼、洗稿、批量產出的戰鬥力完全不在一個量級。
「林黛玉倒拔垂楊柳」「魯智深唱葬花吟」本不是事實,說的人多了,權重高了,也就成了 AI 搜索眼中的事實,引用的信源,是知乎、抖音、簡書用戶編造出來的有鼻子有眼的故事。
如果信源成了 AI,結果只會更加慘烈。想象一下,更多 AI 生成內容被 Google 收錄,AI 搜索參考 Google 的搜索排名,然後最終呈現在用戶面前的,就是 AI 疊加 AI 的垃圾結果。
被投餵的人類,只能修煉得更加火眼金睛,從廢話裏挑出有用的乾貨。
80 分的 AI 搜索
平心而論,我仍然很喜歡 Perplexity 等 AI 搜索產品,它們在 ChatGPT 之後,再次提高了我的生產力。
人類提出問題,它們搜索、摘要、成文,自己已經是一個成熟的工作流,我們付出更少,但效率更高。
大部分的情況下,AI 搜索的表現還是相當不錯的。Google AI 翻車,一部分原因應該是急於推出功能,只顧著提高 Reddit 在搜索中的權重,沒能讓 AI 反思結果是否符合常識。
當我把讓 Google AI 搜索翻車的同款問題輸入 Perplexity,結果就比較讓人滿意。
關於「人一天吃多少石頭」,Perplexity 能夠準確地找到洋蔥新聞的信源,再解釋這是胡說八道,不像 Google AI 搜索把洋蔥新聞當成圭臬。
還有「披薩的奶酪容易滑落怎麽辦」,Google AI 搜索之前建議加點膠水,Perplexity 顯然更加聰明,先給出一些合理的辦法,在我追問能不能加膠水之後,精準地找到了誤導 Google AI 搜索的 Reddit 帖子,說這是在開玩笑。
為了讓結果更嚴謹,Perplexity 甚至跑去亞馬遜搜索了一番,表示它只搜到各種無毒膠水產品,沒說這些膠水能用於食品。
相比 Perplexity,Google 顯然不差在模型能力,而是差在後續的工程和產品化。
AI 搜索從原理上來說,是先搜索再總結,比起不聯網的聊天機器人幻覺更少,核心技術之一是 RAG(檢索增強生成)。
RAG 結合了信息檢索和生成模型,信息檢索根據用戶查詢,從龐大的文檔庫中找到相關信息;生成模型則將這些檢索到的文檔作為上下文,生成更加準確和詳細的回答。
這裏的文檔庫,可以是傳統搜索引擎的索引庫,也可以是法律等專有數據庫、社交媒體等用戶生成內容。
如果網頁上充斥著大量 AI 生成的低質量內容,就會對 AI 搜索的 RAG 產生負面影響。
那麽,面對氣勢洶洶的 AI 生成內容,AI 搜索的下半場,可能就是繼續比拼模型之外的工程能力,較量數據源質量和搜索能力,包括能不能搜到更多網頁,搜到更權威的網頁,或者整合財報等專有信息。
現狀就是,我們漸漸已經離不開 AI 搜索,如果說靠關鍵詞和手工打開鏈接的傳統搜索是 40 分,容易胡說八道的大模型是 60 分,聯網的 AI 搜索把標準提到了 80 分。盡管還會出錯,但體驗過就回不到過去了,不必全然否定。
花樣引用信源,AI 搜索的商戰
除了司空見慣的網頁,AI 搜索產品們,似乎有一個不約而同的想法:提供多模態的信源。
360 AI 可以找到視頻,秘塔可以找到播客和學術論文,Perplexity 可以搜索 Reddit 和 YouTube。
但 AI 搜索更多是提供一個引子,想要更多的詳情內容,還是不能偷懶,要到信源的出處去看。
同時,還有一個有趣的現象,app 們正在推出內嵌的 AI 搜索功能,比如小紅書內測的「搜搜薯」、微信讀書的「AI 問書」,在既有的生態上發掘 AI 的落地點。從這個意義上說,它們也是 AI 搜索產品。
▲ 圖片來自:小紅書@三滴水
2 天前橫空出世的騰訊元寶 app,基於混元大模型,集成 AI 搜索、AI 總結、AI 寫作等功能,更是一開始就被看好。
因為它坐擁了微信公眾號平臺、騰訊新聞平臺等資源,而公眾號算是中文互聯網質量較高的內容集合。
比如,輸入標題,搜索某篇具體的公眾號文章,騰訊元寶可以給出較好的總結,並推薦更多公眾號文章。反之,用豆包等 AI,抓取的是公眾號內容的分發渠道,並且總結得也比較省略。
再結合豆包讓 AI 內容在搜索結果頁顯示的操作,我們似乎又被提醒了一次移動互聯網的內容分布情況。
移動互聯網時代,不像之前的門戶網站時代,app 之間彼此孤立,也很難被搜索引擎爬取。比如,輸入公眾號文章的標題,搜索引擎找不到原文,只能看到分發渠道。
同時,在傳統搜索引擎上,廣告等幹擾項很多、低質量的營銷號內容也很多,我們漸漸習慣了,系統看教程上 B 站,生活瑣事提問用小紅書,找文章用微信搜一搜。
而在 AI 搜索產品、AI 生成內容越來越多以後,以後可能又出現這樣的局面——網頁內容越來越良莠不齊,以數量取勝,而高質量的內容一如既往地保持封閉,變成了垂直 AI 搜索的護城河。
除了大而全的多模態 AI 搜索,可能也會有越來越多優秀的垂直 AI 搜索湧現。
比如,學術搜索引擎 Consensus 口碑較好,2 億多篇論文的優質信源,再集合 AI 驅動的分析能力,答案總是會引用某個研究。
向 Consensus 提問「鍛煉能提高認知能力嗎」,它不忙下結論,而是寫了個摘要,給了個表格,沒有當作簡單的「是否」問題來答。
我們對於 AI 搜索的期待是,在用人話交流的交互過程中,更快地提供更好、更多樣、更可視化、更個性化的內容,回答更加復雜和具體的問題。
然而,與此同時,搜索的內容和生態也正在被 AI 破壞,仿佛隱喻了 AI 的一體兩面。
未來,AI 生成的內容肯定會越來越多。正反拉扯之中,找到更有用的信息,究竟是更難還是更簡單,還是一個懸而未決的問題。拿來就用的美夢還未成真,把 AI 當作工具,再發揮自己的主觀能動性,人類才不容易傷心和失望。---來源: 愛範兒-