![](https://pica.nidbox.net/87/b/1717326240_6eaa0c68_87.jpg)
讓用戶吃石頭,給披薩塗膠水,Google AI 搜索翻車的事情還近在眼前。
號稱要顛覆 Google 的 Perplexity,緊接著也出了狀況。
AI 搜索比起 ChatGPT,能聯網,引用信源,不那麽容易胡說八道了。
但如果,信源本身就是垃圾呢?
AI 搜索,已經在引用另一個 AI 搜索了
「林黛玉倒拔垂楊柳」的梗很多人都聽過,最近在重溫水滸傳,我靈機一動,用中文問 Perplexity,「林黛玉的性格和魯智深的性格有什麽相似之處」。
回答得平平無奇,但引用來源出現了一個意想不到的角色:字節豆包,抖音旗下的 AI 助手。
![](https://pica.nidbox.net/87/1717322936_a98ad3d6_87.jpg)
這難道是什麽新奇的商戰形式嗎?點進去發現,內容就是用戶和豆包的聊天記錄,AI 回復得還很八股文。如果質量寫得比營銷號好就罷了,寫成這樣是罪加一等。
![](https://pica.nidbox.net/87/1717323133_bdaec4ac_87.jpg)
當我直接在 Google 搜索同一個問題,豆包又來刷存在感了,並且高居第二,和 Perplexity 引用的不是同一條,但點進去還是「首先」「其次」打頭的廢話連篇。
![](https://pica.nidbox.net/87/b/1717326094_c3b3a0d9_87.jpg)
之前 The Information 報導過,Perplexity 使用 API 訪問有關 Bing 和 Google 搜索排名的數據,這些數據決定了網頁的相關性、質量和權威性。
換言之,如果豆包容易被 Google 搜到,可能也就更容易被 Perplexity 引用。這就讓人好奇了,為什麽豆包可以出現在搜索引擎?
等我登錄豆包網頁版的最新版本,答案出現了,它默認勾選了一個選項:允許分享內容被搜索引擎收錄,在搜索結果頁顯示。
![](https://pica.nidbox.net/87/b/1717326004_a1b66360_87.jpg)
以上體驗發生在 5 月 31 日下午 2 點。6 月 1 日 19 點,字節回應愛範兒,豆包已更新,內容分享到搜索引擎,不是默認勾選,是用戶主動選擇可以被搜索引擎抓取。
同時,字節表示,針對一些問答內容被搜索收錄,實際是有人使用虛擬賬號創建的高質量問答內容,不是真實用戶。目前已經 clean,現在 Google 搜索時,只有 5 條站內結果。
![](https://pica.nidbox.net/87/b/1717323839_aee08176_87.jpg)
讓用戶和 AI 的聊天記錄被索引,豆包似乎是開了先例。Perplexity、天工、秘塔、360 AI 都可以將聊天記錄以鏈接形式分享,但沒有看到類似豆包的選項。
ChatGPT 也支持以鏈接分享對話,但承諾只是用於個人之間的共享,不會出現在互聯網的公共搜索結果。
![](https://pica.nidbox.net/88/b/1717325773_7c65b759_88.jpg)
早年的「內容農場」,盜取或拼湊他人文章,快速生產內容,憑借關鍵詞優化、頻繁更新等 SEO(搜索引擎優化)策略,搶占搜索頁面的前排,賺取流量和廣告費。
那時候,內容貢獻者還是真人,每天生產數篇文章,但現在輪到了 AI,復製、粘貼、洗稿、批量產出的戰鬥力完全不在一個量級。
「林黛玉倒拔垂楊柳」「魯智深唱葬花吟」本不是事實,說的人多了,權重高了,也就成了 AI 搜索眼中的事實,引用的信源,是知乎、抖音、簡書用戶編造出來的有鼻子有眼的故事。
![](https://pica.nidbox.net/88/b/1717326429_6d119bad_88.jpg)
如果信源成了 AI,結果只會更加慘烈。想象一下,更多 AI 生成內容被 Google 收錄,AI 搜索參考 Google 的搜索排名,然後最終呈現在用戶面前的,就是 AI 疊加 AI 的垃圾結果。
被投餵的人類,只能修煉得更加火眼金睛,從廢話裏挑出有用的乾貨。
80 分的 AI 搜索
平心而論,我仍然很喜歡 Perplexity 等 AI 搜索產品,它們在 ChatGPT 之後,再次提高了我的生產力。
人類提出問題,它們搜索、摘要、成文,自己已經是一個成熟的工作流,我們付出更少,但效率更高。
大部分的情況下,AI 搜索的表現還是相當不錯的。Google AI 翻車,一部分原因應該是急於推出功能,只顧著提高 Reddit 在搜索中的權重,沒能讓 AI 反思結果是否符合常識。
當我把讓 Google AI 搜索翻車的同款問題輸入 Perplexity,結果就比較讓人滿意。
關於「人一天吃多少石頭」,Perplexity 能夠準確地找到洋蔥新聞的信源,再解釋這是胡說八道,不像 Google AI 搜索把洋蔥新聞當成圭臬。
![](https://pica.nidbox.net/88/b/1717326600_bc71a4a7_88.jpg)
還有「披薩的奶酪容易滑落怎麽辦」,Google AI 搜索之前建議加點膠水,Perplexity 顯然更加聰明,先給出一些合理的辦法,在我追問能不能加膠水之後,精準地找到了誤導 Google AI 搜索的 Reddit 帖子,說這是在開玩笑。
為了讓結果更嚴謹,Perplexity 甚至跑去亞馬遜搜索了一番,表示它只搜到各種無毒膠水產品,沒說這些膠水能用於食品。
![](https://pica.nidbox.net/88/b/1717325504_e2bea8b8_88.jpg)
相比 Perplexity,Google 顯然不差在模型能力,而是差在後續的工程和產品化。
AI 搜索從原理上來說,是先搜索再總結,比起不聯網的聊天機器人幻覺更少,核心技術之一是 RAG(檢索增強生成)。
RAG 結合了信息檢索和生成模型,信息檢索根據用戶查詢,從龐大的文檔庫中找到相關信息;生成模型則將這些檢索到的文檔作為上下文,生成更加準確和詳細的回答。
這裏的文檔庫,可以是傳統搜索引擎的索引庫,也可以是法律等專有數據庫、社交媒體等用戶生成內容。
如果網頁上充斥著大量 AI 生成的低質量內容,就會對 AI 搜索的 RAG 產生負面影響。
那麽,面對氣勢洶洶的 AI 生成內容,AI 搜索的下半場,可能就是繼續比拼模型之外的工程能力,較量數據源質量和搜索能力,包括能不能搜到更多網頁,搜到更權威的網頁,或者整合財報等專有信息。
現狀就是,我們漸漸已經離不開 AI 搜索,如果說靠關鍵詞和手工打開鏈接的傳統搜索是 40 分,容易胡說八道的大模型是 60 分,聯網的 AI 搜索把標準提到了 80 分。盡管還會出錯,但體驗過就回不到過去了,不必全然否定。
花樣引用信源,AI 搜索的商戰
除了司空見慣的網頁,AI 搜索產品們,似乎有一個不約而同的想法:提供多模態的信源。
360 AI 可以找到視頻,秘塔可以找到播客和學術論文,Perplexity 可以搜索 Reddit 和 YouTube。
但 AI 搜索更多是提供一個引子,想要更多的詳情內容,還是不能偷懶,要到信源的出處去看。
![](https://pica.nidbox.net/88/b/1717325461_7ed22d60_88.jpg)
同時,還有一個有趣的現象,app 們正在推出內嵌的 AI 搜索功能,比如小紅書內測的「搜搜薯」、微信讀書的「AI 問書」,在既有的生態上發掘 AI 的落地點。從這個意義上說,它們也是 AI 搜索產品。
![](https://pica.nidbox.net/88/b/1717325369_081eabe8_88.jpg)
▲ 圖片來自:小紅書@三滴水
2 天前橫空出世的騰訊元寶 app,基於混元大模型,集成 AI 搜索、AI 總結、AI 寫作等功能,更是一開始就被看好。
因為它坐擁了微信公眾號平臺、騰訊新聞平臺等資源,而公眾號算是中文互聯網質量較高的內容集合。
比如,輸入標題,搜索某篇具體的公眾號文章,騰訊元寶可以給出較好的總結,並推薦更多公眾號文章。反之,用豆包等 AI,抓取的是公眾號內容的分發渠道,並且總結得也比較省略。
![](https://pica.nidbox.net/87/b/1717325312_2a4cadb6_87.jpg)
再結合豆包讓 AI 內容在搜索結果頁顯示的操作,我們似乎又被提醒了一次移動互聯網的內容分布情況。
移動互聯網時代,不像之前的門戶網站時代,app 之間彼此孤立,也很難被搜索引擎爬取。比如,輸入公眾號文章的標題,搜索引擎找不到原文,只能看到分發渠道。
同時,在傳統搜索引擎上,廣告等幹擾項很多、低質量的營銷號內容也很多,我們漸漸習慣了,系統看教程上 B 站,生活瑣事提問用小紅書,找文章用微信搜一搜。
![](https://pica.nidbox.net/88/b/1717325235_8e327dee_88.jpg)
而在 AI 搜索產品、AI 生成內容越來越多以後,以後可能又出現這樣的局面——網頁內容越來越良莠不齊,以數量取勝,而高質量的內容一如既往地保持封閉,變成了垂直 AI 搜索的護城河。
除了大而全的多模態 AI 搜索,可能也會有越來越多優秀的垂直 AI 搜索湧現。
比如,學術搜索引擎 Consensus 口碑較好,2 億多篇論文的優質信源,再集合 AI 驅動的分析能力,答案總是會引用某個研究。
向 Consensus 提問「鍛煉能提高認知能力嗎」,它不忙下結論,而是寫了個摘要,給了個表格,沒有當作簡單的「是否」問題來答。
![](https://pica.nidbox.net/87/b/1717324422_4dd2ea84_87.jpg)
我們對於 AI 搜索的期待是,在用人話交流的交互過程中,更快地提供更好、更多樣、更可視化、更個性化的內容,回答更加復雜和具體的問題。
然而,與此同時,搜索的內容和生態也正在被 AI 破壞,仿佛隱喻了 AI 的一體兩面。
未來,AI 生成的內容肯定會越來越多。正反拉扯之中,找到更有用的信息,究竟是更難還是更簡單,還是一個懸而未決的問題。拿來就用的美夢還未成真,把 AI 當作工具,再發揮自己的主觀能動性,人類才不容易傷心和失望。---來源: 愛範兒-