01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

一個人手搓AI Pin?Sam Altman:單人搞出一個獨角獸公司的時代來了

2024021315:27


如果有這樣一個設備,只有不到手掌的大小,你可以使用這個設備隨時隨地記錄你周圍的聲音,並且可以轉換成文字來和大語言模型交流,那麽你會考慮入手一台嗎?那如果我再告訴你,這樣的設備你甚至可以自己手工制作,成本甚至不到100美金。

是的,就是相當于手搓了一個AI Pin。

英國首家案件取證調查平台Cado的CEO Adam C.H.發布了一個視頻,講述他只用了一塊Coral AI的微型開發板和開發板選配的藍牙模塊,制作了一個語音采集器,Adam稱這個設備爲“Adeus”。這個詞在西班牙語裏是告別的意思,放在這個設備中,它的含義是“告別網絡和監管”,指互聯網廠商無法通過設備來采集用戶的個人隱私。

Coral AI微型開發板

Adeus的算力來自于Coral AI的微型開發板,從上圖裏可以看到,板子包含了一個攝像頭和一個麥克風,MCU(單片機)叫做NXP i.MX RT1176,采用ARM架構,使用的是Cortex-M4和Cortex-M7這兩種處理器。坦白來講,這兩款處理器都是Cortex系列的低端處理器,提供不了多少算力支持。

說到這你可能會覺得“啊,這不胡扯嗎,這個破MCU夠幹什麽的啊”。說這話就代表你問到點上了,讓我們把目光聚焦在那顆外觀明顯有別于其他芯片,刻著“Coral”大Logo的芯片上。這是Coral AI Edge TPU協處理器,能提供4 TOPS (數據結構爲int8)的算力。TPU是谷歌提出的概念,全稱是張量處理單元,專門用于進行深度學習和機器學習任務。

Coral AI Edge TPU

不過此TPU並非彼TPU,它這個叫“Edge TPU”,就是邊緣TPU的意思。它的兼容性和性能都遠不如TPU,但是功耗低、體積小。當然,每個神經網絡模型對性能有不同的要求,面對像Adam C.H.安裝在Adeus裏面的這種開源模型,一般表現不會太差。

那麽接下來的工作就簡單了,Adam C.H.在網上找到了一個開源的人工智能聲音轉文字軟件,再把Adeus連接到計算機上,最後執行安裝,一切就都完成了。如果你想,你可以再爲開發板的攝像頭安裝開源的人工智能軟件,比如標識人臉、標識物體等等。看到這你應該就懂了,現在做電子産品的邏輯是整個過程依靠人工智能,所有的元件都爲人工智能服務,只要硬件算力到位了,最終就能實現功能。



Coral AI微型開發板

我們來逆向思考,假如我們不使用人工智能技術,就單單還原一個“記錄聲音,轉換文字”過程,都是非常費勁的。首先需要一個能夠采集聲音的模塊,通常來說是麥克風。不過麥克風采集的聲音是模擬信號,所以要將取到的模擬信號可能需要經過一些預處理,如濾波、放大等,以確保質量和適應性,而且每一步都需要一顆芯片。

最重要的來了,將模擬信號轉換爲數字信號,以便芯片能夠進行數字信號處理。接下來是對數字信號進行處理,比如常說的降噪、特征提取等步驟,以准備輸入到語音識別引擎。讓這些數字信號經過語音識別引擎後,需要將轉錄出的文字輸出到合適的存儲設備或通過通信接口發送。

對比一下你就會發現,“原來人工智能省了這麽多事啊!”

實話實說,100美金的價格還是有些偏高了。所以Adam C.H.將要在未來使用Raspberry Pi Zero這塊板子來制作Adeus。



Raspberry Pi Zero

無獨有偶,視頻聊天軟件Squad的CTO Ethan Sutin也有類似的想法,不過他想要的是隨時隨地和大語言模型交流。于是他利用蘋果的M1芯片,配合OpenAI的Whisper技術,做出了一個能“揣在兜裏”的Chat GPT3.5。



蘋果M1芯片和麥克風陣列

Whisper是用于自動語音識別(ASR)和語音翻譯的預訓練模型。Whisper的理論基礎是來自于OpenAI的Alec Radford等人的論文《Robust Speech Recognition via Large-Scale Weak Supervision》(通過大規模弱監督實現魯棒的語音識別)。通過對將近70萬小時的標記數據進行訓練,Whisper模型展現了在許多數據集和領域中無需進行微調即可進行有效泛化的強大能力。

這套設備是沒有開關的,所以怎麽激活Whisper也需要人工智能的幫助。Ethan使用的是Silero,這是一個聲音活動檢測(VAD),選擇它不爲別的,主要原因在于Silero所使用的模型——JIT,它僅僅需要1Mb字節大小,而便攜設備最缺的就是容量。

理解這兩個關鍵以後就會發現,Ethan的做法比Adam C.H.還簡單,這個設備的原理是用Silero來辨別是否有聲音傳入麥克風,再利用Whisper模型將聲音轉錄爲文字。通過手機,把轉錄的文字輸入進大語言模型中,最後得到大語言模型的反饋,實現隨時隨地與大語言模型的交流。所以本質上來講,他也是用人工智能來做硬件。蘋果M1芯片價格大約爲40美金,換句話說,這套方案比Coral AI的還便宜不少。



蘋果M1芯片

OpenAI的CEO山姆奧特曼說過,現在已經出現了僅有1個員工就市值10億美元的公司,靠的核心競爭力就是人工智能。

未來尤其是智能穿戴這個領域,極有可能變成一種“你需要什麽功能,就准備多少計算資源”。比如上文提到的兩個設備,他們之所以選擇樹莓派和蘋果M1芯片,原因就在于這兩者提供的內存、顯存、算力滿足了需求。通常情況下,GPU的顯存主要用于存儲模型參數、計算中間結果和進行模型優化的相關操作。而系統的內存主要用于存儲訓練數據、模型參數以及一些運行時的數據。在訓練大型深度學習模型時,確保系統內存和顯存足夠大以容納數據和模型參數是非常重要的。



樹莓派

我們可以把這種將硬件的趨勢簡單縮寫爲一句話:道生一,一生二,二生三,三生萬物。這些大發明家的本質,並不是掌握了多麽精湛的手工工藝,而是巧妙地把人工智能融合進了硬件産品。在未來,隨著技術的持續進步和創新,我們有望迎來一個智能設備制作成本顯著降低的時代。屆時,各類先進的傳感器、微型處理器以及人工智能組件將變得更加易于獲取且價格親民,使得手工愛好者乃至普通大衆都能夠以相對低廉的成本親手制作出功能豐富的智能硬件産品。通過開源社區的支持與共享經濟的發展,制作智能設備所需的軟件資源和技術教程也將變得觸手可及,從而進一步降低了進入門檻。---來源: 矽星人 -