沒有鍵盤元宇宙世界裡,人類會用什麼輸入法?|鈦度專訪
在當下我們可以體驗到的元宇宙的世界裡,人類與機器交互的設備,有頭盔,有手柄,但沒有了鼠標與鍵盤。那麼,我們怎麼在這個世界裡與外界交流?
在計算機時代,因為智能輸入法的出現,我們輸入的效率得以提升。事實上,輸入法已經從一個TO C的基礎工具,演化為人機交互上的重要一環。
在近兩年,受益於元宇宙概念而如日中天的VR/AR等虛擬世界,因為人機交互方式的差異性,技術人員在輸入法方向上的革新也正在迭代創新。
去年9月,搜狗完成了私有化交易,併入騰訊集團。一周年之後,騰訊輸入法部總經理魯劍接受了鈦媒體APP等少數幾家媒體在內的採訪。
鈦媒體APP了解到,騰訊搜狗輸入法,在IoT領域已累積超過1.5億用戶,覆蓋智能家居、智能穿戴、智慧教育、智能汽車等多個行業。
最近,他們將發布新版的VR輸入法,在行業首創可以不用操控鍵盤、能智能識別多種輸入場景的輸入產品,未來將會與「全真互聯網」概念相結合,提供新的人機交互方式。
與VR手柄結合的輸入方式
VR世界的輸入有別於現實物理世界。魯劍告訴鈦媒體APP,用戶在3D場景下去做輸入,甚至做一些交互,其實是需要舉在手柄,在一個投射出來的虛擬鍵盤上進行字符的點擊,這樣的局限就會使打字特別累,也很慢,把VR的沉浸感就給打斷了。
目前我們可以看到的,承載的可能更多的還是影視、遊戲。相對來說,這還屬於比較簡單的需求。但是,如果在未來,VR需要去承載着更多的社交場景的話,比如,我們在VR場景下,去用頭顯,甚至有更沉浸式的社交體驗。
這個時候進行輸入,不管是用語音,還是用手寫、打字,可能都會有一個相對來說更便捷的訴求。針對這些問題,我們可能會需要用語音來「敲打」VR世界的鍵盤——在搜電影、發彈幕的時候,可以自動用語音動動嘴就可以完成輸入。
在VR的需求下,新興技術也會用在輸入法裡,比如,像手勢算法和輸入法的結合,讓用戶也體驗到領空手寫代替在虛擬鍵盤下打字的輸入,畢竟有的時候,語音代表着一種非隱私的環境,而用戶需要靜默輸入的時候,領空手寫的虛擬技術,也會是輸入法領域接下來重點發力的方向。
當前,VR輸入法更多的還是基於3D引擎在做的研發工作,而3D引擎是非常多樣性的,會導致我們輸入法一個一個去適配的時候,工作會相對來說比較複雜。在技術上,技術人員也會去採用像虛擬屏的概念去適配不同的3D引擎,然後來增加輸入法產品的通用性。
魯劍也坦言,在新的場景,輸入法開發的工作,會相對來說慢一點。像在VR場景,他們的順序是優先要去打造一個基線版本,當基線版本積累出來之後,後面流水線上需要去開模,開了模之後,整個體系才能高效運作起來。
以下是鈦媒體APP等對話魯劍的實錄,經鈦媒體APP編輯:
Q:這次你們發布VR端的輸入法,請您介紹一下具體的應用場景?
魯劍:早期有不同的理解。現在VR基本上還是作為一個獨立的硬件設備的存在,但是這個硬件設備呢,我們目前認為它其實是不同於手機的,它的產品形態主要是頭顯、手柄。用戶在3D場景下,其實去做一些輸入,甚至做一些交互,其實是需要舉在手柄,在一個投射出來的虛擬鍵盤上進行字符的點擊,這樣的局限就會使打字特別累,也很慢,把VR的沉浸感就給打斷了。
我們的思考,如果未來VR去承載着更多的社交的話,目前承載的可能更多的還是看片、遊戲,相對來說比較簡單的需求。但是,如果後面用於社交的話,比如我們在VR下面去用頭顯,甚至有更沉浸式的社交體驗的時候,這個時候輸入,不管是用語音,還是用手寫、打字,可能都會有一個相對來說更便捷的訴求。
所以針對以上的這些問題,我們也去首創了一個VR的語音鍵盤。像用戶在搜電影、發彈幕的時候,可以自動用語音動動嘴就可以完成輸入。另外,我們也會去不斷探索像VR中間的一些新興技術用在輸入法裡面,比如像手勢算法和輸入法的結合,讓用戶也體驗到領空手寫代替在虛擬鍵盤下打字的收入,因為畢竟有的時候語音不是很隱私的環境,用戶需要靜默輸入的時候,領空手寫的虛擬技術也會是我們接下來重點發力的方向。
Q:關於這次VR端的輸入法,現在國內外大廠都在布局VR端的輸入法,像這次搜狗推出的輸入法在手勢交互或者識別精度等技術層面,會不會有一些比較大的改進或者亮點?
魯劍:在技術上面,我可以談一些。因為VR更多的還是基於整個3D引擎在做的研發工作,而3D引擎是非常多樣性的,所以會導致我們的輸入法一個一個去適配的時候,工作會相對來說比較複雜。
我們在技術上也會去採用像虛擬屏的概念去適配不同的3D引擎,然後來增加輸入法產品的通用性。另外會去解決用戶輸入效率低的一些難點,比方說像調整鍵盤尺寸、增加音效和震感,同時能夠增加用戶裸手輸入的能力,讓用戶的輸入效率和體驗得到不錯的提升。
還有,我們也會嘗試軟硬件結合,給用戶提供更便利的輸入體驗,比如像虛擬鍵盤和手柄按鍵之間產生一種映射關係,用戶也可以利用手柄上的快捷鍵對文字內容進行增刪改查。
Q:輸入法從PC時代到智能設備,再到萬物互聯,它的屬性一直在變化。現階段,智能家電各種各樣的智能終端設備都有輸入的需求,現階段輸入法最突出的變化是什麼?
魯劍:騰訊搜狗輸入法從2015年開始服務像TV、教育平板這樣的一些硬件廠商,我們積累了比較多的經驗,我們相信像5G、AI技術的發展會使得智能終端的智能程度會不斷地提升,整個賽道的軟硬件廠商都在追求為用戶提供便捷、智能的體驗。
現階段,我們比較明顯的會感受到廠商對於系統輸入法品質上的追求,以及對於人機交互的探索動力也是不斷地在提升。我認為這塊最突出的變化就是要從一個單一的工具升級為萬物互聯的人機交互。
Q:托於開放平台計劃,和其他玩家合作的思路是什麼或者合作的方式是什麼樣的?
魯劍:我們現在推出開放平台的思路更多的是聚焦在人機交互的賽道上,我們的生態合作夥伴未來會包括操作系統、系統中間件、字庫廠商、智能終端、企業辦公軟件。我們希望通過上下游生態以及和合作方的捆綁,形成完整的人機交互解決方案,然後助力各行業、各場景效率和體驗的提升,為行業用戶去創造價值,進而促進輸入法和相關生態合作方,我們能夠共同的去獲得商業價值,這是我們的核心思路。
Q:一些平台型解決方案,不管是什麼行業,我們都能達到高效率嗎?
魯劍:一些新的場景,我們會相對來說慢一點。比如像VR,我們的順序是優先要去打造一個基線版本,當基線版本積累出來之後,後面流水線上需要去開模,開了模之後,後面的定製就會非常快。
Q:這是不是也和搜狗在輸入法領域積累了很多年的經驗有關?
魯劍:每個產品是需要深度的去打磨。我拿一個C端的輸入法舉例,大家看到的其實只是一個鍵盤,但是實際上我們真正把它解構開去看,裡面有表情、語音輸入、手寫輸入,光我們的鍵盤輸入就有上百種。
比如多語言,我們有一百多種鍵盤,還有粵語用戶專門用的粵拼鍵盤,還有遊戲用戶所使用的遊戲鍵盤,以及我們在摺疊屏下面使用的摺疊屏鍵盤、懸浮鍵盤,每一個鍵盤的交互體驗不是說堆一個鍵盤上去就可以,因為它是需要適配機型,甚至是需要自動的用深度學習的方法去適配我們的手型,比如手大的用戶的鍵盤大小是否具備一個自動調節的能力,這些都是需要一個一個去打磨的。在這塊來講,我覺得在這個行業裡面沒有足夠的時間和深度的積累,其實是非常難在短時間內把它做得非常好。
Q:這次推出的幾款新品,在顛覆式創新方面有哪些新的突破?你們的目標用戶,創新生態是什麼樣的?
魯劍:我們結合企業的特點去推出了一個開放平台,通過這個開放平台能夠讓用戶更快、更好的去定製他的輸入法。
具體的這個開放平台未來可以定製的方向,一方面像車載,目前大屏、多屏,其實是主流,針對不同尺寸的屏幕,我們會提供全新的鍵盤布局設計,同時考慮用戶在主駕和副駕輸入的時候不同的體驗,比如鍵盤鏡像、懸浮拖動,都讓主駕和副駕輕鬆的輸入。針對車載常見的地圖導航,我們也會內置車載的專屬詞庫。
甚至我們也在考慮用跨屏的方式去打通我們的輸入場景,比如當你的手解放不出來的時候,去按車載上的導航,因為我們需要把手放在導航上面,還是比較麻煩的,我們是不是也可以用手機去連接車載設備,然後完全輸入。
還有一個就是VR,我覺得創新性剛才也談到了就是推的語音鍵盤,動動嘴就可以完成輸入,同時和手勢算法去結合的這些東西,都是我們獨特的一個創新。
在TV下面,還有大屏下面,我們也推出了一種二維碼的跨屏輸入,它是跨屏輸入概念,把用戶手機和終端設備通過藍牙鏈接後,用手機完成輸入。比如這個設備離我相對很遠,會考慮用我們的手機,在我們的設備上掃一個二維碼,就是傳統的像電視一般是用遙控器做輸入,我們可以考慮在電視上出現一個二維碼,我們離得很遠,但是我們拿手機一掃就可以完成在電視輸入框上的輸入,這樣就不用頻繁地去拿遙控器來去完成輸入。
Q:輸入法解決方案涉及很多不同的領域,包括智慧辦公、智慧金融等等,想問一下,在不同領域的硬件商而言,他們對解決輸入解決方案的需求方面會有哪一些差異?
魯劍:早期更多的還是聚焦在C端,比如移動端、PC端。但是後來隨着產業價值的興起,讓我們對B端有了一個更清晰的認知,所以站在產業需求的角度上來講,為每個行業去提供定製化的,包括不同的解決方案,就成為我們現在優先去做的一個選擇。
比方說,我們現在剛推出的生僻字解決方案,其實就是服務在金融行業上面生僻字改造的需求,當然和智能家電行業對比的話,金融行業的需求差異相對來說還是比較顯著的,需要輸入法聯合字庫廠商、系統的中間件,整體進行生態的結合和改造,最後形成一整套金融行業專屬的生僻字改造解決方案。當然,為了支持生僻字的改造,我們也推出了新的技術方案就是雲輸入法,包括金融行業的專屬詞庫。
像智能汽車其他行業的話,我們也是同樣的道理,在各個行業上都會有針對這個行業比較不同的一些創新,還有和廠商結合的一些定製化的解決方案。所以這個行業的需求現在已經基本脫離輸入法應用了,輸入法現在也從一個基本的C端應用商的工具,逐漸升級為人機交互上重要的一環,也是需要和上下游的廠商深度協同來去完善目前的系統,結合行業的需求和用戶的場景進行定製化的設計。
Q:針對教育行業,輸入法會區別於通用型輸入法所呈現的一些特徵?這個行業用戶的需求主要集中在什麼方向上?
魯劍:這個場景確實也是一個蠻重要的場景,在這個場景下,我們確實會更關心青少年的一些身心健康。當然,為了有別於其他的教育場景,我們也會考慮學習模式和考試模式。之前輸入法的教育場景提供了敏感詞的屏蔽能力,用來去守護青少年的身心健康。
另外就是輸入法的AI能力,也可以在學生學習的過程當中協助同學們掌握組詞、造句、詩詞歌賦,還有在數理化公式相關的一些知識點。當然,我們同時也會推出一個叫「考試模式」,家長端和教師端,因為很多學校現在用的都是搜狗輸入法,如果智能方面做的過於強的話,學生們在考試的過程當中就可以利用輸入法去作弊。
之前,我們在做金融考試的時候就有很多用戶在問說考試機器上有沒有搜狗輸入法?因為我們當時做了一個功能是用搜狗輸入法裡面可以有一個計算機的功能,可以用來去做複雜的運算,所以在「考試模式」下,家長端和教師端可以一鍵開啟學生客戶端的考試模式,在學生上網課或者在線上考試的場景下就避免出現信息引導,從而更真實的考驗學生對知識的掌握程度。
Q:什麼樣的教育機構或者企業,會單獨去為一個輸入法買單呢?
魯劍:這兩年,其實教育行業也在做改革,他們也在全面的電子化,尤其像疫情的影響之下,其實學生的遠程教育會變得比較頻繁。現在的學生,尤其是高年級的學生對於平板的使用是非常多的,有很多的學習和考試都會在平板上來完成。
我們更多的還是圍繞具體的使用場景去做定製化的需求,比如我們的客戶需要在平板中定製這樣一套系統,但是這個系統裡面肯定少不了要有一套學生使用的輸入法,但是一個簡單的輸入法有時候是非常難去滿足客戶需求的,所以他們就會來找我們去圍繞遠程學習的場景去定製這樣一款輸入法。
Q:針對不同的行業會提出很多定製化的方案,對於搜狗來說,可能更多聚焦在技術端開發。各個行業隔行如隔山,每個行業都有自己的問題,有自己獨特的需求,您在與這些行業接觸的過程中,發現有哪些行業的客戶提出過哪些問題是你們之前沒有想到的,又讓您印象比較深刻的?
魯劍:其實還是蠻多的,你坐在辦公室裡面去搞和走出去,其實是有非常大的區別。舉幾個例子,比如我們之前在無障礙方向上做的輸入,我們去面對一個肢殘的用戶看他怎麼去輸入的時候,當時他輸入的方法還是讓我們挺震撼的。
還有像今年我們推出的漢字守護計劃,我們之前認為是有生僻字,但是沒想到會有這麼多,要支持標準(強制性國家標準GB 18030-2022)內的87887個漢字,如果是這樣一個量級的話,之前國家的政策是互聯網可以去適配,今年國家把它變成一個強制需求的時候,我們去和銀行推的時候,其實才知道這個原來是這麼大的一個痛點。
還有在車載下面,我們當時是面對主副屏需求的時候,才發現原來在主駕輸入和副駕輸入的體驗差別這麼大,這些其實都是我們之前沒有意識到的。我和產品同事共同的感觸就是了解需求必須要走出去,並且我現在都坦誠地說,我們走出去的還是要更多一些。即使都是車企,可能不同的車企之間都會給你不同的啟發。
Q:因為2B的行業很多,有大中小客戶,也有不同的需求。我們在服務客戶的團隊上是一個怎樣的策略呢?因為面對海量的用戶,海量細分的需求,搜狗現在是一個怎樣的流程?重點和側重點是?
魯劍:這個分兩個層面去說,一方面是早期我們去交付的時候,我們更聚焦的是頭部客戶,因為我們認為頭部客戶的用戶量比較大,他們對於需求的理解也會更加深刻。早期我們的交付方式更多的是偏向於銷售去跟客戶連接,我們緊接着就是產品經理連接,然後我們採用點對點的交付方式去進行和用戶之間的深度溝通,之前有若干個需求都是點對點去交互。
但是隨着時間的推移,整個的交互方式也會發生變化,因為我們發現一方面整個用戶的需求在收斂,我們接着如果還用這樣的交付方式,勢必在交付成本上會存在大量重複造輪子的情況,這也是我們這次在「騰訊數字生態大會」上想重點主張的一個點,就是我們想要用開放平台的理念和產品來去幫助我們的客戶。
比如,我們希望我們的客戶在一些簡單的輸入法定製,比如這個工業化設備是醫療設備,他肯定希望快速的定製一個輸入法,他只需要去選擇一個醫療的詞庫,然後選擇所需鍵盤的種類,我們提供手寫、9鍵、26鍵等等。當企業用戶勾選完之後一打包,這個輸入法就生成了,生成之後可以拿來做調試。從這個交互方式來講,我們是完成了階層的跨越。-(鈦媒體/採訪、撰文:李程程)