眼下,怕是互聯網最糾結的時刻:智能手機帶來的人口紅利將盡,仿佛所有人們日常生活中該有的應用都已經被開發出來、用戶們也同時失去了嘗試新鮮產品的動力;與此同時,向線下的突進因為過重燒錢、沒有護城河的模式和諱莫如深看不懂的體制深水紛紛受阻,互聯網+了半天還是湊不上去;本來年初VR給諸位打了不少雞血、仿佛商用指日可待,但現在看來目前的終端too young、恐怕至多也才剛剛達到“塞班的階段”;而最近一直在提的內容、直播、網紅等伴隨著政策的收緊、大平臺制霸和數據造假的曝光,看起來越來越不像是真正的風口……除去以上的種種,一場資本寒冬讓投資機構們徹底懵逼了,失去了往日的格局和耐心,歸根結底:快沒錢了。那么問題來了,下一個機會在哪里呢?恰在此時,互聯網女皇來了,最新的年度趨勢報告十分之一的篇幅給了“語音”。女皇陛下是這么說的:語音正在被重塑,成為人機交互的新范式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,而現在語音成為了重要的交互方式。她的案例是Amazon的硬件:Echo。其內置了Amazon Alexa語音助手,目標是占領家居、汽車、手機的麥克風,還能智能購物。這款產品銷量已突破400萬臺。女皇更是大膽指出:語音拐點已經到來,在2015年智能手機銷量下滑之后,Echo銷量或將騰飛。(以上引自《超過十分之一的篇幅給語音,互聯網女皇為何看好麥克風?》)遙相呼應,最新一屆蘋果全球開發者大會WWDC上,庫克也放言將逐步向第三方開發者開放Siri,如果這一切不是“講故事”的話,不出意料我們將看到iPhone上出現更多的聲控APP。與此同時,谷歌公司也提出了雄心勃勃的Google Home計劃,利用語音和自然語言查詢技術的結合侵入用戶的客廳。那么問題又來了,對于中國市場而言,語音會是新的機會嗎?聲控交互會成為VR到來前大熱的交互模式嗎?中國的訊飛和喜馬拉雅們會一路插上翅膀開始騰飛嗎?在此,菜狗必須先潑一潑冷水,我最痛恨的莫過于照搬西方、哄抬賽道的路數打法,就像過去在文章中寫過的那樣,中國版的instagram、中國版的Snapchat、中國版的……這些故事后來呢?所以如果今天是在這里放言要有一個中國版的Echo,那就是我自抽耳光、忽悠大家。但是,盡管我們不能照搬照抄西方流行的產品模式,卻完全可以分析他背后的東西——需求、心理和社會趨勢:Snapchat的崛起印證了IM的高頻(臉書你反應慢了給了機會,但騰訊不會)、社交壓力帶來的發布反悔(騰訊有微信消息可撤回)、年輕人尋求沒有父母的個性空間(騰訊有QQ空間)。所以,不論有沒有人會去copy to china,這背后有一個話題非常值得探討:聲控交互的商業價值有多大?以語音信息和交互為主打的平臺,將有怎樣的市場潛力?一、當下的語音行業怎么了?有人要說,這回你外行了,語音的故事早就被我們玩爛了,結果也就那樣。確實,印象中從許朝軍做啪啪的那一天開始,移動互聯網似乎就已經進入了“語音時代”,然并卵。1、工具領域,科大訊飛強大的語音喚醒、識別、輸入和交互技術從實驗室走上前臺,領先是領先,但似乎并沒有得到太多的應用,讓人印象最深刻的恐怕就是訊飛輸入法和最近非常文藝好用的語記平臺,問題不在于訊飛有沒有成為中國的Siri(漢語領域肯定強于Siri),問題在于即便Siri也遠遠沒有達到預期的效果、成為人們主流的交互方式,只是一個可有可無的玩具。2、社交領域,涌現出唱吧、啪啪、抬杠、陪我、比鄰、偶爾、派派等一批語音社交平臺,然而幾年下來誰也沒有真正達到“社交平臺”的標準和要求。啪啪們的圖片加語音成了一種錦上添花的存在,遠遠沒有達到高頻剛需的狀態,更何況其閱讀成本奇高,遠遠不能和立刻一目了然的圖片視頻相比;更多的平臺成了當年的168聲訊臺、色情熱線,或者當年的碧海銀沙聊天室;即便在主流的微信平臺上,動不動發語音的人、一發發一串的人也常常變成不受人們待見的存在。唯一做得好的可能就是唱吧,因為唱K這樣一種生活中常見的社交模式真的只能靠語音。3、內容領域,這可能是目前唯一可圈可點的區域,喜馬拉雅、echo、聽書、得到們從不同的角度切入,通過基于語音的媒體內容吸引了一票擁孬:比如根據易觀智庫的《中國移動電臺市場年度綜合報告2016》,作為行業領跑的喜馬拉雅,其日活用戶滲透率已經高達74.3%,這么好的DAU數據即便放在整個移動互聯網領域也是不多見的,而最近這家平臺剛剛通過售賣奇葩說老僵尸們的《好好說話》語音節目賺得盆滿缽滿。那么這里就有一個問題,為什么唯一做起來的是語音內容呢?同時,在內容生態領域最強的莫過于“兩微一端”(微信、微博、新聞客戶端),主打語音的內容平臺能做成那樣的體量嗎?以后有一天人們會說“兩微一端一電臺”嗎?? ??二、當前語音的癥結在哪里?有人又要說,語音的內容還不錯啊。但遠遠沒有到離不開的地步吧?而且語音這東西,太麻煩!是的,就是這個“太麻煩”嚴重制約了語音的發展。(一)語音識別交互領域,聲音一直沒有多少存在感1、相關的技術要求太高。中國人說話遠不像老外那樣一個單詞一個意思,而且各地的口音又完全不同,所以語音的識別、喚醒、輸入、交互都是問題,當然強如科大訊飛已經可以破譯粵語、上海話、四川話了,但是還會有后面的問題。 ? ?2、使用場景有限。視覺和觸覺的交互隨時隨地都可進行,只要你低頭悄悄打開手機就行了,但是語音呢,嘈雜的地方不行,人多的地方也不行,甚至晚上一個人了、對著冷冰冰的機器說話,也會有太裝太怪的感覺。3、交互模式不自然。不論是Siri的長按喚醒,還是傻乎乎地“嘿Siri”,感覺都比較違和,當你看著屏幕上Siri正處于“傾聽錄音”狀態,心一下子就緊繃了,生怕說錯或者說得不及時,說完以后機器開始識別了,你看著進度條又莫名其妙地焦慮不安起來、它能不能聽懂呢,會不會聽錯呢?結果識別出來,果然是錯的,日了狗了……4、應用生態遠未形成。盡管訊飛們已經開始開放語音功能和接口,但市面上并沒有出現很多的聲控交互應用,特別是——沒有出現有影響力的第三方應用。(二)語音終端遠未成型能夠大規模商用的中國版Echo還沒有出現,即便非常厲害的可能也市場影響有限,養在深閨人不識吧。(三)語音內容成本過高1、信息獲取成本過高。看文字可以一目十行,看圖片可以盡收眼底,看視頻基本3秒內就可以判斷值不值得看下去。但是語音完全不是這樣,你聽一段語音(如果不是歌聲),往往得聽三分之一以上才能判斷是否值得聽,而這個過程是漫長的、聽的時候還動不動走神、左耳朵進右耳朵出,如果再加上漫長的前奏簡直令人抓狂。這還只是一段語音,如果我又在很多語音中來回播放暫停選擇想聽的內容呢?這個過程簡直繁瑣得崩潰了!2、使用場景有限。一樣的道理,文字圖片可以在任何地方看吧,但是語音呢?3、差異化價值“貌似”不高。既然都能看文字解決,為何要用語音呢,難道就是為了主播磁性的嗓音?如果是為了這些感性的體驗,視頻是不是更好一些呢?這樣看起來,好像語音一無是處,可真的是這樣嗎?解決幾個癥結就好了。三、語音的核心價值和競爭力回到開頭,我們來看Echo這個產品。它和Siri最大的不同在于:這是一個純粹通過語音、完全不需要屏幕的產品,看起來就像一臺音響,用起來就像和人對話一樣。進一步說,它解放了人們的眼睛和雙手,你可以一邊做別的事情,一邊用語音和它交互。這樣一說就清楚了,歸根結底,Siri和訊飛們并不是純粹的聲控交互產品,他們頂多只能算半聲控交互產品,因為從喚醒他們到判斷語音輸入準確與否到最終的結果顯現,你幾乎都要用到眼睛和手,聲控交互的核心價值“解放眼和手、不再低頭族”完全得不到顯現。換句話說,他們都是視觸覺交互的補充而已,所以本身就錦上添花、可有可無。你用Siri打開微信,比自己親手打開能方便多少呢?你用語音輸入法輸入一段話,錯了還得回刪,這真的比打字輸入更方便嗎?但是Echo展現出的是純粹聲控交互完全不同的價值,并且這幾乎是一個“高頻剛需”。1、抓住了不適宜使用手和眼睛的人群。比如中老年人、殘疾人、不擅長打字輸入的人群,除非有一天人類技術發達到腦波交互,否則語音都是最適合他們的交互模式。2、抓住了不方便使用手和眼睛的場景。這就是我們常說的“低頭族場景”,走在路上、正在開車、晚上睡前、保護視力。由于以往的聲控交互產品做得太差,中國人以強大的適應能力,練就了在這些場景“眼疾手快、目不離機”的超能力,哪怕視力下降、頭昏眼花、低頭撞人也在所不惜。但是試想一下,如果聲控交互真的做上去了,語音真的成了喬布斯口中的“自然延伸”,他們還會這樣嗎?3、創造了全新的伴隨式場景。小的時候,我們為何早上起來會聽收音機,因為可以邊聽邊做其他事情,一心兩用。對,就是這個一心兩用!今天我們為何會一邊跑步一邊開車一邊聽喜馬拉雅——像筆者年初一邊在虹橋火車站辦手續一邊在喜馬拉雅聽羅胖的跨年演說、一邊熱淚盈眶……這都是一心兩用呀!簡言之,聲控交互解放了人的手和眼,不僅在不適宜使用眼手的“低頭族場景”,更在其他豐富的時刻。通過聲控交互,你可以邊聽邊說,一邊干其他事情,這種一心多用的方便效率是不可抵御的。本來這些事,你要不停切換APP來完成,或者放下手機、把視線移到別的地方,但是現在完全可以并行不悖、同步推進了。4、語音有其獨有的魅力。Echo首先是音響,可以播放音樂。而在人與人的溝通中,影響最大的是身體語言帶來的氣場(可惜隔了手機屏幕就完全體現不出來了),其次就是聲音(音調音色節奏),最后才是內容。從這個角度說,語音的成本確實比文字高,卻遠比文字“有溫度”,黃執中的辯詞如果打成文字你未必讀得下去,但只要他魔鬼般的嗓音響起,你立刻覺得他什么都是對的了;語音確實沒有視頻一目了然,但成本卻遠比視頻要低,你不需要打瘦臉針玻尿酸弄出一張網紅臉,因為當你的聲音響起,沒有人在意發聲的人有沒有羅胖帥。這也是為什么最近大火的分答會用語音,一來“盜版”成本高一點,二來聽到名人真實的聲音、這滿足感是不同的。四、全新的機會,聲控領域的BATBAT?有人要說了,你這不是在拉大旗做虎皮嗎,說到底還是忽悠我們開發中國版的Echo呀。恰恰相反,我并不認為Echo是創業者們最好的選擇,但是“基于純聲控交互”的APP卻可以成為一個機會,關鍵在于訊飛和喜馬拉雅們能不能迅速“醒轉”,構建出一個對第三方更加友好的生態。什么是基于“純聲控交互”的APP,說白了就是整個APP的使用過程都完全不需要通過屏幕觸摸、不需要動用眼睛和雙手,最好連喚醒他們都可以用語音。這樣的APP一旦出現,我們就根本不需要購買Echo,因為手機就是個簡易版的Echo了,我把手機放在一邊,一邊做別的事情,一邊就可以使用聲控交互了。如果你使用與聲控系統匹配的專用耳麥,如果這個耳麥可以隨時響應、識別你微小的聲音(在人群中大聲很傻比),那么耳麥就是Echo,就是手機之后真正的可穿戴智能硬件,比手表之類強多了。基于目前已經研發出的漢語語音識別喚醒技術,訊飛完全具備這樣的能力,但是成果多半在實驗室里睡大覺。如果能早一步開放出來,如果能搞好與蘋果安卓廠商們的合作不被“雪藏”,那么接下來的勢能是非常可怕的。
下固件網 http://m.xinzhenzfzp.cn/
1.瀏覽或下載本站資料前務必閱讀并知曉本站服務條款
點擊閱讀
2.嚴禁將資料或筆記用于非法用途,或以任何形式的傳播、修改、造成一切損失由使用人承擔后果.
3.內容僅供無商業目的得交流學習,使用時需征得所有權人的授權.
4.資料僅供交流測試,資料存在的未知風險由使用此資料的用戶承擔一切未知事件而產生的后果,正式場景勿以此資料當做正式用途,僅作為過期,過保修,損壞,遺棄或用戶主動放棄對此產品的重要性評估認為此產品不在重要時使用。