某一天,一個男人站在北京上地某辦公室的落地窗前,內(nèi)心起伏,想著這些智能語音給生活帶來的改變,他臉上滿是笑容,看著窗外漸綠的世界,他知道盡管春天已經(jīng)來了,但冬天遠未離去。智能語音的征途還很漫長,但景色還是要看的。
這個男人在向我們?nèi)绱私榻B智能語音帶來的智慧生活同時,他感慨道:“智能語音會是下一個互聯(lián)網(wǎng)入口,尤其在移動互聯(lián)網(wǎng)時代,這個入口將更快形成。”
智能語音或是那個神秘入口
這個男人是雷臻,OKVoice的聯(lián)合創(chuàng)始人,2014年8月,他和另外兩位聯(lián)合創(chuàng)始人決定要做一件厚積薄發(fā)的事情,說是厚積薄發(fā),是因為他們有著五年左右的技術(shù)儲備,這件事情就是現(xiàn)在的OKVoice。
OkVoice主要從事智能語音技術(shù)和人工智能探索,仔細想想這也算是一家比較老的公司了,加上創(chuàng)始團隊五年左右的技術(shù)儲備期,這家公司快6歲了。OKVoice聯(lián)合創(chuàng)始人雷臻在接受硅谷網(wǎng)專訪時,所表現(xiàn)出來的創(chuàng)業(yè)姿態(tài)和思路,對應(yīng)這家公司后來者的身份,更是難以讓人不好奇。當談到爭論和聲音不斷的“移動互聯(lián)網(wǎng)入口”問題的時候,雷臻臉上浮現(xiàn)出了比以往更多的笑容,他表示,智能語音現(xiàn)在正站在風(fēng)口等風(fēng)來,它就是移動互聯(lián)網(wǎng)入口。
資料顯示,目前,國內(nèi)外多家公司從事智能語音相關(guān)產(chǎn)品的研發(fā)和生產(chǎn),國外主要以微軟、谷歌、蘋果、英特爾、IBM等巨頭為代表,國內(nèi)主要以百度、騰訊、盛大、搜狗、科大訊飛、云之聲、OKVoice為代表,其中,科大訊飛、云之聲、OKVioce一類公司是以智能語音為標簽之一的垂直公司。
金礦是容易讓人趨之若鶩的事物,智能語音,被稱為互聯(lián)網(wǎng)的下一個金礦,尤其是在這個移動互聯(lián)網(wǎng)炙手可熱的時期。此間,雖然智能語音更多時候僅是表現(xiàn)為新潮的人機交互方式,但智能語音市場早已開始布局備賽,你未唱罷,我便登臺,搶占傳說中的“入口”。
巨頭公司紛紛涉足語音市場,加劇智能語音市場競爭的同時,搶灘“移動互聯(lián)網(wǎng)入口”的目的越發(fā)清晰,在雷臻看來,智能語音市場的潛力現(xiàn)在仍被低估了,隨著智能硬件的不斷升級改造,未來智能語音市場是會被真的“智能硬件”引爆的。從巨頭公司爭相布局智能語音拉開“移動物聯(lián)網(wǎng)入口”戰(zhàn)備競賽來看,未來幾年,智能語音會上升到一個前所未有的戰(zhàn)略地位,相應(yīng)的智能語音市場,也會有一個明顯的爆發(fā)現(xiàn)象。
滲透式改造行業(yè)才剛剛開始
讓機器理解人的語言,是一個從語音到文本、從文本到理解的技術(shù)過程。由于中國方言和口語豐富多樣,智能語音的準確率和理解率會偏低。面對這樣的中國智能語音市場,國內(nèi)外巨頭必將面臨更為殘酷的競爭。雷臻和他所帶領(lǐng)的Okvoice不愿錯過搶灘中國智能語音市場的絕佳時機,但是雷臻認為,智能語音和行業(yè)的結(jié)合更有意義,更讓大家心動的是,滲透式改造行業(yè)才剛剛開始。
所以,OKvoice除了針對中國方言和口語推出的“語音識別”服務(wù)外,還推出了“字幕服務(wù)、口語評測、智能客服”等特色服務(wù)。
其中,“字幕服務(wù)”就是典型的智能語音和行業(yè)深度整合的技術(shù)類產(chǎn)品,借助“字幕服務(wù)”,可以將影視作品、電視節(jié)目、在線課程、視頻會議等視頻中的聲音,通過語音識別技術(shù)自動生成文字并導(dǎo)入生成字幕。雷臻告訴硅谷網(wǎng),借助云計算和大數(shù)據(jù),這項服務(wù)未來或可實現(xiàn)工具化的在線服務(wù)。非專業(yè)人士拍攝的小視頻,通過這項在線服務(wù),就能輕松制作出具有影視風(fēng)格的短片。
據(jù)第三方數(shù)據(jù)不完全顯示,OKVoice推出的“字幕服務(wù)“快速通過語音識別自動生成文字,目前階段,準確率在垂直領(lǐng)域可達到95%,省時省力。當然還有提升空間,隨著技術(shù)不斷完善,更高的準確率下帶來的便捷體驗,對“字幕制作”這個行業(yè)小痛點,也算是莫大的安慰。
比以上這些更引人注目的,是智能語音與硬件的互動,在市場需求及技術(shù)和模式創(chuàng)新的驅(qū)動下,全球智能語音產(chǎn)業(yè)正在快速發(fā)展。像藍牙耳機、車載導(dǎo)航、語音門禁等智能語音解決方案,都在逐步完善中。不得不承認,智能語音正在改變我們的生活。
隨著智能終端設(shè)備的普及以及可穿戴設(shè)備、智能家居等發(fā)展,智能語音行業(yè)發(fā)展趨勢見好。語音會是未來一種簡單和常用的人機交互模式。特別是在場景化的環(huán)境中,如駕車,不方便通過手或者眼球操作,語音是一種首選的方式。受硬件形態(tài)的約束,市場上將會有更多的硬件引入智能語音的技術(shù)。
一次公開場合上,智能語音技術(shù)和人工智能探索者作為OKVoice的定位被進一步夯實,陸續(xù)上線的服務(wù)中就有我們前面提到的滲透式的行業(yè)解決方案。當然,這些解決方案,還有待市場和用戶的進一步檢驗。
格局未定,后來者自我壁咚
“互聯(lián)網(wǎng)+”的概念提出后,在不久前剛剛舉辦的2015博鰲論壇上,互聯(lián)網(wǎng)領(lǐng)袖的關(guān)注度格外高漲。本次活動上,李彥宏、比爾蓋茨、馬斯克這三位大佬的對話更是引人矚目,其中很多觀點都蘊含著對未來的重要意義。其中,人工智能就是三位大佬在對話上都高度關(guān)注的領(lǐng)域,而眾所周知的事情是,智能語音是人工智能的基礎(chǔ)支持和核心要點。
這聽起來很讓人興奮,雖然智能語音距離人工智能似乎還比較遙遠,但是,越來越多的通道將被打開,在中國,越來越多的公司加入智能語音市場,百度宣布語音識別技術(shù)及能力全面開放,微信發(fā)布了語音識別開放平臺……現(xiàn)階段,互聯(lián)網(wǎng)巨頭都還只是在試水,還沒有大規(guī)模地進入語音這塊市場。大公司考慮更多的是自己的商業(yè)閉環(huán),而垂直的公司更多做一些聚焦,前者進入語音市場是立足做一個平臺級的產(chǎn)品,而后者更關(guān)注垂直與細分市場。
OKVoice也是這么做的,格局未定,后來者可發(fā)揮空間還很大。“巨頭的參與讓智能語音這個領(lǐng)域容易得到更多的關(guān)注,共同培育市場,市場對參與者反饋越多。”雷臻在說這句話的時候異常平靜。
對雷臻來說,這是他的第二次創(chuàng)業(yè)了,第一次是做優(yōu)惠券,就是現(xiàn)在O2O的雛形。第二次,他選擇了智能語音這塊大蛋糕。30多歲的雷臻,看起來干練自信,言談舉止親切而自然。當年雷臻從華為出來的時候,他就堅信,創(chuàng)業(yè)這件事情,厚積薄發(fā)更能帶來驚喜。
前面提到的OKVoice五年的技術(shù)儲備,來源于團隊構(gòu)成的強大技術(shù)背景,但這還不夠,應(yīng)該還有這個團隊共同的強大理想所架設(shè)的“極客”氛圍。在OKVoice創(chuàng)業(yè)初期,公司還在研發(fā)“語音識別”的升級產(chǎn)品,一個主抓技術(shù)的同事因為家中有事,雷臻給了他一個星期的事假,其實,用7天來處理該技術(shù)的家事還是有點緊張的,結(jié)果,這個可愛的技術(shù)大牛只用了不到一半的時間就趕了回來,結(jié)果,該階段項目進展提前完成,為后面“滲透性行業(yè)智能語音服務(wù)”節(jié)省出了競爭時間。
“這樣的一個團隊,是一個可以創(chuàng)造神奇的團隊。”雷臻對來訪者說,又像是在自言自語。言語當中自豪和壓力都有,他對現(xiàn)在的OKVoice的估值是一億美元,別人問他,你這么估值的依據(jù)是什么:是行業(yè)前景,是市場體量,還是技術(shù)儲備?雷臻笑語,他說,我們不主動尋找資本介入,也不排斥資本介入,我這是在逼迫自己呀。
雷臻是一個緊跟潮流的人嗎?像也不像,他似乎忘了一個潮詞。這個潮詞是“壁咚”。壁咚的字面意思是大力拍打墻壁發(fā)出“咚咚”聲的行為,但分場合又有著不同的意義。通常是指戀愛中,男性把女性逼到墻邊,單手或者靠在墻上發(fā)出“咚”的一聲,讓其完全無處可逃的動作。
現(xiàn)在的雷臻就像在談一場戀愛,戀愛對象是“智能語音”,是“競爭對手”,是“行業(yè)未來”,但更多的是他自己。這和自戀無關(guān),他做為后來者,究竟壁咚了誰?在智能語音風(fēng)起云涌的當下,后來者雷臻壁咚的是自己。