品途2018·NBI夏季創(chuàng)新峰會于8月8日在北京四季酒店舉行,以“AI賦能下的樂享未來新體驗”為主題的人工智能圓桌對話也在Pandaily創(chuàng)始人兼CEO 周恒星的主持下熱烈開始。
聲智科技創(chuàng)始人兼CEO陳孝良,至真互聯(lián)創(chuàng)始人兼CEO代黎明,物靈科技創(chuàng)始人兼CEO顧嘉唯,全域醫(yī)療總裁助理、創(chuàng)新運營部總經理閻俊,清帆科技創(chuàng)始人兼CEO一起圍繞智能音箱,語音交互未來的現(xiàn)象級產品,以及未來AI新體驗展開了深入的討論。
NBI的全稱是New Business Information, Inspirition, Impact, and Innovation,新商業(yè)創(chuàng)新影響力。自創(chuàng)建以來,NBI系列活動(NBI Awards、NBI星耀計劃科創(chuàng)大賽等)吸引了近百家投資機構、千余家創(chuàng)業(yè)企業(yè)參與——引領與創(chuàng)新相關的聯(lián)想、發(fā)問、觀察、對話和思考。本次峰會以與創(chuàng)新節(jié)律同步為主題,旨在讓創(chuàng)業(yè)者、投資人、產業(yè)機構參與到新技術的誕生和技術的新突破、發(fā)問創(chuàng)新的可持續(xù)性、觀察產業(yè)變革趨勢以及思考商業(yè)文明的新價值。
圓桌會話開始,主持人Pandaily創(chuàng)始人兼CEO 周恒星向大家介紹五位與會嘉賓,各位嘉賓各自介紹自家公司以及從事的業(yè)務領域。聲智科技創(chuàng)始人陳孝良在現(xiàn)場也為向大家介紹了聲智科技。
聲智科技成立于2016年4月,是一家專注聲學前沿技術和人工智能交互的科技創(chuàng)新公司,公司目前定位于為企業(yè)提供最好的聲學語音技術和語言智能服務。截止目前,聲智科技已經為小米、百度、阿里巴巴、華為、聯(lián)想、360等公司提供了遠場語音交互技術和方案。作為小米智能音箱與百度小度智能音箱遠場語音技術獨家提供者,以及阿里天貓精靈、華為的供應商,聲智科技已經成為眾多頭部大客戶的最佳合作伙伴。不局限于消費電子領域規(guī)模上量的智能音箱、智能機頂盒和平板手機等產品,聲智科技的語音技術也在車載前裝、智能安防、智能金融、教育、醫(yī)療和機器人等行業(yè)得到廣泛應用。
主持人:陳總是在智能語音這個領域,最近的話主要是致力于智能音箱,公司的一些合作伙伴也是國內的互聯(lián)網巨頭公司(BATMH),為什么選擇音箱來作為主要的切入點呢?
陳孝良(聲智科技CEO):從全球市場也可以看出,在消費電子領域,無論是從規(guī)模還是影響力來看,智能音箱都是人工智能領域最成功的落地產品。聲智科技從成立開始就在智能音箱領域下了很大的功夫,這也是為什么智能音箱領域,百度、阿里、騰訊、小米、華為五大巨頭都選擇了聲智科技。我們選擇智能音箱作為突破口,主要是出于兩個方面的考慮。
一個是從整個AI的構架來說,音箱相對來說還是簡單的。不管是前端的聲學處理、語音識別、聲紋識別、語音理解、語音合成,以及后端的內容對接,整個鏈條基本上是一個最可控的簡單系統(tǒng)。另外,智能音箱還最具有代表性。比如,如果我們給智能音箱加上輪子和屏幕,就可以做成一個機器人;還可以把智能音箱的系統(tǒng)放到汽車里面滿足交互需求,因為未來汽車的三大技術就是能源、控制和交互。剛才漢能的陳總也提到了,未來我們實現(xiàn)了智能駕駛之后,我們在車內的大量時間要去做什么,這時候就需要交互技術,而交互的關鍵還是智能音箱這套核心系統(tǒng)。這個系統(tǒng)即簡單,又具有代表性,對于像我們這樣的創(chuàng)業(yè)公司來說作為突破口是最合適的。
另外一點就是公司的成長,公司的成長主要就是看速度。智能音箱在全球是一款銷量很高的產品,今年在中國也快速上量了,也有很多大企業(yè)的參與。其實兩年前我們公司就預測過巨頭公司都會參與到這個市場,正如現(xiàn)在大家所看到的,現(xiàn)在市場上的智能音箱基本上都是互聯(lián)網的幾大巨頭在玩,國外也是如此。巨頭的參與可以快速地降低人工智能新品類的市場培育成本,這個時候也是很適合創(chuàng)業(yè)公司去切入的。
主持人:正如陳總剛剛說到的,智能音箱領域在中國主要是一些互聯(lián)網巨頭在參與,而在美國主要是亞馬遜和谷歌在競爭,據我所知,現(xiàn)在智能音箱領域還沒有出現(xiàn)現(xiàn)象級的產品,可能值得一提的就是亞馬遜的Echo,您覺得亞馬遜為什么能做到這一點呢?
陳孝良:現(xiàn)在大家一提到人工智能,很容易就想到亞馬遜的Echo,國內雖然百度、小米、騰訊、華為等都在參與,但是沒有一個具有代表性的現(xiàn)象級產品。從我們行業(yè)內的角度來看的話,有兩點可以給大家作為參考。
第一點的話還是時間窗口的問題,亞馬遜的Echo在2011年就開始研發(fā),2013年就進入市場,而國內智能音箱真正興起是在去年小米發(fā)布智能音箱的時候,之后阿里、百度、騰訊等才紛紛介入,比亞馬遜要晚了很多。
這個時間上的滯后也帶來了另一個問題,這也是東西方文化的差異,因為我們的文化比較含蓄一些,在面對新的事物上可能難以快速認可,所以在智能音箱剛剛推入市場的時候可能會是懷疑,使用之后可能又是質疑,我相信大家對現(xiàn)在的智能音箱可能還是不滿意。
而且我們東方文化在表達上可能不像西方文化那樣豁達,這些因素疊加在一起,就導致國內的智能音箱不管是在對話頻率還是對話時長都要小于國外,我們對智能音箱的依賴度顯然也還不像歐美那么高。
另外一點就和國內的市場環(huán)境密切相關了,如果要產生現(xiàn)象級產品的話,我們就需要把所有的資源都集中在一兩款產品上。這一點亞馬遜在Echo做的很好,他們基本上把所有的資源、渠道都投入了Echo這款產品。比如我們?yōu)g覽亞馬遜的網站就可以發(fā)現(xiàn),不管什么時候,都有一個關于亞馬遜Echo的banner,而亞馬遜基本上占領了國外壟斷性的線上渠道。
另一個國外巨頭就是谷歌,基本上占據了國外廣告的壟斷地位,也是把這個資源集中投入了Google Home,甚至還投入巨資建設線下渠道。這兩個因素都會讓國外的智能音箱普及度更高。
而我們國內的參與者喜歡單點突破,有的占據了線上的主要渠道優(yōu)勢,有的占據了廣告和百科的一些優(yōu)勢,有的集中在產品優(yōu)勢上發(fā)力,但這些優(yōu)勢分散開很難形成一個集中的點,這樣就很難讓廣大用戶對某一產品有一個全方位的認知,很難產生爆炸性結果。
當然,國內智能音箱的應用生態(tài)在早期階段也很難承擔現(xiàn)象級產品的重任,這也不用過于擔心,因為我們聲智科技一直在持續(xù)研發(fā)應用與其他場景的新技術和新產品。
比如我們正在力推的遠場智能機頂盒,若想要讓這款產品成為一個現(xiàn)象級產品,首先還是需要技術上的率先突破。比如聲智科技的OpenAEC技術,主要解決弱參考信號或者無參考信號等更為復雜場景的回聲抵消(自噪聲抑制)問題,可以讓遠場盒子直接支持所有品牌的電視和喇叭系統(tǒng)并保證極高的交互效率。
現(xiàn)在國內市場上很快可以買到基于聲智科技遠場語音交互技術的阿里天貓精靈魔盒,明年這類產品肯定會有一個爆發(fā)性,是不是會成為現(xiàn)象級的產品,那還要關注國內一些巨頭的力度,特別是運營商對于這種新技術的推廣力度。
另外還有特別重要一點,就是大家對于遠場語音交互系統(tǒng)的認知,未來這必然是一個全新的交互系統(tǒng),甚至不需要界面,但是目前來看,除了智能音箱,很多產品還只是把語音交互作為一個輔助。對于聲智科技來說,通過技術和數據迭代,持續(xù)研發(fā)和推出新技術來尋求現(xiàn)象級人工智能產品,這是我們一直努力的目標。
顧嘉唯(物靈科技CEO):我主要談三點,首先智能音箱這個品類,初期階段語音交互可以將智能音箱作為一個載體,但這個載體的特性是播音樂,播內容,但中國主體的文化人群的用戶習慣很少有使用音箱去獲得音樂的,這也是中美在基層上的一個差異。這一點也說明音箱只是一個開始,終極形態(tài)的音箱產品現(xiàn)在還沒有定下來。
第二點,一個好的語音交互產品背后有兩個方面,第一個是智能家居的控制,第二是有足夠多的內容源,但這兩個生態(tài)系統(tǒng)即便BAT都在猛推,但還是沒有達到很好的效果。
第三點,我認為中國市場還是一個很不成熟的階段,我們要先激發(fā)用戶的需求。當Alexa和Google Assistant已經在海外變成一個千萬級別的通用方案時,創(chuàng)業(yè)公司尋找的下一個高頻入口也會出現(xiàn),無論是機頂盒還是車載。
主持人:張總對于智能音箱這一點有什么看法嗎?
張文濤(清帆科技CEO):“有一點很有意思的,我觀察我兒子,因為他現(xiàn)在還不識字,他每天就會和他的手表對話,回家練舞的時候他就跟他的手表說,給我播一首歌,然后就跟著跳舞,他的交互體驗就很明顯。
語音交互確實是人類的天性,或者說人對聽說的掌握要比文字更自然,我本來不太關注交互,文字對我來說更具有私密性,但是對于我兒子來說,這種交互方式對他來說是最簡單的,現(xiàn)在的很多小孩也都已經習慣語音交互了。我覺得智能語音交互的未來是非??善诘摹?rdquo;
顧嘉唯(物靈科技CEO):對,在YouTube上看很多第一次用iPad的小孩,他們會非常自然,今天語音交互出現(xiàn)后小孩也是最快進入的。這里面有幾個特點,第一點是兒童對語音交互的結果預期相對較低,而成人的預期很高;
而且兒童相信一切都是可以語音交互的,他們比起大人更愿意去交流。而成人如果受挫,就會對這個產品失去信心,Siri之所以做的不是很好,也是這個原因。
閻峻(全程醫(yī)域總裁助理):智能音箱的話,其實我在家里也買了一個小米的智能音箱?,F(xiàn)在對于整個家居互聯(lián)網的人工智能技術是一個新的趨勢,也可以說是一種新的發(fā)展,不管是智能音箱還是智能家居,都是出于起步的階段,我希望能看到它在使用過程中不斷的發(fā)展,希望看到人工智能領域的發(fā)展狀態(tài),是對行業(yè)的體會,也是對生活的體會。
創(chuàng)新是發(fā)展的第一生產力,而目前這是中國企業(yè)發(fā)展最薄弱的環(huán)節(jié),雖然在這是一個全民創(chuàng)新的時代,但如何用創(chuàng)新創(chuàng)造未來也是一個重要的問題。創(chuàng)新如何推動產業(yè)的發(fā)展,如何帶來價值,如何用技術來改變社會的潮流,這些都是我們科技創(chuàng)新者需要考慮的問題。未來的智能語音交互領域何去何從,現(xiàn)象級的語音交互產品究竟是什么,聲智科技也會繼續(xù)努力探索。