眾企業押寶語音智能 以期其能聽懂人心

2016年12月06日10:41  來源:中國青年報
 
原標題:眾企業押寶語音智能 交互認知尚未實現 語音智能何時聽懂人心

吳桂林總是很樂於向人展示自己公司現在使用的語音智能技術。

11月底,在百度語音平台三周年發布會上,這位愛奇藝技術總監拿出手機打開了自家的手機客戶端,對它發出語音指令:“我的會員沒錢了,給我打開VIP充值。”隨后App就跳轉到了會員充值以及支付頁面。

動動嘴就能給身邊的設備下達指令,實現自己的需求,眼下能享受這樣智能化服務的人越來越多。據吳桂林介紹,每天有上百萬愛奇藝App的用戶會使用語音搜索,其中80%以上可以轉化為有效點擊。

作為移動互聯網時代比較典型的應用之一,視頻App的這一變化反映了許多用戶和開發者的共同感受:不知不覺間,我們使用的互聯網產品已經變得更加智能化,人工智能、機器學習、深度神經網絡等原本有些冷門的詞匯,也慢慢被社會廣泛討論起來。

隨著人臉識別、語音合成等技術日趨成熟,走過PC、移動兩大階段的互聯網,下一個階段會不會是更加聰明、智能的智能互聯網?

分歧

今年11月中旬的第三屆世界互聯網大會上,兩位互聯網大佬關於人工智能的分歧成了最引人關注的焦點之一。

百度公司創始人、CEO李彥宏聲稱,移動互聯網時代已經結束,這個風口已經沒有可能出現“獨角獸”企業,未來的機會在人工智能。而騰訊公司控股董事局主席、CEO馬化騰則認為,人工智能只是新技術和新工具,絕對不會因為人工智能來了,移動互聯網就毀掉了。

李彥宏支撐自己觀點的一個理由是,起步於2012年左右的移動互聯網時代,主要得益於移動端用戶的快速增長,但目前國內互聯網滲透率已經超過50%,如果把老人小孩都去掉,真正能成為移動互聯網用戶的人群已經不多了。

一些數據和現象似乎也在說明移動互聯網進一步增長的機會減少了。根據美國市場研究公司IDC的預計,今年全球智能手機出貨量將達到14.5億部,同比增長0.6%,遠低於2015年的10.4%。

在智能手機銷量隻能勉強實現微幅增長的同時,移動互聯網的另一重要載體App的情況也不容樂觀。唱吧、魔漫相機、瘋狂猜圖、臉萌、圍住神經貓、無秘、足記……爆款App越來越多,流行的時間卻似乎越來越短,甚至有行業分析師表示,App的生命周期平均隻有10個月。

在接受中國青年報·中青在線記者採訪時,科大訊飛輪值總裁胡郁也表達了與李彥宏類似的觀點。在他看來,隨著人口紅利的逐漸消退,智能互聯網逐漸代替移動互聯網的趨勢已經逐漸清楚了。“盡管新的手機在不斷地賣出去,但總的用戶數相對穩定,已經基本進入了飽和階段。”

那麼,下一輪機會在哪裡?胡郁注意到,今年以來很多大企業和小型創業團隊開展了不同的嘗試,有的在智能穿戴設備上發力,有的鑽研無人車,“這種狀態有點像前幾年智能機剛出現的時候”。但總結各種嘗試的方向后,胡郁發現它們有一個共同的趨勢:大多數設備都在智能化、開放化。

在DCCI互聯網研究院院長劉興亮看來,移動互聯網之后,互聯網的發展將會進入一個“智能時代”。不同於PC和移動互聯網時代以個人電腦、手機為終端接入互聯網,那時候任何設備都可能成為互聯網的接入終端,而手機這樣的設備也可能會被淘汰。

“智能互聯網更多強調的是每個設備能夠獨立地、有智慧、有感情地工作,可以理解為,以后每個物品都有可能成為一個機器人,一個電腦。”劉興亮說。

押寶

因為看好智能互聯網的發展前景,百度已經在這上面投入許多資源和精力,尤其是在語音智能方面。

“語音識別是非常重要的交互辦法,有很大的潛力去徹底改變人機交互的效率和辦法。”11月22日下午,百度首席科學家吳恩達在接受中國青年報·中青在線記者採訪時提到,語音是最自然而方便的交互方式,語音智能也是目前技術比較成熟、用戶感受比較直觀的智能交互方式。

他舉例說:“比如未來你在家裡想開電燈,想把空調調到24℃,如果可以不再需要拿出手機,就可以使用准確率很高的語音技術的話,我覺得很多用戶都會覺得有非常大的價值。”

為此,當天百度宣布向公眾開放4項全新的語音技術的接口:情感合成、遠場方案、喚醒二期技術和長語音方案。從效果和作用來看,這4項新開放的技術能解決用戶在使用語音交互場合時,經常會面臨的一些普遍而關鍵的問題。例如,百度情感合成技術主要聚焦在為合成語音“加入情感”,目前可達到接近真人發聲的效果。

選擇語音作為智能互聯網切入口的不止百度。11月21日~23日,搜狗、百度和科大訊飛3家公司先后召開了發布會,向外界展示了自己的語音智能產品和實力,並且都宣布其中文語音識別准確率達到了97%。

科大訊飛更是將野心延展到了物聯網上,推出了一款“萬物聯網輸入法”,想通過語音操作的方式解決物聯網設備的人機交互問題。在其最新推出的多款新產品中,既有可實現中、英等語言即時互譯的便攜式翻譯機,也有汽車人機交互系統飛魚助理,還有通過AIUI技術識別身份、分析數據、辦理業務的曉曼機器人。

科大訊飛董事長劉慶峰在演講中表示,以語音為主、鍵盤為輔的人機交互正逐漸成為剛需,語音智能技術的推出和開放也有利於全社會的創新。據他介紹,科大訊飛把智能雲平台開放給開發者之后,平台上總用戶達到8.9億,每天30億人次訪問量,創業團隊從去年的7萬增加到21萬個。

對於一些企業在語音智能方面的布局,洪泰創新空間創始人、CEO王勝江認為,從語音來切入智能互聯網領域是一個很好的入口,因為智能互聯網最終要解決的還是人與機器的連接問題。但在此過程中也會遇到一些難題,例如語音難以完全標准化、人工智能的交互仍存在許多不足。

預言

對語音智能是否足夠智能的擔心不隻出現在創投圈裡,鑽研人工智能多年的專家也頗有擔心。

“我們假設這樣一個場景。一個男人的聲音說:‘打啊,打啊,你打啊。’另一個女人的聲音說:‘反了,反了,反了你。’語音智能的機器人會怎麼判斷?它可能就會覺得這是兩夫妻在打架了。但如果我們走到窗戶前一看就會知道,場景其實是一男一女正在練習倒車。”

11月23日,這個生動的場景模擬引起了台下觀眾的哈哈大笑。做出這個假設場景的是已經關注語音智能領域十余年的中國人工智能學會理事長、中國工程院院士李德毅。

李德毅認為,對於語音智能的研究要盡量接近現實使用的場景,尤其是要讓語音智能置於語義和語境中去學習和理解,甚至實現交互認知。目前的語音智能還不能達到這個水平。

“現在我們到一些機器人展廳去看,不到3分鐘就覺得意思不大,如果你買了個(機器人)回家,不到兩個月你就把它處理掉了,原因是它太死板。”李德毅注意到,目前很多語音智能技術還停留在簡單的語音對話階段,離交互認知還遠遠不夠。

根據新智元發布的《中國人工智能產業發展報告》的描述,在人工智能60年的發展歷程中,經歷了兩次退潮:20世紀七八十年代,由於計算能力不足、難以應對不確定環境等原因,人工智能的討論熱度逐漸冷卻﹔21世紀初,一些人工智能技術成功商用但跨越式發展失敗。

根據上述《報告》的統計,目前全國在人工智能領域創業的公司約有200多家,大部分創建於2010年以后,絕大多數融資仍處於天使輪或者A輪階段。但胡郁認為,目前的人工智能技術還處於“弱人工智能”階段,大多還隻能達到語音助手的水平。

語音智能還未實現交互認知,技術隻達到語音助手的水平。智能互聯網的基礎人工智能技術會不會迎來第三次退潮?

記者把這個問題拋給胡郁,他托著腮思考了好一會兒,然后說:“以前的人工智能退潮都有一個現實的問題,沒有從研究階段轉到使用階段,但現在這次浪潮中我們可以看到,已經在很多方面真實應用了。”

作為技術研究出身的高管,胡郁認為,人工智能的這一波浪潮能達到怎樣的高度目前還不知道,但他認為,與其在浪潮中去預測,倒不如加速手頭正在進行的研究。(王林 羅蘭爍)

(責編:方正(實習生)、張希)