科大訊飛正建立起智能應用生態(tài)圈
作 者:錢麗娜 來 源:商學院發(fā)表日期:2017-07-17
在中國,要證明“我媽是我媽”可是個解不開的死結(jié)。若是子女與父母不在同一戶口簿上,簡直不知道從哪里下手??拼笥嶏w在智慧城市的解決方案中利用聲紋和人臉識別技術,嘗試打通公安、民政、社保、教育等58個部門781類數(shù)據(jù),只要刷臉聽音,就能證明你和你媽之間具有血緣關系。6月2日,《商學院》雜志、中國經(jīng)營者俱樂部帶領企業(yè)家會員走進科大訊飛,全方位地感受人工智能在各領域的應用和突破。企業(yè)家們在驚訝之余,猛然意識到未來已來,再不跟上人工智能的腳步,即將面臨被淘汰的風險。
《偽裝者》中曾經(jīng)有這么一句話,如果一個特工的背影和聲音被人記住,你不是讓對方消失就要讓自己消失。
每個人的聲音是如此獨特而又有趣,這促使科大訊飛創(chuàng)始人劉慶峰從1999年開始帶領團隊攻克聲紋難題。
今天,當你走入科大訊飛位于合肥的園區(qū),在展廳隨時可以聽到奧巴馬說中文、羅振宇播新聞。你真以為高德地圖中林志玲和郭德綱的聲音導航來自本人?錯,那是采用了科大訊飛的語音合成技術。只要采集到足夠的語音樣本,后臺根據(jù)聲紋特征,經(jīng)過機器學習后便可以模擬任何當事人的聲音特征,并達到以假亂真的程度。
2000年以前,中文語音產(chǎn)業(yè)被微軟、IBM等一眾國際IT巨頭壟斷??拼笥嶏w自進入這一領域后發(fā)展迅速,2016年,科大訊飛在國際語音合成比賽中的中文語音合成分為4.5分,英文為4.2分,印地語為3.9分。在非常關鍵的自然度指標上,科大訊飛是4.2分,科大是唯一得分超過4.0的語音參賽系統(tǒng)。
這是什么概念呢?5分是國家播音員的水平,4.5分達到省級播音員的水平。達到這一分值時,人耳已經(jīng)無法分辨是機器發(fā)音還是真人發(fā)音。而4.2分的英文合成語音也戰(zhàn)勝了微軟、IBM、MIT等一眾世界一流的高科技公司和研究機構(gòu)。
光有語音合成技術,也許人們尚無法深切感受語音智能是如何改變、影響我們生活的。在“走進名企”活動中,科大訊飛首次系統(tǒng)地向企業(yè)家們展示了人工智能技術在各個產(chǎn)業(yè)的落地實施情況。
人工智能已經(jīng)像互聯(lián)網(wǎng)、像空氣、像水那樣潛移默化地成為我們生活中的一部分。
一切源于語言
《人類簡史》一書中提到,人類認知革命起源于語言。而要讓機器具備人類的語言能力,這一技術分為三個要點。
一是語音合成。將任意文字信息轉(zhuǎn)化為自然流暢的語言,給機器裝上了人工嘴巴。
二是語音識別。將語言中內(nèi)容、說話人、語種等信息識別出來,給機器裝上了人工耳朵。
三是自然語言理解。對自然語言進行語義理解,給出適合的指令集合,給機器賦予人工大腦。
試試這兩句話:
“爸爸沒法舉起他的兒子,因為他很重。”問:誰重?答:兒子。
“爸爸沒法舉起他的兒子,因為他很虛弱。”問:誰虛弱?答:爸爸。
科大訊飛市場總監(jiān)任萍萍說,單這兩句話中對“他”一詞是誰的理解就相當于六歲孩子的認知水平。這是公司正在攻堅的“六齡童計劃”,即讓機器達到六歲孩子的語言認知推理能力??拼笥嶏w要實現(xiàn)的目標是讓機器像人一樣,不僅能聽會說,還能理解思考,具備人類的思維能力。正是在認知智能領域的突破,科大訊飛獲得Winograd Schema Challenge2016年比賽第一名。
2014年8月,科大訊飛在傳統(tǒng)人工智能(即感知智能)領域取得突破的基礎上,結(jié)合承擔的863類人智能重點攻關項目,正式啟動“訊飛超腦計劃”,研發(fā)基于類人神經(jīng)網(wǎng)絡的認知智能系統(tǒng)。通過對海量知識庫的學習,建立語言理解能力、知識表示能力、聯(lián)想推理能力以及自主學習能力。這里最難的是對自然語言的理解,國際上以通過各個國家的高考來判斷人工智能的先進性。美國華盛頓大學圖靈中心的目標是通過美國的生物學考試,日本則希望考上東京大學。目前科大訊飛的第一目標是達到“一本”的成績,下一個目標是達到進入北大、清華的成績。
人工智能+大數(shù)據(jù)+產(chǎn)業(yè)=無限可能
說到智能語音的應用,人們最熟悉的莫過于地圖語音導航、智能汽車駕駛中的語音秘書服務,隨時隨地通過語音指揮車載智能系統(tǒng)完成各種指令,避免司機駕駛過程中分心。
2013年前后,寶馬、奔馳在中國發(fā)起中文語音輸入系統(tǒng)的供應商PK。在車速60碼的相對安靜的車內(nèi)環(huán)境下,三家語音供應商中文語音輸出的準確率分值均在90分以上,科大訊飛則高達97分;而當車速達到140碼,車內(nèi)噪音激增時,科大訊飛依然保持90分以上的高分,而另兩家則跌到六七十分。為此,科大訊飛一舉拿下中文語音供應商的資質(zhì),并且還為全國一百多款車型提供語音智能服務。
在教育領域,科大訊飛的多語種智能口語評測系統(tǒng)開始一展身手。系統(tǒng)可以分析用戶的語音特征,對口語發(fā)音的標準程度進行智能評分;精確指出用戶發(fā)音的錯誤和缺陷,并給出改進指導。這對于學生語言學習、矯正發(fā)音起到巨大的幫助,未來國家重大考試中的口語評分也將按照這一系統(tǒng)來評測。
在醫(yī)療領域,有醫(yī)院開始嘗試在醫(yī)生椅子上配備智能語音采集設備,問診對話全部自動轉(zhuǎn)為文字病歷,減少了醫(yī)生邊問診邊輸入病歷的麻煩,即使醫(yī)生有地方口音,設備依然能夠準確識別;在醫(yī)療影像領域,公司根據(jù)合作醫(yī)院提供的醫(yī)療影像數(shù)據(jù),肺部結(jié)節(jié)診斷的準確率達到75%,堪比縣級醫(yī)院大夫的診斷水平。未來只要給系統(tǒng)提供更多的數(shù)據(jù),準確率還將進一步提高,并且這一技術還可應用到其他器官的檢查。
面對學生苦不堪言的題海訓練,科大訊飛推出了智學網(wǎng),這是人工智能針對精準教學提出的解決方案。只要將學生的試卷輸入系統(tǒng),評判試卷后,系統(tǒng)能就每一個學生、每道題的得分與班級和地區(qū)的平均分進行比較,找出知識薄弱點,從題庫中匹配相應的訓練題,進行有針對性的訓練。單這一改進就能減少40%的無效做題時間。2015年,科大訊飛在合肥一中嘗試精準教學,在對比實驗中,接受“因材施教”的學生成績明顯提升,與此同時,教師的教學效率平均提升30%。如今,智學網(wǎng)已在全國31個省級行政區(qū)超過1萬所學校使用,全國超過半數(shù)“百強”名校全面應用智學網(wǎng),受益師生超過1500萬人,成為中國數(shù)據(jù)規(guī)模最大、智能程度最高、產(chǎn)品體系最全、應用效果最顯著的個性化教與學的系統(tǒng)。另外,科大訊飛智慧教育系列產(chǎn)品在全國31個省、市、自治區(qū)、直轄市及新加坡等海外市場廣泛應用,服務師生超過8000萬人。人工智能正在改變傳統(tǒng)的教學模式。
此外在智能家居、互動娛樂、智慧城市、智能客服、金融等領域,人工智能也在改變著原有的生態(tài),創(chuàng)造全新的商機??拼笥嶏w通過發(fā)展核心技術、內(nèi)部創(chuàng)業(yè)以及與第三方合作伙伴共贏的方式來擴大核心技術的應用場景,建立起智能應用生態(tài)圈。
“人工智能比我們想象的來得更快”任萍萍說。未來已來,有遠見者已經(jīng)在藍海中找到獨一無二的機會。