前不久,長安汽車旗下的歐尚汽車智慧快樂座艙在渝發(fā)布,將人工智能技術(shù)與汽車使用場景深度融合,打造全球首發(fā)的車外語音交互系統(tǒng)。
這一交互系統(tǒng),來自科大訊飛智能汽車重慶分中心“80后”青年專家馬鴻鵬的團(tuán)隊。
2018智博會上,科大訊飛董事長劉慶峰宣布將西南總部落地重慶,同時落地的還有科大訊飛智能汽車重慶分中心,由來自東北的馬鴻鵬擔(dān)任該中心總經(jīng)理。從此,馬鴻鵬的團(tuán)隊開始與重慶結(jié)緣。
4年來,科大訊飛與長安汽車等重慶車企共建聯(lián)合實驗室,在汽車電子智能化的技術(shù)研發(fā)、產(chǎn)品設(shè)計以及整車應(yīng)用領(lǐng)域展開合作,取得了多項技術(shù)突破。
“我們在重慶的團(tuán)隊平均年齡27歲左右,是一群有技術(shù)、有理想、有沖勁的科技青年,致力于通過‘AI+汽車’,解鎖智能汽車人機(jī)交互新模式,賦能重慶汽車產(chǎn)業(yè)開創(chuàng)新格局。”5月4日是五四青年節(jié),馬鴻鵬在接受重慶日報記者采訪時如是說。
反復(fù)測試建立龐大的場景知識庫
讓車機(jī)系統(tǒng)精準(zhǔn)理解說話人的前言后語
“小安你好,幫我查一下北京的天氣。”
“好的,北京天氣晴,白天氣溫20℃。”
“再幫我訂一張去那兒的機(jī)票。”
……
這樣的對話,在人與人交流中再簡單平常不過。但是,對于人機(jī)互動而言,想要和機(jī)器持續(xù)對話,并讓機(jī)器理解“那兒”就是上文所指的北京,并非易事。
“人坐在車內(nèi),一次喚醒車機(jī)系統(tǒng)就實現(xiàn)多個指令,還要讓系統(tǒng)能前言后語結(jié)合理解,這種交互方式是之前沒有的。”馬鴻鵬說道,要達(dá)到這樣的效果,機(jī)器需要記憶和理解當(dāng)前說話人的意圖和場景,因此就需要覆蓋盡可能多的場景和可能的問法。這樣一來,算法復(fù)雜度會呈幾何級數(shù)增長,使軟件的開發(fā)和維護(hù)都有較大難度。
為了實現(xiàn)這一看似簡單的“高難度”操作,馬鴻鵬帶領(lǐng)著20多人組成的團(tuán)隊入駐長安汽車,反復(fù)測試并建立了一個龐大的場景知識庫。
“通常車內(nèi)常用指令不超過2000種,但我們在車機(jī)上內(nèi)置了常用指令近6000條,以及不常用指令近2萬條,才實現(xiàn)了精準(zhǔn)獲取用戶指令。”馬鴻鵬說。
如今,搭載了相關(guān)技術(shù)的飛魚OS已經(jīng)在長安CS95、CS75等車型上使用,助力重慶汽車在智能汽車賽道拔得頭籌。
訓(xùn)練外語語音識別系統(tǒng)能理解會思考
助力“重慶造”汽車走向國際市場
隨著智能汽車產(chǎn)業(yè)發(fā)展,不少重慶汽車品牌也開始走向國際市場。智能汽車在海外使用,必須適用當(dāng)?shù)氐恼Z種,而在過去,外語的車載語音識別及合成系統(tǒng)被國外企業(yè)掌握,國內(nèi)車企只能使用國外企業(yè)的語音技術(shù)。
“過去很長一段時間長安汽車在面向中東、南美等海外發(fā)行的車型中,語音識別系統(tǒng)一直是采用的國外技術(shù),安全問題是最大的考量。”馬鴻鵬坦言。
為了解決這一“卡脖子”問題,馬鴻鵬團(tuán)隊聯(lián)合科大訊飛研究院展開了長安汽車車載外語語音識別及合成系統(tǒng)研發(fā)。
“做車載外語識別,不僅需要聽懂,還要理解其他國家的語言文化習(xí)慣,甚至同一語種不同地區(qū)的口音,這就需要有強(qiáng)大的識別模型和機(jī)器學(xué)習(xí)做支撐。”馬鴻鵬解釋說,車載語音的“識別”分為“語音識別”和“語義識別”兩個技術(shù)層次,“語音識別”相當(dāng)于人的嘴巴和耳朵,負(fù)責(zé)表達(dá)和獲取;“語義識別”相當(dāng)于人的大腦,負(fù)責(zé)思考和信息處理。為了實現(xiàn)外語的能聽會說、能理解會思考,團(tuán)隊還找來“外援”,邀請一大批留學(xué)生和外語專家加入語音系統(tǒng)的訓(xùn)練中,通過算法的積累和機(jī)器學(xué)習(xí),讓車載外語語音系統(tǒng)更穩(wěn)定高效。
2021年,這套車載外語語音識別系統(tǒng)已成功實現(xiàn)國產(chǎn)化,長安汽車海外發(fā)行的車型均采用了這一國產(chǎn)系統(tǒng)。
獨(dú)創(chuàng)神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動”系統(tǒng)
讓車主可以在車外喚醒車輛“開出來”
在歐尚汽車上打造全球首發(fā)的車外語音交互系統(tǒng),也是智能汽車領(lǐng)域的一大技術(shù)創(chuàng)新。
“以前汽車的語音交互都在車內(nèi),實際上車外智能交互也是用戶的需求。”馬鴻鵬說,以往用戶在用車場景中,常會有開門難、挪車難等痛點(diǎn),而這套車外語音交互系統(tǒng)可以讓車主在車外喚醒車輛,比如在擁擠的停車場,可以叫它“把車開出來”,車輛即可自動向前駛出。購物歸來雙手不方便開門,也可以說一聲“打開后備廂”,后備廂即可自動開啟。
車外語音交互較車內(nèi)語音交互來說,難點(diǎn)在于如何保障在有車外噪音等復(fù)雜環(huán)境下,機(jī)器能聽清楚并執(zhí)行指令。馬鴻鵬介紹,為了實現(xiàn)車外的人車交互,他和團(tuán)隊獨(dú)創(chuàng)了神經(jīng)網(wǎng)絡(luò)降噪算法和“冷啟動”系統(tǒng)兩項技術(shù),讓車外語音交互系統(tǒng)做到360度語音降噪和無死角識別覆蓋,實現(xiàn)穩(wěn)定高效的車外語音交互。
“汽車革命的下半場是智能化、網(wǎng)聯(lián)化、共享化。”他表示,未來,他們還將繼續(xù)扎根重慶,進(jìn)一步探索汽車多語種、多模態(tài)交互技術(shù),為重慶的車域生態(tài)伙伴提供更具有生命力和創(chuàng)新力的智能化場景服務(wù),助力重慶汽車智能制造再上臺階。(記者 張亦筑 實習(xí)生 冉羅楠)
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) www.ulq4xuwux.cn 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 豫ICP備20023378號-15 營業(yè)執(zhí)照公示信息
聯(lián)系我們: 98 28 36 7@qq.com