首頁>專題>話說新經濟>新科技
報告顯示:智能語音千億規模市場未來可期
1月11日,由國家工業信息安全發展研究中心主辦,科大訊飛股份有限公司、國家語音及圖像識別產品質量檢驗檢測中心、國家智能語音創新中心協辦的中國智能語音產業發展高峰論壇暨2022年中國語音產業聯盟年會成功舉辦。
工業和信息化部信息技術發展司副司長王威偉,中國科學院院士姚建銓,國家工業信息安全發展研究中心副主任、國家語音及圖像識別產品質量檢驗檢測中心主任何小龍,聯盟理事長、科大訊飛董事長劉慶峰,科大訊飛總裁吳曉如,清華大學語音和語言技術中心主任、北京得意音通技術有限責任公司董事長鄭方,北京海天瑞聲科技股份有限公司副總經理、首席科學家郝玉峰,國家智能語音創新中心總經理吳江照等通過訊飛聽見云會議的形式線上參會。會議由聯盟秘書長、國家工業信息安全發展研究中心人工智能所副所長劉永東主持。
會上,中國語音產業聯盟發布《中國智能語音產業發展報告(2021-2022)》,報告指出,我國智能語音產業整體發展環境積極向好,多項關鍵技術取得突破,產業扎根不斷深入,已形成大中小企業融通創新、協同發展的健康生態。
工信部信息技術發展司副司長王威偉在致辭中表示,黨的二十大報告提出構建新一代信息技術、人工智能等一批新的增長引擎,智能語音產業作為新一代信息技術和人工智能產業的重要組成部分,必將迎來更大的發展機遇,在促進經濟社會發展和數字化轉型中發揮更加重要的引領和支撐作用。
市場規模高速增長,龍頭企業占據主導份額
智能語音作為智能時代人機交互的關鍵接口,各行業爆發式的場景需求驅動行業發展進入黃金期,技術突破和應用落地不斷深入。從全球范圍來看,2022年全球智能語音產業規模將達351.2億美元,保持33.1%的高速增長;從我國來看,根據德勤統計數據,2022年我國智能語音市場將達341億元,同比增長13.4%。
報告指出,以科大訊飛為代表的語音龍頭企業布局較廣,是行業創新發展的支柱,占據較大市場份額。同時,科大訊飛、百度、阿里等龍頭企業通過打造技術能力開放平臺,構建開源生態,引領行業技術創新和應用開發。以訊飛開放平臺為例,目前已開放545項AI產品及能力,聚集超過380.5萬開發者團隊,開發出超過159.5萬個AI應用,并從AI龍頭+開發者的“二維”生態,升級到AI龍頭+行業龍頭+開發者的“三維”生態,聯合行業龍頭搭建基線系統,讓更多開發者參與到數字經濟浪潮中。
關鍵技術突破,筑牢行業堅實底座
“2022年是智能語音技術突破的關鍵年”,報告指出,我國智能語音企業在多項難點技術上實現新的突破。縱向上從語音識別、合成、翻譯向計算機視覺、認知智能、運動智能領域延伸,橫向上從單點技術突破模式發展到機器認知、多模式復雜場景應用。
在語音識別方面,視聽融合的多模態交互技術成為技術演進的主要方向。科大訊飛多模語音增強技術融合語音與視覺的多模感知,讓高噪音場景下的語音交互跨過實用門檻,率先在車載、會議、地鐵購票和醫療掛號等場景落地。此外,針對低資源語音識別難題,海天瑞聲和科大訊飛分別從語音數據和算法層面推動技術進步。
在語音合成方面,隨著電商直播等行業的繁榮,語音合成技術也表現出擬人化、口語化的發展趨勢。科大訊飛多風格多情感語音合成系統SMART-TTS可提供11種強度可調的情感合成能力。而火山語音的超自然對話語音合成和META的語音對語音翻譯(speech-to-speech translation, S2ST),通過在模型訓練中添加副語言數據,讓語音交互更加自然和個性化。
要促進智能語音技術持續突破,與會專家從兩個方向提出了發展路徑。一方面,姚建銓院士指出,針對智能語音多學科交叉的學科特性,研究人員需要探索新原理、新機制、新材料、新工藝和新器件,集成創新推動核心技術進步;另一方面,語音技術需要進一步向深度理解延伸,科大訊飛總裁吳曉如表示:“更先進的語音交互系統不僅要‘能聽會說’,還要深度地去理解人的信息”,自然語言理解和知識推理技術的進步,讓機器可以在越來越多的領域幫助人類解決更專業和復雜的問題。
應用規模化落地,加速與實體經濟融合
報告指出,受疫情和產業數字化、智能化轉型影響,智能語音應用場景迅速鋪開。據德勤統計數據,預計到2030年,智能語音消費級和企業級應用市場將分別超過700億和千億規模。
在消費者產品領域,AI學習機、翻譯筆等AI+學習產品幫助學生學習減負增效;智能錄音筆、智能辦公本、智能鼠標等AI+辦公產品深受職場人士歡迎;AI翻譯機、智能麥克風、智能語音鍵盤、智能耳機、智能助聽器等AI+生活產品,讓更多人享受AI科技的便利。
在汽車領域,智能語音已成人機交互關鍵環節,并從車內交互衍生車外交互,從單模交互走向多模交互,從被動交互發展為主動交互,為車企提供全棧技術賦能。以科大訊飛為代表的國內AI龍頭已占據中國語音交互車端應用行業的領先地位。
在運營商領域,智能語音技術與健康養老、家庭教育、家庭娛樂等場景結合,帶來更加智慧的家庭生活體驗。融合5G與機器翻譯技術的無障礙智能通信,讓普通的 5G 手機用戶,不用下載任何軟件,就可以使用實時翻譯和轉寫服務,實現跨語種的無障礙視頻通話。
在教育領域,科大訊飛全球中文學習平臺已覆蓋全球183個國家,吸引300多萬海外中文學習愛好者使用;利用智能語音和人工智能技術可實現英語聽說教、學、考、評、管一站式服務,減少無效訓練。
在醫療領域,去年疫情期間,科大訊飛電話機器人助力全國31個省112個地市疫情排查,累計服務超1.1億人次;智能外呼和智醫助理可用于獨居老人、留守兒童的日常關愛和兜底保障。
在城市領域,智能語音技術已在安徽省一體化網上政務服務平臺、聊城城市大腦、三亞市崖州灣科技城智慧產城園區、天津市AI銀發智能服務平臺等創新示范項目中應用。姚建銓院士指出,智能語音與建設智慧城市的要求完全吻合,可以實現各種語音高效轉換和智能處理,為智慧城市進一步建設帶來新的機遇。
在工業領域,我國打造了包括國家智能語音創新中心在內的一批語音技術創新“國家隊”, 開展工業聲學、多語種、AI語音芯片等關鍵共性技術研究工作。科大訊飛聯合國家智能語音創新中心打造的工業聽診器、聲學成像儀、工業設備衛士、智能巡檢機器人等“工業六感”產品,已廣泛應用到生產、質檢、巡檢等多個工業環節。
在金融領域,聲紋識別技術已經被應用在各類身份認證環節。得意音通董事長鄭方表示,聲紋是目前除DNA外,最可靠的身份認證方式,相比傳統方法具有明顯優勢。此外,科大訊飛智能客服機器人、智能聯絡中心AICC等AI+金融應用,幫助金融機構提升客服和運營效率。
展望智能語音產業未來發展,報告認為,后競爭時代亟需關注新增的不確定性因素,包括核心關鍵技術能力仍需提升,開源生態培育仍需加大投入,重點應用場景落地仍需提速,傳統行業開放場景動能不足等。
編輯:董雨吉