由中國科學院自動化研究所高技術創(chuàng)新中心張樹武博士帶領的項目組研究開發(fā)的固定音頻檢測技術作為XX市工商管理局廣播/電視廣告自動監(jiān)播管理系統(tǒng)中的核心技術在系統(tǒng)試運行近一年的檢驗后,日前已正式通過驗收。目前,該系統(tǒng)通過投標已在多個省市獲得XX多線(套)的訂單,預計今年能獲得XX線左右的采購協議。這表明高創(chuàng)中心確定的“以語音語言技術為核心,以網絡內容管理國家需求為主要應用目標,不斷深化和擴展學科方向”的戰(zhàn)略調整開始彰顯成效。
語音語言技術是自動化所的優(yōu)勢學科方向,有著二代科學家近20年的理論、資源和技術的積累。從2003年起,面對國際語音語言研究相對比較低潮的困難局面,該方向不斷整合相關資源和各種需求進行本學科方向的戰(zhàn)略研究,在2004年開始確定“以優(yōu)勢的語音語言技術為核心,以網絡內容管理國家需求為主要應用目標,不斷深化和擴展學科方向”的發(fā)展戰(zhàn)略,同時組織規(guī)模人力在系統(tǒng)平臺、核心技術和應用系統(tǒng)等進行了大規(guī)模的重組和調整。通過一年多的艱苦努力,通過集成國內外優(yōu)勢資源,初步建立了以現代網絡和計算技術為基礎的面向網絡海量信息處理的實時智能信息處理平臺。
作為高創(chuàng)中心智能信息處理平臺的應用系統(tǒng),固定音頻檢測技術具有非常廣泛的應用前景(如:廣播/電視違法廣告內容監(jiān)播、電視節(jié)目分類檔案管理、歌曲檢索、游戲中的聲音定位與搜索等)。中科院自動化高創(chuàng)中心科研人員在該技術上取得了重大突破,提出了領先的具有自主知識產權的固定音頻檢測算法,可在被檢測的音視頻流中對給定的目標音頻片段進行精確的定位和報警。對各種音視頻編碼格式和壓縮率以及通道環(huán)境都有極強的魯棒型(Robustness)。在實際環(huán)境中檢測正確率幾乎達到100%,檢測速度也極快,完全滿足真正應用的實際需求。
目前高創(chuàng)中心以該“網絡海量信息處理平臺”為基礎,正在承接多項涉及內容和公共安全的智能信息處理項目,并不斷通過這些應用驅動,在核心技術上產生長足的突破。同時,通過戰(zhàn)略調整和目標的凝練,該方向近年來培養(yǎng)了一批以丁鵬、王卓和陳振標等為代表的、以30歲以下年輕科技骨干為主體的工程和研究復合型人才隊伍,固定人員規(guī)模已經達到15人,逐步形成了人盡其才、各得其所的和諧研究局面,為下一步團隊的建設打下了良好的基礎。