http://bfqmb.cn 2005-09-08 09:04 《中華工控網(wǎng)》原創(chuàng)
在剛剛結(jié)束的“國際口語翻譯研究聯(lián)盟(C-STAR III)”組織的國際機器翻譯核心技術(shù)評測中,我所“網(wǎng)絡(luò)內(nèi)容管理與信息服務(wù)”團隊提交的中-英翻譯系統(tǒng)取得了BLEU得分0.528,NIST得分10.25的最好成績。C-STAR是國際上最早從事口語翻譯的國際性組織,這次中-英翻譯評測吸引了包括美國IBM公司、CMU計算機系、日本ATR、德國亞琛大學、意大利ITC、日本NTT等12個著名研究機構(gòu)參加。據(jù)研究,中文到英文人工翻譯句子的BLEU得分一般在0.5~0.6,這說明我所翻譯技術(shù)在評測應(yīng)用場景下的翻譯結(jié)果已經(jīng)接近人工翻譯的質(zhì)量。這是團隊不斷進行戰(zhàn)略方向研究和人才建設(shè)所取得的又一成果。
從2003年起,由高創(chuàng)中心和模式識別實驗室相關(guān)人員組成的團隊明確認識到目標凝練和隊伍建設(shè)對于創(chuàng)新事業(yè)發(fā)展的決定作用。結(jié)合國家重大戰(zhàn)略需求,深入研究本學科方向應(yīng)用的新特點和趨勢,以語音語言技術(shù)為核心,逐步確定了網(wǎng)絡(luò)內(nèi)容管理、媒體內(nèi)容管理和通用領(lǐng)域機器翻譯三大戰(zhàn)略方向,并整合相關(guān)資源,完善團隊建設(shè)。在機器翻譯方面,適時地實現(xiàn)了從限定領(lǐng)域口語翻譯向通用領(lǐng)域文本翻譯的轉(zhuǎn)變,提升了技術(shù)的完備性和可擴充性。同時團隊把機器翻譯作為團隊國際合作和基礎(chǔ)理論創(chuàng)新的重要窗口。這次參加評測的系統(tǒng)是團隊集成了研究組多年的技術(shù)以及雙語語料庫的積累,抓住機器翻譯理論發(fā)生重大轉(zhuǎn)折的機遇,通過組織和引進優(yōu)秀青年人才,在短短不到一年的時間里面取得的階段性成果。同時團隊還在機器翻譯理論上積極創(chuàng)新,在近一年的時間里,論文 “An Approach to Automatic Acquisition of Translation Templates Based on Phrase Structure ExtractionAlignment” 被國際核心期刊 IEEE Transaction on SpeechAudio Processing 錄用,論文 “Toward Practical Spoken Language Translation” 被國際機器翻譯領(lǐng)域權(quán)威雜志 Machine Translation 錄用,從而結(jié)束了我所自然語言處理研究只有高水平的技術(shù)和系統(tǒng),沒有國際一流學術(shù)期刊論文的歷史。
目前團隊還在加緊攻關(guān),通過不斷提高統(tǒng)計翻譯技術(shù)的泛化性能提升系統(tǒng)的翻譯性能。機器翻譯技術(shù)通過與語音識別等技術(shù)的結(jié)合,可形成可靠的口語翻譯裝置和翻譯服務(wù),同時也必將進一步擴展網(wǎng)絡(luò)內(nèi)容管理的語種范疇。 |