http://bfqmb.cn 2009-07-22 17:02 來源:中國自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)
網(wǎng)絡(luò)是把“雙刃劍”。
在網(wǎng)絡(luò)融合、通信技術(shù)飛速發(fā)展的信息時(shí)代,除了病毒、黑客攻擊,信息安全的范疇至少已經(jīng)擴(kuò)展到了通信干擾、竊取,信號(hào)阻斷、置換,傳輸網(wǎng)絡(luò)切斷,隱私泄漏等更為復(fù)雜和寬廣的層面。其中制黃販黃、宣揚(yáng)暴力、低俗的網(wǎng)上傳播一度甚囂塵上,嚴(yán)重影響著青少年的身心健康和社會(huì)穩(wěn)定。截至2009年4月中旬,我國已經(jīng)關(guān)閉了3000多個(gè)低俗網(wǎng)站。
“我們的信息安全正在受到威脅。是不是僅僅依靠關(guān)閉網(wǎng)站就能一勞永逸?這如同大禹治水,僅僅靠‘堵’可能很難達(dá)到預(yù)期目的。最好的辦法,除了強(qiáng)化法制、提高免疫力,還要有技術(shù)干預(yù),而這種技術(shù)是可以實(shí)現(xiàn)的?!敝v這番話的不是別人,正是一直關(guān)注我國信息安全問題的著名語言學(xué)家、原全國人大常委會(huì)副委員長許嘉璐。
聯(lián)手:信息高速路上共謀安全
時(shí)光回溯到上世紀(jì)90年代初。
“日讀一卷書”書屋。許嘉璐坐在寫字臺(tái)前,悄然合上尼葛洛龐帝的《數(shù)字化生存》最后一頁。望著窗外闌珊燈火,他思緒萬千,強(qiáng)烈地感受到數(shù)字化帶來的挑戰(zhàn),信息高速公路上時(shí)刻存在安全隱患,可能危及國家安全、社會(huì)穩(wěn)定和國民經(jīng)濟(jì)發(fā)展的大局。
這不是杞人憂天。2000年9月,第55屆聯(lián)合國大會(huì)發(fā)出十點(diǎn)倡議,號(hào)召全世界聯(lián)合起來,共同防范網(wǎng)絡(luò)犯罪。美國也在APEC會(huì)議上發(fā)出共同打擊網(wǎng)絡(luò)犯罪活動(dòng)的倡議,呼吁世界各國從法律和技術(shù)兩個(gè)層面加強(qiáng)網(wǎng)絡(luò)安全防范,加大對網(wǎng)絡(luò)安全犯罪和網(wǎng)絡(luò)恐怖活動(dòng)的打擊力度。與此同時(shí),人們看到,搜索引擎已經(jīng)成為信息安全的重要目標(biāo)之一,個(gè)別搜索引擎披露了一些國家的地理地域、軍事設(shè)施和經(jīng)濟(jì)資源信息,引起世界各國的高度警覺。
許嘉璐表示:“信息安全關(guān)系到國家根本利益,是國家安全的重要組成部分。這不只是學(xué)術(shù)界的‘熱門話題’,更是值得全社會(huì)關(guān)注的重要現(xiàn)實(shí)問題。為了國家的安全,我們要有自己的計(jì)算機(jī)語言處理方式?!?
這時(shí),許嘉璐擔(dān)任著國家語委主任。作為訓(xùn)詁學(xué)家,他對古代漢語、現(xiàn)代漢語深有研究,此時(shí)又開始關(guān)注計(jì)算機(jī)語言處理。在他的主持提議下,國家語委設(shè)立了一個(gè)專業(yè)部門,負(fù)責(zé)管理和研究計(jì)算機(jī)語言處理工作。按照西方計(jì)算機(jī)語言理論操作進(jìn)行的研究,始終未能跳出基于“理性”、“規(guī)則”、“關(guān)鍵詞”窠臼,三四年后發(fā)現(xiàn)此路不通。許嘉璐為此食不甘味,夜不能寐。
許嘉璐有一位老友叫黃曾陽,在中國科學(xué)院聲學(xué)所工作,黃曾陽創(chuàng)立了一種立足于漢語特色的信息處理理論。黃曾陽的父親是一位著名訓(xùn)詁學(xué)家。潛移默化的影響,使得黃曾陽古文古詩詞功底非常深厚。上世紀(jì)五十年代“向科學(xué)大進(jìn)軍”的號(hào)召,促使黃曾陽進(jìn)入北京大學(xué)物理系理論物理專業(yè),1958年畢業(yè)后,來到中國科學(xué)院聲學(xué)研究所工作。1988年以前的30年間,他主要從事信號(hào)處理和水聲物理方面的研究,1989年以后,轉(zhuǎn)向自然語言理解領(lǐng)域,由“聽”水聲改為“聽”人聲。由于兼有中國傳統(tǒng)語言學(xué)、信號(hào)處理、哲學(xué)等方面的造詣,經(jīng)8年臥薪嘗膽,黃曾陽創(chuàng)立了計(jì)算機(jī)自然語言理解處理的“概念層次網(wǎng)絡(luò)理論”,簡稱HNC理論。
HNC理論擯棄傳統(tǒng)方法,力圖引導(dǎo)計(jì)算機(jī)模擬人類大腦對語言的感知模式去理解自然語言,借鑒吸收中國古人對語言理解的成果,在語言的語義層面上構(gòu)建了概念的層次網(wǎng)絡(luò),并提出一種描述語句深層語義結(jié)構(gòu)的簡明語句分類序列和表示式,建立了可由計(jì)算機(jī)接受和操作的公式和分析模式,以使計(jì)算機(jī)具有理解自然語言的智能——這是幾十年來未能攻克的世界性重大科學(xué)難題。
1995年10月,北京正是霜染紅葉的季節(jié),中國科學(xué)院“香山會(huì)議”的一次主題會(huì)在香山飯店舉行,研討“跨世紀(jì)中文信息處理技術(shù)及其研究方向”,許嘉璐是這次會(huì)議的主講人,會(huì)上,遇到老友黃曾陽,了解到黃曾陽正在進(jìn)行的研究課題時(shí),大有聯(lián)手恨晚的感覺。許嘉璐將HNC理論列為我國中文信息處理三大流派之一,并對其發(fā)展寄予厚望。他不僅對黃曾陽的研究提供思想上的支持,還給予了研究經(jīng)費(fèi)上的幫助。
鴻雁傳書。許嘉璐與黃曾陽通過電郵傳達(dá)各自的構(gòu)想。后來,許嘉璐把自己的一些思路寫成文章,收進(jìn)文集。再后來,許嘉璐擔(dān)任全國人大常委會(huì)副委員長,仍難以割舍研究計(jì)算機(jī)語言處理的情結(jié)。在視察HNC工作時(shí),許嘉璐說:“這是落實(shí)科技興國的一件實(shí)事。”許嘉璐親自主持了國家計(jì)算機(jī)自然語言理解的“863”攻關(guān)項(xiàng)目。
許嘉璐的得意門生、訓(xùn)詁學(xué)研究生陳小盟早年下海,在深圳從事研究與貿(mào)易,一路春風(fēng)時(shí),卻意外地被導(dǎo)師召回北京。許嘉璐一臉嚴(yán)肅:“我想同你商量一件事。我們要有自己的計(jì)算機(jī)語言處理系統(tǒng),這不僅是一項(xiàng)科研,重要的是關(guān)涉到信息安全與國家安全。把你的公司關(guān)掉,把這些年下海的贏利拿出來,注冊一個(gè)IT公司,幫助黃先生把HNC基礎(chǔ)理論研究搞起來?!?
陳小盟知道,西方語言學(xué)理論中有喬姆斯基的語言深層結(jié)構(gòu)理論、奎廉的語義網(wǎng)絡(luò)理論、山克的概念從屬理論、菲爾墨的格語法,而中文的計(jì)算機(jī)語言信息處理與這些理論不盡相同,要有“字義基元化,詞義組合化”的漢語研究背景,要有音韻學(xué)、訓(xùn)詁學(xué)和漢語語法研究及傳統(tǒng)計(jì)算機(jī)語言學(xué)研究背景,才有可能勝任。而這幾點(diǎn),正是他的長處。2000年底,陳小盟毅然辭去北京麥納科技公司總裁職務(wù),帶著1000萬元投資,闖進(jìn)中關(guān)村,與中科院聲學(xué)所合作注冊成立了北京大正語言知識(shí)處理研究院,黃曾陽受聘擔(dān)任研究院的首席科學(xué)家。
一項(xiàng)關(guān)系到國家信息安全的自主創(chuàng)新事業(yè),序幕徐徐拉開。
來源:光明日報(bào)