http://bfqmb.cn 2009-07-22 17:02 來(lái)源:中國(guó)自動(dòng)化學(xué)會(huì)專家咨詢工作委員會(huì)
網(wǎng)絡(luò)是把“雙刃劍”。
在網(wǎng)絡(luò)融合、通信技術(shù)飛速發(fā)展的信息時(shí)代,除了病毒、黑客攻擊,信息安全的范疇至少已經(jīng)擴(kuò)展到了通信干擾、竊取,信號(hào)阻斷、置換,傳輸網(wǎng)絡(luò)切斷,隱私泄漏等更為復(fù)雜和寬廣的層面。其中制黃販黃、宣揚(yáng)暴力、低俗的網(wǎng)上傳播一度甚囂塵上,嚴(yán)重影響著青少年的身心健康和社會(huì)穩(wěn)定。截至2009年4月中旬,我國(guó)已經(jīng)關(guān)閉了3000多個(gè)低俗網(wǎng)站。
“我們的信息安全正在受到威脅。是不是僅僅依靠關(guān)閉網(wǎng)站就能一勞永逸?這如同大禹治水,僅僅靠‘堵’可能很難達(dá)到預(yù)期目的。最好的辦法,除了強(qiáng)化法制、提高免疫力,還要有技術(shù)干預(yù),而這種技術(shù)是可以實(shí)現(xiàn)的?!敝v這番話的不是別人,正是一直關(guān)注我國(guó)信息安全問(wèn)題的著名語(yǔ)言學(xué)家、原全國(guó)人大常委會(huì)副委員長(zhǎng)許嘉璐。
聯(lián)手:信息高速路上共謀安全
時(shí)光回溯到上世紀(jì)90年代初。
“日讀一卷書(shū)”書(shū)屋。許嘉璐坐在寫(xiě)字臺(tái)前,悄然合上尼葛洛龐帝的《數(shù)字化生存》最后一頁(yè)。望著窗外闌珊燈火,他思緒萬(wàn)千,強(qiáng)烈地感受到數(shù)字化帶來(lái)的挑戰(zhàn),信息高速公路上時(shí)刻存在安全隱患,可能危及國(guó)家安全、社會(huì)穩(wěn)定和國(guó)民經(jīng)濟(jì)發(fā)展的大局。
這不是杞人憂天。2000年9月,第55屆聯(lián)合國(guó)大會(huì)發(fā)出十點(diǎn)倡議,號(hào)召全世界聯(lián)合起來(lái),共同防范網(wǎng)絡(luò)犯罪。美國(guó)也在APEC會(huì)議上發(fā)出共同打擊網(wǎng)絡(luò)犯罪活動(dòng)的倡議,呼吁世界各國(guó)從法律和技術(shù)兩個(gè)層面加強(qiáng)網(wǎng)絡(luò)安全防范,加大對(duì)網(wǎng)絡(luò)安全犯罪和網(wǎng)絡(luò)恐怖活動(dòng)的打擊力度。與此同時(shí),人們看到,搜索引擎已經(jīng)成為信息安全的重要目標(biāo)之一,個(gè)別搜索引擎披露了一些國(guó)家的地理地域、軍事設(shè)施和經(jīng)濟(jì)資源信息,引起世界各國(guó)的高度警覺(jué)。
許嘉璐表示:“信息安全關(guān)系到國(guó)家根本利益,是國(guó)家安全的重要組成部分。這不只是學(xué)術(shù)界的‘熱門(mén)話題’,更是值得全社會(huì)關(guān)注的重要現(xiàn)實(shí)問(wèn)題。為了國(guó)家的安全,我們要有自己的計(jì)算機(jī)語(yǔ)言處理方式?!?
這時(shí),許嘉璐擔(dān)任著國(guó)家語(yǔ)委主任。作為訓(xùn)詁學(xué)家,他對(duì)古代漢語(yǔ)、現(xiàn)代漢語(yǔ)深有研究,此時(shí)又開(kāi)始關(guān)注計(jì)算機(jī)語(yǔ)言處理。在他的主持提議下,國(guó)家語(yǔ)委設(shè)立了一個(gè)專業(yè)部門(mén),負(fù)責(zé)管理和研究計(jì)算機(jī)語(yǔ)言處理工作。按照西方計(jì)算機(jī)語(yǔ)言理論操作進(jìn)行的研究,始終未能跳出基于“理性”、“規(guī)則”、“關(guān)鍵詞”窠臼,三四年后發(fā)現(xiàn)此路不通。許嘉璐為此食不甘味,夜不能寐。
許嘉璐有一位老友叫黃曾陽(yáng),在中國(guó)科學(xué)院聲學(xué)所工作,黃曾陽(yáng)創(chuàng)立了一種立足于漢語(yǔ)特色的信息處理理論。黃曾陽(yáng)的父親是一位著名訓(xùn)詁學(xué)家。潛移默化的影響,使得黃曾陽(yáng)古文古詩(shī)詞功底非常深厚。上世紀(jì)五十年代“向科學(xué)大進(jìn)軍”的號(hào)召,促使黃曾陽(yáng)進(jìn)入北京大學(xué)物理系理論物理專業(yè),1958年畢業(yè)后,來(lái)到中國(guó)科學(xué)院聲學(xué)研究所工作。1988年以前的30年間,他主要從事信號(hào)處理和水聲物理方面的研究,1989年以后,轉(zhuǎn)向自然語(yǔ)言理解領(lǐng)域,由“聽(tīng)”水聲改為“聽(tīng)”人聲。由于兼有中國(guó)傳統(tǒng)語(yǔ)言學(xué)、信號(hào)處理、哲學(xué)等方面的造詣,經(jīng)8年臥薪嘗膽,黃曾陽(yáng)創(chuàng)立了計(jì)算機(jī)自然語(yǔ)言理解處理的“概念層次網(wǎng)絡(luò)理論”,簡(jiǎn)稱HNC理論。
HNC理論擯棄傳統(tǒng)方法,力圖引導(dǎo)計(jì)算機(jī)模擬人類大腦對(duì)語(yǔ)言的感知模式去理解自然語(yǔ)言,借鑒吸收中國(guó)古人對(duì)語(yǔ)言理解的成果,在語(yǔ)言的語(yǔ)義層面上構(gòu)建了概念的層次網(wǎng)絡(luò),并提出一種描述語(yǔ)句深層語(yǔ)義結(jié)構(gòu)的簡(jiǎn)明語(yǔ)句分類序列和表示式,建立了可由計(jì)算機(jī)接受和操作的公式和分析模式,以使計(jì)算機(jī)具有理解自然語(yǔ)言的智能——這是幾十年來(lái)未能攻克的世界性重大科學(xué)難題。
1995年10月,北京正是霜染紅葉的季節(jié),中國(guó)科學(xué)院“香山會(huì)議”的一次主題會(huì)在香山飯店舉行,研討“跨世紀(jì)中文信息處理技術(shù)及其研究方向”,許嘉璐是這次會(huì)議的主講人,會(huì)上,遇到老友黃曾陽(yáng),了解到黃曾陽(yáng)正在進(jìn)行的研究課題時(shí),大有聯(lián)手恨晚的感覺(jué)。許嘉璐將HNC理論列為我國(guó)中文信息處理三大流派之一,并對(duì)其發(fā)展寄予厚望。他不僅對(duì)黃曾陽(yáng)的研究提供思想上的支持,還給予了研究經(jīng)費(fèi)上的幫助。
鴻雁傳書(shū)。許嘉璐與黃曾陽(yáng)通過(guò)電郵傳達(dá)各自的構(gòu)想。后來(lái),許嘉璐把自己的一些思路寫(xiě)成文章,收進(jìn)文集。再后來(lái),許嘉璐擔(dān)任全國(guó)人大常委會(huì)副委員長(zhǎng),仍難以割舍研究計(jì)算機(jī)語(yǔ)言處理的情結(jié)。在視察HNC工作時(shí),許嘉璐說(shuō):“這是落實(shí)科技興國(guó)的一件實(shí)事。”許嘉璐親自主持了國(guó)家計(jì)算機(jī)自然語(yǔ)言理解的“863”攻關(guān)項(xiàng)目。
許嘉璐的得意門(mén)生、訓(xùn)詁學(xué)研究生陳小盟早年下海,在深圳從事研究與貿(mào)易,一路春風(fēng)時(shí),卻意外地被導(dǎo)師召回北京。許嘉璐一臉嚴(yán)肅:“我想同你商量一件事。我們要有自己的計(jì)算機(jī)語(yǔ)言處理系統(tǒng),這不僅是一項(xiàng)科研,重要的是關(guān)涉到信息安全與國(guó)家安全。把你的公司關(guān)掉,把這些年下海的贏利拿出來(lái),注冊(cè)一個(gè)IT公司,幫助黃先生把HNC基礎(chǔ)理論研究搞起來(lái)?!?
陳小盟知道,西方語(yǔ)言學(xué)理論中有喬姆斯基的語(yǔ)言深層結(jié)構(gòu)理論、奎廉的語(yǔ)義網(wǎng)絡(luò)理論、山克的概念從屬理論、菲爾墨的格語(yǔ)法,而中文的計(jì)算機(jī)語(yǔ)言信息處理與這些理論不盡相同,要有“字義基元化,詞義組合化”的漢語(yǔ)研究背景,要有音韻學(xué)、訓(xùn)詁學(xué)和漢語(yǔ)語(yǔ)法研究及傳統(tǒng)計(jì)算機(jī)語(yǔ)言學(xué)研究背景,才有可能勝任。而這幾點(diǎn),正是他的長(zhǎng)處。2000年底,陳小盟毅然辭去北京麥納科技公司總裁職務(wù),帶著1000萬(wàn)元投資,闖進(jìn)中關(guān)村,與中科院聲學(xué)所合作注冊(cè)成立了北京大正語(yǔ)言知識(shí)處理研究院,黃曾陽(yáng)受聘擔(dān)任研究院的首席科學(xué)家。
一項(xiàng)關(guān)系到國(guó)家信息安全的自主創(chuàng)新事業(yè),序幕徐徐拉開(kāi)。
來(lái)源:光明日?qǐng)?bào)