http://bfqmb.cn 2009-07-22 17:07 來源:中國自動化學(xué)會專家咨詢工作委員會
要素重組:讓自主創(chuàng)新能力無窮大的秘密
許嘉璐(右)和他的學(xué)生陳小盟(左)。中為河北省委常委、唐山市委書記趙勇(時任團中央書記處書記)。
許嘉璐曾經(jīng)撰文指出,HNC的研究,第一,必須采取集體攻關(guān)的辦法;第二,可以用“百花齊放,百家爭鳴”的方針,不拘一格,幾種風(fēng)格齊頭并進,既相互競爭,又彼此取長補短;第三,采用科學(xué)的管理辦法,按照科學(xué)研究的規(guī)律管理;第四,既要爭取國家的支持,又要盡量與企業(yè)合作;第五,既要出成果又要出人才;第六,中文信息處理事業(yè)將是長期的,要有薪火相傳的準(zhǔn)備;第七,允許失敗,在不斷失敗—研究—再失敗—再研究的循環(huán)往復(fù)中前進。
按照這一思路,北京大正語言知識處理研究院十分注意生產(chǎn)要素重組工作,他們要讓自主創(chuàng)新的能力無窮大。
在許嘉璐的主持建議下,2004年1月,北京師范大學(xué)成立了中文信息處理研究所,以發(fā)揮語言學(xué)與應(yīng)用語言學(xué)學(xué)科優(yōu)勢,加強中文信息處理應(yīng)用基礎(chǔ)研究;促進語言學(xué)與計算機等相關(guān)學(xué)科的交融,推動計算機語言學(xué)這一交叉學(xué)科的發(fā)展;搭建中文信息處理領(lǐng)域的合作平臺,匯集高校、科研院所、高科技企業(yè)的專家學(xué)者集體攻關(guān),探索中文信息處理理論與應(yīng)用研究的新路;為國家培養(yǎng)兼通語言學(xué)與計算機科學(xué)的“兩棲型”專業(yè)人才;保持我國在語言信息技術(shù)領(lǐng)域的競爭力,保障國家、民族和社會的信息安全。
而北京大正語言知識處理科技有限公司,具有民營性質(zhì),是針對自然語言理解處理的理論探索及其技術(shù)應(yīng)用的高新技術(shù)企業(yè),是科技成果轉(zhuǎn)化的基地。
根據(jù)許嘉璐的意見,研究院第二個資源重組的表現(xiàn)為全新的“學(xué)、研、產(chǎn)、用”相結(jié)合的產(chǎn)業(yè)化創(chuàng)新之路。許嘉璐多次指出,中文信息處理事業(yè)事關(guān)國家安全和社會穩(wěn)定,它的發(fā)展需要加強基礎(chǔ)研究、應(yīng)用研究和社會需求三者的結(jié)合,需要語言學(xué)界和計算機科學(xué)界專家學(xué)者的密切配合、共同攻關(guān)。HNC基礎(chǔ)理論和技術(shù)及其應(yīng)用研究過程中,課題組通過探索市場經(jīng)濟條件下的科學(xué)研究模式和項目管理模式,組織了中國科學(xué)院、北京大學(xué)、清華大學(xué)、上海交通大學(xué)、北京大正語言知識處理研究院等高校、科研院所、高科技企業(yè)的專家集體攻關(guān),打通語言學(xué)與計算機科學(xué)的壁壘。
中國計算機語言學(xué)專業(yè)委員會第一屆主任魯川,在《有關(guān)“科學(xué)”和“語言”的暢想》一文中寫道:“HNC是自然科學(xué)跟人文科學(xué)交叉的新興‘智慧科學(xué)’的一個典型代表。在探索過程中,北京大正語言知識處理研究院根據(jù)社會生產(chǎn)需求拓展研究領(lǐng)域,以理論研究促進方法學(xué)的創(chuàng)新。以應(yīng)用方法學(xué)創(chuàng)新,催生應(yīng)用成果的實現(xiàn),用應(yīng)用成果轉(zhuǎn)化反哺基礎(chǔ)研究,使自主創(chuàng)新逐步走上了良性循環(huán)的道路?!?/P>
持續(xù)創(chuàng)新:“核心競爭力”的金鑰匙
許嘉璐(前右)與陳小盟(后左)在工作中。
在強手如林的競爭中,北京大正語言知識處理研究院招兵買馬,廣納賢才,依托黃曾陽的HNC理論,在許嘉璐的精心指點下,潛下心來,埋頭HNC基礎(chǔ)理論研究和各項實驗,一干就是8年。這8年,得到了慧眼識珠的中關(guān)村管委會和北京市委、市政府的大力支持。
八度燕來雁去,八度星回歲改,八度寒來暑住,八度春華秋實。
8年前,黃曾陽的理論還只是一些公式和PC機上的初步模版演示。8年后,他已經(jīng)是詩情畫意,收獲滿囊。他的專著《HNC(概念層次網(wǎng)絡(luò))理論∶計算機理解語言研究的新思路》由清華大學(xué)出版社出版,概念層次網(wǎng)絡(luò)的研究,對語義文本、分詞等等的研究漸入佳境。黃曾陽也桃李滿枝,不少學(xué)子志愿投身到HNC理論這一具有自主知識產(chǎn)權(quán)的研究中,并不斷尋求新的創(chuàng)新與突破。
8年中,研究院一步一個腳印,捷報頻傳:
2001年6月,研究院成立半年后,HNC網(wǎng)絡(luò)信息智能過濾器樣板機誕生并進入中試。年底,過濾器開始試應(yīng)用。它能有效地識別文本信息內(nèi)容,提高了智能與自動識別能力,對網(wǎng)絡(luò)中流動的海量電子文本信息進行目標(biāo)搜索與追蹤。這一成果,使我國在信息語言知識處理領(lǐng)域的國際競爭中占據(jù)領(lǐng)先地位。
2003年4月,“HNC信息智能過濾器”以其卓越的品質(zhì)通過公安部計算機信息系統(tǒng)安全產(chǎn)品質(zhì)量檢測,5月,取得公安部頒發(fā)的《計算機信息系統(tǒng)安全產(chǎn)品銷售許可證》,6月,取得國家版權(quán)局頒發(fā)的軟件著作權(quán)登記證書。
2004年,“HNC信息智能過濾器”獲得北京市科委頒發(fā)的軟件企業(yè)認定和軟件產(chǎn)品登記認定。
2005年,研究院參與承擔(dān)的“中文信息處理應(yīng)用基礎(chǔ)研究”課題,順利通過國家高新技術(shù)研究發(fā)展計劃(863計劃)驗收,HNC開始形成了具有原始創(chuàng)新特點的理論與技術(shù)體系。
2007年,研究院承擔(dān)了國家科技支撐計劃“中文信息處理應(yīng)用研究與系統(tǒng)開發(fā)”課題的研發(fā)。
2008年5月,工業(yè)和信息化部公布:大正研究院的“花季護航”上網(wǎng)管理軟件,中標(biāo)“綠色上網(wǎng)過濾軟件產(chǎn)品一年使用權(quán)及相關(guān)服務(wù)采購”項目,成為國內(nèi)相關(guān)領(lǐng)域軟件產(chǎn)品中惟一入選文字過濾產(chǎn)品……
8年來,大正研究院和北京師范大學(xué)中文信息處理研究所一起,先后承擔(dān)了包括國家重點科技支撐中文信息處理應(yīng)用研究與系統(tǒng)開發(fā)項目(即原國家973計劃項目)、國家863計劃項目及中科院知識創(chuàng)新工程項目等科研任務(wù)。
8年來,大正研究院在國內(nèi)外學(xué)術(shù)期刊發(fā)表論文60余篇,取得了2項發(fā)明專利、17項計算機軟件著作權(quán)。
總結(jié)8年的創(chuàng)新實踐之路,研究院董事長陳小盟感慨良多。
陳小盟說:“思想與理念有多遠,創(chuàng)新之路就會有多遠。在大正研究院,我們提煉了這樣一條理念:HNC語言知識處理基地是一株大樹;HNC語言知識、HNC概念聯(lián)想網(wǎng)絡(luò)、以此為基礎(chǔ)吸收進來的其他理論應(yīng)用成果、世界知識是它的根;建立在對語言的語義理解的基礎(chǔ)上,應(yīng)用在計算機對語言信息的智能化處理的多個層面是它的果實。”
按照許嘉璐的構(gòu)想,研究院更像一個孵化器,在特殊機制催生下,HNC理論好比種子,市場需求好比土壤,北京大正語言知識處理研究院的基礎(chǔ)理論研究好比耕耘,而實用技術(shù)和項目則是陽光雨露下破殼而出的新生命。
黨的十七大以后,他們認真學(xué)習(xí)科學(xué)發(fā)展觀,對自主創(chuàng)新開始了新一輪的反思。經(jīng)過總結(jié)經(jīng)驗教訓(xùn),逐步達成共識:研究院的核心競爭力,來自持續(xù)不斷的自主創(chuàng)新;自主創(chuàng)新的動力來自市場需求。自主創(chuàng)新是一個科技、經(jīng)濟一體化過程,是技術(shù)進步與應(yīng)用創(chuàng)新共同作用催生的產(chǎn)物,從而對知識社會條件下以需求為導(dǎo)向、以人為本的創(chuàng)新模式更加堅定不移。
八年“潛伏”:贏得“紅杏枝頭春意鬧”
黃曾陽(中)在一次機器翻譯研討會上。
黑格爾說過:“要是沒有熱情,世界任何偉大事業(yè)都不會成功。”
作為HNC基礎(chǔ)研究課題的重要承擔(dān)單位之一和成果轉(zhuǎn)化基地,大正語言知識處理研究院、大正語言知識處理科技有限公司匯集了一大批莘莘學(xué)子。他們甘于奉獻,耐得住寂寞。許嘉璐說:“在IT界員工的收入一般是可觀的,而且跳槽早已司空見慣,‘大正’的收入只能說是中等水準(zhǔn),但到這里工作的學(xué)子們很少抱怨。大家默默耕耘,無私奉獻,就是為了讓具有自主創(chuàng)新的技術(shù)能夠茁壯成長,就是為了提高國家的科技軟實力。”
自主創(chuàng)新激發(fā)出蓬蓬勃勃的活力,HNC基礎(chǔ)理論研究猶如一株青翠欲滴的新苗,一旦破土而出,就呈現(xiàn)出日新月異的景象。自主創(chuàng)新不斷推動著科研成果的產(chǎn)業(yè)化進程,隨著基礎(chǔ)理論研究的深化,“大正”的系列產(chǎn)品脫穎而出。
在推出HNC信息智能過濾器后,研究院又針對家庭、學(xué)校、網(wǎng)吧、企事業(yè)單位等不同用戶群推出系列產(chǎn)品,形成豐富的產(chǎn)品線。值得稱道的“花季護航”上網(wǎng)管理軟件,剛剛出爐就炙手可熱,被全國婦聯(lián)“百萬家庭護苗工程”確定為指定產(chǎn)品?!盎咀o航”上網(wǎng)管理軟件,運用特有的語義判定技術(shù),能夠自動判定識別信息的褒貶義,對黃色暴力黑色等不良信息進行有效的防止與過濾。海量內(nèi)容審查和管理系統(tǒng)——自動審查軟件,是針對海量內(nèi)容難于搜索、難于管理,人工審核費時費力等問題而開發(fā)的一款自動審查出版內(nèi)容的軟件,讓計算機模擬人腦,在“理解”的基礎(chǔ)上判斷文本內(nèi)容,有效地解決了誤審核的問題,提高了審核的準(zhǔn)確度。
與此同時,北京大正語言知識處理研究院還面對漢語加快走向世界的客觀需求,開發(fā)推出了創(chuàng)新、實用、大眾化的“漢語之聲”網(wǎng)站,用戶可以在漢語之聲網(wǎng)站享受學(xué)習(xí)漢語、體驗中國文化、訂購中國文化產(chǎn)品等專業(yè)服務(wù)。
面對果實累累的今天,許嘉璐說:“自主創(chuàng)新是實現(xiàn)民族復(fù)興的不竭動力,中華民族要自立于世界民族之林,要展翅騰飛,就要不斷提升科技軟實力,依靠自主創(chuàng)新變中國制造為中國創(chuàng)造。要在自主創(chuàng)新中出成果、出人才。北京大正語言知識處理研究院開發(fā)HNC基礎(chǔ)理論技術(shù),并通過自主創(chuàng)新取得了初步成果,這僅僅是一個嘗試。相信我們國家會有大批類似HNC這樣的自主知識產(chǎn)權(quán)理論和技術(shù)誕生,也相信會有大批北京大正語言知識處理研究院式的IT企業(yè)脫穎而出?!?
來源:光明日報