與機器視覺有關(guān)的學(xué)科有許多.本節(jié)主要討論一些與機器視覺密切相關(guān)的領(lǐng)域.關(guān)于機器視覺與其它學(xué)科的關(guān)系,我們不作詳盡的討論.
圖像處理是一個發(fā)展比較成熟的領(lǐng)域.圖像處理技術(shù)通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復(fù)任務(wù)則留給人來完成.圖像處理包括圖像增強、圖像壓縮和模糊校正與非聚焦圖像等課題.機器視覺系統(tǒng)把圖像作為輸入,產(chǎn)生的輸出為另一種形式,比如圖像中物體輪廓的表示.因此,機器視覺的重點是在人的最小干預(yù)下,由計算機自動恢復(fù)場景信息.圖像處理算法在機器視覺系統(tǒng)的早期階段起著很大的作用,它們通常被用來增強特定信息并抑制噪聲.
計算機圖形學(xué)是通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化(Visualization)和虛擬現(xiàn)實(Virtual Reality)中起著很重要的作用.機器視覺正好是解決相反的問題,即從圖像中估計幾何基元和其它特征.因此,計算機圖形學(xué)屬于圖像綜合,機器視覺屬于圖像分析.這兩個領(lǐng)域在其發(fā)展的早期階段是沒有什么聯(lián)系的,但是近十幾年來發(fā)展的越來越相近了.機器視覺使用了計算機圖形學(xué)中的曲線和曲面表示方法以及其它的一些技術(shù),而計算機圖形學(xué)也使用機器視覺技術(shù),以便在計算機中建立逼真的圖像模型.可視化和虛擬現(xiàn)實把這兩個領(lǐng)域緊密地聯(lián)系在一起.
模式識別主要用于識別各種符號、圖畫等平面圖形.模式一般指一類事物區(qū)別于其它事物所具有的共同特征。模式識別方法主要有統(tǒng)計方法和句法方法兩種,統(tǒng)計方法是指從模式抽取一組特征值,并以劃分特征空間的方法來識別每一個模式。句法方法是指利用一組簡單的子模式(模式基元)通過文法規(guī)則來描述復(fù)雜的模式。模式識別方法是機器視覺識別物體的重要基礎(chǔ)之一.機器視覺識別物體還經(jīng)常需要其它的技術(shù).我們將在物體識別部分簡要地討論統(tǒng)計模式識別的主要內(nèi)容.
人工智能(artificial intelligent, AI)涉及到智能系統(tǒng)的設(shè)計和智能計算的研究.在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進行表示,并分析和理解場景.人工智能有三個過程:感知、認知和行動.感知把反應(yīng)現(xiàn)實世界的信息轉(zhuǎn)換成信號,并表示成符號,認知是對符號進行各種操作,行動則把符號轉(zhuǎn)換成影響周圍環(huán)境的信號.人工智能的許多技術(shù)在機器視覺的各個方面起著重要作用.事實上,機器視覺通常被視為人工智能的一個分支.
人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANNs)是一種信息處理系統(tǒng),它是由大量簡單的處理單元(稱為神經(jīng)元)通過具有強度的連接(connection)相互聯(lián)系起來,實現(xiàn)并行分布式處理(parallel distribution processing, PDP).人工神經(jīng)網(wǎng)絡(luò)的最大特點是可以通過改變連接強度來調(diào)整系統(tǒng),使之適應(yīng)復(fù)雜的環(huán)境,實現(xiàn)類似人的學(xué)習(xí)、歸納和分類等功能.人工神經(jīng)網(wǎng)絡(luò)已經(jīng)在許多工程技術(shù)領(lǐng)域得到了廣泛的應(yīng)用.神經(jīng)網(wǎng)絡(luò)作為一種方法和機制將用于解決機器視覺中的許多問題.
神經(jīng)物理學(xué)與認知科學(xué)長期將人類視覺作為主要的研究對象.機器視覺中已有的許多方法與人類視覺極為相似.目前,許多機器視覺研究者對研究人類視覺計算模型比研究機器視覺系統(tǒng)更感興趣,希望機器視覺更加自然化,更加接近生物視覺。我們在第二章介紹人類視覺的一些研究成果,使讀者在研究機器視覺時或多或少能從生物視覺機理中得到啟發(fā).不過,我們的重點在于研究機器視覺系統(tǒng),因此,不討論機器視覺與神經(jīng)物理學(xué)或認知科學(xué)的聯(lián)系.
|