影像擷取物件之應用--追瞳辨識1

 

  近年來,隨著電腦速度及效能的提昇,使得電腦的應用範圍不斷的擴張,他從單純的執行計算功能到現在複雜化網路多媒體的呈現,往往有意想不到的突破,因此各種新的人機介面(Man-machine Interface),解決了人們在生活上的許多問題,而且在控制領域上扮演了一個極重要的角色。在我們現實生活中,我們常常因為某些因素而覺得雙手不夠,而需要另一種新的技術來解決這個問題,所以吸引了一些研究人員的重視,他們利用了聲音、視覺來代替傳統的雙手控制[7]

我們使用CCD抓入眼睛影像及其二值化處理如圖 3

 

圖三 眼睛影像及其二值化處理

 

  如此一來我們做眼睛視線追蹤的方法就相當簡單了:我們只要求該過濾後的影像的眼睛瞳孔質心坐標即可。設 MaskImage[x][y] 為經過上一節二值化處理後的影像,大小為 320x240,其眼睛瞳孔質心的 MXMY ,因為我們光學環是固定的,我們假定除了瞳孔外,其它部分是不動的。設一個二值化的影像,其質心MX 坐標為不動的部分(P),加曈孔的分量(V),即:

MX = P + V

當另一張影像連續進來時,設其質心的坐標為 MX',即:

MX'=P + V'

其中 MX MX' P 分量是一樣的。所以:

MX' - MX = (P+V)-(P+V') = V-V'

即質心坐標差為瞳孔坐標差。

在此我們應用了此原理實作了一應用程式如下:

  主畫面有左、中、右三個部分,每當眼睛看到某部分,那部分便亮起來。在此程式中,我們必須注意初始化的問題。我們的設計是一開始時便計算質心,當質心坐標相差最多不超過一閥值 G1 連繼發生 N1 次,則系統進入穩定,就是開始承認坐標值了MX。當 MX 大於某一閥值 N2 時,表示使用正在看右邊的部分,小於某一閥值 N3 時,表示使用正在看左邊的部分,否則就是看中間的部分。G1N1N2N3 這些閥值都是由實驗得來的,在此程式中,我們 G1 設為 3N1 10N28N325。該程式的執行畫面如圖 4至圖 8,結果都能成功的測出眼球所注視的區域,而該區域會亮了起來。

 

圖四程式進入後初使狀態

 

 

五 啟動二值化的畫面

 

下一頁 回首頁