影像擷取物件之應用--追瞳辨識1

影像擷取物件之應用--追瞳辨識1

　　近年來，隨著電腦速度及效能的提昇，使得電腦的應用範圍不斷的擴張，他從單純的執行計算功能到現在複雜化網路多媒體的呈現，往往有意想不到的突破，因此各種新的人機介面(Man-machine Interface)，解決了人們在生活上的許多問題，而且在控制領域上扮演了一個極重要的角色。在我們現實生活中，我們常常因為某些因素而覺得雙手不夠，而需要另一種新的技術來解決這個問題，所以吸引了一些研究人員的重視，他們利用了聲音、視覺來代替傳統的雙手控制[7]。

我們使用CCD抓入眼睛影像及其二值化處理如圖 3：

圖三　眼睛影像及其二值化處理

　　如此一來我們做眼睛視線追蹤的方法就相當簡單了：我們只要求該過濾後的影像的眼睛瞳孔質心坐標即可。設 MaskImage[x][y] 為經過上一節二值化處理後的影像，大小為 320x240，其眼睛瞳孔質心的 MX，MY ，因為我們光學環是固定的，我們假定除了瞳孔外，其它部分是不動的。設一個二值化的影像，其質心MX 坐標為不動的部分(P)，加曈孔的分量(V)，即：

MX = P + V

當另一張影像連續進來時，設其質心的坐標為 MX'，即：

MX'=P + V'

其中 MX 和 MX' 的 P 分量是一樣的。所以：

MX' - MX = (P+V)-(P+V') = V-V'

即質心坐標差為瞳孔坐標差。

在此我們應用了此原理實作了一應用程式如下：

　　主畫面有左、中、右三個部分，每當眼睛看到某部分，那部分便亮起來。在此程式中，我們必須注意初始化的問題。我們的設計是一開始時便計算質心，當質心坐標相差最多不超過一閥值 G1 連繼發生 N1 次，則系統進入穩定，就是開始承認坐標值了MX。當 MX 大於某一閥值 N2 時，表示使用正在看右邊的部分，小於某一閥值 N3 時，表示使用正在看左邊的部分，否則就是看中間的部分。G1、N1、N2、N3 這些閥值都是由實驗得來的，在此程式中，我們 G1 設為 3，N1 為 10，N2為8，N3為25。該程式的執行畫面如圖 4至圖 8，結果都能成功的測出眼球所注視的區域，而該區域會亮了起來。

圖四程式進入後初使狀態

圖五　啟動二值化的畫面

下一頁回首頁