何謂語音辨識

 

  語音辨識最主要的目的是希望電腦聽懂人類說話的聲音,進而命令電腦執行相對應的工作。當聲音藉由類比到數位的轉換裝置輸入電腦內部,並以數值方式儲存後,語音辨識程式便開始已事先儲存好的聲音樣本與輸入的測試聲音樣本進行比對工作。比對完成後點腦集輸入一個它認為最“像”的聲音樣本序號,我們就可以知道使用者剛剛唸進去的聲音代表何意,進而命令電腦做事。

  因此設計一個語音辨識程式,至少又有兩方面的知識:

  1. 瞭解如何把外界的聲音訊號抓到電腦內部處理:

  2.  這一部份和語音使用者的聲音輸入/輸出(I/O)硬體裝置有關,不同的裝置會使這部分的處理程式也不相同,然而處理聲音I/O的基本原理卻差不多。

  3. 瞭解聲音比對原理:

  4.  聲音比對原理一直是研究語音辨識的專家學者們急於尋求突破的地方,截至目前為止,已有不下上千篇的相關論文在尋找這方面的解答。

      所謂的語音辨識(Speech Recognition)有別於語者辨識(Speech Identification),語音辨識著重的是聲音代表的意義,而語者辨識是要辨識說話者的身份,兩者各不同的應用範圍,前者可應用於將聲音轉成文字的場合,而後者可用在門禁系統等。

     

    anarrow.gif (1450 bytes)下一頁  replay.gif (15720 bytes)回首頁