設計方案推薦:基于ATMEGAl28的語音識別系統(tǒng)設計

2013-09-24 17:04 來源:互聯(lián)網(wǎng) 作者:和靜

0 引言

傳統(tǒng)的人機交互依靠復雜的鍵盤或按鈕來實現(xiàn),隨著科技的發(fā)展,一些新型的人機交互方式也隨之誕生,帶給人們?nèi)碌捏w驗。基于語音識別的人機交互方式是目前熱門的技術之一。但是語音識別功能算法復雜、計算量大,一般在計算機上實現(xiàn),即使是嵌入式方面,多數(shù)方案也需要運算能力強的ARM或DSP,并且外擴RAM、FLASH等資源,增加了硬件成本,這些特點無疑限制了語音識別技術的應用,尤其是嵌入式領域。

本系統(tǒng)采用的主控MCU為Atmel公司的ATMEGA128,語音識別功能則采用ICRoute公司的單芯片LD3320。LD3320內(nèi)部集成優(yōu)化過的語音識別算法,無需外部FLASH,RAM資源,可以很好地完成非特定人的語音識別任務。

1 整體方案設計

1.1 語音識別原理

在計算機系統(tǒng)中,語音信號本身的不確定性、動態(tài)性和連續(xù)性是語音識別的難點。主流的語音識別技術是基于統(tǒng)計模式識別的基本理論,原理如圖1所示。

1

語音識別通常需要兩個階段完成。第一階段是訓練,主要是提取語音特征,用戶往往需要進行幾次語音訓練,經(jīng)過預處理和特征提取后獲得相應特征參數(shù)。第二階段是識別,識別過程就是將輸入的語音特征參數(shù)和模型庫中的參數(shù)進行相似性比較,最后輸出匹配度最高的特征參數(shù)完成識別過程。

2 硬件電路設計

硬件框架如圖2所示,電路主要由主控制器電路和語音識別電路組成。ATMEGA128控制LD3320語音識別電路,輸出結果由ATMEGA128處理,然后通過總線來控制不同的設備。

2

2.1 控制器電路

控制器選用Atmel公司生產(chǎn)的ATMEGA128芯片,采用先進的RISC結構,內(nèi)置128 KB FLASH,4 KB SRAM,4 KB E2PROM等豐富資源。該芯片是業(yè)界高性能、低功耗的8位微處理器,并在8位單片機市場有著廣泛應用。

1 2 3 4 > 
人機交互 語音識別 ATMEGAl28

相關閱讀

暫無數(shù)據(jù)

一周熱門

  • 合翔電子X中之杰智能:揭秘一家離散制造企業(yè)的柔性智造秘訣!
    合翔(常州)電子有限公司成立于1996年,主要生產(chǎn)蜂鳴器并廣泛應用于汽車、筆記本電腦、家用電器等領域。公司有BYD、奇瑞
  • AI 推動未來科學 晶泰科技共襄未來科學大獎周
    近日,為期五天的未來科學大獎周在中國香港舉辦。未來科學大獎周旨在弘揚科學精神,禮贊科學成就,以前瞻視角引領公眾探尋世界科
  • Quobly宣布容錯量子計算關鍵里程碑
    法國領先的量子計算初創(chuàng)公司Quobly報告稱,F(xiàn)D-SOI技術可以作為商業(yè)量子計算的可擴展平臺,充分利用傳統(tǒng)的半導體制造