phân loại nhận dạng tiếng nói

Một số đánh giá về hiệu quả nhận dạng tiếng nói dùng kỹ thuật phân tích băng con

Một số đánh giá về hiệu quả nhận dạng tiếng nói dùng kỹ thuật phân tích băng con

Ngày tải lên : 10/11/2012, 09:21
... để phân tích tiếng nói thành các băng con và thực hiện nhận dạng tiếng nói đã phân tích. Các kết quả nhận dạng cho thấy các băng con có ảnh hưởng khác nhau tới hiệu quả nhận dạng tiếng nói ... không làm giảm kết quả nhận dạng mà ở một mức độ nào đó còn làm tăng kết quả nhận dạng so với tiếng nói gốc. Đặc biệt với tiếng nói có nhiễu, nhận dạng trực tiếp với tiếng nói gốc cho kết quả ... hơn nhận dạng với tiếng nói gốc. Các băng con khác nhau ảnh hưởng khác nhau tới hiệu quả nhận dạng cho thấy trong kỹ thuật nhận dạng tiếng nói dùng phân tích băng con, khi kết hợp kết quả nhận...
  • 6
  • 798
  • 3
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 2

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 2

Ngày tải lên : 16/11/2012, 09:21
... DSP56002 và CS4215, thực hiện trích formant của tín hiệu tiếng nói dùng giải thuật STFT. Cuối cùng là đã thực hiện được việc nhận dạng tiếng nói và ứng dụng để điều khiển. SVTH:Huỳnh Quốc Trâm ... hiệu sẽ sử dụng phương pháp kết hợp mẫu để nhận dạng tiếng nói. III. Kết luận sơ bộ: Luận văn đã thực hiện được việc :mở rộng bộ nhớ cho DSP56002, nhận dữ liệu âm thanh từ ngoài qua giao tiếp ... sử dụng trong mạch. Các chương sau sẽ giới thiệu về các công cụ toán học và phương pháp nhận dạng tiếng nói. Chương 7 giới thiệu về phép biến đổi Fourier với tín hiệu liên tục và rời rạc, và...
  • 2
  • 675
  • 8
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 3

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 3

Ngày tải lên : 16/11/2012, 09:21
... đơn giản. 4.5 . Chủ chấp nhận (HACK): Đầu vào này có hai chức năng . Nó cung cấp một tín hiệu bắt tay chủ chấp nhận cho việc truyền DMA và có thu một ngắt chủ chấp nhận tương thích với bộ ... có thể trợ giúp cấu hình cho các thiết bị bộ nhớ và ngoại vi thay đổi tùy theo loại trong họ. DSP56002 là một loại trong họ xử lí DSP56000 bao gồm bộ phận chính xử lí tín hiệu số tương thích ... trong bộ xử lí khi PLL được cho phép và ở trạng thái khóa. 8.7 . Điều khiển phân cực CKOUT(CKP): Chân vào này định nghóa sự phân cực của đầu ra xung nhịp CKOUT. 8.8 . Đầu vào khởi động PLL(PINIT): SVTH:Huỳnh...
  • 9
  • 750
  • 5
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 4

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 4

Ngày tải lên : 16/11/2012, 09:21
... 1s. VII. Các thanh ghi nhận của cổng SSI: Thanh ghi dịch nhận (RSR) là thanh ghi 24-bit nhận các dữ liệu từ chân SRD của cổng SSI. Thanh ghi nhận dữ liệu (RX) là thanh ghi 24-bit nhận dữ liệu SVTH:Huỳnh ... phép ngắt nhận Cho phép ngắt rời Cho phép truyền Bit chọn word Dịch trực tiếp SCI Send break Chọn weakup mode Cho phép weakup nhận Wire or mode select Cho phép nhận Thanh ghi SCR X:$FFF0 Nhận bit ... GOTHRU Khi bit cờ báo nhận tín hiệu đồng bộ (RFS) của SSISR (bit 3) được đặt thì nó chỉ ra rằng có một sự nhận tín hiệu đồng bộ xảy ra khi nhận lại từ mà ở trong thanh ghi nhận dữ liệu nối tiếp....
  • 44
  • 555
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Ngày tải lên : 16/11/2012, 09:21
... , X:(R0) B , Y:(R4) ; cho phép ADD B , A X1, B Y1, A ;không cho phép C . CÁC LOẠI TRUYỀN DỮ LIỆU SONG SONG: Các loại truyền song song là: o Truyền dữ liệu ngắn tức thời o Cập nhật thanh ghi ... . DẠNG LỆNH: 1./Lệnh một từ: Lệnh một từ tác động lên tất cả các chế độ định địa chỉ của DSP56002, ngoại trừ các chế độ định địa chỉ tuyệt đối và dữ liệu tức thời. Mã hợp ngữ nguồn cho loại ... X:$FFFE , A 2./ Các lệnh số học Các lệnh số học dùng ALU dữ liệu để thực hiện thực hiện tất cả các loại phép xử lí số học. Toán hạng nguồn cho các lệnh số học được chứa trong thanh ghi nhập ALU...
  • 10
  • 519
  • 2
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Ngày tải lên : 16/11/2012, 09:21
... của CS4215 đều có 8 bit. CS4215 nhận biết bốn dạng dữ liệu âm thanh:16 bit bù hai tuyến tính, 8 bit không có dấu tuyến tính, 8 bit A- law, 8 bit µ-law. Dữ liệu nhận trên SDIN được lưu trữ trong ... SDOUT của CS4215 là thông tin nhận được khi D/C~ ở mức thấp. Tốc độ đồng bộ cấu trúc bằng tần số chuyển đổi được đặt bởi các bit DFR0 – DFR2 của thanh ghi định dạng dữ liệu. Một cấu trúc có ... Trung bình Max Đơn vị Độ phân giải của ADC 16 - - Bits Độ sai lệch phi tuyếân của ADC - - ± 0.9 LSB Tầm hoạt động : Ngõ nhập Line Ngõ nhập Mic IDR 80 72 84 78 - - dB dB Hệ số méo dạng sóng hài toàn...
  • 16
  • 682
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 7

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 7

Ngày tải lên : 16/11/2012, 09:21
... OE:cho phép đọc. • CE:cho phép chip hoạt động. • Nguồn VCC :+5V. Sử dụng bộ lọc đầu vào LPF để loại bớt nhiễu ở tần số lớn hơn 4kHz, và để chống trùm phổ . + - 3 2 1 V OUT C2 R2...
  • 12
  • 596
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 8

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 8

Ngày tải lên : 16/11/2012, 09:21
... FFT trên DSP56002 sử dụng giải thuật phân chia theo thời gian DIT (decimation-in-time). Đây là công cụ toán học cơ bản chuẩn bị cho việc nhận dạng tiếng nóiphần sau. A . BIẾN ĐỔI FOURIER ... tập con nhỏ hơn và nhờ đó mà loại bỏ được các phép tính toán không cần thiết. Hai phương pháp phổ biến trong việc chia nhỏ tập dữ liệu mẫu là: 1. Thuật giải FFT phân chia mười theo thời gian ... : )(Fe)t(f o o tj ω−ω↔ ω 4. Tính chất co giãn :       ω ↔ a F a 1 )at(f 5. Tính chất vi phân và tích phân : )(F)j( t )t(f n n n ωω↔ ∂ ∂ ω ω ↔ττ ∫ ∞− j )(F d)(f t 6. Mômen:gọi n m là mômen cấp...
  • 7
  • 602
  • 8
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 9

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 9

Ngày tải lên : 16/11/2012, 09:21
... GVHD:Thầy Lê Tuấn Anh Biến Đổi STFT Hệ số α xác định bề rộng về thời gian của cửa sổ phân tích, β là hệ số chuẩn hoá. Biến đổi Fourier ngược của hàm cửa sổ Gaussian là: αω− α π β=ω 4 2 / e)(W ... hai miền thời gian và tần số. Tuy nhiên nó gặp phải một trở ngại là khi ta đã chọn một cửa sổ phân tích thì kích thước của cửa sổ này sẽ không đổi trên toàn mặt thời gian – tần số. Mọi thành ... yêu cầu định vị tốt về thời gian. Điều này chỉ có thể thực hiện được khi kích thước của cửa sổ phân tích có thể thay đổi tuỳ theo yêu cầu định vị tốt về thời gian hay tần số. SVTH:Huỳnh Quốc...
  • 3
  • 553
  • 7
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 10

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 10

Ngày tải lên : 16/11/2012, 09:21
... tiếng nói sẽ dùng phương pháp kết hợp mẫu để nhận dạng tiếng nói. I .TRÍCH ĐẶC TRƯNG TIẾNG NÓI DÙNG PHÉP PHÂN TÍCH STFT Sau khi đã số hoá tín hiệu, chúng ta bắt đầu trích đặc trưng tiếng nói ... 9-143 GVHD:Thầy Lê Tuấn Anh Nhận Dạng Tiếng Nói Hình 9.13 Kết quả trích formant của từ ‘LEFT’ dùng STFT II . NHẬN DẠNG TIẾNG NÓI : Trong hệ thống điều khiển bằng tiếng nói, phần quan trọng nhất ... quan trọng nhất và phức tạp nhất là chương trình nhận dạng tiếng nói. Bằng các công cụ phân tích tín hiệu hiện có, hệ thống nhận dạng tiếng nói được thiết lập theo hướng phối hợp mẫu, trong...
  • 66
  • 779
  • 2
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 17

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 17

Ngày tải lên : 16/11/2012, 09:21
... 103 CHƯƠNG IX : XỬ LÝ TÍN HIỆU TIẾNG NÓI 104 I. TRÍCH ĐẶC TRƯNG TIẾNG NÓI DÙNG PHÉP PHÂN TÍCH STFT 104 II. NHẬN DẠNG TIẾNG NÓI 122 III.CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI 126 KẾT QUẢ 167 KẾT LUẬN ... B. BIẾN ĐỔI FOURIER RỜI RẠC 96 C. PHÂN TÍCH BIẾN ĐỔI NHANH FOURIER 96 CHƯƠNG VIII: BIẾN ĐỔI FOURIER THỜI GIAN NGẮN 101 A. CÔNG THỨC...
  • 2
  • 278
  • 1

Xem thêm