0

phân loại nhận dạng tiếng nói

Một số đánh giá về hiệu quả nhận dạng tiếng nói dùng kỹ thuật phân tích băng con

Một số đánh giá về hiệu quả nhận dạng tiếng nói dùng kỹ thuật phân tích băng con

Thạc sĩ - Cao học

... để phân tích tiếng nói thành các băng con và thực hiện nhận dạng tiếng nói đã phân tích. Các kết quả nhận dạng cho thấy các băng con có ảnh hưởng khác nhau tới hiệu quả nhận dạng tiếng nói ... không làm giảm kết quả nhận dạng mà ở một mức độ nào đó còn làm tăng kết quả nhận dạng so với tiếng nói gốc. Đặc biệt với tiếng nói có nhiễu, nhận dạng trực tiếp với tiếng nói gốc cho kết quả ... hơn nhận dạng với tiếng nói gốc. Các băng con khác nhau ảnh hưởng khác nhau tới hiệu quả nhận dạng cho thấy trong kỹ thuật nhận dạng tiếng nói dùng phân tích băng con, khi kết hợp kết quả nhận...
  • 6
  • 798
  • 3
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 2

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 2

Điện - Điện tử - Viễn thông

... DSP56002 và CS4215, thực hiện trích formant của tín hiệu tiếng nói dùng giải thuật STFT. Cuối cùng là đã thực hiện được việc nhận dạng tiếng nói và ứng dụng để điều khiển. SVTH:Huỳnh Quốc Trâm ... hiệu sẽ sử dụng phương pháp kết hợp mẫu để nhận dạng tiếng nói. III. Kết luận sơ bộ:Luận văn đã thực hiện được việc :mở rộng bộ nhớ cho DSP56002, nhận dữ liệu âm thanh từ ngoài qua giao tiếp ... sử dụng trong mạch. Các chương sau sẽ giới thiệu về các công cụ toán học và phương pháp nhận dạng tiếng nói. Chương 7 giới thiệu về phép biến đổi Fourier với tín hiệu liên tục và rời rạc, và...
  • 2
  • 675
  • 8
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 3

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 3

Điện - Điện tử - Viễn thông

... đơn giản.4.5 . Chủ chấp nhận (HACK): Đầu vào này có hai chức năng . Nó cung cấp một tín hiệu bắt tay chủ chấp nhận cho việc truyền DMA và có thu một ngắt chủ chấp nhận tương thích với bộ ... có thể trợ giúp cấu hình cho các thiết bị bộ nhớ và ngoại vi thay đổi tùy theo loại trong họ. DSP56002 là một loại trong họ xử lí DSP56000 bao gồm bộ phận chính xử lí tín hiệu số tương thích ... trong bộ xử lí khi PLL được cho phép và ở trạng thái khóa.8.7 . Điều khiển phân cực CKOUT(CKP): Chân vào này định nghóa sự phân cực của đầu ra xung nhịp CKOUT.8.8 . Đầu vào khởi động PLL(PINIT):SVTH:Huỳnh...
  • 9
  • 750
  • 5
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 4

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 4

Điện - Điện tử - Viễn thông

... 1s.VII. Các thanh ghi nhận của cổng SSI: Thanh ghi dịch nhận (RSR) là thanh ghi 24-bit nhận các dữ liệu từ chân SRD của cổng SSI. Thanh ghi nhận dữ liệu (RX) là thanh ghi 24-bit nhận dữ liệu SVTH:Huỳnh ... phép ngắt nhận Cho phép ngắt rờiCho phép truyềnBit chọn wordDịch trực tiếpSCISend breakChọn weakup modeCho phép weakup nhận Wire or mode selectCho phép nhận Thanh ghi SCRX:$FFF0 Nhận bit ... GOTHRU Khi bit cờ báo nhận tín hiệu đồng bộ (RFS) của SSISR (bit 3) được đặt thì nó chỉ ra rằng có một sự nhận tín hiệu đồng bộ xảy ra khi nhận lại từ mà ở trong thanh ghi nhận dữ liệu nối tiếp....
  • 44
  • 555
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Điện - Điện tử - Viễn thông

... , X:(R0) B , Y:(R4) ; cho phép ADD B , A X1, B Y1, A ;không cho phép C . CÁC LOẠI TRUYỀN DỮ LIỆU SONG SONG:Các loại truyền song song là:o Truyền dữ liệu ngắn tức thời o Cập nhật thanh ghi ... . DẠNG LỆNH:1./Lệnh một từ: Lệnh một từ tác động lên tất cả các chế độ định địa chỉ của DSP56002, ngoại trừ các chế độ định địa chỉ tuyệt đối và dữ liệu tức thời. Mã hợp ngữ nguồn cho loại ... X:$FFFE , A2./ Các lệnh số học Các lệnh số học dùng ALU dữ liệu để thực hiện thực hiện tất cả các loại phép xử lí số học. Toán hạng nguồn cho các lệnh số học được chứa trong thanh ghi nhập ALU...
  • 10
  • 519
  • 2
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 5

Điện - Điện tử - Viễn thông

... của CS4215 đều có 8 bit. CS4215 nhận biết bốn dạng dữ liệu âm thanh:16 bit bù hai tuyến tính, 8 bit không có dấu tuyến tính, 8 bit A-law, 8 bit µ-law. Dữ liệu nhận trên SDIN được lưu trữ trong ... SDOUT của CS4215 là thông tin nhận được khi D/C~ ở mức thấp. Tốc độ đồng bộ cấu trúc bằng tần số chuyển đổi được đặt bởi các bit DFR0 – DFR2 của thanh ghi định dạng dữ liệu. Một cấu trúc có ... TrungbìnhMax Đơn vịĐộ phân giải của ADC 16 - - BitsĐộ sai lệch phi tuyếân của ADC - -±0.9 LSBTầm hoạt động : Ngõ nhập Line Ngõ nhập MicIDR 80728478--dBdBHệ số méo dạng sóng hài toàn...
  • 16
  • 682
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 7

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 7

Điện - Điện tử - Viễn thông

... OE:cho phép đọc.• CE:cho phép chip hoạt động.• Nguồn VCC :+5V.Sử dụng bộ lọc đầu vào LPF để loại bớt nhiễu ở tần số lớn hơn 4kHz, và để chống trùm phổ . + - 3 2 1 VOUT C2 R2...
  • 12
  • 596
  • 0
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 8

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 8

Điện - Điện tử - Viễn thông

... FFT trên DSP56002 sử dụng giải thuật phân chia theo thời gian DIT (decimation-in-time). Đây là công cụ toán học cơ bản chuẩn bị cho việc nhận dạng tiếng nóiphần sau. A . BIẾN ĐỔI FOURIER ... tập con nhỏ hơn và nhờ đó mà loại bỏ được các phép tính toán không cần thiết. Hai phương pháp phổ biến trong việc chia nhỏ tập dữ liệu mẫu là:1. Thuật giải FFT phân chia mười theo thời gian ... :)(Fe)t(footjω−ω↔ω4. Tính chất co giãn :ω↔aFa1)at(f5. Tính chất vi phân và tích phân :)(F)j(t)t(fnnnωω↔∂∂ωω↔ττ∫∞−j)(Fd)(ft6. Mômen:gọi nmlà mômen cấp...
  • 7
  • 602
  • 8
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 9

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 9

Điện - Điện tử - Viễn thông

... GVHD:Thầy Lê Tuấn Anh Biến Đổi STFT Hệ số α xác định bề rộng về thời gian của cửa sổ phân tích, β là hệ số chuẩn hoá. Biến đổi Fourier ngược của hàm cửa sổ Gaussian là:αω−απβ=ω42/e)(W ... hai miền thời gian và tần số. Tuy nhiên nó gặp phải một trở ngại là khi ta đã chọn một cửa sổ phân tích thì kích thước của cửa sổ này sẽ không đổi trên toàn mặt thời gian – tần số. Mọi thành ... yêu cầu định vị tốt về thời gian. Điều này chỉ có thể thực hiện được khi kích thước của cửa sổ phân tích có thể thay đổi tuỳ theo yêu cầu định vị tốt về thời gian hay tần số. SVTH:Huỳnh Quốc...
  • 3
  • 553
  • 7
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 10

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 10

Điện - Điện tử - Viễn thông

... tiếng nói sẽ dùng phương pháp kết hợp mẫu để nhận dạng tiếng nói. I .TRÍCH ĐẶC TRƯNG TIẾNG NÓI DÙNG PHÉP PHÂN TÍCH STFTSau khi đã số hoá tín hiệu, chúng ta bắt đầu trích đặc trưng tiếng nói ... 9-143GVHD:Thầy Lê Tuấn Anh Nhận Dạng Tiếng Nói Hình 9.13 Kết quả trích formant của từ ‘LEFT’ dùng STFTII . NHẬN DẠNG TIẾNG NÓI :Trong hệ thống điều khiển bằng tiếng nói, phần quan trọng nhất ... quan trọng nhất và phức tạp nhất là chương trình nhận dạng tiếng nói. Bằng các công cụ phân tích tín hiệu hiện có, hệ thống nhận dạng tiếng nói được thiết lập theo hướng phối hợp mẫu, trong...
  • 66
  • 779
  • 2
Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 17

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 17

Điện - Điện tử - Viễn thông

... 103CHƯƠNG IX : XỬ LÝ TÍN HIỆU TIẾNG NÓI 104 I. TRÍCH ĐẶC TRƯNG TIẾNG NÓI DÙNG PHÉP PHÂN TÍCH STFT 104 II. NHẬN DẠNG TIẾNG NÓI 122III.CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI 126KẾT QUẢ 167KẾT LUẬN ... B. BIẾN ĐỔI FOURIER RỜI RẠC 96C. PHÂN TÍCH BIẾN ĐỔI NHANH FOURIER 96CHƯƠNG VIII: BIẾN ĐỔI FOURIER THỜI GIAN NGẮN 101 A. CÔNG THỨC...
  • 2
  • 278
  • 1

Xem thêm