Tổng hợp và nhận dạng tiếng nói ứng dụng vào nhập đọc dữ liệu văn bản, kiểm soát bảo vệ điều khiển các hệ thống thông tin máy tính, hỗ trợ xây dựng các sản phẩm multimedia dạy học trên cơ sở tiếng việt

68 1 0
Tổng hợp và nhận dạng tiếng nói ứng dụng vào nhập đọc dữ liệu văn bản, kiểm soát bảo vệ điều khiển các hệ thống thông tin máy tính, hỗ trợ xây dựng các sản phẩm multimedia dạy học trên cơ sở tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CwITo} / 620) BAO CAO KY THUAT DE TAI TONG HOP & NHAN DANG TIENG VIET : Chi nhiém: TS Hoang Kiém | | | 1994-1995 CHUONG 1- CO CHE TAO RA TIENG NOI VA THU NHẬN TIẾNG NÓI CHUGNG CO CHE TẠO RA TIẾNG NÓI VÀ THU NHẬN TIẾNG NÓI 9» ˆ O chương ta đề cập đến hai vấn đề : chế tạo tiếng nói chế tiếp nhận tiếng nói, nghiêng góc độ giải phẫu sinh lý nhiều Việc hiểu chức quan tham gia tạo tiếng nói tiếp nhận tiếng nói giúp có nhìn sâu hơn, tốt hơn, từ đề nhiều phương pháp mô chế làm việc người giao tiếp với máy tiếng nói 1.1 CƠ CHẾ TẠO RA TIẾNG NÓI 1.1.1 Giới thiệu Để liên lạc thơng tin với người nghe, người nói sé phát tín hiệu tiếng nói dạng sóng áp suất hiệu gồm có biến đổi áp tiếp trước miệng, nguồn âm nguồn gốc từ mũi, má họng ) Tín từ đầu người nói đến tai người nghe Tín suất theo thời gian thường đo trực ( âm có hiệu tiếng nói khơng trạng thái tĩnh, thay đổi đặc tính quan phát âm co hay giãn Tiếng nói chia làm nhiều đoạn 4m ( sound segment ) mà có số đặc điểm âm học khoảng thời gian ngắn Vì người nói mong tạo đãy âm tương ứng với thông điệp muốn diễn đạt nên hầu hết chuyển động cd quan phát âm dựa sổ ý chí điều khiển, khớp cd quan quan phát âm có vị trí đóng góp vào việc tạo âm : dây âm, lưỡi, môi, răng, xương hàm Âm chia làm hai lớp : (a) ngun âm, mà phát luồng khơng khí khơng bị hạn CHUONG 1-CO CHE TAO RA TIENG NOI VA THU NHAN TIENG NOI chế quan phat va (b) phụ âm, mà hạn chế lưồng khơng khí số điểm, yếu ngun âm Sau hít khơng khí vào phổi, tiếng nói thường tạo khơng khí thể ra( tiếng nói tạo lúc hít vào ) Việc sản sinh tiếng nói xem hoạt động lọc mà nguồn âm kích thích đầu lọc vùng âm Ngưồn âm tuần hồn, dẫn đến kết diếng nói hữu ( voiced speech ); hay bị nhiễu ồn khơng tuần hồn, dấn đến kết điếng nói vd ( unvoiced speech ) Nguén tạo tiếng nói hữu xây quản vùng phát âm, lưồng khơng khí bị gián đoạn cách tuần hoàn dây âm Luồng khơng khí thổ việc đóng mở dây âm kích thích vùng phát âm cách tuần hồn Tiếng nói vơ chất ngẫu nhiên tín biệu tạo vùng họng vùng phát âm Đối với hai loại kích thích hữu vơ thanh, vùag phát âm hoạt động đầu lọc, khuếch đại những,tần số âm làm lỗng tần số khác -' Một tiếng nói hữu tuần hồn có phổ gồm hịa âm ( harmonic ) tần số rang động vùng phát âm, tần số này, thường viết tắt FO, khía cạnh vật lý tín hiệu tiếng nói tương ứng với âm sắc tiếp nhận Một tín hiệu tuần hồn thật có phổ dạng đường thẳng rời rạc, vùng phát âm giữ ổn định lúc nên âm thành tiếng ( voieed sound ) thường gần-tuần hồn ( quasi-periodic ) Dù cho tín hiệu tiếng nói có thành tiếng hay khơng thành tiếng, đặc tính thường tương đổi ổn định ( quasi-stationary ) khoảng thời gian ngắn ( 10ms ), tín hiệu thay đổi thật khoảng thời gian lớn thời gian âm riêng biệt ( khoảng 80ms ) 1.1.3 Giải phẫu sinh lý eơ quan tạo tiếng nói : Không giống tai, dùng cho chức nghe, quan tạo tiếng nói cịn đóng chức khác thể thỏ, ăn, ngửi Do hoạt động tạo tiếng nói quan phải theo hướng giảm tối thiểu nỗ lực (chẳng hạn "năng lượng" thời gian) Băng tần tiếng nói liên lạc thường xấp xi phạm vi 7KH¿, tần số thấp này, quan sản sinh tiếp nhận tiếng nói tổ hiệu 1.1.3.1 Phối ngực Những quan tạo tiếng nói chia làm ba nhóm quản vùng âm : phổi, CHUONG 1-CO CHE TAO RA TIENG NOLVA THU NHAN TIENG NOI quản vùng Phổi nơi mà từ luồng khơng khí ra, qua áp suất, tạo nên âm trước thoát khỏi miệng dạng thay đổi hơ hấp, hít tín hiệu tiếng nói nằm lồng ngực, phổi có nhiệm vụ ) Việc thổ bình vào thổ thể tích khơng khí lên xuống ( khoảng 0,5 lít hơ hấp thục thường chiếm khoảng 60% thời gian chu kỳ hơ hấp Việc chủ yếu bổi hồnh đáy lồng ngực, có hồnh giãn cho phép phổi xương sườn Những liên sườn bụng sườn bên kéo xương sườn phồng lên kéo xương sườn lại với để thỏ hoành co lại làm giãn nổ phổi, giãn nở đàn hồi để đẩy khơng khí hỗ trợ cho việc hơ hấp: liên để hít vào, liên sườn bên Luồng khơng khí lúc nói hic hơ hấp bình thường khác đáng kể Vì bầu hết âm thổ nhiều tạo suốt trình thổ ra, nên hiệu thời gian thể lên đến hon thời gian hít vào, điển hình tỷ lệ vào 1:10, có 1:30 trường hợp đặc biệt rồng khơng khí Biên độ âm có liên hệ 'gián tiếp với tốc độ giây, ta phải Dé tao tiếng nói đủ lớn để nghe suốt nhiều tích phổi lúc đẩy hon 0,5 lit khơng khí Đối với người nam trưởng thành, thể nghỉ khoảng 4-5 lít, có khoảng 1-2 lít cận khơng thể đẩy sai biệt tối đa ( gọi dung tích sống) lúc phổi phồng nửa xẹp vào khoảng ð lít Tiếng nói bình thường đùng đến tiếng nói lớn dùng khoảng 80% Tée độ thể tích luồng khơng khí khỏi phổi ngực hết Độ lúc phổi dung tích sống, bụng điều co lại khiển; tương đối cố định, vào khoảng 0.2 Hft/s Điều địi hỏi biếng nói ( để làm hít vào suốt giai đoạn đầu trình thổ phát âm phải đủ ngắn phổi chậm xẹp xuống ) Nói cách dễ hiểu hỗ trợ bổ giãn nở phổi không cần phải kiểm tra phải ngồi qua mức hơ sung co that thổ để táng cường khơng khí hấp bình thường tương đối khoảng “Tiếng nói lúc đàm thoại đồi hỏi áp suất phổi âm tiếng 10em H,O Nó khác với lúc thở bình thường 1-2cm HạO Ngay nhỏ so với áp nói lớn với áp suất tối đa khoảng 20 cm H,O, phổi giữ suất khí ( 976cm H;O ) Trong áp suất khơng khí khí thường thay đổi tương đối ổn định q trình phát âm, lưồng khơng hẹp ) đáng kể nghẽn tắc biến đổi theo thời gian ( lúc rộng lúc quản vùng âm 1.1.3.2 Thanh quản dây âm : khơng khí Việc hơ hấp bình thường ft tạo âm nghe âm Âm đẩy từ phổi thông suốt qua quản vùng phần xuất đường lường khơng khí bị tắc nghẽn -4- hay hoàn CHUONG 1- CO CHE TAO RA TIENG NOI VA THU NHAN TIENG NOI tồn, làm gián đoạn luồng khơng khí, tạo tiếng nhiễu ồn hay xung động khơng khí Nguồn gốc sinh hầu hết tiếng nói quản, ndi mà âm làm nghẽn tắc phần hay hồn tồn luồng khơng khí từ phổi Thanh quản có cấu tạo khung gồm bốn sụn ( sụn giáp, sụn phổi, sụn nhẫn sụn nắp môn ), nối với dây chằng dây màng, nối phổi với vùng âm qua ống gọi khí quản Khí quản dài khoảng 12cm đường kính khoảng 1.5 - 2cm, chia thành hai phế quản trước vào phổi Sụn nắp mơn có nhiệm vụ che đậy quản thức ăn xuống ống tiêu hóa đến dày Trong quản dây âm, cặp cấu trúc đàn hồi gồm gân, cơ, niêm mạc nằm theo hướng trước-sau phía sau trái cổ Ở đàn ông, dây âm dài khoảng 15mm khoảng 13mm đàn bà Bằng cách co thất khác nhau, dây quản thay đổi chiều dài độ day nằm cấu hình khác Điểm tận phía trước dây âm bám vào sụn giáp, cịn điểm tận phía sau gắn với hai sụn phẫu riêng biệt, mà đu đưa hay trượt đóng hay mỏ dây âm Trong suốt lúc hơ hấp bình thường, dây âm hoàn toàn phép luồng khơng khí tự qua mà khơng tạo âm ( lúc hô hấp sâu chúng mở xa để luồng khơng khí vào tối đa ) Nếu chúng đóng lại, lồng khơng khí bị cản trở đủ để tạo tiếng ồn mơn, Tiếng giống vùng khe thay đổi âm (rộng khoảng 8mm lúc nghỉ ) nói tạo từ tiếng ồn gọi tiếng thầm { whisper ) lúc thở dài Tiếng tạo theo cấu tương tự âm bị ngăn hẹp lại, lưỡi cái, bay môi rãng Tất âm liên quan đến tiếng ồn khơng tuần hồn Nếu vùng âm mơn đóng hồn tồn, luồng khơng khí bị ngừng lại khơng có âm phát Sự ngất lưồng khơng khí 20-150ras sinh lớp âm gọi âm tốc nghẽn ( stop ) Co nguc tiếp tục đẩy khơng khí, áp suất hình thành sau lỗ đóng khi-nó mở 1.1.2.3 Chuyển động dây âm Lớp âm thứ ba lớp quan trọng nhất, âm dội Hồng ( sonorant soand ) Âm tạo kích thích vùng âm qua rung động tuần hoàn dây âm Trong âm dội tiếng, khơng khí khỏi phổi bị ngất cách nhanh chóng đóng mổ tuần hồn dây âm Tốc độ rung động gọi tần số ban (FO) Chu kỳ lần đóng dây âm liên tiếp, Tạ = 1/FO, cé giá trị trung bình thay đổi theo kích thước day âm người nói ( trẻ có chu kỳ ngắn, đàn ơng có chu kỳ dài ) Vì FO hình dạng vùng âm khơng én CHUONG 1-CO CHE TAO RA TIENG NOLVA THU NHAN TIENG NOI gần tuần hồn định nên âm dội tiếng thật khơng tuần hồn mà (quasi-periodic) khoảng thời gian ngắn Rung động dây gần lại với nhau, am ( phonation ) xảy âm có đủ độ đàn bồi ) va áp suất có độ khác biệt vừa đủ áp suất bên môn (Pay giãn nở bên môn Rung động dây âm gây mô giải thích theo thuyết khí động lực học Sự tắc nghẽn môn thường liên quan theo luồng khơng khí đến dây âm đàn hồi, mà chuyển động Một áp suất âm xuất mơn lực Bernoulli đóng dây âm theo q trình hút Lực giải thích theo định luật bảo tồn lượng Khơng khí qua ống có tổng động số điểm vận phương ống Thế tỷ lệ với áp suất khơng khí, cịn động tỷ lệ bình giảm tốc khơng khí Khi vận tốc tăng mơn hẹp, áp suất chỗ phải đủ lớn tạo Thi độ chênh lệch áp suất phần môn làm cho môn lưồng khơng khí lớn, áp suất âm xuắt dây âm đóng lại Sự đồng mơn lại ngắt luồng khơng khí, điểm mà građient áp suất lại xuất qua môn, cuối tạo âm hữu dây âm lại mở lần Trong hầu hết trung bình áp suất ( dội tiếng ), vùng âm tương đối rộng P„u áp suất khí Trong âm tắc nghẽn hữu thanh, FÔ giảm âm mơn giảm, rung động dừng hồn tồn vùng trạng thái đóng đủ lâu trên, nên có Vì phần dây âm dễ thay đổi nhiều so với phần phần khoảng thời gian trễ phần đóng mở trước trước âm thực theo làm Chu ky chuyển động dây lên suốt pha hai thành phần dọc ngang : (a) dây âm di chuyển xuống đóng P„ đần đần làm âm tách rời di chuyển lại Tần nữa; (b) suốt pha mổ trước phần dây âm đóng mơn Chủ kỳ lặp lại chanh âm có xu hướng tách phần sau mà có khuynh hỗ trợ co giãn đàn bồi dây âm, môn lớn hướng trả chúng tình trạng co lại ban đầu Khu vực lámmẺ cho đàn bà suốt trình đội tiếng khoảng 90raim cho dàn ông 1.1.3.4 Vùng âm thanh, tạo tiếng nói, vùng Phổi cung cấp luồng khơng khí ngưồn áp suất cho để tạo âm âm thường uến nắn, điều chỉnh luồng khơng khí tiến trình vùng âm lại thành phần quan trọng mơ xương, vùng tiếng nói Là ống nhỏ gồm có thành phần mơ khác âm cung cấp phương tiện để tạo nhiều loại âm việc phân phối nắng Vùng âm có hai chức năng: (1) thay đổi CHUONG 1- CO CHE TAO RA TIENG NOI VA THU NHAN TIENG NĨI lượng phổ dạng sóng âm thanh mơn, (2) góp phần vào việc tạo âm tắc nghẽn Ta phân biệt âm khác hoàn ( hữu hay vơ ), hình đạng phổ ), thời gian Những âm xác thanh, khoảng thời gian âm kết dây âm vùng 4m chủ yếu nhờ tính tuần ( tần số có lượng nhiều định đặc tính đội tiếng âm hoạt động đồng Vùng âm mô tả ngắn gọn ống âm với cộng hưởng, gợi formani, đối cộng hưởng Việc chuyển động khớp vùng âm làm thay đổi hình dạng ống âm, thay đổi tần số Khi thể tích khơng khí sóng áp suất âm tương ứng ởi qua vùng âm, tần số làm loãng tần số khác khuyếch đại lên Ở người nam trưởng thành, vùng âm dài khoảng 17cm ti môn đến mơi, chiếm diện tích cắt ngang khoảng 90cm Sau qua quar., khơng khí từ phổi qua khoang miệng khoang hầu, cuối thoát khỏi môi Ranh giới hai khoang xác định mềm (lưỡi gà), luồng khơng khí điểm nảy vào khoang mũi hay qua vào khoang miệng: Lưỡi gà nằm đỉnh đầu cấu trúc mơ di chuyển được, gọi mềm, mà đựng lên hầu hết âm tiếng nói, đóng khoang mũi để khơng nhận khơng khí Trong q trình hơ hấp âm mũi, nhiên, mềm hạ thấp không khí qua mũi ngồi Vùng âm cịn mê tả chuỗi ốtống hình trụ cá thiết điện cắt ngang thay đổi, hình dang thật phức tạp nhiều, thành có hình dạng thay đổi Chỉ có lưỡi, hàm mơi khơng có chuyển động Phía biên vùng âm tương đốt cố định ( có liên hệ đến đầu ), thành phần thay đổi: phía sau họng trơn phẳng liên tục, vịm khoang miệng gồm có mềm linh hoạtở phía sau, sau cứng không linh hoạt, cuối môi hàm Khoang mũi hồn tồn khác, gồm có mê đạo đường lót mơ dịch nhầy Nó có điện tích bề mặt bên lớn hoạt động máy cộng hưởng, làm lỗng đáng kể lượng sóng âm qua Lễ mở khoang họng khoang miệng gọi cổng màng họng Lỗ mổ rộng người nam trưởng thành khoảng 5cm”, 1.2 CƠ CHẾ TIẾP NHẬN TIẾNG NÓI: 1,3.1 Giới thiệu: Liên lạc tiếng nói truyền đạt thơng tin từ não người nói sang não người nghe qua tín hiệu tiếng nói phần trước ta làm quen với CHƯƠNG - CƠ CHẾ TẠO RA TIẾNG NOI VA THU NHAN TIENG NOI giai đoạn tiến trình này, giai đoạn tạo tiếng nói, ta xem xét cách thức tín hiệu vào tai người nghe chuyển đổi thành thông điệp ngôn ngữ Nó hên quan đến hai biến cố sau: biến cố tiếp nhận ( audition ) hay nghe ( hearing ), mà ghỉ nhận âm tiếng nói não, biến cố cảm nhận ( perception ), ma né giải mã thông điệp từ biểu điễn thần kinh âm Ở đây, hạn hẹp đề tài nên ta bàn đến biến cố tiếp nhận Tiến trình tiếp nhận hiểu tiến trình mà thay đổi áp suất tai chuyển thành lưồng thần kinh dây thần kinh thính giác Có lẽ ta biết đến chế mà não diễn dịch lưồng thần kinh sang tính hiệu ngơn ngữ 1.33 Giải phẫu sinh lý tai: Việc tạo tiếng nói chế tiếp nhận có lễ đặc biệt nhạy cảm với tần số tín hiệu tiếng nói phù hợp với việc liên lạc ( tức tần số Người nghe phân biệt khác biệt nhỏ số âm nằm vùng tần số xảy song song Tai mà chứa thơng tin xấp xỉ 200-5600Hz ) thời gian tần Tai gồm có ba phần : tai ngồi, tai tai Tai dẫn hướng thay đổi áp suất tiếng nói vào màng nhĩ, tai chuyển đổi thay đổi áp suất thành chuyển động học Tai chuyển đổi rung động học thành luồng điện nơron thính giác, mà dẫn đến não 1.2.2.1 Tai ngồi : Phần thấy bên tai gọi loa tai, dẫn hướng sóng âm vào ống tai dạng hình phễu, loa tai gíúp cho việc định chỗ âm thanh, bảo vệ cho tai không bị vật thể lạ xâm nhập Ống tai khoang chứa đầy khơng khí, đầu mở loa tai đầu đóng lại màng nhĩ Nó hoạt động cộng hưởng bước sóng 1⁄4 Vì ống tai người lớn đài khoảng 2.7cm ( đường kính khoảng 0.7 cm ), nên cộng hưởng gần 3KHz Cộng hưởng khuếch đại lượng 3KHz 5KHz lên đến 19-15đB, mà có lẽ hỗ trợ cho việc cảm nhận tiếng nói mang thơng tin đáng kế tần số cao 1.2.2.2 Tai giữa: Tai gọi hàn nhĩ, nằm xương thái dương, liên hệ với họng qua vịi Đastache Trong tai có chuỗi xương xương búa, xương đe xương bàn đạp, hai căng màng nhĩ bàn đạp Cán CHUONG 1- CO CHE TAO RA TING NOI VA THU NHAN TIENG NOI xương búa gán vào mặt sau màng nhĩ, ln ln kéo vào nên màng nhĩ luôn bị kéo căng khiến cho sóng âm tác dụng lên phần màng nhĩ dẫn chuyền đến chuỗi xương Khi co lại, căng màng nhĩ kéo xương cán búa vào bàn đạp kéo chân xương bàn đạp khổi cửa số bầu dục để làm giảm dẫn truyền âm Áp suất âm tăng lên khoảng 304B tai chủ yếu khác biệt điện tích bề mặt giữa, bên mang nhĩ lớn bên cửa sổ bầu dục nhỏ ( Tương ứng la 55mm? va 3,2mm? ) Tai gitta cịn có nhiệm vụ cản trổ bớt âm lớn vào tai 1.9.2.3 Tai : 'Tai gồm hệ thống ống nằm xương thái dương, gọi mê đạo xương Bên mê đạo xương mê đạo màng, chia thành ốc tai, soan nang, cầu nang ống bàn khuyên Khoảng không gian mê đạo xưởng mê đạo nang chứa ngoại dịch, cịn bên mê Khơng có thơng thương ngoại dịch nội dịch đạo màng chứa nội dịch a) Oc tai : Ốc ống gồm hình xoắn ốc dài 35mm làm hai vịng 3/4 Mang Reissner màng chia ốc tai làm tầng GO tầng tiền đình, đưới tầng nhĩ, tầng Tầng tiền đình tầng nhĩ chứa ngoại dịch thông thương với qua khe nhỏ đỉnh ốc tai Tầng chứa nội dich, | không liên lạc với hai tầng Tầng tiền đình tận cửa sổ bầu dục, tầng nhĩ tận sổ tròn màng nhĩ phụ Màng Reissner mỏng dễ dịch chuyển nên không gây cần trỏ cho dẫn truyền âm từ tầng tiền đình đến tầng Vai trị màng Reissner trì chất dịch đặc biệt tầng cần thiết cho hoạt động tế bào nhận cảm Màng cấu tạo 20.000-30.000 sợi nền, phát xuất từ trục ốc tai, kéo dài đến thành ốc tai Sợi cấu.trúc cứng, đàn hồi, cố định đầu đầu tự nên rung chuyển dễ đàng Chiều dài sợi tầng đần từ đáy đến đỉnh ốc tai, từ 0.4mm đến 0.5mm Ngược lại, đường kính sợi lại giảm dần từ đáy đến đỉnh ốc tai, khiến cho độ cứng sợi giảm 100 lần Kết sợi ngắn, cứng, gần đáy ốc tai, có khuynh hướng rung với tần số cao, cịn sợi dài, mỏng gần đỉnh ốc tai, có khuynh hướng rung với tần số thấp Nằm màng quan Corti, cấu tạo tế bào lông tế bào nhận cảm âm Cơ quan Corti trải dài từ đáy đến đỉnh ốc tai, gồm ba hàng tế bào lơng ngồi hàng tế bào lông Đỉnh tế bào lông cố định cấu trúc cứng màng lưới Màng lưới chống đồ trụ CHUONG 1- CO CHE TAO RA TIENG NOI VA THU NHAN TIENG NÓI Corti hình tam giác gắn chặt với trụ Corti màng lưới hợp thành màng mái mỏng, nhày, chun giãn thân ndron nằm trục ốc tai, màng nền, khí chuyển động; màng nền, đơn vị Phủ lên lông Các ndron đến bao quanh đáy tế bào lơng, cịn sợi trục hợp thành nhánh thính giác thần kinh.tiền đình ốc tai tận nhân ốc tai, tai hank tay b) Ối bán khuyê: + Ah Mỗi tai có ba ống bán khun nằm thẳng góc với Phần phình ống đáy bóng màng, bóng màng đổ vào soan nang Trong bóng màng cd quan nhận cảm tiền đình gọi mào bóng, cấu tạo tế bào lơng Phía tế bào vịm Lơng tế bào nằm vòm, đáy tế bào tiếp xúc với rdron nhánh tiền đình thần kinh ốc tai Soan nang cầu nang chứa tổ chức nhận cảm tiền đình, gọi vết soan nang vết cầu nang, cấu tạo tế bào lông Phủ lên tế bào màng chứa tỉnh thể Calcium Carbonate, hay gọi sối tai c) “Tế bào lơng : Tế bào lơng có đỉnh chứa 30-150 lông Ngoại trừ ốc tai, lông Kinocilium khơng di động Cịn lơng cịn lai la Stereocilia Day té bao lông tiếp xúc với nơron 1.2.3 Cơ chế nghe 1.3.3.1 Sóng âm Âm cảm giác sinh rung chuyển không khí đuợc truyền đến màng nhĩ dạng sóng âm Vận tốc dẫn truyền sóng âm khơng khí 344m/s 20 độ Ở mực nước biển, tăng lên theo nhiệt độ độ cao Cường độ âm liên quan đến biên độ sóng âm, độ cao âm liên quan đến tần số, tần số ảnh hưởng đến phần cường độ âm thanh, tần số thấp âm nghe to Sóng âm khơng có chư kỳ định cho cảm giác tiếng động; cịn sóng âm có đoạn lặp lại, với tần số hịa âm khác cho âm nhạc Cường độ âm đo hệ thống decibel, cường độ âm điễn tả logarithm cường độ thực chúng Phương pháp logarithm cần thiết giới hạn cường độ nghe tai người rộng Từ tiếng thầm đến tiếng động lớn nhất, su gia tang nang lượng âm khoảng tỷ lần, tai cảm nhận thay đổi khoảng 10.000 lần Sự gia tăng nắng lượng ââm gấp 10 lần gợi bel 0.1 bel 1A decibel Cường độ gây tổn thương cho quan Corti 140 decibel CHUONG - PHÉP BIẾN ĐỔI FOURIER Trước tiên qui ước ký hiệu sau : nút thứ ¡ tầng thứ m ký hiệu X„0) Mỗi tầng có N mat vA M=log,(N) tầng Để thuận Hiện, ta ký hiệu dãy vào xín) tầng thứ Như vậy, tầng thứ m+1, ta có thé coi day Xu) dãy vào X„„.¡@) (à kết tính toán) dãy Đối với tầng đầu với N=8, ta có : Xo(0) =x(0); Xo(4) = x(4); Xo(1) = x()); Xo(5) = x(5); Xo(2) = x(2); Xo(8) = x(6); Xo(3) = x(3); Xo(7) = x(7); Sử dụng ký hiệu từ sơ đồ, ta thấy phép tính tầng có dạng chung sau : XP) = Xa(p) + WƑ'N.Xu(g) (3.8) Xi (q) = Xa(p) + W2 Xa) = X(p) - Wy Xa@) (3.9) Xe(p} Xasi(p} ¥ 1a(4) W r+ Đ Hình 8: Lưu đổ tính tốn W N/2 Keoi(a) TM F N “hình bướm”, Cặp phép tính biểu dién hình Do hình dáng bề ngồi lưu đồ mà phép tính gọi phép tính hình bướm Mỗi tầng có số hình bướm N/2 hình Nhờ có tính chất : - Wyk? wt nên ta cịn có thé tiếp tục rút bớt số phép nhân mét nua vi sé hang T=W'y.X,(q) cần tính có lần cơng thức (3.8), (3.9) lưu đồ hình Ta CĨ : Xãz«i(P) = X20) + T Xã¿l(g) = Xz(p) - TT CHUONG - PHEP BIEN DOI FOURIER XP) Xg) + T Wy Xap) = X_(p) + T Xu = Xulp)-T Hinh : Lan đồ tính tốn “hình bướm” cải tiến Trong lưu đồ ta cần phép nhân phức Kết hợp Hình với Hình 7, ta có lưu đồ tính FFT phân chia theo thời gian với hình bướm cải tiến ( xem hình 10 ) Số phép nhân lưu đồ giảm nửa ( thời gian làm phép nhân máy tính lớn nhiều so với thời gian làm phép cộng !) 4.3.3.2 Thuật tốn tính chỗ (In Place ) Các lưu đồ tính FFT trình bày khơng cho ta thấy hiệu tính tốn mà cịn cho ta thấy cách cất giữ số liệu vào x(n) kết X(k) Ta thấy tầng hình có N nút vào N nút Nếu ta cho nút tương ứng với biến phức lập chương trình số ô nhớ cần dùng lớn (tỉ lệ với N.logzN) ` Lưu đồ cho thấy từ đầu dãy vào x(n) bố trí theo thứ tự phân chia hình vẽ ta nhận kết theo thứ tự tăng dần Và sảu lần tính tầng, ta lại dùng nhớ chứa dãy vào để chứa dãy ra, với số ô nhớ phụ trợ thêm q trình tính tốn Cụ thể hình bướm, sau tính Xnsi(p) va Xy.i(q ) xong’ ta thay la X,,(p) va X,,(q) khong can dang dén ntia nén ta cé thé chtia vao dãy kết X„ )(p) Xuu(q) tưởng ứng Như vậy, nút nằm hàng ngang tầng hiểu chứa ô nhớ, chỗ Sau làm tất tầng, kết cuối lA day X(k) nhận ô nhớ chứa dãy vào xín) (đương nhiên giá trị dấy vào x(n) mất) Cách làm vay gọi thuật tốn tính chỗ FFT, Mật vấn đề đặt ta phải tìm thuật tốn phân chia day vao x(n) theo thứ tự trình bày hình vẽ Để hiểu việc đễ dàng, ta biểu diễn số vào đưới dạng nhị phân Ví dụ với N=8, số dãy vào n biểu diễn bàng bít n2 n1 a0 Việc lúc đầu dãy xía) đượccủa phân thành hai dãy chan va lẻ ghi thành việc phân dãy xín) thành dãy có bit nO = (tương ứng với số chân) có bit n=1 (tương ứng với số lẻ) Sau việc phân chia chẵn lẻ hai dãy lại tiến hành thông qua bit n1 hay Cứ tiếp tục với bit n2, Như vậy, thứ tự bit biểu điễn số dãy x(n) phân chia n0 n1 n2, tức ngược với thứ tự bít biểu diễn số CHƯƠNG - PHEP BIEN DOI FOURIER :_ x(4) x{?) >> wo =o ° ~1 téng 10; đổ ba hợp hình minh lấn họa phân tang tính 7, nd DFT (với N điểm M=8) al p~ n2 chia x(n0 kết ni th qùa x(009) = x(0) x(100) = x(4) Le ——>— x(110) = x(8§) x[09L) = xi1) oe x(101) = x(ã) x(011) = x(3) x(1IT} = x(7) 98 | + họa việc tít", X(2) ~—— i phân chia diy ‡ x(010)z vao x(n) eo thai gian việc kết n2) f—>—m>— ! t=ằ>— ——>— pe x{n2 n1! n0) ' ———i 11¿ minh “đảo no x(t) phan Dây Hình \ ‹ chià hình [ 28 tang Lưu \ ° WO sau / xx -1 w9 Hình \ x(?}' theo nguyên LẮC CHUONG 4-PHEP BIEN DOI FOURIER dãy vào x(n) lúc đầu n2 n1 n0 Do việc phân chia kiểu gọi kiế “dao bit" (bit reverse) Hinh 11 minh họa việc thực phân chia theo kiểu đảo bị: 4.3.2.3 Cac dang khác thuật tốn Ta thay đổi lưu đồ tính tốn theo thuật tốn "tại chỗ" hình v hình 10 mà khơng làm thay đổi kết tính tốn cách di chuyển vị trí c¿ đường nằm ngang nối nút Khi chuyển, quan hệ nút đườn nằm ngang khác giữ nguyên, nghĩa nhánh chéo nối nút s giãn nở theo hình vẽ song giữ nguyên hệ số truyền Như ta b trí lại trật tự xếp đầu vào theo thứ tự bất kỳ,ví dụ theo thứ tự tự nhiên KỲ kết đầu xếp theo thứ tự đảo bit Cách làm họa hình 12 Đây.cũng lưu đồ tương ứng với thuật toán Cooley va Tuke viết lúc ban đầu - TT NON x1) -ơœ Z _—< Wo s7” „Š awh x2) xứ) x(3) » £8) x44) xũ) x(§) X(§) Aang Hình 12: t Lưu ting đổ minh với dãy vào họa tính ting DFT dược sấp xếp N điểm theo phân thứ tự chia theo thời tự nhiên gian TTe TT TC ae pene CHUONG - PHÉP BIẾN ĐỔI FOURIER Trong lưu đồ trên, ta xếp đầu vào theo thứ tự tự nhiên đầu theo thứ tự tự nhiên cách bố trí lại nút Đương nhiên thuật tốn tính chỗ khơng cịn tác dụng! 4.3.3 Thuật toán FFT số phân chia theo tần số (Radix-2 Decimation In Frequency (DIF) FFT Algor ithms) 4.3.3.1 Nguyên tắc x(n) Ở phần ta trình bày thuật tốn FFT dựa việc chia nhỏ dãy vào để phan tach DFT N điểm thành DFT nhỏ Trong phần ta xem xét thuật toán FFT dựa việc phân tách dãy X{k) thành day theo cách phân tách day x(n) số nên thuật toán gọi Với giả thiết N = 2™ ta 06 thé chia N/2 mau dau, nửa sau chứa N/2 mẫu Xứ)= Do số k X(k) gắn liền với thang tần thuật toán FFT phân chia theo tần số, dãy vào làm hai nửa, nửa đầu chứa lại Ta có : N/2-1 N=) n=0 n=N/2 2, xía.WyF+ Ð) xín)WyPR W/2-L XŒ)= 2, x(n) Wy n=0 voi Wy thự + Wy N/2-1 5ˆ n=0 x(n+N/2).Wy"* = -1 va ket hợp hai tổng lại, ta có : XŒO = N/2-( 2È, “=0 (xn) + CDk-x(n+N/2)] Wy : Xét k = 2r (k chan) vAk = 2r 41 Ck lễ ) ta nhận X(2r) va X(2r+1) tưởng ứng với dãy số chẵn dãy số lẻ : KQ@r) = {2-1 D0 n=0 X(2r+l= N/2-1 D0 „=0 [ x(n) +x(n+N/2) Wy? (x(a) -x(n+N/2) Wy Wy? với r = 0,1, ,(N/2 - 1) day Do Wy”" = Wus”" nên ta thấy X(2r) chinh 1A DFT N/2 diém CHƯƠNG 4- PHÉP BIẾN ĐỔI FOURIER x(0) vị | — g1) x1) OFT x(2) xtÐ xí! DFT x8) ˆN/2 điểm x{7) Hình + Po XI?) =o Xí4) ——o x(8) F~*— X(1) FT>— X(3} —>—o X(§) po X(7) N/2 diéw x(3) =i 13: Lưu đổ DFT M/2 phân điểm ee chía (ví theo dụ với TRÍNh 1t: Lựử dỡ day dé minh ‘ho a céch "7? nhấp phân chịa" thed tin số: sổ H=§), cia x(0) DFT WN điểm thành hai CHUONG -PHEP BIEN DOI FOURIER e(n) = x(n) + x(n+N/2); gín) tổng nửa đầu dãy với nửa sau dãy x(n) Con X(2r+1) chinh 14 DFT N/2 diém cia tich W véi day h(n) = x(n) - x(n+N/2); hứm) hiệu nửa đầu xín) với nửa sau dãy xín) Như DFT dãy N điểm tính sau : trước hết tạo hai đãy g(n) hín), sau thực hín).W Cuối thực DFT hai dãy này, ta có điểm X(k) số chẵn X(k) số lẻ Tình 13 minh họa cách tính với ví đụ N = Với DẸT N/2 điểm ta lại tiến hành hoàn toàn tương tự làm để tách thành hai DET N⁄4 điểm Cứ đến DFT cuối hai điểm Hình 14 minh họa lưu đồ tổng quất tính DFT theo phương pháp phân chia theo tần số Qua lưu đồ ta thấy tầng cần N phép nhân có M = logạN tầng Số phép nhân tổng cộng N/2.logạN, với số phép nhân cách tính theo phương pháp phân chia theo thời gian Số phép cộng 4.3.3.3 Thuật tốn tính chỗ Từ lưu đồ hình 14 ta thấy có số điểm tương tự khác hai phương pháp tính FET Trước hết ta thấy phương pháp phân chia theo tần số, dãy vào xếp theo thứ tự tự nhiên dãy xếp theo thứ tự "đáo bit” Muốn nhận thứ tự đúngở đầu ra, ta phải thực phép đổi chỗ đảo bit Trong hai phương pháp, ta tính theo phương pháp chỗ Giống phương pháp trước, ta xáo trộn hàng lưu đồ theo chiều thẳng đứng mà không làm thay đổi kết miễn nhánh nối nút giữ nguyên với hệ số truyền Ta thấy phép toán tầng phép tính biểu diễn "hình bướm” có khác hai loại hình bướm Với qui ước ký biệu đầu vào đầu tầng thứ m nhu phương pháp trước, ta có : Ãa«i(P) = Xu(p) + Xa(q) Xms(Q) = [Xa(p) - Xu(q)]WTN X(p)- ° X,,(q) Xuui(p) = Xy(p) + X,(q) Knet(@D = [Xa(p) - Xu(Q)].WÍN Hình lã: Luu dé tinh todn “hình bướm” hình 14 tình bướm có khác với hình bướm phương pháp phân chia theo thời gian (hình9) Ngồi qui ước cách vẽ lưu đồ hình bướm sử dụng phổ biến trên, người ta dùng qui ước khác CHƯƠNG 4- PHÉP BIẾN ĐỔI FOURIER at wa Hình 16 thời gian : Cách ký hiệu thứ hai hình bướm FFT co sé2 phân chia theo atb b tình 17 a+bW + a-bw SN tần số + Nay : Cách ký hiệu thứ hai hình bướm FFT cø số phân chia theo 4.3.4 Cach tinh FFT nguge ( IFFT : Inverse FFT ) , Cặp công thức biến đổi Fourier thuận ngược : N-I Xk) = DD xin) Wy™ vớik=0/1, N-L n=0 N-U x(n) = (Y/N) D) X(k) Wy" k=O - - - với n = 0,1, N-1 - Ta nhận xét cập công thức biến đổi Fourier thuận ngược có tưởng tự đáng kể Chúng khác hệ số tỈ lệ dấu mũ hệ số W, Do ta hồn tồn dùng thuật tốn FFT thuận để tính FET ngược cách sau : Lấy liên hợp phức hai vế công thức * chuyển hệ sốtỉ lệ N sang trái, ta có : wW-L N.x*(n)= 37 X*(k) Wy k=0 Vế phải công thức DET day X*(k) nên ta dùng chương trình tính FFT để tính Sau dãy xí(n) nhận cách lấy liên hợp phức hai vế công thức * chia cho n để có : CHUONG 4-PHEP BIEN DOI FOURIER N-1 x(n) = (1N) 3; [X*@Œ).Wy*I* k=0 Như chương trình tính FFT dùng để tính FFT thuận lẫn FFT ngược Việc tính FFT ngược chương trình tính FFT thuận tóm tắt sau : X(k) 1) Cho day X(k), lay liên hợp phức X(k) cách đổi dấu phần ảo ti) Goi chuong trinh tinh FFT dé tinh FFT cha day X(k) đổi dấu phần ảo ii) Lấy liên hợp phức kết thu cách đổi dấu phần ảo Sau chia dãy cho hệ số tỉ lệ N để thu kết mong muốn CHUONG - ỨNG DỤNG FET TRONG VIỆC NHẬN BIẾT CÁC CHỮ SỐ CHUGNG UNG DUNG FFT TRONG VIEC NHAN BIET (TIẾNG NÓI) CÁC CHỮ SỐ 5.1 GIỚI THIỆU SƠ LƯỢC VỀ NHẬN DẠNG TIẾNG NÓI 5.1.1 Giới thiệu chung Như ta thấy, giao tiếp người máy tính thực chủ yếu phương tiện vào bình thường như: hình, bàn phím, chuột, máy quét( scanner ) Các phương tiện phát huy hiệu chúng sohg số trường hợp, coa người cảm thấy bị gò bó, tốc độ chậm chạp, khơng nhanh giao tiếp tự nhiên người với người Từ nảy sinh tốn đưa giao tiếp người máy tính sang giao tiếp tiếng nói ( đối thoại ) Giao tiếp tiếng nói người máy tính gồm hai phần là: tổng hợp tiếng nói (Speech Synthesis) - tức chuyển từ "văn sang tiếng nói”, nhận dang tiếng nói (Speech Recognition) - tite 14 chuyén ti" tiếng nói sang văn bản” Ở đây, ta đề cập đến vấn đề nhận dang tiếng nói Có thể nói, việc thiết kế hệ tổng hợp tiếng nói dễ thành cơng nhiều so với thiết kế mmột hệ nhận dạng tiếng nói Lý đễ thấy có bất đối xứng việc tạo tiếng nói việc diễn dịch tiếng nói Việc đưa liệu vào máy tính thơng qua nhận dạng tiếng nói có ưu điểm sau đây: * Khơng đời hỏi phải luyện tập nhiều tiếng nói tự nhiên người: Tốc độ nhập liệu nhanh so với đánh vào từ bàn phím (khoảng 150 từ/phút nhập tiếng nói, 50 từ/phút đánh tốt, 15 từ/phút đánh đở) wy « CHUONG - UNG DUNG FFT TRONG VIEC NHẬN BIẾT CÁC CHỮ SỐ * ‘Trong giao tiếp tiếng nói với máy tính, người xử lý song song thơng tin khác « _ Thiết bị vào tiếng nói microphone đơn giản 5.1.3 Đánh giá hệ nhận đạng tiếng nói Việc tiến hành nhận dạng tiếng nói người chưa thể thực Bộ óc người hoạt động tỉnh vị, nhận dạng luồng tiếng nói liên tục với từ vựng tiếng nói người, từ hình thành khái niệm ban đầu trình nhận dạng hiểu ý nghĩa khái niệm Đo để đạt tới hồn hảo óc, người ta phải thực việc nhận dạng tiếng nói qua nhiều giai đoạn khác nhau, từ đơn giản đến phức tạp Đơn giản nhận dạng từ phát âm cách biệt nhau, nghĩa phát âm rời ra, khơng có nối vần Sau ta tiến thêm bước nhận dạng tiếng nói liên tục Để đánh giá hệ nhận dạng tiếng nói, người ta dựa vào độ xác -của hệ ( hay tỉ lệ sai số ) Tuy nhiên, độ đo lại thay đổi hoàn toàn theo ứng dụng khác lệ thuộc nhiều vào : « « Mơi trường thu âm Ỷ Kích thước khả thứ tự từ tự điển mà hệ chấp nhận « - Hệ thếng độc lập với người nói hay phụ thuộc vào người nói « - Hệ thống nhận dạng tiếng nói liên tục hay nhận dạng từ phát âm riêng biệt 5.1.3 Cách tiếp cận nhận dạng : Nhận dạng tiếng nói xem trường hợp riêng nhận dạng ( Pattern Recognition ) Về chất, nhận dạng tiếng nói đời hỏi ánh xạ tiếng nói văn cho ứng với đạng sóng nhập vào ta xác định văn tưởng ứng với Văn từ, câu, hay đơn vị ngơn ngữ Tồn cơng việc nhận dạng, gồm nhận dạng tiếng nói, tiến hành qua hai giai đoạn : huấn luyện sau nhận dạng Giai đoạn huấn luyện thiết lập từ điển mẫu tiếng nói gán cho nhãn văn Trong hệ thống độc lập với người nói, việc huấn luyện thực suốt trình phát triển hệ thống thường kết hợp phương pháp tay với tự động, hệ nhận dạng phụ thuộc người CHƯƠNG - UNG DUNG FFT TRONG VIC NHAN BIBT CAC CHU SỐ nói lại huấn luyện khách hàng Giai đoạn nhận dạng tự động ( thường thời gian thực ) gán nhãn cho mẫu nhập vào chưa biết Theo lý thuyết, hệ nhận đạng tiếng nói đơn giản từ điển lớn, đó, entry ( chẳng hạn từ ) dạng sóng lưu nhận văn Cho mẫu tiếng nói vào, ta tìm kiếm từ điển để tìm mẫu đối sánh gần với mẫu vào ( cách dùng độ đo ), hệ thống xuất văn tương ứng Việc áp dụng phương pháp nhận dạng vào nhận dạng gồm nhiều bước: chuẩn hóa, tham số hóa, trích chọn đặc trưng, so nhau, định Ở bước, ta lại có nhiều phương lựa Do hình thành nên nhiều mơ hình nhận đạng tiếng nói khác tiếng nói bao sánh giống pháp để chọn Ngồi ra, mơ hình mạng ndron dùng hệ nhận dạng tiếng nói chúng tơi xin giới thiệu mơ hình mạng logic thích ứng, viết tất từ tiếng Anh ALN ( Adaptive Logic Network), với mức độ ban đầu nhận biết ( tiếng nói ) chữ số từ khơng đến chín Mạng thiết kế khoa Khoa Học Máy Tính thuộc trường Đại Học Tổng Hợp Alberta, Canada 5.2 GIỚI THIỆU VỀ MẠNG ALN DŨNG TRONG NHẬN DẠNG ã.3.1 Giới thiệu chung ALN nhị phân , mà nút sau huấn luyện loại bỏ nút du thừa có chức nút AND hay OR Va dé ALN tương đương cổng NAND Sau nhận vectø nhập vào dang vectd boolean, ALN sé xudt mét gid tri bit (0 hay 1) MLP ALN trường hợp đặc biệt mạng tiếp nhận nhiều lớp quen thuộc ( Multilayer Perception Feedforward Network ) Chi cé mét it thay đổi tất đơn giản Nói cách ngắn gọn, nút AEN đầu vào, có hai tín hiệu vào xị x; boolean, méi “trọng lượng” liên kết (connection weight) xác định bit thông tin đơn lẻ, "hàm làm bằng" (squashing fanetion) ngưỡng Đặc biệt, bị bạ boolean nút xuất giá trị boolean : (by + 1)*x, + (by + 1*x, Bến tổ hợp AND, 2 bị bạ (00, 11, 10, 01) tạo bén ham boolean biến : OR, LEFT, RIGHT, ta định nghĩa : LEFT (x,,x2) = x, RIGHT (x,,X») = Xo CHUONG - UNG DUNG FFT TRONG VIỆC NHÂN BIẾT CÁC CHỮ SỐ Ví dụ 1*%; + 1*x¿ > xị X; 1, tức nút AND Bốn hàm hàm boolean hai biến đồng biến, hàm Một hàm boolean gọi đồng biến thay đổi từ sang ( ) đầu vào khơng gây kết xuất thay đổi từ sang Ta kiểm chứng điều bốn hàm trên, lưu ý hàm XOR khơng phải hàm đồng biến XOR (9,1) = XOR(0,1) = Như ta nói, đầu vào ALN phải vectd mà thành phần giá trị boolean Còn đầu ALN bịt hay Khi ALN cần học hàm thực mà biến thuộc loại thực hay nguyên ta phải dùng đến phương pháp mã bước ngẫu nhiên (random_walk encoding) để lượng hóa giá trị thực hay nguyên Mỗi đầu vào mã riêng biệt thành veetd bịt ( tức thành phần giá trị nối lại với lấy bù để tạo thành vectơ vào qua nhiều ALN : bít kết vectd bịt, sau lại gidi ma để lấy mức lượng hóa giá trị kết liên tục mà ta cần học Một tính chất quan trọng ALN mà nhờ boolean ) Sau chúng ALN Sau xử lý tạo thành kết lấy giá trị gần với : ứng dụng cập nhận dạng, tính bất nhạy cảm ( insensitivity ) Sau ta đề đến tính chất 5.2.2 Tinh bat nhạy cảm ALN : cổng Ta hay xem nhị phân mà nút biểu điễn nút khơng logic có đầu vào Giả sử cân có 2E nút ( phải nút ) xếp L lớp Mỗi nút gán ngẫu nhiên ta thấy rằng, bốn hàm boolean biến : AND, OR, LEFT, RIGHT Người thay đổi nhỏ vectd vào ( thay đổi cách Hamming ) đưa đến xác suất thay đổi nhỏ Khi giả sử đầu vào bị thay đổi, kết xuất nút mà gắn vào 0.5 0.25, Vì vậy, xác suất thay đổi kết xuất nút cao kết xuất va van van , đến tận gốc, xác suất thay đổi tính trung bình, đo theo khoảng kết xuất xác suất thay đổi laa” CHUONG - UNG DUNG FFT TRONG VIỆC NHẬN BIẾT CÁC CHỮ SỐ 5.2.3 Huấn luyện ALN : Đầu tiên nối kết ngẫu nhiên với số biến vào boolean phần bù chúng Đầu vào nút đầu gốc Những biến vào thành phần vectd biểu diển mẫu Việc huấn luyện tập vectd vào có cho trước kết xuất mong muốn Ta gọi lần thời kỳ ( epoch ) Sau huấn luyện xong ta kết nút gán cho hàm thích hợp, cho phép ta xấp xỉ kết xuất mong muốn đặc tả liệu huấn luyện, có khả tổng quát hóa, tức cho trả lời tương đối xác vectd vào khác mà khơng có mặt suốt q trình huấn luyện Điều đáng nói với ALN huấn luyện xong, xem mạch logic kết hợp Sau qua giai đoạn tương thích, hàm LEFT, RIGHT loại bỏ, cịn nút AND,OR Do theo quy tắc De Morgan, cay tưởng đương logic với loạt cổng NAND Kết cho phép ta dịch transitors trực tiếp ALN sang phần cứng dễ dàng, trở thành "cây 5.3 ỨNG DỤNG FFT TRONG NHẬN BIẾT (TIẾNG NÓI) CÁC CHỮ SỐ QUA MẠNG ALN Với mạng ALN xây dựng sẵn, thử nghiệm kết hợp với phép biến đổi ƑFT để nhận biết tiếng nói chữ số từ khơng đến chín Chúng tơi tiến hành theo cách sau : « Do can phải nhận dạng mười từ nên vùng kết xuất mã năm bịt ( dùng bến bít khoảng cách kết gần, đễ gây sai số ) Độ đo dùng độ đo Hamming, tức với hai vectd bit có chiều đài w\ va wo, ta định nghĩa: ynmjng (WỤ, Wa) = Số bít khác w, va.wy bay » detanuning (Wi, W2) = SO bit eta (w, XOR wy) Một từ thu âm vào, sau cắt bé phan du thtia ( tiếng im lặng ), đưa qua biến đổi FFT để rút 1024 đặc trưng Sau 1024 đặc trưng chia thành 256 nhóm, mổi nhóm gồm Mỗi nhóm tính giá trị trung bình, dơ ta cịn 256 giá trị thực trích từ mẫu thu vào Mỗi giá trị ứng với vectd dài lồ bit vùng mã [-2000 2000] Sau ta nối 256 vectg bịt lại, vectd có chiều dài 4096 bit, làm đầu vào CHUGNG - UNG DUNG FFT TRONG VIỆC NHẬN BIẾT CÁC CHỮ SỐ © - Do vùng kết xuất mã bit nên ta phải huấn luyện qua năm Kết cho thấy để huấn luyện thành công 100% ( tức 100% vectd vào, sau tính tốn qua cho kết mong muốn ban đầu ), số thời kỳ tối đa Trung bình khoảng ö phút cho 50 mẫu suốt trình huấn luyện toàn nam cay * _ Với cách làm trên, đạt số kết chưa khả quan ( sai số cịn lớn ) giúp số ý tưởng cải tiến phương pháp cho tốt Điểm yếu phương pháp chúng tơi làm mã vùng giá trị vào khoảng [-2000 2000] Đó chúng tơi chúng tơi chưa có điều kiện thống kê hệ số Fourier để chạn vùng thích hợp để mã hóa Giải pháp mã vùng [-3000 2000] giải pháp thử nghiệm nên đặc trưng trích từ mẫu thu vào cịn thơ thiển dẫn đến kết khơng xác Hy vọng với thời gian sau này, cố gắng tìm cách cải tiến điểm yếu để kết tốt

Ngày đăng: 06/10/2023, 12:25

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan