nhận dạng giọng nói vào hệ thống điều khiển tự động

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	5
Dung lượng	20,8 KB

Nội dung

TÍCH HỢP CƠNG CỤ NHẬN DẠNG TIẾNG NĨI VÀO CÁC HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG Danh sách nhóm: Nguyễn Thị Ngọc Nguyễn Thị Thu Cúc Nguyễn Nhật Luân Phan Hồng Long Phạm Xn Lộc I NHẬN DẠNG GIỌNG NĨI: 1.Lịch sử nhận dạng giọng nói: - Nhận diện giọng nói lần đầu xuất thiết bị điện toán cá nhân từ khoảng 20 năm trước, Windows 98 giới thiệu Tuy nhiên, bạn ngạc nhiên biết công nghệ bắt đầu nghiên cứu từ năm 1936 - Hệ thống nhận diện giọng nói ban đầu hiểu chữ số kỹ sư cho ngơn ngữ người phức tạp Năm 1952, Bell Laboratories thiết kế "Audrey", hệ thống nhận diện chữ số từ giọng nói định 10 năm sau triển lãm World's Fair, IBM trình diễn hệ thống "Shoebox" nhận diện 16 từ tiếng Anh khác 2.Nhận dạng giọng nói gì?: - Nhận dạng giọng nói q trình nhận dạng mẫu, với mục đích phân lớp (classify) thơng tin đầu vào tín hiệu tiếng nói thành dãy mẫu học trước lưu trữ nhớ Các mẫu đơn vị nhận dạng, chúng từ, âm vị - Đây máy hệ thống có khả nhận dịch (hoặc hiểu thực hiện) lệnh thu từ giọng nói người Nhận dạng giọng nói gồm thuật ngữ: Voice recognition Speech recognition + Voice recognition liên quan đến việc xác định giọng nói xác cá nhân đó, tương tự phương pháp nhận diện sinh trắc học + Speech recognition việc xác định từ ngữ câu nói dịch chúng sang ngơn ngữ máy tính 3.Phần mềm nhận diện giọng nói hoạt động nào?: - Để chuyển giọng nói sang văn câu lệnh máy tính, hệ thống phải thực trình gồm nhiều bước phức tạp - Khi nói, bạn tạo rung động khơng khí Bộ chuyển đổi tín hiệu tương tự sang số (Analog-to-Digital Converter, ADC) chuyển sóng tương tự (analog) thành liệu mà máy tính hiểu - Để làm điều này, hệ thống thu thập mẫu (hoặc số hóa) âm cách đo xác sóng âm khoảng thời gian gần nhau, sau lọc âm số hoá để loại bỏ tiếng ồn, tách chúng thành dải tần số khác Nó "bình thường hóa" tinh chỉnh âm đến mức âm lượng không thay đổi xếp theo thời gian Không phải lúc người nói với tốc độ nên âm phải điều chỉnh cho phù hợp với tốc độ mà âm mẫu ghi nhận nhớ máy - Tiếp theo, tín hiệu chia thành nhiều phần nhỏ (thời gian khoảng vài phần trăm giây, chí phần ngàn giây trường hợp có phụ âm cuối khó phân biệt "p" "t") Chương trình sau đặt phần âm vào âm vị có sẵn ngơn ngữ thích hợp( Theo Wikipedia, âm vị phân đoạn nhỏ âm dùng để cấu tạo nên phân biệt cách phát âm Do đó, âm vị nhóm âm với khác biệt tương đối nhỏ đảm nhận chức ý nghĩa tùy theo người nói phương ngữ.Trong tiếng Anh có khoảng 40 âm vị khác Ví dụ, hầu hết người ngữ không nhận ra, đa số ngôn ngữ, âm k từ phát âm thực khác biệt Ví dụ k kit ký âm [kʰ] k skill ký âm /k/ Trong số ngôn ngữ, ký tự đại diện cho âm vị, số ngôn ngữ khác tiếng Anh, tương ứng xác Ví dụ tiếng Anh ký tự sh đại diện cho /ʃ/, k c đại diện cho âm /k/ (trong kit cat) ) 4.Nhận diện giọng nói dùng để làm gì? - Chuyển thành văn điều khiển máy tác dụng phổ biến nhận diện giọng nói, nhiên cơng nghệ mang đến nhiều hứa hẹn cho người khuyết tật ( Một số ứng dụng DriveSafe.ly đọc tin nhắn đến email cho người khiếm thị, số ứng dụng khác cho phép tìm kiếm nhắn tin giọng nói (chuyển thành văn bản) dành cho người bị liệt ) 5.Ưu nhược điểm cơng nghệ nhận diện giọng nói 5.1 Ưu điểm: - Khả truy cập: Với người khuyết tật khơng thể dùng chuột hay bàn phím, họ dùng giọng nói để hệ thống chuyển thành văn bản, giúp nhập liệu hay điều khiển cách dễ dàng - Kiểm tra tả: Bạn truy cập vào công cụ chỉnh sửa tương tự giải pháp xử lý văn chuẩn Tất nhiên, thứ khơng thể xác 100% phần mềm nhận diện xử lý phần lớn lỗi tả, ngữ pháp - Tốc độ nhanh: Phần mềm nắm bắt giọng nói bạn với tốc độ nhanh so với nhập liệu bàn phím, tốc độ nhập liệu giọng nói cải thiện đáng kể 5.2 Nhược điểm: - Thiết lập "dạy": Mặc dù chúng hứa hẹn hoạt động sau vài phút thiết lập, thực trình ghi nhận, làm quen với giọng nói, âm điệu tốc độ nói bạn có đơi chút phức tạp tốn thời gian Một số phần mềm bắt bạn nói lại, chí khơng thể nhận diện bạn nói - Chưa thực ổn định: Việc nói mà bị ngắt chừng khiến bạn "cụt hứng", đặc biệt bối rối bạn lên xuống giọng hay dưng nói nhỏ lại - Kho từ vựng hạn chế: Bạn phải sẵn sàng chấp nhận trường hợp phần mềm xử lý lâu từ vừa nói khơng nằm từ điển Đó điều cải tiến ngày II HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG Khái niệm: Hệ thống điều khiển tự động (điều chỉnh tự động): Tập hợp tất thiết bị kỹ thuật, đảm bảo điều khiển điều chỉnh tự động trình Ý nghĩa điều khiển tự động: - Đáp ứng hệ thống không thõa mãn u cầu cơng nghệ - Tăng độ xác - Tăng suất - Tăng hiệu kinh tế Bài toán lĩnh vực điều khiển tự động - Phân tích hệ thống: Cho hệ thống tự động biết cấu trúc thơng số Bài tốn đặt tìm đáp ứng hệ thống đánh giá chất lượng hệ - Thiết kế hệ thống: Biết cấu trúc thông số đối tượng điều khiển Bài toán đặt thiết kế điều khiển để hệ thống thỏa mãn yêu cầu chất lượng - Nhận dạng hệ thống: Chưa biết cấu trúc thông số hệ thống Vấn đề dặt xác định cấu trúc thông số hệ thống Phân loại hệ thống điều khiển tự động 4.1 Phân loại dựa mô tả toán học hệ thống - Hệ thống liên tục: Hệ thống liên tục mô tả phương trình vi phân - Hệ thống rời rạc: Hệ thống rời rạc mơ tả phương trình sai phân - Hệ thống tuyến tính: hệ thống mơ tả hệ phương trình vi phân/sai phân tuyến tính -Hệ thống phi tuyến: Hệ thống mô tả hệ phương trình vi phân/sai phân phi tuyến -Hệ thống bất biến theo thời gian: hệ số phương trình vi phân/ sai phân mô tả hệ thống không đổi -Hệ thống biến đổi theo thời gian: hệ số phương trình vi phân/ sai phân mô tả hệ thống thay đổi theo thời gian 4.2 Phân loại dựa số ngõ vào – ngõ hệ thống - Hệ thống ngõ vào – ngõ (hệ SISO): (Single Input –Single Output) - Hệ thống nhiều ngõ vào – nhiều ngõ (hệ MIMO): (Multi Input – Multi Output) 4.3 Phân loại theo chiến lược điều khiển * Mục tiêu điều khiển thường gặp sai số tín hiệu tín hiệu vào chuẩn nhỏ tốt Tùy theo dạng tín hiệu vào mà ta có loại điều khiển sau: -Điều khiển ổn định hóa: Nếu tín hiệu chuẩn x(t) = const, ta gọi điều khiển ổn định hóa -Điều khiển theo chương trình: Tín hiệu vào x(t) hàm thay đổi theo thời gian biết trước -Điều khiển theo dõi: Tín hiệu vào x(t) hàm trước theo thời gian 4.4 Quá trình thiết lập hệ thống điều khiển - Bước 1: Chuyển đổi yêu cầu kỹ thuật thành hệ thống vật lý - Bước 2: Vẽ sơ đồ khối chức Chuyển đổi miêu tả đặc tính hệ thống thành sơ đồ khối chức Đây miêu tả phần chi tiết hệ thống mối quan hệ chúng - Bước 3: Thiết lập sơ đồ nguyên lí - Bước 4: Sử dụng sơ đồ nguyên lý thiết lập sơ đồ khối graph tín hiệu biểu diễn không gian trạng thái - Bước 5: Rút gọn sơ đồ khối - Bước 6: Phân tích thiết kế 5.Ứng dụng nhận dạng giọng nói với cơng nghệ Machine learning -Là lĩnh vực công nghệ Trí tuệ nhân tạo (AI), Machine learning phương pháp phân tích liệu từ tự động hóa việc xây dựng mơ hình phân tích Đây cơng nghệ hứa hẹn mang lại hỗ trợ tối ưu cho doanh nghiệp với nhiều ứng dụng giới thực, ví dụ nhận dạng giọng nói nhận diện hình ảnh - Ứng dụng cơng nghệ Machine learning, phòng nghiên cứu phát triển cơng ty Baidu chế tạo công cụ mang tên gọi Deep Voice – mạng lưới nơ-ron sâu có khả tạo giọng nói nhân tạo khó để phân biệt từ giọng nói thật người Mạng lưới “học” nét đặc trưng nhịp điệu, giọng nói, cách phát âm âm vực nhằm tạo giọng người nói xác đến kì lạ Ngồi ra, Google sử dụng Machine learning cho sản phẩm khác liên quan đến giọng nói dịch thuật Google Translate, Google Text To Speech, Google Assistant 6.Ứng dụng nhận dạng tiếng nói vào điều khiển xe hơi: - Không dừng việc điều khiển cử chỉ, việc giao tiếp giọng nói với xe cơng nghệ tuyệt vời để tích hợp - Hệ thống Blue Link Hyundai tích hợp Google Maps vào tháng 1/2013 Siri thông qua công nghệ Eyes Apple, cho phép tài xế gọi điện, nhắn tin, mở nhạc mà không cần phải tập trung lái xe, tất thực qua giọng nói - Trước Nuance Dragon Drive mang cơng nghệ nhận diện giọng nói lên xe hơi, ứng dụng cho phép tài xế soạn tin nhắn, lấy thông tin giao thơng lộ trình thơng qua tương tác giọng nói Kết nối smartphone với nhận diện giọng nói xe để người lái xe tiện lợi sử dụng tiện ích Google “nghe” email, gửi tin nhắn, … 7.Ứng dụng nhận dạng tiếng nói thiết bị di động - Bạn thấy xuất ngày phổ biến cơng nghệ nhận dạng giọng nói ứng dụng chat/nhắn tin Facebook Messenger có tính chia sẻ giọng nói từ lâu, nhiều dịch vụ Over-The-Top Zalo, Viber WhatsApp nước ngồi nhanh chóng đón đầu xu hướng để tích hợp tính chat giọng nói vào sản phẩm - Một khảo sát gần Forrestor gia tăng app điều khiển giọng nói Một số lượng lớn người dùng xài công nghệ để gửi tin nhắn, 46% dùng cho việc tìm kiếm, 40% dùng giọng nói để tìm đường 38% dùng để ghi Đó số lớn tính 1168 người dùng tham gia nghiên cứu ... vừa nói khơng nằm từ điển Đó điều cải tiến ngày II HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG Khái niệm: Hệ thống điều khiển tự động (điều chỉnh tự động) : Tập hợp tất thiết bị kỹ thuật, đảm bảo điều khiển điều. .. điều khiển để hệ thống thỏa mãn yêu cầu chất lượng - Nhận dạng hệ thống: Chưa biết cấu trúc thông số hệ thống Vấn đề dặt xác định cấu trúc thông số hệ thống Phân loại hệ thống điều khiển tự động. .. tốn học hệ thống - Hệ thống liên tục: Hệ thống liên tục mơ tả phương trình vi phân - Hệ thống rời rạc: Hệ thống rời rạc mô tả phương trình sai phân - Hệ thống tuyến tính: hệ thống mơ tả hệ phương

Ngày đăng: 22/02/2019, 18:53