TÍCH HỢP CƠNG CỤ NHẬNDẠNG TIẾNG NĨI VÀO CÁC HỆTHỐNGĐIỀUKHIỂNTỰĐỘNG Danh sách nhóm: Nguyễn Thị Ngọc Nguyễn Thị Thu Cúc Nguyễn Nhật Luân Phan Hồng Long Phạm Xn Lộc I NHẬNDẠNGGIỌNG NĨI: 1.Lịch sử nhậndạnggiọng nói: - Nhận diện giọngnói lần đầu xuất thiết bị điện toán cá nhântừ khoảng 20 năm trước, Windows 98 giới thiệu Tuy nhiên, bạn ngạc nhiên biết công nghệ bắt đầu nghiên cứu từ năm 1936 - Hệthốngnhận diện giọngnói ban đầu hiểu chữ số kỹ sư cho ngơn ngữ người phức tạp Năm 1952, Bell Laboratories thiết kế "Audrey", hệthốngnhận diện chữ số từgiọngnói định 10 năm sau triển lãm World's Fair, IBM trình diễn hệthống "Shoebox" nhận diện 16 từ tiếng Anh khác 2.Nhận dạnggiọngnói gì?: - Nhậndạnggiọngnói q trình nhậndạng mẫu, với mục đích phân lớp (classify) thơng tin đầu vào tín hiệu tiếng nói thành dãy mẫu học trước lưu trữ nhớ Các mẫu đơn vị nhận dạng, chúng từ, âm vị - Đây máy hệthống có khả nhận dịch (hoặc hiểu thực hiện) lệnh thu từgiọngnói người Nhậndạnggiọngnói gồm thuật ngữ: Voice recognition Speech recognition + Voice recognition liên quan đến việc xác định giọngnói xác cá nhân đó, tương tự phương pháp nhận diện sinh trắc học + Speech recognition việc xác định từ ngữ câu nói dịch chúng sang ngơn ngữ máy tính 3.Phần mềm nhận diện giọngnói hoạt động nào?: - Để chuyển giọngnói sang văn câu lệnh máy tính, hệthống phải thực trình gồm nhiều bước phức tạp - Khi nói, bạn tạo rung động khơng khí Bộ chuyển đổi tín hiệu tương tự sang số (Analog-to-Digital Converter, ADC) chuyển sóng tương tự (analog) thành liệu mà máy tính hiểu - Để làm điều này, hệthống thu thập mẫu (hoặc số hóa) âm cách đo xác sóng âm khoảng thời gian gần nhau, sau lọc âm số hoá để loại bỏ tiếng ồn, tách chúng thành dải tần số khác Nó "bình thường hóa" tinh chỉnh âm đến mức âm lượng không thay đổi xếp theo thời gian Không phải lúc người nói với tốc độ nên âm phải điều chỉnh cho phù hợp với tốc độ mà âm mẫu ghi nhận nhớ máy - Tiếp theo, tín hiệu chia thành nhiều phần nhỏ (thời gian khoảng vài phần trăm giây, chí phần ngàn giây trường hợp có phụ âm cuối khó phân biệt "p" "t") Chương trình sau đặt phần âm vào âm vị có sẵn ngơn ngữ thích hợp( Theo Wikipedia, âm vị phân đoạn nhỏ âm dùng để cấu tạo nên phân biệt cách phát âm Do đó, âm vị nhóm âm với khác biệt tương đối nhỏ đảm nhận chức ý nghĩa tùy theo người nói phương ngữ.Trong tiếng Anh có khoảng 40 âm vị khác Ví dụ, hầu hết người ngữ không nhận ra, đa số ngôn ngữ, âm k từ phát âm thực khác biệt Ví dụ k kit ký âm [kʰ] k skill ký âm /k/ Trong số ngôn ngữ, ký tự đại diện cho âm vị, số ngôn ngữ khác tiếng Anh, tương ứng xác Ví dụ tiếng Anh ký tự sh đại diện cho /ʃ/, k c đại diện cho âm /k/ (trong kit cat) ) 4.Nhận diện giọngnói dùng để làm gì? - Chuyển thành văn điềukhiển máy tác dụng phổ biến nhận diện giọng nói, nhiên cơng nghệ mang đến nhiều hứa hẹn cho người khuyết tật ( Một số ứng dụng DriveSafe.ly đọc tin nhắn đến email cho người khiếm thị, số ứng dụng khác cho phép tìm kiếm nhắn tin giọngnói (chuyển thành văn bản) dành cho người bị liệt ) 5.Ưu nhược điểm cơng nghệ nhận diện giọngnói 5.1 Ưu điểm: - Khả truy cập: Với người khuyết tật khơng thể dùng chuột hay bàn phím, họ dùng giọngnói để hệthống chuyển thành văn bản, giúp nhập liệu hay điềukhiển cách dễ dàng - Kiểm tra tả: Bạn truy cập vào công cụ chỉnh sửa tương tự giải pháp xử lý văn chuẩn Tất nhiên, thứ khơng thể xác 100% phần mềm nhận diện xử lý phần lớn lỗi tả, ngữ pháp - Tốc độ nhanh: Phần mềm nắm bắt giọngnói bạn với tốc độ nhanh so với nhập liệu bàn phím, tốc độ nhập liệu giọngnói cải thiện đáng kể 5.2 Nhược điểm: - Thiết lập "dạy": Mặc dù chúng hứa hẹn hoạt động sau vài phút thiết lập, thực trình ghi nhận, làm quen với giọng nói, âm điệu tốc độ nói bạn có đơi chút phức tạp tốn thời gian Một số phần mềm bắt bạn nói lại, chí khơng thể nhận diện bạn nói - Chưa thực ổn định: Việc nói mà bị ngắt chừng khiến bạn "cụt hứng", đặc biệt bối rối bạn lên xuống giọng hay dưng nói nhỏ lại - Kho từ vựng hạn chế: Bạn phải sẵn sàng chấp nhận trường hợp phần mềm xử lý lâu từ vừa nói khơng nằm từ điển Đó điều cải tiến ngày II HỆTHỐNGĐIỀUKHIỂNTỰĐỘNG Khái niệm: Hệthốngđiềukhiểntựđộng (điều chỉnh tự động): Tập hợp tất thiết bị kỹ thuật, đảm bảo điềukhiểnđiều chỉnh tựđộng trình Ý nghĩa điềukhiểntự động: - Đáp ứng hệthống không thõa mãn u cầu cơng nghệ - Tăng độ xác - Tăng suất - Tăng hiệu kinh tế Bài toán lĩnh vực điềukhiểntựđộng - Phân tích hệ thống: Cho hệthốngtựđộng biết cấu trúc thơng số Bài tốn đặt tìm đáp ứng hệthống đánh giá chất lượng hệ - Thiết kế hệ thống: Biết cấu trúc thông số đối tượng điềukhiển Bài toán đặt thiết kế điềukhiển để hệthống thỏa mãn yêu cầu chất lượng - Nhậndạnghệ thống: Chưa biết cấu trúc thông số hệthống Vấn đề dặt xác định cấu trúc thông số hệthống Phân loại hệthốngđiềukhiểntựđộng 4.1 Phân loại dựa mô tả toán học hệthống - Hệthống liên tục: Hệthống liên tục mô tả phương trình vi phân - Hệthống rời rạc: Hệthống rời rạc mơ tả phương trình sai phân - Hệthống tuyến tính: hệthống mơ tả hệ phương trình vi phân/sai phân tuyến tính -Hệ thống phi tuyến: Hệthống mô tả hệ phương trình vi phân/sai phân phi tuyến -Hệ thống bất biến theo thời gian: hệ số phương trình vi phân/ sai phân mô tả hệthống không đổi -Hệ thống biến đổi theo thời gian: hệ số phương trình vi phân/ sai phân mô tả hệthống thay đổi theo thời gian 4.2 Phân loại dựa số ngõ vào – ngõ hệthống - Hệthống ngõ vào – ngõ (hệ SISO): (Single Input –Single Output) - Hệthống nhiều ngõ vào – nhiều ngõ (hệ MIMO): (Multi Input – Multi Output) 4.3 Phân loại theo chiến lược điềukhiển * Mục tiêu điềukhiển thường gặp sai số tín hiệu tín hiệu vào chuẩn nhỏ tốt Tùy theo dạng tín hiệu vào mà ta có loại điềukhiển sau: -Điều khiển ổn định hóa: Nếu tín hiệu chuẩn x(t) = const, ta gọi điềukhiển ổn định hóa -Điều khiển theo chương trình: Tín hiệu vào x(t) hàm thay đổi theo thời gian biết trước -Điều khiển theo dõi: Tín hiệu vào x(t) hàm trước theo thời gian 4.4 Quá trình thiết lập hệthốngđiềukhiển - Bước 1: Chuyển đổi yêu cầu kỹ thuật thành hệthống vật lý - Bước 2: Vẽ sơ đồ khối chức Chuyển đổi miêu tả đặc tính hệthống thành sơ đồ khối chức Đây miêu tả phần chi tiết hệthống mối quan hệ chúng - Bước 3: Thiết lập sơ đồ nguyên lí - Bước 4: Sử dụng sơ đồ nguyên lý thiết lập sơ đồ khối graph tín hiệu biểu diễn không gian trạng thái - Bước 5: Rút gọn sơ đồ khối - Bước 6: Phân tích thiết kế 5.Ứng dụng nhậndạnggiọngnói với cơng nghệ Machine learning -Là lĩnh vực công nghệ Trí tuệ nhân tạo (AI), Machine learning phương pháp phân tích liệu từtựđộng hóa việc xây dựng mơ hình phân tích Đây cơng nghệ hứa hẹn mang lại hỗ trợ tối ưu cho doanh nghiệp với nhiều ứng dụng giới thực, ví dụ nhậndạnggiọngnóinhận diện hình ảnh - Ứng dụng cơng nghệ Machine learning, phòng nghiên cứu phát triển cơng ty Baidu chế tạo công cụ mang tên gọi Deep Voice – mạng lưới nơ-ron sâu có khả tạo giọngnóinhân tạo khó để phân biệt từgiọngnói thật người Mạng lưới “học” nét đặc trưng nhịp điệu, giọng nói, cách phát âm âm vực nhằm tạo giọng người nói xác đến kì lạ Ngồi ra, Google sử dụng Machine learning cho sản phẩm khác liên quan đến giọngnói dịch thuật Google Translate, Google Text To Speech, Google Assistant 6.Ứng dụng nhậndạng tiếng nóivàođiềukhiển xe hơi: - Không dừng việc điềukhiển cử chỉ, việc giao tiếp giọngnói với xe cơng nghệ tuyệt vời để tích hợp - Hệthống Blue Link Hyundai tích hợp Google Maps vào tháng 1/2013 Siri thông qua công nghệ Eyes Apple, cho phép tài xế gọi điện, nhắn tin, mở nhạc mà không cần phải tập trung lái xe, tất thực qua giọngnói - Trước Nuance Dragon Drive mang cơng nghệ nhận diện giọngnói lên xe hơi, ứng dụng cho phép tài xế soạn tin nhắn, lấy thông tin giao thơng lộ trình thơng qua tương tác giọngnói Kết nối smartphone với nhận diện giọngnói xe để người lái xe tiện lợi sử dụng tiện ích Google “nghe” email, gửi tin nhắn, … 7.Ứng dụng nhậndạng tiếng nói thiết bị di động - Bạn thấy xuất ngày phổ biến cơng nghệ nhậndạnggiọngnói ứng dụng chat/nhắn tin Facebook Messenger có tính chia sẻ giọngnóitừ lâu, nhiều dịch vụ Over-The-Top Zalo, Viber WhatsApp nước ngồi nhanh chóng đón đầu xu hướng để tích hợp tính chat giọngnóivào sản phẩm - Một khảo sát gần Forrestor gia tăng app điềukhiểngiọngnói Một số lượng lớn người dùng xài công nghệ để gửi tin nhắn, 46% dùng cho việc tìm kiếm, 40% dùng giọngnói để tìm đường 38% dùng để ghi Đó số lớn tính 1168 người dùng tham gia nghiên cứu ... vừa nói khơng nằm từ điển Đó điều cải tiến ngày II HỆ THỐNG ĐIỀU KHIỂN TỰ ĐỘNG Khái niệm: Hệ thống điều khiển tự động (điều chỉnh tự động) : Tập hợp tất thiết bị kỹ thuật, đảm bảo điều khiển điều. .. điều khiển để hệ thống thỏa mãn yêu cầu chất lượng - Nhận dạng hệ thống: Chưa biết cấu trúc thông số hệ thống Vấn đề dặt xác định cấu trúc thông số hệ thống Phân loại hệ thống điều khiển tự động. .. tốn học hệ thống - Hệ thống liên tục: Hệ thống liên tục mơ tả phương trình vi phân - Hệ thống rời rạc: Hệ thống rời rạc mô tả phương trình sai phân - Hệ thống tuyến tính: hệ thống mơ tả hệ phương