Nội dung chính của báo cáo xu hướng phát triển công nghệ là trình bày xu hướng nghiên cứu và ứng dụng trí tuệ nhân tạo, dữ liệu lớn và mạng lưới kết nối vạn vật trong thành phố thông minh. Mời các bạn tham khảo chi tiết nội dung báo cáo.
SỞ KHOA HỌC VÀ CÔNG NGHỆ TP.HCM TRUNG TÂM THÔNG TIN VÀ THỐNG KÊ KH&CN BÁO CÁO PHÂN TÍCH XU HƯỚNG CÔNG NGHỆ Chuyên đề: XU HƯỚNG NGHIÊN CỨU VÀ ỨNG DỤNG TRÍ TUỆ NHÂN TẠO, DỮ LIỆU LỚN VÀ MẠNG LƯỚI KẾT NỐI VẠN VẬT TRONG THÀNH PHỐ THƠNG MINH Biên soạn: Trung tâm Thơng tin Thống kê Khoa học Công nghệ Với cộng tác của: PGS.TS Đặng Trần Khánh PGS.TS Thoại Nam TS Lê Thành Sách Trường Đại học Bách khoa TP Hồ Chí Minh TP.Hồ Chí Minh, 06/2018 MỤC LỤC I TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU VÀ ỨNG DỤNG AI, BIG DATA VÀ IOT TRONG THÀNH PHỐ THÔNG MINH Công nghệ tảng cách mạng công nghiệp 4.0 1.1 Mạng lưới kết nối Internet vạn vật 1.2 Dữ liệu lớn 1.3 Trí tuệ nhân tạo 1.3.1 Trí tuệ nhân tạo nhánh nghiên cứu 1.3.2 Những thành công học sâu thời gian gần 1.3.3 Nguyên nhân thành công học sâu triển vọng 10 1.3.4 Các bước ứng dụng học sâu 12 II PHÂN TÍCH XU HƯỚNG NGHIÊN CỨU VÀ ỨNG DỤNG AI, BIG DATA VÀ IOT TRONG GIAO THÔNG TRÊN CƠ SỞ SỐ LIỆU SÁNG CHẾ QUỐC TẾ 13 Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo thời gian 16 Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo quốc gia 16 Tình hình công bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo hướng nghiên cứu 17 Các đơn vị dẫn đầu sở hữu sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông 17 Sáng chế tiêu biểu 18 Kết luận 18 III GIỚI THIỆU HỆ THỐNG XỬ LÝ DỮ LIỆU CỦA TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH 19 Ứng dụng giao thông 19 Ứng dụng môi trường 20 Ứng dụng y tế 20 Những ứng dụng khác 21 Kết luận 21 Tài liệu tham khảo 23 XU HƯỚNG NGHIÊN CỨU VÀ ỨNG DỤNG TRÍ TUỆ NHÂN TẠO, DỮ LIỆU LỚN VÀ MẠNG LƯỚI KẾT NỐI VẠN VẬT TRONG THÀNH PHỐ THÔNG MINH *********************** I TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU VÀ ỨNG DỤNG AI, BIG DATA VÀ IOT TRONG THÀNH PHỐ THÔNG MINH Thành phố Hồ Chí Minh, thành phố lớn Việt Nam, liên tục phát triển trở thành đô thị đặc biệt trung tâm kinh tế, văn hoá, giáo dục, khoa học công nghệ lớn Việt Nam Tuy nhiên, nhiều tiêu định mức kinh tế nằm ngồi kiểm sốt so với kế hoạch vấn đề xã hội lũ lụt, ùn tắc giao thông bệnh tật Hơn nữa, vấn đề kinh tế công nghệ lạc hậu hiệu thấp thách thức cho phát triển kinh tế xã hội người Thành phố Hồ Chí Minh Sự bùng nổ cơng nghệ thời đại cách mạng công nghiệp 4.0 bao gồm mạng lưới kết nối Internet vạn vật, phát triển vượt bật trí tuệ nhân tạo ứng dụng xử lý liệu lớn cho phép xây dựng ứng dụng để khắc phục vấn đề tồn kỳ vọng mang lại lợi ích lớn Công nghệ tảng cách mạng công nghiệp 4.0 Với việc tăng sức mạnh phần cứng giảm chi phí, hội tụ kết nối Internet vạn vật (IoT), liệu lớn (Big data) mà tạo ra, khả làm cho có ý nghĩa thơng qua trí tuệ nhân tạo (AI) đến thời điểm sẵn sàng cho việc thực hoá ý tưởng mà trước có khoa học viễn tưởng góp phần tham gia vào cách mạnh cơng nghiệp 4.0 Sau xin giới thiệu ngắn gọn công nghệ tảng đề cập (1) mạng lưới kết nối Internet vạn vật (IoT), (2) Dữ liệu lớn (Big data) (3) Trí tuệ nhận tạo (AI) 1.1 Mạng lưới kết nối Internet vạn vật IoT thuật ngữ đưa Kevin Ashton (nhà khoa học đồng sáng lập kiêm giám đốc điều hành Auto-ID Center, Đại học MIT) vào năm 1999 Tuy vậy, từ đầu năm 1980 có thiết bị kết nối Internet máy bán nước giải khát Coke Carnegie Melon University Thuật ngữ IoT thực phổ biến sau hội nghị giới công nghệ thông tin (Internet Protocol version - Giao thức mạng Internet hệ 6) lần thứ diễn Pháp năm 2014 Theo wikipedia.org, IoT kịch giới, mà đồ vật, người cung cấp định danh riêng mình, tất có khả truyền tải, trao đổi thơng tin, liệu qua mạng mà không cần đến tương tác trực tiếp người với người, hay người với máy tính IoT phát triển từ hội tụ công nghệ không dây, công nghệ vi điện tử Internet Nói đơn giản tập hợp thiết bị có khả kết nối với nhau, với Internet với giới bên ngồi để thực cơng việc Internet Vạn Vật cung cấp kết nối chuyên sâu cho thiết bị, hệ thống dịch vụ, kết nối mang hiệu vượt trội so với kiểu truyền tải máy-máy (M2M), đồng thời hỗ trợ da dạng giao thức, miền (domain), ứng dụng Kết nối thiết bị nhúng (luôn vật dụng thông minh), kỳ vọng mở kỷ nguyên tự động hóa hầu hết ngành, từ ứng dụng chuyên sâu điện lưới thông minh, mở rộng tới lĩnh vực khác thành phố thơng minh Hình Mô tả tương tác mạng lưới thiết bị kết nối Internet Trong IoT, "vạn vật/đối tượng thông minh" trở thành đối tượng tham gia tích cực vào kinh doanh, q trình thơng tin xã hội, nơi chúng tạo khả để tương tác giao tiếp chúng với với môi trường cách trao đổi liệu thông tin "cảm nhận được" môi trường, tự động phản ứng với kiện "thế giới vật chất/thực tế" tác động đến cách thực quy trình kích hoạt hành động tạo dịch vụ có khơng có can thiệp trực tiếp người Các dịch vụ tương tác với "vật thể/đối tượng thông minh" cách sử dụng giao diện tiêu chuẩn cung cấp liên kết cần thiết thông qua Internet, truy vấn thay đổi trạng thái chúng truy xuất thơng tin liên quan đến chúng, có tính đến vấn đề bảo mật riêng tư Tóm lại, IoT khái niệm cách mạng hoá thiết bị từ bình thường sang "thơng minh" thơng qua việc ứng dụng tích hợp thêm cảm biến, truyền động, công nghệ truyền liệu thiết bị Trong đó, việc thu thập liệu từ thiết bị, truyền liệu qua mạng thực tác vụ dựa việc trích xuất liệu thu thập ba chức ứng dụng IoT Do đó, hội tụ công nghệ cho thu thập liệu, phân tích vận dụng, điều khiển tự động hố, hệ thống nhúng, truyền thông, ổn định độ tin cậy, bảo mật tạo thành công nghệ IoT IoT tin tưởng kỳ vọng mang lại lợi ích lớn ứng dụng chuỗi cung ứng, vận tải, nông nghiệp ngành sản xuất, đặc biệt nước phát triển Việt Nam Đến năm 2020, thấy phát triển hành lang Siêu thành phố thành phố kết nối mạng, hợp có thương hiệu Với 20% dân số giới dự kiến sống đô thị vào năm 2025, q trình thị hóa xu hướng tác động đến sống tính di động cá nhân tương lai Việc mở rộng ranh giới thành phố nhanh chóng, gia tăng dân số phát triển sở hạ tầng, buộc ranh giới thành phố mở bên bao chùm lên thành phố vệ tinh xung quanh để tạo thành Siêu thành phố, với dân số 10 triệu người Đến năm 2023, có 30 siêu thành phố tồn cầu, với 55% số kinh tế phát triển Ấn Độ, Trung Quốc, Nga Mỹ Latinh Điều dẫn đến phát triển thành phố thơng minh với tám tính thơng minh, bao gồm: Kinh tế thơng minh (Smart Economy), Tịa nhà thông minh (Smart Buildings), Di chuyển thông minh (Smart Mobility), Năng lượng thông minh (Smart Energy), Công nghệ thông tin Truyền thông thông minh (Smart Information Communication and Technology), Quy hoạch thông minh (Smart Planning), Công dân thông minh (Smart Citizen) Chính phủ thơng minh (Smart Governance) Vào năm 2025, giới có khoảng 40 thành phố thơng minh 10 Vai trị quyền thành phố đặc biệt quan trọng để triển khai IoT Vận hành hoạt động hàng ngày thành phố tạo chiến lược phát triển đô thị thúc đẩy việc sử dụng IoT Do đó, thành phố dịch vụ chúng tảng gần lý tưởng cho nghiên cứu IoT, có tính đến yêu cầu thành phố biến chúng thành giải pháp hỗ trợ công nghệ IoT Ở Châu Âu, sáng kiến thành phố thông minh tập trung hoàn toàn vào IoT thực theo dự án Smart Santander Chương trình Nghiên cứu khung (PF7) Dự án nhằm mục đích triển khai sở hạ tầng IoT bao gồm hàng ngàn thiết bị IoT trải khắp số thành phố (Santander, Guildford, Luebeck Belgrade) Điều cho phép đồng thời phát triển đánh giá dịch vụ thực thí nghiệm nghiên cứu khác nhau, qua hỗ trợ tạo mơi trường thành phố thông minh 1.2 Dữ liệu lớn - Theo wikipedia.org: Dữ liệu lớn (Big data) thuật ngữ liệu lớn phức tạp mà phương pháp truyền thống không đủ ứng dụng để xử lý liệu - Theo Gartner: Dữ liệu lớn nguồn thơng tin có đặc điểm chung khối lượng lớn, tốc độ nhanh liệu định dạng nhiều hình thức khác nhau, muốn khai thác địi hỏi phải có hình thức xử lý để đưa định, khám phá tối ưu hóa quy trình Tóm lại, liệu lớn thuật ngữ cho tập liệu lớn phức tạp mà phần mềm ứng dụng xử lý liệu truyền thống không đủ khả để xử lý chúng Các tác vụ tập liệu lớn gồm lưu trữ, phân tích, quản lý liệu, tìm kiếm, chia sẻ, chuyển giao, trực quan hóa, truy vấn, cập nhật bảo mật thông tin thách thức khoa học xử lý liệu Trong thực tế nay, việc phân tích liệu lớn ứng dụng IoT số liệu thống kê tham khảo để phân tích dự báo, phân tích hành vi người dùng, ứng dụng phương pháp xử lý liệu nâng cao (bao gồm trí tuệ nhân tạo) Dữ liệu lớn hình thành chủ yếu từ nguồn: (1) Dữ liệu hành (phát sinh từ chương trình tổ chức, phủ hay phi phủ) Ví dụ, hồ sơ y tế điện tử bệnh viện, hồ sơ bảo hiểm, hồ sơ ngân hàng ; - Dữ liệu từ hoạt động thương mại (phát sinh từ giao dịch hai thực thể) Ví dụ, giao dịch thẻ tín dụng, giao dịch mạng, bao gồm giao dịch từ thiết bị di động; - Dữ liệu từ thiết bị cảm biến thiết bị chụp hình ảnh vệ tinh, cảm biến đường, cảm biến khí hậu; - Dữ liệu từ thiết bị theo dõi, ví dụ theo dõi liệu từ điện thoại di động, GPS; - Dữ liệu từ hành vi, ví dụ tìm kiếm trực tuyến (tìm kiếm sản phẩm, dịch vụ hay thơng tin khác), đọc trang mạng trực tuyến ; - Dữ liệu từ thông tin ý kiến, quan điểm cá nhân, tổ chức, phương tiện thông tin xã hội Phương pháp khai thác quản lý liệu lớn thiết kế phù hợp dựa theo nguồn hình thành liệu lớn Mỗi nguồn liệu lớn khác có phương pháp khai thác quản lý liệu lớn khác Tuy nhiên, phần lớn tổ chức giới dùng Hadoop ecosystem giải pháp tối ưu để khai thác quản lý liệu lớn Hadoop tảng cho phép xử lý phân tán tập liệu lớn, nhiên để vận hành cơng ty cần có chuyên gia khoa học liệu Sự đời giải pháp dịch vụ hỗ trợ xử lý liệu (data-as-a-self-service) cho phép công ty phân tích liệu họ mà khơng cần phải xây dựng phận kỹ thuật khoa học liệu Điều có giá trị cơng ty vừa nhỏ khơng có đủ ngân sách để thuê chuyên gia khoa học liệu phục vụ cho nhu cầu công ty Do đó, có suy giảm nhanh chóng việc sử dụng Hadoop Ngồi ra, cơng ty ưu tiên sử dụng ứng dụng tảng đám mây để giảm chi phí cho việc xây dựng trung tâm liệu, làm cho mô hình data-as-a-self-service trở nên phổ biến Dữ liệu lớn có đặc trưng sau: - Khối lượng liệu: đặc điểm tiêu biểu liệu lớn, khối lượng liệu lớn Kích cỡ Big data ngày tăng lên, tính đến năm 2012 nằm khoảng vài chục terabyte nhiều petabyte (1 petabyte = 1024 terabyte) cho tập hợp liệu Dữ liệu truyền thống lưu trữ thiết bị đĩa mềm, đĩa cứng Nhưng với liệu lớn sử dụng công nghệ “đám mây” đáp ứng khả lưu trữ liệu lớn - Tốc độ: hiểu theo khía cạnh: (a) Khối lượng liệu gia tăng nhanh (mỗi giây có tới 72.9 triệu yêu cầu truy cập tìm kiếm web bán hàng Amazon); (b) Xử lý liệu nhanh mức thời gian thực (real-time), có nghĩa liệu xử lý tức thời sau chúng phát sinh (tính đến mili giây) Các ứng dụng phổ biến lĩnh vực Internet, Tài chính, Ngân hàng, Hàng khơng, Qn sự, Y tế – Sức khỏe phần lớn liệu lớn xử lý real-time Công nghệ xử lý liệu lớn ngày cho phép xử lý tức trước chúng lưu trữ vào sở liệu - Đa dạng: liệu truyền thống hay nói đến liệu có cấu trúc, ngày 80% liệu sinh phi cấu trúc (tài liệu, blog, hình ảnh, video, hát, liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe…) Big data cho phép liên kết phân tích nhiều dạng liệu khác Ví dụ, với bình luận nhóm người dùng Facebook với thông tin video chia sẻ từ Youtube Twitter - Độ tin cậy/chính xác: tính chất phức tạp Dữ liệu lớn độ tin cậy/chính xác liệu Với xu hướng phương tiện truyền thông xã hội (Social Media) mạng xã hội (Social Network) ngày gia tăng mạnh mẽ tính tương tác chia sẻ người dùng Mobile làm cho tranh xác định độ tin cậy & xác liệu ngày khó khăn Bài tốn phân tích loại bỏ liệu thiếu xác nhiễu tính chất quan trọng Big data - Giá trị: đặc điểm quan trọng liệu lớn, bắt đầu triển khai xây dựng liệu lớn việc cần phải làm xác định giá trị thông tin mang lại nào, có định có nên triển khai liệu lớn hay khơng Nếu có liệu lớn mà nhận 1% lợi ích từ nó, khơng nên đầu tư phát triển liệu lớn Kết dự báo xác thể rõ nét giá trị liệu lớn mang lại Ví dụ, từ khối liệu phát sinh trình khám, chữa bệnh giúp dự báo sức khỏe xác hơn, giảm chi phí điều trị chi phí liên quan đến y tế Dữ liệu lớn khác với liệu truyền thống điểm bản: Dữ liệu đa dạng hơn; lưu trữ liệu lớn hơn; truy vấn liệu nhanh hơn; độ xác cao - Dữ liệu đa dạng hơn: khai thác liệu truyền thống (dữ liệu có cấu trúc), thường phải trả lời câu hỏi: Dữ liệu lấy kiểu gì? định dạng liệu nào? Đối với liệu lớn, trả lời câu hỏi Hay nói khác, khai thác, phân tích liệu lớn không cần quan tâm đến kiểu liệu định dạng chúng; điều quan tâm giá trị mà liệu mang lại có đáp ứng cho cơng việc tương lai hay không - Lưu trữ liệu lớn hơn: lưu trữ liệu truyền thống vô phức tạp đặt câu hỏi lưu nào? dung lượng kho lưu trữ đủ? gắn kèm với câu hỏi chi phí đầu tư tương ứng Cơng nghệ lưu trữ liệu lớn phần giải vấn đề nhờ công nghệ lưu trữ đám mây, phân phối lưu trữ liệu phân tán kết hợp liệu phân tán lại với cách xác xử lý nhanh thời gian thực - Truy vấn liệu nhanh hơn: liệu lớn cập nhật liên tục, kho liệu truyền thống cập nhật tình trạng khơng theo dõi thường xun gây tình trạng lỗi cấu trúc truy vấn dẫn đến khơng tìm kiếm thông tin đáp ứng theo yêu cầu - Độ xác cao hơn: liệu lớn đưa vào sử dụng thường kiểm định lại liệu với điều kiện chặt chẽ, số lượng thông tin kiểm tra thông thường lớn, đảm bảo nguồn lấy liệu khơng có tác động người vào thay đổi số liệu thu thập 1.3 Trí tuệ nhân tạo 1.3.1 Trí tuệ nhân tạo nhánh nghiên cứu Trí tuệ nhân tạo (Artificial Intelligence - AI) lĩnh vực nghiên cứu với mục đích tạo chương trình máy móc có khả người Những khả quan trọng người mà lĩnh vực Trí tuệ nhân tạo quan tâm là: (a) khả học, (b) khả biểu diễn tri thức suy diễn, (c) khả nghe-nhìn, (d) khả sử dụng ngôn ngữ, (e) khả thể cử Theo wikipedia.org, AI trí tuệ người lập trình tạo nên với mục tiêu giúp máy tính tự động hóa hành vi thơng minh người Trí tuệ nhân tạo khác với việc lập trình logic ngơn ngữ lập trình việc ứng dụng hệ thống học máy (tiếng Anh: machine learning) để mơ trí tuệ người xử lý mà người làm tốt máy tính Cụ thể, trí tuệ nhân tạo giúp máy tính có trí tuệ người như: biết suy nghĩ lập luận để giải vấn đề, biết giao tiếp hiểu ngơn ngữ, tiếng nói, biết học tự thích nghi,… Trí tuệ nhân tạo bắt đầu nghiên cứu vào năm 1940, trải qua nhiều thăng trầm thành công Hiện (2018), nhờ vào Trí tuệ nhân tạo công ty công nghệ tạo sản phẩm hữu ích độc đáo Tuy vậy, với phát triển mạnh năm gần đây, Trí tuệ nhân tạo để lại khơng lo lắng cho người khả bị máy móc vượt qua tương lai Từ khái niệm đề xuất nhóm nhỏ nhà nghiên cứu thuộc trường đại học Mỹ, lĩnh vực Trí tuệ nhân tạo chia làm nhiều nhánh nghiên cứu con; nhánh quan tâm đến vài khả người trình bày bảng bên Khả Khả học Khả biểu diễn tri thức suy diễn Khả nghenhìn Khả sử dụng ngơn ngữ Khả thể cử Các nhánh nghiên cứu thuộc Trí tuệ nhân tạo Nhánh nghiên cứu Mục tiêu Học máy, Học máy nghiên cứu phát triển Học sâu kỹ thuật giúp cho máy tính học tri thức từ liệu đầu vào Các phương pháp Nhánh cung cấp sở để máy tính biểu diễn tri thức thực việc suy diễn suy diễn người Thị giác máy tính, Xử lý tiếng nói Các nhánh nghiên cứu phát triển kỹ thuật để giúp máy tính nghe nhìn người Nhánh nghiên cứu giúp cho Xử lý ngơn ngữ tự máy tính hiểu ngôn nhiên ngữ mà người sử dụng Nhánh giúp robot thể Robotics hành động cử người Với người, học khả quan trọng; nhờ học tập mà người sở hữu kiến thức kỹ cụ thể Tương tự vậy, Học máy cung cấp kỹ thuật phương pháp để thực nhiều khả khác máy móc; nhiều ứng dụng nhánh Thị giác máy tính, Xử lý tiếng nói Xử lý ngơn ngữ tự nhiên thực nhờ vào kỹ thuật Học máy Học máy nghiên cứu từ ngày đầu lĩnh vực Trí tuệ nhân tạo, nhiều kỹ thuật hữu ích tạo để giúp máy tính học tập từ liệu Trong khoảng thập niên gần đây, kỹ thuật tạo mang lại thành cơng vang dội, Học sâu (Deep learning) Về mặt học thuật, Học sâu kỹ thuật nâng cấp Mạng nơron nhân tạo, kỹ thuật tạo từ ngày đầu thành lập hướng nghiên cứu Trí tuệ nhân tạo Tuy vậy, với nâng cấp nhất, Học sâu chứng minh hiệu nhánh nghiên cứu Thị giác máy tính, Xử lý tiếng nói Xử lý ngôn ngữ tự nhiên 1.3.2 Những thành công học sâu thời gian gần * Xử lý tiếng nói Hai tốn Xử lý tiếng nói Nhận dạng tiếng nói Tổng hợp tiếng nói; Nhận dạng Tiếng nói chuyển tín hiệu âm dạng số sang dạng văn gồm tiếng có đoạn âm, cịn Tổng hợp tiếng nói làm cơng việc ngược lại Hiện có sản phẩm cung cấp hai khả với độ xác tốc độ cao, chí cho Tiếng việt Google search: cung cấp dịch vụ tìm kiếm giao tiếp qua ngôn ngữ tự nhiên, Google search hỗ trợ nhiều ngơn ngữ (có Tiếng việt) Ở số mẫu câu Google hiểu ý người hỏi, tổng hợp câu trả dạng âm đọc lại cho người hỏi Siri: Một sản phẩm tương tự Google Search Siri hãng Apple, sản phẩm cài đặt hệ điều hành iOS Apple Các trang tin tức: Rất nhiều kênh tin tức Tiếng Anh có hỗ trợ tổng hợp tiếng nói (Tiếng Anh) đọc lại cho người nghe, VOA News * Xử lý ngơn ngữ tự nhiên Ngồi chức đơn giản kiểm tra tính đắn mặt từ vựng cú pháp phát triển từ lâu, việc dịch máy - tức chuyển đoạn văn (bài văn) từ ngôn ngữ sang ngơn ngữ khác - thực dễ dàng ứng dụng Google Translate, với kết tốt Gần đây, dạng ứng dụng khác liên quan đến khả hiểu ngôn ngữ tự nhiên quan tâm chatbot Các chatbot hiểu ý người nói chuyện đưa câu trả lời phù hợp với ngữ cảnh nói Do đó, kết hợp với khả nhận dạng tổng hợp tiếng nói đề cập trên, máy tính giao tiếp tự nhiên với người Hiện chatbot nhiều công ty sử dụng làm trợ lý ảo trang mua sắm diễn đàn * Thị giác máy tính Việc trang bị khả nhìn cho máy tính nghiên cứu từ vài thập niên gần đây, vậy, trước năm 2012 kết đạt hạn chế độ xác, tính bền vững với mơi trường làm việc tốc độ tính tốn Với hỗ trợ từ Học sâu, máy tính có khả thực tốn Thị giác máy tính với tốc độ độ xác cao 1.3.3 Nguyên nhân thành công học sâu triển vọng Trước đây, giải tốn Trí tuệ nhân tạo có dùng đến Học máy, nhà phát triển thường xây dựng giải pháp gồm có hai khối cơng việc chính, trình bày Hình (a) Khối nhận vào tín hiệu thơ (ví dụ như, đoạn âm thanh, tập tin văn bản, video); khối thường phải tiền xử lý tín hiệu (như lọc nhiễu) sau tiến hành rút trích biễu diễn đặc trưng mong muốn dạng véc-tơ, gọi véc-tơ đặc trưng Ở bước huấn luyện, chương trình huấn luyện nhận vào hai tập hợp véc-tơ đặc trưng; tập dùng để huấn luyện, tập dùng để kiểm thử chất lượng trình huấn luyện Dựa tập liệu này, chương trình huấn luyện tạo ra định (tùy theo ứng dụng định gọi phân loại, nhận dạng, v.v.) Ở bước làm việc, véc-tơ đặc trưng thu từ rút trích đặc trưng nạp vào định kết cuối (kết cuối nhãn phân loại (bài tốn phân loại), tên định danh (bài tốn nhận dạng), v.v.) Hì nh (a) Tín hiệu đầu vào Bộ rút trích đặc trưng 0.1 0.2 Kết đầu cuối … 0.4 Véc-tơ đặc trưng Hì nh (b) Tín hiệu đầu vào Mạng nơron nhiều lớp Máy tính tốn huấn luyện Kết đầu cuối Hình : (a) cách tiếp cận truyền thống, (b) cách tiếp cận dùng mạng nơron học sâu Nhược điểm cách tiếp cận truyền thống: Cần chuyên gia: cách tiếp cận truyền thống phải cần đến chuyên gia lĩnh vực cụ thể (ví dụ như, Xử lý tiếng nói, Xử lý ngơn ngữ tự nhiên, Thị giác máy tính) để nghiên cứu đề xuất phương pháp rút trích biểu diễn đặc trưng cụ thể; vậy, đặc trưng theo cách gọi đặc trưng thiết kế thủ cơng (handcrafted features) Tính thích nghi thấp: Trước thiết kế, chuyên gia cần phải khảo sát liệu gốc đề xuất ràng buộc điều kiện làm việc cụ thể; đó, đặc trưng thiết kế theo cách khó mở rộng Cách tiếp cận dùng Học sâu trình bày Hình (b); theo đó, tín hiệu thơ nạp vào mạng, mạng tính toán cho kết cuối Theo cách này, mạng không cần đến chuyên gia lĩnh vực để thiết kế trích chọn đặc trưng Các đặc trưng học tự động cách làm Ở bước huấn luyện, đặc trưng học tự động cho toàn mạng cho kết đánh giá tập kiểm thử tốt Cách tiếp cận có nhiều ưu điểm như: (a) thích nghi tốt với điều kiện làm việc, (b) tránh lan truyền lỗi từ khối xử lý trước sang khối tính tốn cách làm truyền thống, (c) tính tốn nhanh nhờ vào cơng nghệ tính tốn song song Tuy vậy, Học sâu có nhược điểm sau: Cần lượng lớn liệu có nhãn: Học sâu cần đến lượng lớn liệu có nhãn (dữ liệu có nhãn liệu thích nhãn kèm Ví dụ, với tốn nhận dạng: ảnh liệu, nhãn tên định danh người ảnh đó.) để huấn luyện, kiểm thử kiểm tra Lượng liệu cần phải bao phủ đầy đủ tình mơi trường làm việc thực tiễn kết cuối với độ xác cao Rất may mắn, nghiên cứu gần cho thấy rằng, việc thiếu thốn liệu huấn luyện giảm nhẹ phần kỹ thuật học chuyển tiếp; đó, trước huấn luyện mạng với tập liệu nhỏ, nhà phát triển sử dụng lại thông số học tốn khác để làm điểm khởi đầu cho q trình học Ngoài ra, kỹ thuật làm giàu liệu (data augmentation) quan trọng để đảm bảo đủ liệu cho huấn luyện mạng Cần kiến trúc mạng phù hợp: Điểm quan trọng ứng dụng Học sâu phải đề xuất kiến trúc mạng phù hợp cho toán cần giải Đây việc khó nhất, u cầu hiểu biết Học máy nói chung Học sâu Việc sử dụng lại nâng cấp mơ hình mạng có cộng đồng nghiên cứu hướng phù hợp cho triển khai ứng dụng Cần cơng nghệ tính tốn song song: Mạng nơron học sâu thường gồm nhiều lớp tính tốn Lượng tham số cần học mạng nơron hữu ích Học sâu thơng thường lên đến vài trăm triệu số Thêm vào đó, lượng liệu huấn luyện thường phải lớn Do đó, việc tính tốn CPU thơng thường khơng phù hợp Rất may mắn, có nhiều cơng nghệ tính tốn song song ứng dụng vào tăng tốc việc tính tốn mạng Điển hình việc sử dụng card đồ họa (GPU) hãng Nvidia, Telsa P100, P40, v.v Khi sử dụng GPU để tính tốn, q trình huấn luyện rút ngắn lại gồm vài ngày thay vài tuần hay tháng (tùy vào toán) Tuy vậy, trình làm việc (inference) có đáp ứng nhanh; ví dụ, với tốn phát vật thể ảnh, giây card xử lý lên đến hàng trăm hình 1.3.4 Các bước ứng dụng học sâu Việc ứng dụng học sâu để giải tốn Trí tuệ nhân tạo bao gồm bước sau: Chuẩn bị liệu: Ở bước người phát triển cần phải chuẩn bị liệu có nhãn để huấn luyện, kiểm thử kiểm tra Cả ba tập phải bao phủ đầy đủ tình thực tiễn triển khai Tuy vậy, lượng liệu tập huấn luyện thường nhiều so với hai tập lại Quá trình làm giàu liệu tiến hành bước lưu lại, tiến hành trực tuyến trước lần nạp liệu huấn luyện vào mạng Xây dựng kiến trúc: Người phát triển cần phải xây dựng kiến trúc mạng phù hợp cho toán Kiến trúc mạng nên thực framework phổ biến Pytorch, Tensorflow, Caffe, v.v Huấn luyện, kiểm thử kiểm tra: Huấn luyện mạng công việc dùng tập liệu huấn luyện để tìm thơng số mạng cho đáp ứng mạng với tập liệu kiểm thử đủ tốt; cách làm kỳ vọng mạng tìm cho kết đánh giá tốt tập kiểm tra dùng thực tiễn Đây công việc tốn nhiều thời gian phải tinh chỉnh siêu tham số phải đợi trình học cho kết chấp nhận Khi huấn luyện, người phát triển thường phải làm việc sau: (a) xây dựng hàm tổn thất, (b) lựa chọn giải thuật huấn luyện, (c) lựa chọn siêu tham số, (d) chạy, quan sát giá trị tổn thất, tinh chỉnh siêu tham số - chí tái kiến trúc mạng Triển khai hệ thống: Nếu q trình huấn luyện thành cơng, người phát triển có mơ hình mạng triển khai thực tiễn Ở bước này, người phát triển cần lựa chọn phương pháp tính tốn phù hợp – tính tốn tập trung máy chủ hay tính tốn phân tán máy trạm Mỗi lựa chọn cho dạng phần cứng khác Với cơng nghệ tính tốn chọn, người phát triển tiến hành thử nghiệm, đánh giá nhân rộng quy mô II PHÂN TÍCH XU HƯỚNG NGHIÊN CỨU VÀ ỨNG DỤNG AI, BIG DATA VÀ IOT TRONG GIAO THÔNG TRÊN CƠ SỞ SỐ LIỆU SÁNG CHẾ QUỐC TẾ Theo báo cáo sơ thành phố thông minh năm 2014 quan tiêu chuẩn ISO IEC ban hành (ISO/IEC JTC Information technology: Smart cities Preliminary Report 2014, 71tr.) cơng nghệ có xu hướng sử dụng thành phố thơng minh gồm có: Ubiquitous computing (tính tốn phổ biến) Networking (mạng) Open data (dữ liệu mở) Big data (dữ liệu lớn) GIS (geographic information system – hệ thống thông tin địa lý) Cloud computing (điện toán đám mây) SOA (service-oriented architecture – kiến trúc hướng dịch vụ) E-government (chính phủ điện tử) Embedded networks (mạng nhúng) Artificial intelligence (trí tuệ nhân tạo) IoT (Internet of Things – mạng lưới kết nối vạn vật) Dựa sở liệu sáng chế quốc tế, nhận thấy IoT, big data AI công nghệ nằm công nghệ dẫn đầu số lượng sáng chế công bố cơng nghệ có xu hướng sử dụng thành phố thông minh Biểu đồ 1: Số lượng sáng chế công nghệ thành phố thông minh theo tài liệu ISO/IEC JTC Khi tiến hành khảo sát tình hình nghiên cứu ứng dụng công nghệ qua công cụ tra cứu học thuật google scholar, kết cho thấy thành phố thông minh, AI, big data IoT công nghệ có số lượng tài liệu cao Biểu đồ 2: Số lượng tài liệu hệ thống google scholar công nghệ thành phố thông minh theo tài liệu ISO/IEC JTC Qua phân tích cho thấy công nghệ quan tâm có hướng ứng dụng thành phố thơng minh Theo tài liệu phát triển thành phố thông minh Đài Loan (Smart city development in Taiwan: the trend and strength of smart city solutions, 10/2017, 38tr.), ngành giao thông việc nghiên cứu ứng dụng AI, big data IoT để quản lý bãi đậu xe, giám sát lưu lượng theo thời gian thực, thu phí điện tử, giải tắc nghẽn giao thơng,… Nguồn: “Smart city development in Taiwan: the trend and strength of smart city solutions”, 10/2017, 38tr Nguồn: “Smart city development in Taiwan: the trend and strength of smart city solutions”, 10/2017, 38tr Hình Nghiên cứu ứng dụng AI, big data IoT giao thơng Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo thời gian Biểu đồ Số lượng sáng chế nghiên cứu ứng dụng AI, big data IoT giao thơng theo thời gian Đến tháng 12/2017, có 5797 sáng chế nghiên cứu ứng dụng IoT, AI big data giao thông công bố 27 quốc gia tổ chức (WO EP) Sáng chế công bố vào năm 1983 Bỉ tác giả Haeghen Marc đề cập đến vấn đề đặt camera quan sát tuyến đường Trong khoảng 10 năm trở lại (2007 – 2017), số lượng sáng chế công bố ngày tăng mạnh Giai đoạn 2014 – 2017, tốc độ tăng trưởng sáng chế công bố tăng gấp lần sau năm Điều chứng tỏ nghiên cứu ứng dụng IoT, AI big data giao thông quan tâm giới Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo quốc gia Biểu đồ Số lượng sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo quốc gia Trong 27 quốc gia Trung Quốc, Hoa Kỳ, Hàn Quốc, Ấn Độ Canada quốc gia dẫn đầu công bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thơng Trong đó, Canada có 70 sáng chế công bố, Ấn Độ với 94 sáng chế, Hàn Quốc có 335 sáng chế, Hoa Kỳ 716 sáng chế Trung Quốc dẫn đầu với 3783 sáng chế Có thể kết luận rằng, nghiên cứu ứng dụng AI, big data IoT giao thông quan tâm quốc gia Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo hướng nghiên cứu Biểu đồ Tình hình cơng bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông theo hướng nghiên cứu Trên sở liệu sáng chế công bố, nhận thấy nghiên cứu ứng dụng AI, big data IoT giao thơng theo hướng chính, hệ thống/phương pháp xử lý liệu, truyền liệu số hệ thống kiểm sốt Trong đó, hệ thống/phương pháp xử lý liệu chiếm tỷ lệ cao nhất, cho thấy hướng nghiên cứu nhà sáng chế quan tâm Các đơn vị dẫn đầu sở hữu sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông Biểu đồ Các đơn vị dẫn đầu sở hữu sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông Trong 10 đơn vị dẫn đầu sở hữu sáng chế, có tên tuổi quen thuộc giới SamSung, Qualcomn, Microsoft, ZTE, Intel Trong đó, Samsung Electronics đơn vị sở hữu nhiều sáng chế với 88 sáng chế Sáng chế tiêu biểu Infrastructure-based collision warning using artificial intelligence (Cảnh báo va chạm dựa sở hạ tầng sử dụng trí tuệ nhân tạo) Tác giả: Wolterman M Số công bố: US7317406B2 Thời điểm công bố: 12/2017 Quốc gia cấp bằng: Hoa Kỳ Đơn vị sở hữu: Toyota Tech Cent Usa Inc Sáng chế đề cập đến thiết bị kiểm sốt tín hiệu giao thơng, có phân tích tình dựa trí tuệ nhân tạo xác định giảm tốc dừng đưa dự đoán vi phạm The artificial intelligence traffic light control method and the controller using the vision image analysis (Phương pháp điều khiển đèn giao thơng trí tuệ nhân tạo điều khiển sử dụng phân tích hình ảnh thị giác) Tác giả: KIM K H Số công bố: KR2017123457A Thời điểm công bố: 11/2017 Quốc gia cấp bằng: Hàn Quốc Sáng chế đề cập đến điều khiển ánh sáng thông minh nhân tạo bao gồm camera cài đặt giao lộ, nơi tín hiệu giao thơng cài đặt giao lộ phân tích hình ảnh thị giác phân loại hình ảnh chụp camera Kết luận - Đến 2017, có 5797 sáng chế nghiên cứu ứng dụng IoT, AI big data giao thông công bố 27 quốc gia tổ chức Số lượng sáng chế công bố ngày tăng khoảng 10 năm trở lại đây, đặc biệt tăng mạnh giai đoạn 2014 – 2017 chứng tỏ vấn đề quan tâm giới - Trung Quốc, Hoa Kỳ, Hàn Quốc, Ấn Độ Canada quốc gia dẫn đầu công bố sáng chế nghiên cứu ứng dụng AI, big data IoT giao thông - Nghiên cứu ứng dụng AI, big data IoT giao thông tập trung vào hướng chính, là: “hệ thống/phương pháp xử lý liệu”, “truyền liệu số” “hệ thống kiểm sốt” Trong đó, “hệ thống/phương pháp xử lý liệu” hướng nghiên cứu nhà sáng chế quan tâm nhiều III GIỚI THIỆU HỆ THỐNG XỬ LÝ DỮ LIỆU CỦA TRƯỜNG ĐẠI HỌC BÁCH KHOA – ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH Ứng dụng giao thông Hệ thống giao thông thông minh ứng dụng điển hình kết hợp khái niệm Kết nối Internet vạn vật, Dữ liệu lớn Trí tuệ nhân tạo Ở mức nhất, ngữ cảnh Việt nam, Kết nối vạn vật thể điểm điện thoại di động hành khách người điều khiển phương hay GPS phương tiện kết nối trung tâm Ngoài ra, giao lộ hay điểm quan sát, camera cài đặt để thu thập hình ảnh giao thông truyền trực tuyến trung tâm Với thiết bị có tính kết nối đó, thu thập lượng lớn số liệu từ GPS từ camera đơn vị thời gian Vì lượng liệu lớn, khơng thể phân tích hiệu phương pháp thủ công, phải cần đến kỹ thuật Trí tuệ nhân tạo Hiện tại, Khoa Khoa học Kỹ thuật máy tính Đại học Bách Khoa Tp.HCM thử nghiệm kỹ thuật phân tích cho dạng liệu GPS hình ảnh nhằm cho thông tin liên quan mật độ, lưu lượng, vận tốc phương tiện giao thông Đặc biệt với tín hiệu thu từ camera, toán phân loại loại xe (xe máy, xe bánh, xe bus, xe tải), nhận dạng biển số xe giải Kết thu khả quan tiến trình kết hợp với tập đồn VNPT để ứng dụng quy mô lớn Một số kết phân tích video giao thơng minh họa Hình sau (a) (b) (c) Hình 3: (a) Kết phát xe từ video (màu hình bao thể loại phương tiện), (b) Kết theo vết phương tiện giao thông, (c) Kết nhận dạng biển số xe Ứng dụng mơi trường Ơ nhiễm mơi trường bao gồm khơng khí, nguồn nước tiếng ồn thực trạng gây ảnh hưởng đến sức khoẻ sống người dân thành phố Hiện nay, nhà nước ban hành luật quy định việc giám sát môi trường đặc biệt khu công nghệp nhu cầu việc xây dựng trạm quan trắc môi trường thiết yếu Nhờ việc ứng dụng mạng kết nối Internet vạn vật bao gồm cảm biến chất lượng khơng khí, chất lượng nước tiếng ồn, liệu hệ thống quan trắc thu thập ghi nhận làm minh chứng để xử lý có vi phạm xảy Bên cạnh đó, hệ thống quan trắc cịn đưa cảnh báo dự báo cho người dân sống xung quanh khu vực biết trạng mơi trường Ngồi việc triển khai trạm quan trắc khu cơng nghiệp, triển khai trạm quan trắc khắp thành phố để thu thập tạo sở liệu lớn để việc phân tích dự báo thay đổi thời tiết ĐHBK triển khai nhiều hệ thống quan trắc khu cơng nghiệp khu vực TP Hồ Chí Minh bao gồm Củ Chi, Hóc Mơn tỉnh lân cận bao gồm Trà Vinh, Vĩnh Long Hình minh hoạ hệ thống quan trắc nước thải khu cơng nghiệp COD, DO, pH, … Hình 4: Hệ thống quan trắc nước thải khu công nghiệp Ứng dụng y tế Hiện thiết bị đeo phổ biến, chức thiết bị giải trí, chúng cịn có khả đo đạc nhịp tim huyết áp, hỗ trợ kết nối truyền thông tin trung tâm Các thiết bị đo đạc đường huyết nhỏ gọn xách tay nhà hay du lịch phương tiện giúp thu thập số đường huyết người bệnh truyền trung tâm Với thiết bị vậy, đơn vị y tế cung cấp dịch vụ theo dõi chăm sóc tốt cho bệnh nhân Tại sở y tế, lượng liệu sinh từ máy chụp cắt lớp CT MRI lớn Với dạng liệu này, chun gia y tế khơng thể nhìn trực tiếp vào điểm khối liệu chiều; đó, họ tốn nhiều thời gian để tương tác với phần mềm để xem xét lát cắt chiều Với kỹ thuật Trí tuệ nhân tạo, máy tính tự động phát tổn thương thể u gan phổi, sau hiển thị đối tượng phát cách trực quan Hiện tại, trình làm việc với loại ảnh CT MRI thử nghiệm thành công Khoa Khoa học Kỹ thuật máy tính Đại học Bách Khoa Tp.HCM, kết hợp với Bệnh viện Đại học Y Dược Tp.HCM để đánh giá toàn diện thử nghiệm thực tiễn Nguyên lý số kết hệ thống minh họa Hình sau Hình 5: Ứng dụng Trí tuệ nhân tạo phân tích ảnh chụp CT MRI Những ứng dụng khác Ngoài ứng dụng trọng điểm trên, số ứng dụng khác nghiên cứu triển khai mơ hình thành phố thơng minh như: Ứng dụng giám sát tình hình an ninh trật tự khu phố qua hệ thống camera Ứng dụng hỗ trợ tìm chỗ đỗ xe thành phố Ứng dụng điều tiết ra-vào trạm khu chế xuất kho hang Ứng dụng thiết bị robot không người lái để giám sát khu vực mà người khó tiếp cận Kết luận Các công nghệ Kết nối Internet vạn vật (IoT), Dữ liệu lớn (Big Data) Trí tuệ nhân tạo (AI) thay đổi cách sống, làm việc tạo nhiều hội Một thành phố thơng minh chứa hàng trăm nghìn cảm biến tạo lượng lớn liệu, thơng qua việc ứng dụng trí tuệ nhân tạo để phân tích cho phép dịch vụ thành phố đáp ứng tốt nhu cầu người dân Bằng cách này, doanh nghiệp tổ chức khác cung cấp cho khách hàng họ nhiều dịch vụ cá nhân hóa hơn, phù hợp với nhu cầu họ Để hiểu rõ có hướng tiếp cận phù hợp việc xây dựng thành phố thơng minh, cần có chương trình nghiên cứu lộ trình triển khai hợp lý, phù hợp với đặc thù riêng thành phố Thành phố Hồ Chí Minh (thơng qua Sở Khoa học Cơng nghệ khoa Khoa học & Kỹ thuật Máy tính, Trường Đại học Bách Khoa-ĐHQG Tp HCM) xây dựng khung chương trình nghiên cứu cho giai đoạn đến Mỗi địa phương/thành phố cần có định hướng khung chương trình nghiên cứu riêng để tạo điều kiện cần cho việc xây dựng thành phố thông minh Tài liệu tham khảo Anh Tùng (2017), Internet kết nối vạn vật, tạp chí STINFO, số 7, 8tr Nguyễn Công Hoan (2015), Tổng quan liệu lớn, Kỷ yếu Hội thảo khoa học “Thống kê Nhà nước với Dữ liệu lớn”, 7tr Nguyễn Quang Hoan (2007), Nhập mơn trí tuệ nhân tạo, Học Viện Cơng nghệ Bưu Chính Viễn Thơng, Hà Nội, 165tr Tổng luận Internet vạn vật: tương lai, Cục Thông tin Khoa học Công nghệ Quốc gia, số 5, 2017, 54tr Viktor Mayer-Schonberger Kenneth Cukier; Vũ Duy Mẫn dịch (2017), Dữ liệu lớn: cách mạng làm thay đổi cách sống, làm việc tư duy, Nxb.Trẻ, 304tr ISO/IEC JTC Information technology: smart cities preliminary report 2014, 71tr., truy cập từ trang https://www.iso.org/ Smart city development in Taiwan: the trend and strength of smart city solutions, 2017, 38tr., truy cập từ trang https://www.cdti.es/ https://www.derwentinnovation.com/ https://www.wikipedia.org/ ... MẠNG LƯỚI KẾT NỐI VẠN VẬT TRONG THÀNH PHỐ THÔNG MINH *********************** I TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU VÀ ỨNG DỤNG AI, BIG DATA VÀ IOT TRONG THÀNH PHỐ THÔNG MINH Thành phố Hồ Chí Minh, thành. .. MINH Ứng dụng giao thông Hệ thống giao thông thông minh ứng dụng điển hình kết hợp khái niệm Kết nối Internet vạn vật, Dữ liệu lớn Trí tuệ nhân tạo Ở mức nhất, ngữ cảnh Việt nam, Kết nối vạn vật. .. 20 Ứng dụng y tế 20 Những ứng dụng khác 21 Kết luận 21 Tài liệu tham khảo 23 XU HƯỚNG NGHIÊN CỨU VÀ ỨNG DỤNG TRÍ TUỆ NHÂN TẠO, DỮ LIỆU LỚN VÀ MẠNG