Báo cáo lĩnh vực liên quan đến mô phỏng, tính toán các hiệu ứng, hiện tượng vật lý, về các hệ thống điều khiển, mạng máy tính và các ứng dụng kỹ thuật của máy tính, ghép nối các thiết bị đo với máy tính …
GIỚI THIỆU VỀ CHUYÊN NGÀNH VẬT LÝ TIN HỌC
Giới thiệu về Bộ môn Vật lý tin học
Bộ môn Vật lý Tin học thuộc Khoa Vật lý - Vật lý Kỹ thuật, Trường Đại học Khoa học
Tự nhiên, Đại học Quốc gia TPHCM được thành lập vào năm 1998.
Vật lý Tin học là ngành khoa học liên ngành kết hợp giữa Vật lý, điện tử và khoa học máy tính Người học được đào tạo các kiến thức về khoa học cơ bản, Vật lý, điện tử, các phần mềm, các thuật toán máy tính, … để ứng dụng vào việc thiết kế hệ thống điện tử ứng dụng, phát triển các phần mềm ứng dụng và khoa học tính toán trên máy tính thông qua các cơ chế kết nối, vận hành và truyền thông dữ liệu.
Hình 1.1 Minh Hoạ Bộ môn Vật lý Tin học
Giới thiệu về nhân sự Bộ môn Vật lý tin học
Bộ môn Vật lý Tin học có 15 cán bộ bao gồm: 1 PGS, 5 TS, 6 NCS, 3 ThS.
Bảng 1.1 Danh sách cán bộ của Bộ môn Vật lý tin học
Hữu Chức Vụ Hướng Nghiên Cứu
Phân loại tín hiệu điện não đồ (EEG);
Nghiên cứu tín hiệu điện cơ (EMG);
Kiểm soát tiếng ồn (ANC); tiếng vọng âm thanh (AEC);
Thuật toán học máy, học sâu
Pin năng lượng mặt trời.
Phó bộ môn Ứng dụng Web
Ứng dụng phần mềm điện thoại
Chí Linh Giảng Viên Lý thuyết hạt
Từ học: Nghiên cứu lý thuyết hiệu ứng Spin Hall
Nhiệt điện : Nghiên cứu tính chất nhiệt điện của vật liệu bán dẫn
Quang học : Tính toán hệ số điện môi, exciton trong vật liệu 2 chiều.
Bán dẫn : Nghiên cứu các hệ defects trong vật liệu oxit.
Giảng Viên Công nghệ Nano
Từ học: Nghiên cứu lý thuyết hiệu ứng Spin Hall
Nhiệt điện: Nghiên cứu tính chất nhiệt điện của vật liệu bán dẫn.
Bán dẫn: Nghiên cứu các hệ defects trong vật liệu oxit.
Giảng Viên Xử lý tín hiệu số
Ứng dụng App ThS Hồ Văn
Bình Giảng Viên Vi điều khiển
Giảng Viên Applied Nuclear Physics in Industry (NDT)
Phân loại tín hiệu điện não đồ (EEG);
Phân loại tín hiệu điện não đồ (EEG);
Nghiên cứu tín hiệu điện cơ (EMG);
Kiểm soát tiếng ồn (ANC); tiếng vọng âm thanh (AEC);
Hình tượng hóa dữ liệu và phân tích dữ liệu lớn
(Visualization and big data analysis)
Giảng Viên Công nghệ đóng gói LED (LED packaging) tiên tiến
Thiết kế quang học LED (Optical Design)
LED chiếu sáng (LED lighting)
Tính chất quang vật liệu ZnO, TiO2,…ứng dụng trong chiếu sáng
Mô phỏng và thực nghiệm phân bố nhiệt của LED
LED ứng dụng cho nông nghiệp và an ninh.
Mô hình hóa nguồn sáng, vật liệu phát quang.
Thiết kế phổ phát quang bằng mô phỏng và thực nghiệm.
Công nghệ chống rò rỉ ánh sáng xanh cho LED ( anti-blue light leakage).
Công nghệ chống chói cho chiếu sáng.
Hiệu suất lượng tử của vật liệu phát quang (YAG:Ce; doped -YAGG phosphor)
LED cực tím, LED phát bức xạ khả kiến, LED phát bức xạ hồng ngoại.
Xử lý tín hiệu y - tin sinh học
Giảng Viên Phân loại tín hiệu điện não đồ (EEG)
Thị Tú Trinh Giảng Viên
Mạng vô tuyến nhận thức (CR)
Kỹ thuật đa truy cập phi trực giao (NOMA)
Kỹ thuật phần tử phản xạ thông minh (IRS)
Giới thiệu về Chương trình đào tạo giai đoạn chuyên ngành
1.3.1 Các hướng nghiên cứu (làm khóa luận tốt nghiệp)
Các hướng nghiên cứu Bộ môn Vật lý Tin học:
Phân tích hình ảnh y khoa để trích xuất thông tin hữu ích như phát hiện bệnh, đo kích thước, phân tích cấu trúc nội tạng
Máy học trong xử lý ảnh y khoa: sử dụng các thuật toán học sâu để hỗ trợ các nhiệm vụ xử lý và phân tích ảnh y khoa.
Xây dựng mô hình 3D cơ quan nội tạng dựa trên hình ảnh y khoa 3D để hiểu rõ hơn về tình trạng bệnh lý.
Tái tạo và kết xuất 3D: xây dựng lại mô hình 3D của cấu trúc giải phẫu từ hình ảnh y khoa để mô phỏng và hỗ trợ can thiệp.
Ảnh chụp cắt lớp (Tomography): sử dụng kỹ thuật tomography như CT (Computed Tomography) hoặc MRI (Magnetic Resonance Imaging) để tạo ra hình ảnh 3D của cơ thể, giúp chẩn đoán và theo dõi các bệnh lý.
Phát triển công cụ y tế dựa trên ảnh: xây dựng các ứng dụng và công cụ dựa trên hình ảnh y khoa, như phần mềm hỗ trợ quyết định lâm sàng, ứng dụng di động cho bác sĩ, hoặc hệ thống quản lý hình ảnh y khoa.
Phân loại, nhận diện các tín hiệu điện não (EEG), điện cơ (EMG), điện tim (ECG)
Phát triển các thuật toán máy học cho phân loại tín hiệu y khoa: nghiên cứu về việc sử dụng học máy và trí tuệ nhân tạo để xây dựng các thuật toán và mô hình máy tính để phân loại các tín hiệu EEG, EMG và ECG
Kết hợp nhiều loại tín hiệu y khoa: nghiên cứu về cách kết hợp thông tin từ nhiều loại tín hiệu y khoa khác nhau để cải thiện độ chính xác trong phân loại và nhận diện.
Xử lý tín hiệu thời gian thực: xử lý và phân loại tín hiệu y tế trong thời gian thực, có thể được áp dụng trong các ứng dụng theo dõi bệnh nhân trong thời gian thực hoặc trong phẫu thuật.
Bảo mật và quản lý dữ liệu y tế: đảm bảo tính bảo mật và quyền riêng tư của dữ liệu y tế là một khía cạnh quan trọng trong nghiên cứu này, đặc biệt khi xử lý dữ liệu cá nhân của bệnh nhân.
Hình 1.2 Minh hoạ xử lý ảnh y khoa
Kiểm soát tiếng ồn (ANC), tiếng vọng (AEC), nhiễu âm thanh
Phát triển công nghệ ANC (Active Noise Control): cải tiến các hệ thống ANC, sử dụng cảm biến và thuật toán để giảm tiếng ồn xung quanh môi trường
AEC (Acoustic Echo Cancellation): nghiên cứu về cách loại bỏ tiếng vọng (echo) trong các hệ thống truyền tải âm thanh hoặc video gặp phải trong các cuộc gọi điện thoại, họp trực tuyến, hoặc videoconference.
Hệ thống phát hiện và phân loại các loại tiếng ồn và nhiễu âm thanh không mong muốn, và sau đó áp dụng các biện pháp xử lý hoặc kiểm soát để loại bỏ chúng
Quản lý nhiễu âm thanh trong xử lý tín hiệu: loại bỏ nhiễu âm thanh trong tín hiệu âm thanh, đặc biệt trong các ứng dụng như xử lý giọng nói, nhận dạng giọng nói, hoặc xử lý tín hiệu âm nhạc.
Nghiên cứu phát triển các thiết bị và công nghệ ANC/AEC: mới để kiểm soát tiếng ồn, tiếng vọng, và nhiễu âm thanh.
Nhóm Điện Tử, Vi Mạch Và Hệ Thống Nhúng Iot
Thu thập dữ liệu, cảm biến, đo lường và điều khiển, hiển thị: cảm biến y tế và sức khỏe, cảm biến trong ngành nông nghiệp, hiển thị dữ liệu và tương tác người-máy,…
Hình 1.3 Minh hoạ phân loại và nhận diện các tín hiệu điện
Hình 1.4 Minh hoạ (ANC), (AEC), nhiễu âm
Thiết kế vi mạch số và hệ thống nhúng: thiết kế vi mạch số chất lượng cao, mạng nơ- ron nhúng (Embedded Neural Networks), hệ thống xử lý tín hiệu số,…
Các giải pháp xây dựng hệ thống thông minh, internet kết nối vạn vật (IOT): bảo mật iot, ứng dụng trong quản lý năng lượng và môi trường, mạng IOT,…
Nhóm Các Mô Hình, Dữ Liệu Và Trí Tuệ Nhân Tạo (AI)
Mô phỏng và mô hình hóa: mô hình hóa dự đoán thời tiết, mô phỏng và mô hình hóa trong ngành công nghiệp, mô hình hóa trong y tế và dược phẩm,…
Trí tuệ nhân tạo (AI), mạng nơ-ron, thuật toán học sâu, học máy.
Hình 1.5 Minh hoạ Thu thập dữ liệu, cảm biến
Hình 1.6 Minh hoạ Thiết kế vi mạch
Hình 1.7 Minh hoạ xây dựng thông minh, internet kết nối vạn vật (IoT)
Hình 1.8 Minh hoạ mô phỏng và mô hình
Các mô hình ảo hóa, Big Data, Data Science, …
Mạng máy tính: Mạng không dây và di động, mạng máy tính vùng rộng (WAN) và mạng máy tính cục bộ (LAN), mạng máy tính vận tải, bảo mật mạng,
Lập trình trên điện thoại di động: phát triển ứng dụng di động đa nền tảng, xây dựng ứng dụng di động cho thị trường doanh nghiệp, ứng dụng di động cho giáo dục,…
Cơ hội việc làm
Cử nhân Công nghệ vật lý điện tử và tin học có thể công tác ở những lĩnh vực sau:
Làm việc tại các công ty nước ngoài liên quan đến lĩnh vực công nghệ chế tạo bán dẫn, vi mạch điện tử, các công ty phần mềm như Intel, Robert Bosch, Samsung,
Hình 1.9 Minh hoạ thuật toán học sâu, học máy
Hình 1.10 Minh hoạ phân tích dữ liệu và ảo hóa dữ liệu
Hình 1.11 Minh hoạ Internet cáp quang tốc độ cao
Hình 1.12 Minh hoạ lập trình trên điện thoại di động
Hình 1.13 Minh hoạ phát triển ứng dụng Web
FPT, Viettel, VNPT, Mitsuba, Ryomo, Renesas, Sony, Olympus, Arrive Technologies, On Semiconductors, Ascenx Technologies, Bureau Veritas,…
Giảng dạy và nghiên cứu tại các trường đại học trong nước và quốc tế.
Làm việc và nghiên cứu trong các phòng thí nghiệm của các trường Đại học, các viện nghiên cứu trên toàn quốc.
Làm trong các công ty thuộc các lĩnh vực công nghệ nano, màng mỏng, quang – quang phổ, trung tâm khoa học vật liệu, các trung tâm phân tích, Phòng Thí Nghiệm Công Nghệ Nano ĐHQG TP.HCM, Khu Công nghệ cao TP HCM,…
Làm việc ở Sở khoa học & Công nghệ, bệnh viện và các cơ sở y khoa, công ty, khu chế xuất,…
Tiếp tục học sau đại học tại các nước phát triển cũng như trong nước theo chương trình học bổng của Đại Học Quốc Gia và các chương trình học bổng quốc tế.
Tự lập các dự án khởi nghiệp về lĩnh vực công nghệ kỹ thuật.
Hình 2.1 Minh hoạ đo điện não EEG
NỘI DUNG NGHIÊN CỨU
Giới thiệu về nội dung nghiên cứu
2.1.1 Điện não đồ Điện não đồ có tên tiếng Anh là Electroencephalogram (viết tắt EEG) , đây là một kỹ thuật không xâm lấn cho phép đo hoạt động điện của não bộ Nó dựa trên nguyên lý ghi lại các xung điện sinh ra từ hoạt động của các tế bào thần kinh (neuron) trong não.
Trong nghiên cứu EEG, các điện cực (electrodes) được đặt trên da đầu để ghi lại tín hiệu điện từ vỏ não Những tín hiệu này sau đó được khuếch đại và hiển thị dưới dạng sóng não trên màn hình máy tính.
EEG được chia thành 5 loại sóng cơ bản, mỗi loại có tần số và biên độ đặc trưng:
Sóng Delta (0.5-3 Hz): sóng chậm, liên quan đến giấc ngủ sâu.
Sóng Theta (4-7 Hz): sóng chậm, liên quan đến trạng thái thư giãn, mơ màng.
Sóng Alpha (8-13 Hz): sóng trung bình, liên quan đến trạng thái thức tỉnh, tập trung. Sóng Beta (14-30 Hz): sóng nhanh, liên quan đến trạng thái thức tỉnh, tập trung cao độ. Sóng Gamma (30-100 Hz): sóng rất nhanh, liên quan đến xử lý thông tin, nhận thức.
Phân tích sóng não EEG cho phép nghiên cứu về:
Hoạt động của não trong các trạng thái khác nhau: tỉnh, ngủ, thiền,
Các rối loạn về thần kinh/tâm thần: động kinh, mất ngủ, tự kỷ, Đáp ứng của não với các kích thích bên ngoài: âm thanh, hình ảnh, đau,
Nghiên cứu về nhận thức: chú ý, ghi nhớ, ra quyết định,
2.2.2 Biến đổi Wavelet rời rạc
Biến đổi Wavelet rời rạc có tên tiếng Anh Discrete Wavelet Transform (viết tắt DWT) là một công cụ toán học dùng để xử lý tín hiệu, nén dữ liệu và phân tích ảnh, biến đổi một tín hiệu thành một tập hợp các hệ số sóng con, đặc trưng của mỗi tín hiệu được biểu diễn ở các tỷ lệ khác nhau.
DWT có nhiều dạng khác nhau, tùy vào việc lựa chọn các hàm cơ sở Các hàm cơ sở thường bao gồm hai loại: hàm tỷ lệ (scaling function) và hàm sóng con (wavelet function) Hàm tỷ lệ giúp xấp xỉ tín hiệu ở các tỷ lệ thô, còn hàm sóng con giúp phát hiện các chi tiết ở các tỷ lệ Các hàm cơ sở này phải thỏa mãn một số tính chất, như trực giao (orthogonal) hoặc song trực giao (biorthogonal).
Tính chất trực giao (orthogonal) hoặc song trực giao (biorthogonal) của các hàm cơ sở là rất quan trọng để đảm bảo khả năng tái tạo tín hiệu một cách chính xác từ các hệ số DWT Nếu hệ cơ sở là trực giao, nó có nghĩa là các hàm tỷ lệ và sóng con là trực giao với nhau, điều này giúp đảm bảo rằng không có thông tin nào bị mất trong quá trình biến đổi, làm cho việc lặp lại các bước của biến đổi DWT trở nên dễ dàng và có thể đảm bảo tính chất của một hệ cơ sở ortonormal, giúp tái tạo tín hiệu một cách chính xác và hiệu quả Tính chất này là quan trọng trong các ứng dụng như nén dữ liệu và phục hồi tín hiệu.
Hình 2.2 Minh họa cho tín hiệu 1 chiều
Một số dạng DWT phổ biến là:
DWT của Daubechies: là một tập hợp các DWT được đề xuất bởi nhà toán học Bỉ Ingrid Daubechies vào năm 1988 DWT này dựa trên việc sử dụng các phương trình đệ quy để tạo ra các mẫu rời rạc ngày càng chính xác của một hàm sóng con, mỗi tỷ lệ có độ phân giải gấp đôi tỷ lệ trước đó Trong bài báo cáo khoa học ông Daubechies đã suy ra một tập hợp các hàm sóng con, trong đó hàm sóng con đầu tiên là hàm sóng con của Haar.
Kể từ thời điểm đó lĩnh vực này đã phát triển nhanh chóng và nhiều biến thể của các hàm sóng con gốc của Daubechies đã được phát triển.
Hàm cơ sở Symlet (Symmetric orthogonal wavelet) được giới thiệu bởi Donoho và Johnstone vào năm 1995, là một loại hàm sóng con được sử dụng trong biến đổi Wavelet rời rạc (DWT) Hàm cơ sở Symlet được thiết kế để cân bằng giữa tính chất trực giao và tính chất trực giác (symmetry) Mục tiêu của Symlet là giảm độ lệch (skewness) của hàm sóng con. Để làm rõ những ưu điểm biến đổi Wavelet rời rạc cần phải so sánh với biến đổi Fourier
Trong phân tích Fourier, Biến đổi Fourier rời rạc (DFT) phân tách tín hiệu thành các hàm cơ sở hình sin có tần số khác nhau Không có thông tin nào bị mất trong quá trình chuyển đổi này; nói cách khác, chúng ta có thể khôi phục hoàn toàn tín hiệu gốc từ biểu diễn DFT (FFT) của nó.
Trong phân tích sóng con, biến đổi sóng con rời rạc (DWT) phân tách tín hiệu thành một tập hợp các hàm cơ sở sóng con trực giao lẫn nhau Những hàm này khác với các hàm cơ sở hình sin ở chỗ chúng được định dạng theo không gian, có nghĩa là khác không trên một phần của tổng độ dài tín hiệu Hơn nữa, các hàm sóng con là các phiên bản mở rộng, dịch chuyển và thu phóng của một hàm chung φ, được gọi là sóng mẹ Giống như trong phân tích Fourier, DWT là khả nghịch, vì vậy có thể phục hồi hoàn toàn tín hiệu ban đầu từ biểu diễn DWT của nó.
Không giống như DFT, DWT thực tế đề cập không chỉ đến một biến đổi đơn lẻ, mà thay vào đó là một tập hợp các biến đổi, mỗi biến đổi có một tập hợp các hàm cơ sở sóng con khác nhau, trong đó có tập sóng con của Daubechies, Symlet đóng góp vào việc phân tách xử lý tín hiệu điện não đồ – EEG.
Mô tả quá trình DWT vào quá trình phân tích tín hiệu trong EEG
Phương pháp xử lý tín hiệu EEG
1 Tiền xử lý tín hiệu EEG: Loại bỏ nhiễu, lọc tín hiệu, chuẩn hóa, để chuẩn bị dữ liệu EEG sạch sẽ cho quá trình phân tích.
2 Chọn sóng mẹ phù hợp: Các lựa chọn phổ biến là sóng mẹ Daubechies, Coiflet, Symlet, tùy thuộc vào mục đích phân tích.
3 Phân tích đa tần số bằng DWT: Áp dụng thuật toán DWT để phân rã tín hiệu EEG thành các thành phần tần số khác nhau Các thành phần này tương ứng với các hoạt động não khác nhau.
4 Xử lý và phân tích các hệ số sóng con: Trích xuất các đặc trưng, tính toán năng lượng, biên độ, từ các hệ số sóng con để phân tích hoạt động não liên quan đến tín hiệu EEG.
5 Phân loại và giải thích kết quả: Sử dụng các thuật toán học máy phân loại trạng thái não khác nhau dựa trên các đặc trưng sóng con DWT đã trích xuất Giải thích các kết quả. Ứng dụng thực tiễn của DWT
Phân tích tần số đa cấp:
DWT cho phép phân tách tín hiệu EEG thành các thành phần tần số ở các mức biến đổi khác nhau Điều này giúp xác định sự biến đổi tần số của hoạt động não ở cả các tần số cao và thấp.
Hình 2.3 Quá trình chuyển đổi tín hiệu EEG thô thành hình ảnh tần số thời gian bằng DWT
Thực nghiệm/Các bước nghiên cứu
+ Lần đầu tiên ta phải set up mũ
+ Mình gắn những sensor vào cái mũ
+ Kết nối với lại Emotiv Pro thông qua cái USB
+ Sau đó ta chỉnh Contact Quality đến 100%
+ Mình tiếp tục chỉnh EEG Quality đến 100%
+ Cuối cùng mình tiến hành thu
+ Những hình ảnh cho những gạch đầu dòng
Hình 2.5 Thực hiện lắp ráp sensor vào mũ
Hình 2.6 Kết nối tín hiệu Emotiv Pro thông qua USB
Hình 2.7 Điều chỉnh Contact Quality đến giá trị 100%
Hình 2.8 Tiếp tục thưc hiện điều chỉnh EEG Quality đến 100%
+ Tiếp theo ta thêm 1 tấm hình có 14 dãy tín hiệu (gồm 14 dòng tương ứng với 14 kênh)
Mô tả quy trình + thiết bị
Hình 2.9 Thực nghiệm lấy mẫu trong thực tế
Hình 2.10 14 Kênh khác nhau của tín hiệu EEG
Thí nghiệm cần thu gồm 7 nhãn trong đó có 5 nhãn nguyên âm a,e,i,o,u và 2 nhãn nhị phân 0 và 1
+ Lần đầu tiên ta mở mắt thư giãn ở trước màn hình trong vòng 5 giây
+ Tiếp theo ta sẽ quan sát cái nhãn của mình trên đoạn trình chiếu bằng powerpoint có nền trắng và chữ đen trong vòng 5 giây
+ Sau đó ta bắt đầu nhắm mắt lại và suy nghĩ cái nhãn ta vừa quan sát lúc nãy trong vòng 8 giây
+ Và mở mắt lại sau khi nghe âm thanh vang lên môt tiếng tít là ta xong 1 nhãn và ta tiếp tục quy trình này với 6 nhãn còn lại
+ Tất cả quá trình này sẽ tốn 126 giây ( 2 phút 6 giây) và ta lặp lại cả quá trình này 20 lần
+ Những hình ảnh cho những gạch đầu dòng
+ Tiếp theo ta thêm 1 tấm hình có 14 dãy tín hiệu ( gồm 14 dòng tương ứng với 14 kênh)
Hình 2.11 Mô tả quy trình lấy mẫu Đo Điện Não _ EEG
Thảo luận, phân tích và đánh giá kết quả
Bảng 2.2 Các kết quả nghiên cứu thực nghiệm trên EMOIV EPOC + 14 KÊNH
Về các mô hình Ensemble, Bagged Trees cho kết quả tốt nhất trên cả 4 tập dữ liệu a-e, a-i, a- o, a-u Đặc biệt là trên tập a-u, Bagged Trees đạt độ chính xác 84.0% cao nhất.
Trong các mô hình neural network, không có mô hình nào thực sự vượt trội Kết quả trên các tập dữ liệu khá tương đồng nhau Mô hình Bilayered NN có kết quả tốt nhất trên tập a-o với 74.9%.
So sánh giữa Ensemble Models và Neural Network Models, Ensemble Models nhìn chung cho kết quả tốt hơn Đặc biệt Bagged Trees vượt trội hơn các mô hình NN.
Trong 4 tập dữ liệu, kết quả trên tập a-u thường tốt nhất, tiếp đến là a-o, a-i và cuối cùng là a-e Điều này cho thấy các mô hình dự đoán tốt hơn với các từ có chứa nguyên âm u và o.
Trong các mô hình Ensemble, Bagged Trees cho kết quả tốt nhất, đặc biệt là trên tập dữ liệu e-u với độ chính xác 73.7%.
Trong số các mô hình Neural Network, kết quả khá tương đồng, không mô hình nào thực sự vượt trội Mô hình Narrow NN có kết quả nhỉnh hơn trên cả 3 tập dữ liệu.
So sánh giữa Ensemble và NN thì Ensemble vẫn cho kết quả tốt hơn Tuy nhiên khoảng cách điểm số giữa 2 nhóm mô hình có phần thu hẹp so với trước đó.
Trong 3 tập dữ liệu, kết quả trên tập e-u vẫn cao nhất, tiếp đến là e-o và thấp nhất là e-i.
Hình 2.13 Biểu diễn đồ thị 3 tập dữ liệu e-i, e-o, e-u
Ensemble, Bagged Trees tiếp tục cho kết quả tốt nhất, đặc biệt là 69.7% trên tập i-u.
Trong các mô hình NN, kết quả khá tương đồng, cao nhất là Narrow NN với 55.2% trên tập i-o và 57.1% trên tập i-u.
So sánh giữa 2 nhóm, Ensemble vẫn hơn NN Tuy nhiên khoảng cách điểm số đã thu hẹp lại đáng kể.
Giữa 2 tập dữ liệu, các mô hình dự đoán tốt hơn trên tập i-u so với i-o. o-u
Trong các mô hình Ensemble, Boosted Trees cho kết quả tốt nhất với 64.3%, cao hơn Bagged Trees.
Trong các mô hình NN, Narrow NN vẫn dẫn đầu với 53% điểm số.
Nhìn chung Ensemble vẫn cho kết quả vượt trội hơn so với các mô hình NN. Độ chính xác cao nhất là 64.3% của Boosted Trees và thấp nhất là 50.6% của Bilayered NN. a-e-i-o-u
Trong các mô hình Ensemble, Bagged Trees lại cho kết quả tốt nhất với độ chính xác 41.8%.
Trong số các mô hình Neural Network, Narrow NN có kết quả cao nhất là 34.9%.
So sánh giữa 2 nhóm mô hình, Ensemble vẫn cho kết quả cao hơn đáng kể so với NN Bagged Trees vượt trội hơn hẳn so với các mô hình NN. Độ chính xác trên tập dữ liệu chung thấp hơn nhiều so với các tập riêng lẻ trước đó Cao nhất là 41.8% của Bagged Trees, thấp nhất là 28.5% của SubspaceDiscriminant Điều này cho thấy tập dữ liệu chung phức tạp hơn và khó dự đoán hơn.
Tóm lược nhận xét tổng quan các mô hình
Boosted Trees cho kết quả tốt nhất trong hầu hết các trường hợp so với các mô hình Ensemble khác Độ chính xác cao nhất là 82.2% trên tập a-u.
Bagged Trees cũng cho kết quả tương đối tốt, thường xếp thứ 2 sau Boosted Trees.
Subspace Discriminant và Subspace KNN thường cho kết quả kém nhất trong các mô hình Ensemble.
Về mô hình Neural Network:
Không có sự khác biệt lớn về độ chính xác giữa các kiến trúc mạng khác nhau Narrow NN có xu hướng cho kết quả tốt hơn một chút.
Trong hầu hết các trường hợp, NN cho kết quả kém hơn so với Ensemble Models, đặc biệt là so với Boosted và Bagged Trees.
Độ chính xác giảm dần khi tăng số lớp nguyên âm.
5 lớp (a-e-i-o-u) cho độ chính xác thấp nhất, khoảng 30-40%.
2 lớp (ví dụ a-e) cho độ chính xác cao nhất, có thể đạt trên 80%.
Nhìn chung, Boosted Trees là mô hình hoạt động tốt nhất trên bài toán này. Độ chính xác giảm khi tăng số lớp phân loại Mô hình Ensemble như Boosted/BaggedTrees vẫn cho kết quả tốt hơn Neural Network.