Bài giảng Lý thuyết nhận dạng – Chương 5: Sự phân lớp dựa trên láng giềng gần nhất thông tin đến các bạn những kiến thức về luật K láng giềng gần nhất; quy tắc xây dựng đồ thị và/hoặc; tìm kiếm trên đồ thị và/hoặc.
LÝ THUYẾT NHẬN DẠNG Chương 5: Sự phân lớp dựa láng giềng gần Biên soạn: TS Ngô Hữu Phúc Bộ mơn: Khoa học máy tính Học viện kỹ thuật quân Email: ngohuuphuc76@gmail.com Chương 5: Phân lớp láng giềng gần Giới thiệu Việc xác định kích thước cửa sổ “tốt nhất” áp đặt số mẫu khối Ví dụ: Để ước lượng p(x) từ n mẫu, xác định phần tử trung tâm x tăng kích thước có đủ kn mẫu Các mẫu kn-LGGN x Hàm mật độ xác định: Ta mong muốn: pn x kn / n Vn lim kn and lim kn / n n Chương 5: Phân lớp láng giềng gần n Ví dụ ước lượng mật độ k-LGGN Ước lượng mật độ k-LGGN với k=3 k=5 Chương 5: Phân lớp láng giềng gần Giới thiệu (t) Trong thực tế, phân lớp thường phi tuyến Phương pháp phân lớp “tốt” dựa ước lượng mật độ k-láng giềng gần (LGGN) Quy tắc LGGN: Chọn lớp mẫu huấn luyện gần Khi N → vô cùng, sai số phân lớp LGGN với xác suất PNN giới hạn bởi: PB PNN M PB PB PB M 1 đó, PB sai số Beyes Như vậy, sai số phương pháp LGGN không lần sai số tối ưu Chương 5: Phân lớp láng giềng gần 5.1 Luật k láng giềng gần Luật: Tìm k-LGGN vector chưa biết từ vector huấn luyện Đưa vector chưa biết vào lớp mà có xuất nhiều vector huấn luyên Cận lỗi phân lớp xác định PB Pk NN PNN PB k k tăng, giá trị gần đến sai số tốt Beyes Chương 5: Phân lớp láng giềng gần Ví dụ phân lớp sử dụng k-LGGN Mẫu kiểm tra (xanh cây) đưa vào lớp mầu đỏ k=3, đưa vào lớp mầu xanh dương k=5 Chương 5: Phân lớp láng giềng gần 5.1 Luật k láng giềng gần (t) Khoảng cách sử dụng để tìm k-LGGN: dùng khoảng cách Mahalanobis hay Euclidean Độ phức tạp việc phân lớp: Phương pháp có độ phức tạp O(lN) Có thể tăng hiệu việc sử dụng cấu trúc liệu dạng tìm kiếm Chương 5: Phân lớp láng giềng gần Ví dụ đồ thị and/or cho tìm kiếm Đồ thị and/or dùng để tăng hiệu tìm kiếm k-LGGN Chương 5: Phân lớp láng giềng gần Quy tắc xây dựng đồ thị và/hoặc Mỗi toán ứng với đỉnh đồ thị Nếu có tốn tử quy tốn tốn khác, ví dụ R: a→b, đồ thị có cung gán nhãn từ đỉnh a tới đỉnh b Đối với toán tử quy toán số toán con, ví dụ R: a→b,c,d, ta đưa đỉnh a1, đỉnh biểu diễn tập toán {b,c,d} toán R: a→b,c,d xây dựng sau: Chương 5: Phân lớp láng giềng gần Ví dụ đồ thị và/hoặc Xét tốn sau: Trạng thái ban đầu (bài toán cần giải) a Tập toán tử quy gồm: R1: a→d,e,f R2: a→d,k R3: a→g,h R4: d→b,c R5: f→i R6: f→c,j R7: k→e,l R8: k→h Tập trạng thái kết thúc (các toán sơ cấp) T={b,c,e,j,l} 10 Chương 5: Phân lớp láng giềng gần Ví dụ đồ thị và/hoặc 11 Chương 5: Phân lớp láng giềng gần Tìm kiếm đồ thị và/hoặc Thơng thường, sử dụng tìm kiếm theo chiều sâu để tìm lời giải cho tốn Tìm đến đỉnh u, đỉnh giải hay khơng tùy thuộc thuộc lớp tốn Hàm Solvable sau trả TRUE giải được, không FALSE Function Solvable(u); Begin If u đỉnh kết thúc then {Solvable(u) ← true; stop } If u không đỉnh kết thúc khơng có đỉnh kề then {Solvable(u) ← false; stop } For toán tử R áp dụng u { Ok ← true; For v kề u theo R If Solvable(v) = false then {Ok ← false; exit } If Ok then Solvable(u) ← true; Operator(u) ← R; stop} Solvable(u) ← false; End; 12 Chương 5: Phân lớp láng giềng gần Tìm kiếm đồ thị và/hoặc(tiếp) Biến Ok: với toán tử R áp dụng u, biến Ok nhận giá trị true tất đỉnh v kề u theo R giải được, Ok nhận giá trị false có đỉnh v kề u theo R không giải Hàm Operator(u) ghi lại tốn tử áp dụng thành cơng u, tức Operator(u) = R đỉnh v kề u theo R giải 13 Chương 5: Phân lớp láng giềng gần ... n n Chương 5: Phân lớp láng giềng gần n Ví dụ ước lượng mật độ k-LGGN Ước lượng mật độ k-LGGN với k=3 k=5 Chương 5: Phân lớp láng giềng gần Giới thiệu (t) Trong thực tế, phân lớp thường... dụng cấu trúc liệu dạng tìm kiếm Chương 5: Phân lớp láng giềng gần Ví dụ đồ thị and/or cho tìm kiếm Đồ thị and/or dùng để tăng hiệu tìm kiếm k-LGGN Chương 5: Phân lớp láng giềng gần Quy tắc xây... trạng thái kết thúc (các toán sơ cấp) T={b,c,e,j,l} 10 Chương 5: Phân lớp láng giềng gần Ví dụ đồ thị và/hoặc 11 Chương 5: Phân lớp láng giềng gần Tìm kiếm đồ thị và/hoặc Thơng thường, sử dụng