Đề tài “ Nhận dạng cử chỉ bàn taydùng phân cụm Kmeans và mạng Nơron” của nhóm xây dựng với mong muốn góp một phần thúc đẩy sự phát triển trong nhận dạng cử chỉ, thông qua việc tìm hiểu các thành tựu của các nước khác.Sau khi thực hiện đề tài này, nhóm thực hiện đề tài mong muốn đây sẽ là tài liệu hữu ích cho các ứng dụng trong nhận dạng cử chỉ bàn tay. Vì hiện nay, các công trình nghiên cứu về nhận dạng cử chỉ bàn tay đã thu được nhiều kết quả tốt và có ý nghĩa quan trọng trong một số lĩnh vực như:Về mặt kỹ thuật, công nghệ nhận dạng cử chỉ đã thay đổi cách con người tương tác với hệ thống thiết bị, không còn bó buộc trong những cách tương tác truyền thống (như thông qua bàn phím máy tính hoặc điện thoại…) mà chuyển sang tương tác trực tiếp bằng cử chỉ. Ngoài ra có thể giúp người khiếm thính nhận biết ngôn ngữ qua cử chỉ bàn tay.Về mặt nghiên cứu khoa học, các hệ thống nhận dạng cử chỉ hiện tại đều dựa trên phương pháp thống kê và so khớp mẫu. Phương pháp này đòi hỏi các tri thức về nhận dạng và một lượng lớn dữ liệu huấn luyện, bao gồm các dạng cử chỉ, để huấn luyện bộ nhận dạng. Lượng dữ liệu huấn luyện càng lớn, bộ nhận dạng càng có nhiều khả năng đưa ra kết quả chính xác hơn.
Trang 1BỘ GIÁO DỤC & ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM
KHOA ĐIỆN – ĐIỆN TỬ
BỘ MÔN ĐIỆN TỬ VIỄN THÔNG
Trang 2LỜI CẢM ƠN
Trước tiên nhóm thực hiện đề tài xin gửi lời cảm ơn chân thành đến quýthầy cô trong trường Đại Học Sư Phạm Thành Phố Hồ Chí Minh nói chung vàcác thầy cô trong bộ môn Điện Tử - Viễn Thông nói riêng đã tận tình giảng dạy,truyền đạt cho chúng em những kiến thức, kinh nghiệm quý báu trong suốt thờigian qua
Đặc biệt em xin gửi lời cảm ơn đến thầy NGÔ QUỐC CƯỜNG Thầy đãtận tình chỉ bảo, hướng dẫn chúng em trong suốt quá trình thực hiện đồ án Trongthời gian làm việc với Thầy, chúng em không ngừng tiếp thu thêm nhiều kiếnthức bổ ích mà còn học tập được tinh thần làm việc, thái độ nghiên cứu khoa họcnghiêm túc, hiệu quả, đây là những điều rất cần thiết cho chúng em trong suốtquá trình học tập và công tác sau này
Cuối cùng nhóm thực hện đồ án xin gửi lời cảm ơn sâu sắc tới gia đình, bạn
bè đã động viên, đóng góp ý kiến và giúp đỡ trong quá trình học tập, nghiên cứu
và hoàn thành đồ án tốt nghiệp
Do kiến thức còn hạn hẹp và thời gian thực hiện không được nhiều, nênmặc dù nhóm đã cố gắng nhưng vẫn còn nhiều sai sót và hạn chế Nhóm rấtmong nhận được những sữa chữa, góp ý quý báu của quý thầy cô và bạn bè
TP.HCM, ngày tháng năm 2015
Nhóm thực hiện
Võ Đắc ThọTrần Quang Tráng
i
Trang 3PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
1 Thông tin sinh viên
Họ và tên: Trần Quang Tráng MSSV: 09917433
2 Thông tin đề tài
Tên của đề tài: NHẬN DẠNG CỬ CHỈ BÀN TAY DÙNG PHÂN CỤM MEANS VÀ MẠNG NƠ-RON
K-Mục đích của đề tài: Phát hiện bàn tay và nhận dạng được năm cử chỉ bàn tay cơ
bản: một ngón, hai ngón, ba ngón, bốn ngón và năm ngón tay.
Đồ án tốt nghiệp được thực hiện tại: Bộ môn Điện Tử Viễn Thông, Khoa Điện Điện Tử, Trường Đại học Sư Phạm Kỹ Thập Thành Phố Hồ Chí Minh
-Thời gian thực hiện: Từ ngày 01/10/2014 đến 31/12/2014
3 Các nhiệm vụ cụ thể của đề tài
- Tìm hiểu các phương pháp nhận dạng cử chỉ bàn tay qua các bài báo
- Định hướng phương pháp và nghiên cứu thuật toán nhận dạng cử chỉ bàntay
- Nghiên cứu thuật toán phân cụm K-means và phát hiện màu da
- Thực hiện phân cụm K-means và màu da trên matlab
- Nghiên cứu huấn luyện ảnh dùng mạng Nơ-ron
- Thu thập 100 mẫu ảnh và tiến hành huấn luyện
- Nhận dạng năm cử chỉ bàn tay và thiết kế giao diện chương trình
4 Lời cam đoan của sinh viên
Chúng tôi – Võ Đắc Thọ và Trần Quang Tráng cam đoan ĐATN là công trìnhnghiên cứu của chúng tôi dưới sự hướng dẫn của thạc sỹ Ngô Quốc Cường
Trang 4Các kết quả công bố trong ĐATN là trung thực và không sao chép từ bất kỳ côngtrình nào khác.
Trang 5MỤC LỤC
LỜI CẢM ƠN i
PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP ii
MỤC LỤC iv
LIỆT KÊ HÌNH viii
LIỆT KÊ BẢNG x
LIỆT KÊ TỪ VIẾT TẮT xi
TÓM TẮT xii
CHƯƠNG 1 1
GIỚI THIỆU 1
1.1 TỔNG QUAN VỀ NHẬN DẠNG CỬ CHỈ BÀN TAY 1
1.2 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC 2
1.3 Ý NGHĨA CỦA ĐỀ TÀI 3
1.4 MỤC TIÊU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 3
1.4.1 Mục tiêu 4
1.4.2 Phương pháp nghiên cứu 4
1.4.3 Giới hạn đề tài 4
1.5 NỘI DUNG NGHIÊN CỨU ĐỀ TÀI 4
CHƯƠNG 2 5
CƠ SỞ LÝ THUYẾT 5
2.1 NHỮNG VẤN ĐỀ TRONG XỬ LÝ ẢNH 5
2.1.1 Điểm ảnh 5
Trang 62.1.2 Ảnh 5
2.1.3 Độ phân giải của ảnh 6
2.1.4 Mức xám của ảnh 7
2.2.5 Ảnh nhị phân 7
2.2.6 Ảnh màu 7
2.2.7 Khử nhiễu 7
2.2.8 Chỉnh mức xám 8
2.2.9 Nhận dạng ảnh 8
2.2 NHẬN DẠNG CỬ CHỈ BÀN TAY BẰNG DATA GLOVE 9
2.3 NHẬN DẠNG CỬ CHỈ BÀN TAY BẰNG LỊCH SỬ CHUYỂN ĐỘNG 11
2.4 NHẬN DẠNG CỬ CHỈ BÀN TAY BẰNG TÍNH NĂNG TỔ HỢP
17
2.5 XÂY DỰNG HỆ THỐNG NHẬN DẠNG CỬ CHỈ BÀN TAY 21
CHƯƠNG 3 22
PHÂN CỤM VÀ PHÁT HIỆN MÀU DA 22
3.1 PHÂN CỤM DỮ LIỆU 22
3.1.1 Giới thiệu về phân cụm dữ liệu 22
3.1.2 Thuật toán K-means 23
3.1.2.1 Giới thiệu thuật toán K-means 23
3.1.2.2 Khoảng cách Euclidean 24
3.1.2.3 Phần tử trung tâm 24
3.1.2.4 Sơ đồ thuật toán K-means 25
3.2 PHÁT HIỆN MÀU DA DỰA VÀO KHÔNG GIAN MÀU 26
3.2.1 Giới thiệu 26
v
Trang 73.2.2 Các hình thái của ảnh 26
3.2.2.1 Chuyển ảnh màu thành ảnh xám 26
3.2.2.2 Lược đồ xám của ảnh 27
3.2.3 Không gian màu 28
3.2.3.1 Không gian màu RGB 30
3.2.3.2 Không gian màu YCbCr 30
3.2.3.3 Không gian màu HSV 31
3.2.4 Sơ đồ khối phát hiện màu da 32
3.3 PHÁT HIỆN BÀN TAY BẰNG K-MEANS VÀ MÀU DA 32
CHƯƠNG 4 35
HỆ THỐNG NHẬN DẠNG CỬ CHỈ DÙNG MẠNG NƠ-RON 35
4.1 GIỚI THIỆU MẠNG NƠ-RON 35
4.2 CÁC TÍNH CHẤT CỦA MẠNG NƠ-RON NHÂN TẠO 36
4.3 MÔ HÌNH MẠNG NƠ-RON NHÂN TẠO 36
4.4 MẠNG PERCEPTRON 37
4.4.1 Cấu trúc cơ bản 37
4.4.2 Hàm hoạt hóa Perceptron 38
4.5 GIẢI THUẬT LAN TRUYỀN NGƯỢC 41
4.6 HỆ THỐNG NHẬN DẠNG CỬ CHỈ BÀN TAY 46
4.6.1 Huấn luyện ảnh bằng mạng Nơ-ron 46
4.6.2 Hệ thống nhận dạng cử chỉ bàn tay 49
CHƯƠNG 5 51
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 51
5.1 KẾT LUẬN 51
Trang 85.1.1 Những mặt làm được 51
5.1.2 Những mặt chưa làm được 51
5.2 HƯỚNG PHÁT TRIỂN 52
PHỤ LỤC A 53
A1 Chương trình xử lý ảnh vào 53
A2 Chương trình nhận dạng 54
PHỤ LỤC B 55
B1 Giao diện chính 55
B2 Giao diện nhận dạng hình 2D từ máy tính 55
B3 Giao diện nhận dạng trực tiếp 56
TÀI LIỆU THAM KHẢO 57
vii
Trang 9LIỆT KÊ HÌNH
Hình 2.1: Sơ đồ kết nối của hệ thống Data Glove 9
Hình 2.2: Giải thuật theo dỏi găng tay Data Glove 10
Hình 2.3: Định nghĩa sự chuyển động tay 11
Hình 2.4: Lưu đồ nhận dạng cử chỉ qua lịch sử ảnh 12
Hình 2.5: Bộ ROI xác định khu vực phân tích 13
Hình 2.6: Cử chỉ vẩy tay 14
Hình 2.7: Các chuyển động tay 15
16 Hình 2.9: Tiền xử lý ảnh 19
Hình 2.10: Sơ đồ khối hệ thống nhận dạng cử chỉ bàn tay 21
Hình 3.1: Lưu đồ thuật toán K-means 25
Hình 3.2: Ảnh RGB 27
Hình 3.3: Lược đồ histogam 28
Hình 3.4: Các màu cơ sở 29
Hình 3.6: Không gian màu YCbCr 31
Hình 3.7: Không gian màu HSV 32
YHình 3.8: Sơ đồ khối phát hiện màu da 32
Hình 3.10: Phát hiện bàn tay từ hình gốc 3.8(e) 34
Hình 3.11: Tách bàn tay ra khỏi ảnh gốc 34
Hình 3.12: Bàn tay sau khi được resize kích thước 60x50 34
YHình 4.1: Mô hình một mạng Nơ-ron nhân tạo đơn giản 36
Hình 4.2: Mạng perceptron 37
Hình 4.3: Mã unipolar hàm hoạt hoá của perceptron 38
Trang 10Hình 4.4: Mã nhị phân (0,1) của hàm hoạt hóa 39
Hình 4.5: Mã bipolar của hàm hoạt hóa 40
Hình 4.6: Biểu diễn perceptron 2 ngõ vào 41
Hình 4.7: Biểu diễn lớp đơn ba ngỏ vào 42
Hình 4.8: Perceptron đa lớp 42
46 47 47 48 49 50 50 55 55 56
ix
Trang 11LIỆT KÊ BẢNG
17
48
50
Trang 12LIỆT KÊ TỪ VIẾT TẮT
CCD – Change Coupled Device
CCIR – Consultative Committee International Radio
CMOS – Complementary Metal Oxide Semiconductor
CGA – Color Graphic Device
CLARA – Clustering LARge Application
HSV – Hue Saturation Value
MLP – MultiLayer Perceptron
MEMS –Microelectromechanical Systems
NTSC – National Television System Committee
PAL– Phase Alternating Line
PAM – Partitioning Around Medoids
ROI – Region Of Interest
RGB – Red Greed Blue
SVM – Support Vector Machine
xi
Trang 13TÓM TẮT
Ngày nay, nhận dạng nói chung và nhận dạng cử chỉ bàn tay nói riêng là mộtkhái niệm không còn xa lạ bởi ý nghĩa ứng dụng trong thực tế, ví dụ như nhậndạng cử chỉ bàn tay để thông báo hoặc điều khiển hành vi…
Đề tài thực hiện nhận dạng cử chỉ bàn tay sử dụng phương pháp phân cụm dữliệu K-means và huấn luyện mạng Nơ-ron Hệ thống nhận dạng trên gồm haiphần: phần huấn luyện và phần nhận dạng Dữ liệu ảnh mẫu sẽ được chuẩn hóathành ảnh nhị phân Bằng việc so sánh ảnh cần nhận dạng với cơ sở dữ liệu ảnhmẫu thông qua mạng Nơ-ron để phát hiện và nhận dạng cử chỉ bàn tay tươngứng
Nhóm thực hiện huấn luyện 100 ảnh mẫu với 5 cử chỉ bàn tay trong cùng điệukiện sáng Kết quả nhận dạng thành công 90%
Trang 14CHƯƠNG 1
GIỚI THIỆU
1.1 TỔNG QUAN VỀ NHẬN DẠNG CỬ CHỈ BÀN TAY
Trong thời đại công nghệ thông tin hiện nay, các hệ thống máy móc tự động
đã dần thay thế con người trong nhiều công đoạn của công việc Máy móc có khảnăng làm việc hiệu quả, độ chính xác cao và hữu dụng trong môi trường nguy hạiđối với con người, tốc độ xử lý của máy tính, thiết bị ngày càng nhanh Đến nay,việc giao tiếp giữa con người và máy móc còn khá thủ công như thông qua bànphím và các thiết bị nhập dữ liệu
Con người mong muốn máy móc càng thông minh hơn, tốc độ xử lýnhanh hơn và có thể tương tác với người dùng bằng giọng nói là yêu cầu của cácthiết bị trong tương lai Hiện nay trên thế giới các công nghệ nhận dạng cử chỉ đãphát triển, các hệ thống ứng dụng nhận dạng cử chỉ đã được ứng dụng ở nhiềunơi và độ chính xác của các hệ thống ngày càng được cải thiện.Một bộ phận củakhoa học xử lý ảnh là lĩnh vực thị giác máy tính hiện đang thu hút rất nhiều sựquan tâm của các nhà nghiên cứu xử lý ảnh với mục tiêu xây dựng nên một thếgiới trong đó hệ thống thị giác kỳ diệu của con người có thể được mô phỏng bởicác hệ thống máy tính, đem lại khả năng cảm nhận bằng thị giác cho các hệthống về môi trường xung quanh Mơ ước về một hệ thống máy tính có thể hoànhập vào thế giới con người với đầy đủ các giác quan trong đó thị giác đóng vaitrò quan trọng đang dần dần được hiện thực hoá với những đóng góp nghiên cứucủa các nhà khoa học trên phạm vi toàn thế giới
1
Trang 15Hệ thống nhận dạng cử chỉ sẽ có những ứng dụng tuyệt vời trong tất cảcác lĩnh vực của đời sống Nếu được áp dụng thành công thì nó sẽ trở thành mộtcuộc cách mạng trong giao tiếp với máy móc, các ứng dụng của nó sẽ bao trùmlên nhiều lĩnh vực như giúp đở người khuyết tật, công nghiệp, an ninh và giải trí.
1.2 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
a Thế giới
Nhận dạng cử chỉ bàn tay là phương tiện giao tiếp tự nhiên nhất của conngười Chính vì vậy, việc nghiên cứu để máy tính có thể hiểu được cử chỉ bàn taycủa con nguời đã và đang rất phát triển Trong những năm gần đây, nhiều loại hệthống nhận dạng cử chỉ bàn tay đã được đề xuất và phát triển theo hướng thựchành sử dụng vào trong cuộc sống thực cũng như việc nghiên cứu các giải thuậtnhận dạng một cách chính xác hơn
- Nghiên cứu của Dharani Mazumdar, Anjan Kumar Talukda vàKandapar Kumar Sarma nghiên cứu nhận dạng cử chỉ bằng găng taycảm biến Data Glove[4] Bằng việc sữ dụng lối ra số của serson gia tốcMEMS gắn liền với các ngón tay và sử dụng vi điều khiển Máy tínhphân tích và xử lý thông tin dữ liệu và thực hiện các thuật toán
- Nghiên cứu của Chen Chiung Hsieh và Dung Hua Liou về nhận dạng cửchỉ bằng lịch sử chuyển động ảnh[2] Các khung hình được tích lũytrong các hình ảnh lịch sử chuyển động Sử dụng các báo động sai lọc ranếu số lượng điểm ảnh da phát hiện nhỏ hơn một ngưỡng nhất định Hệthống được xây dựng trên các khối: Digital Zoom, phát hiện màu da,nhận dạng cử chỉ
- Chenglong Zu, Xuan Wang, Hejion Huang và Jianping Shen nghiên cứu
về nhận dạng cử chỉ bằng các tính năng tổ hợp[7] Dựa trên các tínhnăng phân biệt màu da, không gian màu YCbCr Nhận dạng bàn tayđược nhận dạng với ba tính năng: bất biến Hu, khu vực cử chỉ bàn tay
và Fourier Và dùng MLP để phân biệt các cử chỉ bàn tay
Trang 16Tới thời điểm này, nhận dạng cử chỉ được giả thiết là được thực hiện trongmôi trường bình thường, không bị ràng buộc bởi bất cứ điều kiện nào.
1.3 Ý NGHĨA CỦA ĐỀ TÀI
Đề tài “ Nhận dạng cử chỉ bàn taydùng phân cụm K-means và mạng ron” của nhóm xây dựng với mong muốn góp một phần thúc đẩy sự phát triểntrong nhận dạng cử chỉ, thông qua việc tìm hiểu các thành tựu của các nước khác.Sau khi thực hiện đề tài này, nhóm thực hiện đề tài mong muốn đây sẽ là tàiliệu hữu ích cho các ứng dụng trong nhận dạng cử chỉ bàn tay Vì hiện nay, cáccông trình nghiên cứu về nhận dạng cử chỉ bàn tay đã thu được nhiều kết quả tốt
Nơ-và có ý nghĩa quan trọng trong một số lĩnh vực như:
- Về mặt kỹ thuật, công nghệ nhận dạng cử chỉ đã thay đổi cách con ngườitương tác với hệ thống thiết bị, không còn bó buộc trong những cách tươngtác truyền thống (như thông qua bàn phím máy tính hoặc điện thoại…) màchuyển sang tương tác trực tiếp bằng cử chỉ Ngoài ra có thể giúp ngườikhiếm thính nhận biết ngôn ngữ qua cử chỉ bàn tay
- Về mặt nghiên cứu khoa học, các hệ thống nhận dạng cử chỉ hiện tại đềudựa trên phương pháp thống kê và so khớp mẫu Phương pháp này đòi hỏicác tri thức về nhận dạng và một lượng lớn dữ liệu huấn luyện, bao gồm các
3
Trang 17dạng cử chỉ, để huấn luyện bộ nhận dạng Lượng dữ liệu huấn luyện cànglớn, bộ nhận dạng càng có nhiều khả năng đưa ra kết quả chính xác hơn.
1.4 MỤC TIÊU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
1.4.1 Mục tiêu
- Thuật toán phân cụm K-means tạo tập mẫu cho huấn luyện và nhận dạngbàn tay
- Xây dựng mô hình nhận dạng cử chỉ bằng mạng Nơ-ron trên matlab
1.4.2 Phương pháp nghiên cứu
- Tìm hiểu các bước thực hiện phương pháp phân cụm trong thuật toán means
K Thực hiện phân cụm KK means và phân biệt màu da trên matlab
- Nghiên cứu tổng quan về mạng Nơ-ron nhân tạo
- Mô phỏng mô hình nhận dạng cử chỉ sử dụng mạng Nơ-ron nhân tạo
1.4.3 Giới hạn đề tài
- Nhóm thực hiên nhận dạng 5 cử chỉ bàn tay
- Số mẫu để huấn luyện bằng mạng Nơ-ron trong 100 mẫu
- Nhận dạng cử chỉ bàn tay thông qua hình ảnh 2D có sẳn và môi trườngkhông phức tạp(điều kiện sáng, độ chói, )
- Nhận dạng thông qua Webcam
1.5 NỘI DUNG NGHIÊN CỨU ĐỀ TÀI
Với đề tài “Nhận dạng cử chỉ bàn tay dùng phân cụm K-means và mạngNơ-ron” nhóm tập trung nghiên cứu các vấn đề cụ thể sau:
Chương 1:Giới thiệu
Chương 2: Cơ sở lý thuyết
Chương 3: Phân cụm và phát hiện màu da
Chương 4: Hệ thống nhận dạng cử chỉ bàn tay dùng mạng Nơ-ron
Chương 5: Kết luận và hướng phát triển
Trang 19CHƯƠNG 2
CƠ SỞ LÝ THUYẾT
2.1 NHỮNG VẤN ĐỀ TRONG XỬ LÝ ẢNH
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để
xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổigần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí(không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó đượcthiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi mộtđiểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trongkhuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)
Định nghĩa:Điểm ảnh là một phần tử của ảnh số tại toạ độ (x, y) với độ
xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó đượcchọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mứcxám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận đượcgọi là một phần tử ảnh
Ảnh được xem như là một tập hợp các điểm ảnh
Bất kỳ hình ảnh từ một máy quét hoặc từ một Camera số hay trong máytính là một hình ảnh kỹ thuật số Hình ảnh máy tính đã được “số hóa”, đây là quátrình chuyển đổi từ hình ảnh màu sắc thực tế thành các dữ liệu số bao gồm cáchàng và cột của hàng triệu mẫu màu được đo từ hình ảnh ban đầu
Trang 20Một máy ảnh kỹ thuật số dùng chip CCD (Change Coupled Device) đằngsau ống kính, CCD bao gồm một mạng lưới các điểm bắt sáng được phủ bằng lớpbọc màu (đỏ - Red, xanh lục – Green, xanh dương – Blue), mỗi điểm ảnh chỉ bắtmột màu Do đó khi chụp ảnh ( cửa sập mở), ánh sáng qua ống kính và được lưulại trên bề mặt chip cảm biến dưới dạng điểm ảnh Mỗi điểm ảnh có một mứcđiện áp khác nhau sẽ được chuyển đến bộ phận đọc giá trị theo từng hàng Giá trịmỗi điểm ảnh sẽ được khuếch đại và được đưa vào bộ chuyển đổi tín hiệu tương
tự sang tín hiệu số, cuối cùng đổ vào bộ xử lý để tái hiện lại hình ảnh đã chụp.chính quá trình đọc thông tin thực hiện theo từng hàng đã làm cho tốc độ xử lýảnh chậm, thiếu hoặc thừa sáng Đối với máy ảnh kỹ thuật số dùng chip CMOStại các điểm bắt sáng có sẵn mạch điện hỗ trợ dễ dàng tích hợp ngay quá trình xử
lý điểm ảnh Với cấu trúc này, mỗi điểm ảnh sẽ được xử lý ngay tại chỗ và đồngloạt truyền tín hiệu số về bộ xử lý để tái hiện hình ảnh đã chụp nên tốc độ xử lýnhanh hơn rất nhiều
Cảm biến nhìn thấy màu sắc và độ sáng của từng khu vực nhỏ là lấy mẫu
Đó là giá trị màu sắc của từng khu vực được đo và ghi thành giá trị số đại diệncho màu sắc Quá trình này được gọi là số hóa hình ảnh Dữ liệu được tổ hợpthành các hàng và cột để giữ lại vị trí của từng khu vực hình ảnh Mỗi giá trị dữliệu đó chính là điểm ảnh Các dữ liệu hình ảnh là bao gồm các giá trị màu RGB
số trong một mạng lưới các hàngvà cột Khi tất cả các dữ liệu ảnh được kết hợplại và sao chép liên tiếp, chính xác trật tự cột trên giấy in hoặc hoặc màn hìnhmáy tính, não bộ con người nhận ra hình ảnh ban đầu
Độ phân giải của ảnh là mật độ điểm ảnh được ấn định trên một ảnh sốđược hiển thị Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọnsao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cáchthích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bốtheo trục x và y trong không gian hai chiều
6
Trang 21Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor)
là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh(320*200) Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hìnhCGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưngdiện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn
Trang 222.2.7 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh :
- Nhiều hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng cácphép lọc
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹthuật nội suy Kỹ thuật này nhằm tăng cường độ mịn cho ảnh
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại
và phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứngdụng trong nhiều ngành khoa học khác nhau Mẫu ở đây có thể là ảnh của vântay, ảnh của một vật nào đó được chọn, một chữ viết khuôn mặt người …
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạnchủ yếu sau đây:
1 Thu nhận dữ liệu và tiền xử lý
2 Biểu diễn dữ liệu
3 Nhận dạng, ra quyết định
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1 Đối sánh mẫu dựa trên các đặc trưng được trích chọn
8
Trang 232 Phân loại thống kê
3 Đối sánh cấu trúc
4 Phân loại dựa trên mạng Nơ-ron nhân tạo
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cậnđơn lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp
và cách tiếp cận khác nhau Do vậy, các phương thức phân loại tổ hợp hay được
sử dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kếcác hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinhtrong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ranhững yêu cầu về tốc độ tính toán Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyêngia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu
2.2 NHẬN DẠNG CỬ CHỈ BÀN TAY BẰNG DATA GLOVE
Nghiên cứu của Dharani Mazumdar, Anjan Kumar Talukda và KandaparKumar Sarma nghiên cứu nhận dạng cử chỉ bằng găng tay cảm biến DataGlove[4] Bằng việc sữ dụng lối ra số của serson gia tốc MEMS gắn liền với cácngón tay và sử dụng vi điều khiển
Hình 2.1: Sơ đồ kết nối của hệ thống Data Glove
Trang 24Phương pháp sử dụng găng tay Data Glove Mặt phẳng màu HSV là mặtphẳng màu hợp lý nhất cho hình ảnh màu sắc phân khúc Người nghiên cứuchuyển đổi không gian màu các khung ảnh vào từ RGB sang mặt phẳng màuHSV Thiết lập phạm vi giá trị màu từ ngưỡng thấp hơn ngưỡng trên cho màu sắcđặt biệt của găng tay, người nghiên cứu có thể dễ dàng loại bỏ các thành phầnkhác của khung ảnh Cuối cùng, kết quả được chuyển đổi sang nhị phân Sau đó,trọng tâm của các thay phân đoạn được xác định và trọng tâm được xác định đểlàm quỷ đạo cử chỉ.
Hình2.2: Giải thuật theo dỏi găng tay Data Glove
Các bược thực hiện nhận dạng cử chỉ bằng Data Glove:
- Bước 1: Các khung ảnh đầu vào được chuyển thành mặt phẳng màu HSB
từ ảnh màu RGB
- Bước 2: Giá trị màu được thiết lập đúng cách với giá trị màu của găng tay
10
Trang 25- Bước 3: Mặt phẳng HSV được chuyển thành mặt phẳng nhị phân vớingưỡng thích hợp.
- Bước 4: Thay đổi sự co giãn trên mặt ảnh nhị phân và phân đoạn ảnh
- Bước 5: Tính trọng tâm của khu vực phân đoạn và sử dụng tính nhữngkhoảng khắc
- Bước 6: Quỷ đạo cử chỉ có thể tìm thấy bằng cách kết nối trọng tâm củacác khu vực phân đoạn
2.3 NHẬN DẠNG CỬ CHỈ BÀN TAY BẰNG LỊCH SỬ CHUYỂN ĐỘNG
Phương pháp nhận dạng cử chỉ bàn tay bằng lịch sử ảnh chuyển động đượcChen Chiung Hsieh và Dung Hua Liou nghiên cứu thích hợp để kiểm soát hầuhết các thiết bị dân dụng[2] Một mô hình màu da thích ứng dựa trên khuôn mặtphát hiện được sử dụng để phát hiện các vùng da giống tay, đến phân loại các cửchỉ bàn tay động, đã phát triển một cách đơn giản và lịch sử chuyển động ảnhdựa trên phương pháp bốn nhóm Haar-like
Cử chỉ bàn taytĩnh và động được thể hiện ở hình 2.4 Các hướng di chuyểnbàn tay được sử dụng để phân loại các cử chỉ bàn tay động trong hình 2.4(a) tới2.4(d) trong khi các phát hiện mặt tĩnh của bàn tay dựa vào sự cố định của khuônmặt trong một thời điểm được thể hiện ở hình 2.4(e) và 2.4(f)
Hình 2.3: Định nghĩa sự chuyển động tay (a) đến (d) và mặt tĩnh của bàn
tay (e) và (f)
Trang 26Biểu đồ của hệ thống được thực hiện là sự xuất hiện của khuôn mặt là mộttrong những thành phần quan trọng Màu nhận dạng khuôn mặt được Viola vàJones nghiên cứu và được mở rộng bởi Lienhart và Maydt Các đặc điểm củaphương pháp này là việc sử dụng các màu đen trắng mẫu để tìm đôi mắt trênkhuôn mặt khác biệt màu da người Do đó, báo động sai sẽ lọc ra nếu số lượngđiểm ảnh da phát hiện trong khu vực khuôn mặt nhỏ hơn mottj ngưỡng nhất định.
Hệ thống này được chia thành ba phần chính: zoom kỹ thuật số, phân biệt màu da
và công nhận cử chỉ bàn tay
Hình 2.4: Lưu đồ nhận dạng cử chỉ qua lịch sử ảnh
- Khối Zoom kỹ thuật số
Khối zoom kỹ thuật số là cần thiết để phóng to hình ảnh xung quanh người sửdụng khi cử chỉ bàn tay người sử dụng ở khoảng cách xa so với máy ảnh Vìvậy, người sử dụng không cần điều chỉnh vị trí của mình Bước này để kíchthước hình ảnh ban đầu mặc định là 320x240 pixels cho độ phân giải máy ảnhbước đầu thiết lập khác nhau Nếu phát hiện khuôn mặt nhỏ hơn so với kíchthước chuẩn của khuôn mặt, người sử dụng có thể điều chỉnh kích thước bằngtay bới các trang bị có khả năng zoom quang học của máy ảnh hoặc bằngcách sữ dụng cung cấp độ zoom tự động bởi suy bi-linear tới vùng quantâm(ROI) tập trung vào khuôn mặt phát hiện Khoảng cách điều hành lýtưởng là khoảng 60 cm trong hệ thống nhận dạng cử chỉ bàn tay Nếu ngườidùng rất xa, họ sẽ xuất hiện nhỏ hơn
12
Trang 27- Phân biệt màu da
Do phạm vi màu da bao gồm nhiều màu da giống nhau Nếu chúng ta xâydựng một mô hình mau da tương thích, tỷ lệ màu sai sẽ giảm đi đáng kể.Bằng cách khai thác thông tin màu da từ khuôn mặt cá nhân để tạo ra các môhình màu da của mỗi người sẽ cải thiện hệ thống mạnh mẽ vì số lượng giảmcủa các biến thể màu sắc trong khuôn mặt và tay của mỗi người
Da thích nghi trên mô hình màu khuôn mặt dựa trên đề xuất của Liou được ápdụng Vùng da mặt được phát hiện có thể thu được bằng cách loại bỏ mắt,mủi, miệng và bằng cách phân tích biểu đồ mức xám Phân bố màu đỏ, xanh
lá cơ bản, màu đỏ ban đầu được giả định là phân bố Gaussian để các phươngtiện và độ lệch chuẩn được tính toán để xây dựng các mô hình màu da thíchnghi Sau đó, có thể sử dụng mô hình màu da để phát hiện các vùng da khác
từ người đó Từ kết quả thí nghiệm, hệ thống có thể phát hiện pixels da đúngngay cả khi nó đang ở trong vùng có điều kiện ánh sáng cực kỳ xấu
- Nhận dạng cử chỉ bàn tay tĩnh
Mặt tĩnh cử chỉ bàn tay được phát hiện dựa trên da thích nghi của mô hìnhmàu Người làm cử chỉ bàn tay nắm tay và vẫy tay trong khu vực nhất định.Các vị trai kích thước khuôn mặt phát hiện được sử dụng để xác định ROInhư trong công thức 2.2
ROI (x , y , width, height )=¿ (2.2)Trng đó khuôn mặt phát hiện được đại diện bởi một vòng tròn với trung tâm(face.x, face.y) và bán kính face.r Các khu vực phát hiện cử chỉ bàn tay tĩnh
là ở phía bên phải của khuôn mặt như được chỉ bởi các hình chữ nhật màu đỏtrong hình 2.5(a) Đó là bộ ROI được dựa trên thói quen của người sử dụngtay phải và có thể thay đổi để bên trai của khuôn mặt nếu người đó thuận taytrái
Trang 28Hình 2.5: Bộ ROI xác định khu vực phân tích
1 Nắm tay: Các ROI phát hiện tay nắm và tiếp tục chia thành bốn khu vựcnhỏ như hình 2.5(b) khi nào người sử dụng thực hiện một nắm tay, kếtquả của vùng da được phát hiện sẽ thể hiện giống hình 2.5(c) Do đó, cửchỉ bàn tay nắm tay có thể xác nhận bằng cách kiểm tra bốn khu vựcnhỏ như trong công thức 2.3
2 Vẫy tay: Nhận dạng cử chỉ vẫy tay là dựa trên chuyển động phát hiện
và trình tự thời gian như trong hình 2.6 Bằng cách quan sát cử chỉ vẫytay trong hình 2.6 Thứ nhất, các chuyển động như thể hiện trong hình2.6 thu được bằng cách trừ liên tục hai khung hình thì kết quả là rõ ràngnhất Thứ hai, các chuyển động kéo dài trong các khoảng thời gian Vìvậy, hai điều kiện để xác định cử chỉ vẫy tay Nếu các kích thước củacác khu vực chuyển động trong ROI được cài sẵn là đủ lớn và kéo dàitrong một khoảng thời gian, thì có thể khẳng định là cử chỉ vẫy tay.Khoảng thời gian được thiết lập khoảng 3s
14
Trang 29Hình 2.6: Cử chỉ vẫy tay
- Nhận dạng cử chỉ bàn tay động
Cử chỉ bàn tay động được thực hiện bới áp dụng các thông tin chuyển động.Biến thể trong khung có thể được tích lũy trong các hình ảnh chuyển độnglịch sử Phương pháp phát hiện theo hướng đơn giản của bàn tay chuyển độngdựa trên chuyển động sau đó hình ảnh lịch sử được đề xuất Bốn nhóm hướng
mô hình được định nghĩa để đo số lượng của hướng
Hình 2.7:Các chuyển động tay (a) Khung trước, (b) Khung hiện tại, (c)
Khung khác biệt ,(d) Các kết quả lịch sử chuyển động ảnh
Trang 301 Lịch sử chuyển động ảnh: Hình 2.7(a) và 2.7(b) cho thấy hai khunghình liên tục và hình 2.7(c) là các khung khác nhau, trong đó các khuvực kết quả là các cùng chuyển động trong một hình ảnh duy nhất, cóđược hình chuyển động như thể hiện hình 2.7(d) Lợi ích của hình ảnhlịch sử chuyển động là có thể duy trì đối tượng quỹ đạo trong mộtkhung hình Thông tin di động được sử dụng để cập nhật các hình ảnhchuyển động lịch sử MHI như trong công thức 2.4, khung khác biệt vàđược thiết lập như là 15 Các giá trị trong MHI là 0-255.
MHI ( x , y ) t=MHI ( x , y ) t−1+DF ( x , y ) t−1−α (2.4)
2 Mô hình Haar-like cho phát hiên hướng: Bốn Haar-like giống như cácmẫu hướng như thể hiện trong hình 2.8 đã được đề xuất để phát hiệnxem bàn tay đang di chuyển lên, xuống, trái, phải Ví dụ, các hình ảnhlịch sử chuyển động trong hình 2.7(d) được sử dụng để phân loại Cáctruy cập trái sẽ được tăng lên rất nhiều lần vì các mô hình trong hình.Hình 2.8(c) phù hợp với lịch sử chuyển động Đó là, nếu các yếu tố cònlại là sáng hơn những yếu tố đúng, điểm truy cập hướng bên trái sẽđược tăng thêm một Tương tự như vậy, đối với từng cái trong số 30mẫu trai, bộ đếm sẽ tăng lên nếu tình trạng trên đáp ứng
Tổng của tất cả các điểm truy cập hướng như trong công thức 2.5 được
sử dụng để bình thường hóa bốn điểm truy cập hướng như trong côngthức 2.6 đến 2.9 Bảng 2.1 cho thấy các quy tắc phân loại và tương ứngngưỡng Những cử chỉ bàn tay động sẽ được phân loại và hướng ngượcvới giá trị tối đa
∑¿Count up+Count down+Count¿+Count
¿ ¿(2.5)
16
Trang 31Hình 2.8: Di chuyển tay và phát hiện hướng, (a)up, (b)down,
Trang 32DOWN =(Count down)2/∑¿ (2.7)
cử chỉ bàn tay và Fourier mô tả được sự tạo thành các vector tính năng mới để cóthể nhận dạng cử chỉ bàn tay
- Tiền xử lý: Xử lý các hình ảnh bàn tay để có các tính năng bàn tay sau khiphát hiện cử chỉ bàn tay để có được những hình dạng tay
1 Phát hiện cử chỉ bàn tay là phát hiện hình dạng tay Hình dạng tayđược phân chia theo các tính năng của màu da giúp để phân loại cáchình ảnh tay dựa vào các cụm chia theo màu da Có năm không gianmàu sắc phổ biến để phân cụm các đối tượng gồm RGB, HSV, YCbCr
và YUV Các nghiên cứu sự phân bố màu da của bàn tay con ngườitheo những điều kiện ánh sáng khác nhau trong bốn không gian màuđược đề cập ở trên Các kết quả cho thấy không gian màu YCbCr vàHSV phù hợp hơn RGB về phát hiện màu da Trong bài nghiên cứu sửdụng YCbCr để phân đoạn cử chỉ bàn tay trong hệ thống
2 Cử chỉ bàn tay tiền xử lý: người nghiên cứu nhị phân hình ảnh ban tay
và tăng cường độ tương phản của hình ảnh để hình dạng bàn tay và cáctính năng có được chính xác nhất, và loại bỏ các hình ảnh nhiễu trongquá trình chuyển đổi Bước đầu tiên trong thuật toán chuyển đổi nhịphân hình ảnh tay ta sử dụng các giá trị màu và các điểm ảnh bằngcách tính các giá trị trong ảnh RGB Bước hai, các điểm ảnh được gáncho các giá trị màu đen nếu vùng nào có các giá trị thỏa mãn giá trị
18
Trang 33màu da thì được gán các giá trị điểm trắng Để giảm nhiễu ta thêm bộlọc trung bình và bộ làm phẳng.
Hình 2.9:Tiền xử lý ảnh (a)Hình cử chỉ bàn tay ban đầu, (b) và (c)Hình
ảnh được chuyển đổi và loại bỏ nhiễu
- Nhận dạng cử chỉ: Trong quá trình này, các thông tính năng của HU, khuvực cử chỉ bàn tay, và các mô tả Fourier cùng nhau hình thành một vector.Các vector đặc trưng vùng tay là tỷ lệ diện tích, tỷ lệ nhị phân, diện tíchmặt và chu vi bàn tay Giá trị tỷ lệ diện tích là tỷ lệ mà các khu vực vùngmặt bị chia cắt bởi các cử chỉ bàn tay diện tích hình chử nhật Ngườinghiên cứu tính các giá trị của bàn tay diện tích khu vực hình chữ nhật vàcác cử chỉ bàn tay Ta có thể tính toán bằng cách quét các điểm ảnh tổnghợp màu trắng của ảnh nhị phân, và sau này thu được bằng cách cắt cáchình ảnh nhị phân HU được tạo ra từ lý thuyết bất biến đại số HU chứngminh rằng một số trong những khoảng khắc có một bản dịch tốt, rộng, bất
Trang 34biến và xoay đặc trưng HU thiết lập được cấu tạo của những trung tâm
bậc hai và bậc ba và biểu thức như sau:
Fourier mô tả là Fourier biến đổi hệ số trong các dạng biên đường cong và
được sử dụng để phân tích các tín hiệu miền tần số của đường cong biên
đối tượng Hệ số biến đổi Fourier rời rạc như sau:
z (K )=1
2∑p (1)exp(−j 2nk
n ),k =0,1,2 , … , n−1(2.17)
Ở mức thấp các cử chỉ bàn tay được sử dụng để xác định bán kính vòng
quay và góc định hướng và ở mức cao dùng để mô tả các chi tiết của cử
chỉ bàn tay Người nghiên cứu chọn mười tham số của z(0) để xây dựng
mọt vector mười chiều Fourier biến đổi z’(k) đã được khi vị trí của các
điểm cong bắt đầu di chuyển mộ khoảng cách α, góc xoay φ, và kích
thước được mở rộng γ lần
z ' ( K )=γ exp ( jφ )exp(j 2 π
n kα)z (k )+F( x0+i y0)(2.18)
20
Trang 35Chuẩn hóa hệ số biến đổi có thể xác định khi giá trị mô đun ||Z(k)|| và ||Z(1)|| của hệ số biến đổi Fourier được tính toán.
d (k )=¿∨Z (k )∨¿
¿∨Z (1)∨¿, k=1,2 , … n−1 (2.19)
- Xác định cử chỉ bàn tay: Multi-layer perceptron là một phân loại chung vềcác mạng Nơ-ron chuyển tiếp, và được sử dụng để phân loại các động táctay trong hệ thống ứng dụng Hàm S chức năng thường được sử dụngtrong nhiều lớp perceptron để tạo thuận lợi trong việc tính toán Chương 4
sẽ nói rõ về các hoạt động của mạng Nơ-ron
2.5 XÂY DỰNG HỆ THỐNG NHẬN DẠNG CỬ CHỈ BÀN TAY
Ở đề tài này, chúng tôi chọn kỹ thuật phân cụm dữ liệu K-means và khônggian màu để xác định vùng bàn tay, đồng thời dùng huấn luyện ảnh bằng mạngNơ-ron để nhận dạng cử chỉ bàn tay từ hình 2D
Sơ đồ khối hệ thống:
Hình 2.10: Sơ đồ hệ thống nhận dạng cử chỉ bàn tay
Trang 36CHƯƠNG 3
PHÂN CỤM VÀ PHÁT HIỆN MÀU DA
3.1 PHÂN CỤM DỮ LIỆU
3.1.1 Giới thiệu về phân cụm dữ liệu
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểudiễn phân tích, nhận dạng ảnh Phân đoạn ảnh là một thao tác ở mức thấp trongtoàn bộ quá trình xử lý ảnh Quá trình này thực hiện việc phân vùng ảnhthành các vùng rời rạc và đồng nhất với nhau hay nói cách khác là xác định cácbiên của các vùng ảnh đó Các vùng ảnh đồng nhất này thông thường sẽtương ứng với toàn bộ hay từng phần của các đối tượng thật sự bên trong ảnh.Như vậy, mục tiêu của phân đoạn ảnh là làm nổi bật hoặc tách hẳn đối tượngcần quan tâm ra từ ảnh ban đầu, làm đơn giản hóa và thay đổi cách biểudiễn để dễ dàng phân tích hơn Vì thế, trong hầu hết các ứng dụng của lĩnhvực xử lý và nhận dạng ảnh, phân đoạn ảnh luôn đóng một vai trò quan trọng
và cần thiết, nó thường là bước tiền xử lý đầu tiên trong toàn bộ quá trình trướckhi thực hiện các thao tác khác ở mức cao hơn như nhận dạng đối tượng
Trước sự bùng nổ của thông tin, phân cụm dữ liệu nói chung và phân cụmảnh nói riêng đã trở thành một lĩnh vực nghiên cứu quan trọng
Phân cụm (Clustering) là quá trình phân tách tập các đối tượng dữ liệuthành các tập có ý nghĩa các tập con gọi là cụm (cluster) Thông thường chotrước tập gồm n đối tưởng , mỗi đối tượng có p thuộc tính, phân cụm sẽ tìm racách chia hợp lý n đối tượng vào một cụm nào đó Trong đó, một cụm là tập cácđối tượng có một số thuộc tính giống nhau và khác với các đối tượng dữ liệu ở
22
Trang 37cụm khác ở một số thuộc tính Mỗi cụm sẽ được xữ như như một nhóm, vì thếphân cụm còn có thể coi như là nén dữ liệu.
Khác với việc phân lớp đối tượng, nhãn của lớp là chưa biết Điều này xảy
ra ở những dữ liệu lớn, vì thế việc gán nhãn cho các dữ liệu lớn là một quá trìnhtốn kém Việc phân cụm rất có ích trong cái nhìn tổng quan trên toàn dữ liệu Đểđạt được điều đó, mỗi cụm cần được gán nhãn chủ đề, điều này giúp cho việcđịnh hướng ngươi dùng về dữ liệu trong cụm đó
Thông thường, để phân cụm dữ liệu, người ta sử dụng các đại lượng vềkhoảng cách, ví dụ như khoảng cách Euclide Phân cụm có ứng dụng nhiềutrong các lĩnh vực như Web, xử lý ảnh…
Một số phương pháp phân cụm điển hình:
Phân cụm phân hoạch: K-means, PAM, CLARA,
Phân cụm phân cấp
Phân cụm dựa trên mật độ
Phân cụm dựa trên mô hình
Phân cụm có ràng buộc
Ở đây, đề tài sẽ đề tài đề cập tới thuật toán phân cụm K-means (thuộcphương pháp Phân cụm phân hoạch)
3.1.2.1 Giới thiệu thuật toán K-means
Thuật toán K-means clustering do MacQueen giới thiệu trong tài liệu “J.Some Methods for Classification and Analysis of Multivariate Observations”năm 1967
K-means Clustering là một thuật toán dùng trong các bài toán phânloại/nhóm n đối tượng thành k nhóm dựa trên đặc tính/thuộc tính của đối tượng(k £n nguyên, dương)
Về nguyên lý, có n đối tượng, mỗi đối tượng có m thuộc tính, ta phân chiađược các đối tượng thành k nhóm dựa trên các thuộc tính của đối tượng bằngviệc áp dụng thuật toán này
Coi mỗi thuộc tính của đối tượng (đối tượng có m thuộc tính) như một toạ
độ của không gian m chiều và biểu diễn đối tượng như một điểm của không gian
m chiều
ai =( xi1, xi2, xim)