Xuất phát từ nhu cầu thực tiễn trên, Tôi đã chọn đề tài Nghiên cứu ứng Trang 9 Quyển luận văn này sẽ nh một tài liệu tham khảo, giúp ngời đọc có hình dung về khái niệm nhận dạng ảnh,
Trang 1nguyÔn minh s¬n
Ngêi híng dÉn khoa häc : TS NguyÔn V¨n khang
hµ néi - 2008
Trang 2Lời cam đoan
Tôi xin cam đoan bản luận văn này đợc thực hiện bởi chính bản thân tôi dới sự hớng dẫn của TS Nguyễn Văn Khang cùng với các tài liệu đã đợc trích dẫn trong phần tài liệu tham khảo ở phần cuối bản luận văn
Nguyễn Minh Sơn
Trang 3ph¸p nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot”
9B
1.1 Tæng quan vÒ øng dông c¸c ph¬ng ph¸p nhËn d¹ng ¶nh
13B1.1.2 C¬ së khoa häc cña øng dông c¸c ph¬ng ph¸p nhËn d¹ng
17B1.1.4 T×nh h×nh nghiªn cøu øng dông nhËn d¹ng ¶nh trong ®iÒu
19B1.1.5 T×nh h×nh nghiªn cøu, øng dông trong níc 20B7
Trang 477B3.1.1 Không gian biểu diễn đối tợng, không gian diễn dịch 78B28
79B3.1.2 Mô hình và bản chất của quá trình nhận dạng 80B29
83B3.1.2.2 Bản chất của quá trình nhận dạng 84B31
86B33
Trang 53.4 m¹ng n¬ ron nh©n t¹o vµ NhËn d¹ng theo m¹ng n¬ ron 112B41
Trang 64.2 Xây dựng các tham số cho bộ điều khiển camera 142B75
143B4.2.1 Tính toán tốc độ quay theo phơng ngang ϕ 144B75
145B4.2.2 Tính toán tốc độ quay theo phơng đứng ψ 146B77
147B
4.3 Xây dựng các tham số cho bộ điều khiển robot 148B78
149B4.3.1 Các tham số ảnh hởng tới tốc độ của Robot 150B78
151B4.3.2 Tính toán các tham số trong bộ điều khiển 152B79
Trang 7Danh mục ký hiệu và chữ viết tắt
ξx, ξy Tọa độ của đối tợng trong ảnh
ϕ G óc của camera theo phơng ngang
ψ Góc của camera theo phơng đứng
e Vector sai lệch vị trí
Trang 8Lời Mở đầu
Sự phát triển của kỹ thuật điện tử và công nghệ thông tin đã kéo theo sự phát triển của một loạt các ngành liên quan Một trong những ngành đó là ngành xử lý – nhận dạng ảnh số Trên thế giới, công nghệ xử lý – nhận dạng ảnh đã và đang đợc phát triển rất mạnh mẽ vì nó có rất nhiều ứng dụng trong hầu hết các lĩnh vực của con ngời Và hiện nay, nếu sản phẩm nào có ứng dụng công nghệ này thì đều đợc coi là sản phẩm thông minh, có sức cạnh tranh lớn Một trong những lĩnh vực rất cần đợc trang bị công nghệ nhận dạng ảnh đó là công nghiệp chế tạo Robot Việc ứng dụng công nghệ này trong điều khiển Robot sẽ làm tăng khả năng nhận thức cho Robot, làm cho nó ngày càng hoàn thiện và giống con ngời
ở trong nớc, môn xử lý ảnh mới chỉ đợc giảng dạy ở một số trờng trọng điểm về khoa học kỹ thuật nh Đại học Bách khoa Hà nội, Đại học Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh… Và mới chỉ giới hạn trong các ngành nh công nghệ thông tin, điện tử viễn thông Hiện, cha có nhiều nghiên cứu để đa công nghệ này vào ứng dụng thực tiễn trong các ngành, các lĩnh vực khác
– Hiện nay, công nghệ xử lý nhận dạng ảnh số đang đợc rất nhiều bạn trẻ quan tâm Đặc biệt là các bạn sinh viên đang hoặc có ý định tham gia trò chơi Robocon quốc tế Bởi vì hầu hết các Robot tự động hiện nay chủ yếu
rò đờng theo vạch kẻ sân và không phân biệt đợc cấu kiện của mình hay của
đội bạn Việc trang bị kỹ thuật nhận dạng ảnh cho Robot tự động sẽ làm giảm bớt các nhợc điểm trên, đồng thời làm tăng khả năng điều khiển linh hoạt cho Robot
Xuất phát từ nhu cầu thực tiễn trên, Tôi đã chọn đề tài Nghiên cứu ứng
dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot
Trang 9Quyển luận văn này sẽ nh một tài liệu tham khảo, giúp ngời đọc có hình dung về khái niệm nhận dạng ảnh, các phơng pháp nhận dạng ảnh và biết cách ứng dụng công nghệ này trong điều khiển Robot Cụ thể ở đây tôi xây dựng phơng pháp nhận dạng ảnh để điều khiển Robot trong việc tìm và
đuổi bắt mục tiêu đang di động có phơng và vận tốc cha biết
Trong khuôn khổ của một đề tài với quỹ thời gian không cho phép và có một số khó khăn trong việc cập nhập tài liệu cũng nh do hạn chế của bản thân, nên chắc chắn quyển luận văn này không tránh khỏi những thiếu sót Vậy kính mong các thầy cô cùng các bạn yêu thích công nghệ này đóng góp chỉ bảo, phê bình để đề tài này ngày càng hoàn thiện
Trang 10chơng I Tổng quan về “ ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot” và nội dung
cần nghiên cứu
1.1 Tổng quan về ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot
1.1.1 Tính thời sự
Ngày nay, trớc sự phát triển vợt bậc của khoa học kỹ thuật, các thiết
bị máy móc thay thế hoặc hỗ trợ cho con ngời trong lao động sản xuất, trong sinh hoạt, đòi hỏi ngày càng phải hoàn thiện hơn Trong những năm gần đây
do kỹ thuật vi điện tử phát triển rất mạnh, đã khiến cho tốc độ của các bộ vi xử
lý ngày càng cao, chất lợng của các camera kỹ thuật số ngày càng hoàn thiện Vì vậy, việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh ngày càng sâu rộng trong tất cả các lĩnh vực nh trong công nghiệp, quân sự, an ninh, vũ trụ, y học, giao thông vv… và cả trong cuộc sống hàng ngày
Từ khi xuất hiện cho tới nay, không ai có thể phủ nhận đợc vai trò của Robot trong sản xuất công nghiệp lẫn trong sinh hoạt gia đình Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm, và những công việc mà tốc độ và độ chính xác vợt quá khả năng của con ngời Khi ngời máy trở nên tinh vi hơn, thị giác máy tính sẽ đóng vai trò ngày càng quan trọng Ngời
ta sẽ đòi hỏi ngời máy không những phát hiện và nhận dạng các bộ phận công nghiệp mà còn hiểu đợc những gì chúng thấy và đa ra những hành
động phù hợp Việc phát triển, hoàn thiện các tính năng giúp cho ngời máy ngày càng giống với con ngời đã khiến các nhà khoa học trên thế giới phải tốn nhiều công sức Ngày nay, cùng với sự phát triển tột bậc của khoa học kỹ
Trang 11thuật, ngời ta đã tạo ra đợc nhiều Robot có khả năng quan sát, làm đợc nhiều việc với độ chính xác cao vv Trong những con Robot này, ngời ta sử …dụng một hay nhiều camera để ghi lại hình ảnh xung quanh Robot Và bằng công nghệ nhận dạng ảnh, xử lý ảnh, máy tính sẽ phân tích và đa ra quyết
định Nh vậy camera, công nghệ nhận dạng ảnh đóng một vai trò rất quan trọng, nó giống nh mắt của con ngời
Việc tìm hiểu, nghiên cứu các kỹ thuật xử lý ảnh, nhận dạng ảnh đã và
đang đợc sự quan tâm của rất nhiều nhà nghiên cứu vì đây là lĩnh vực còn rất mới Bên cạnh đó việc nghiên cứu các kỹ thuật này, sẽ giúp chúng ta bắt nhịp
đợc với sự phát triển công nghệ của thế giới Từ đó ta có thể nắm đợc , nguyên lý để ứng dụng vào các ngành công nghệ khác đồng thời làm chủ đợc các thiết bị hiện có trên thị trờng đang ứng dụng công nghệ này
1.1.2 Cơ sở khoa học của ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot
ý tởng sử dụng camera làm mắt cho robot đã có từ lâu, từ khi camera mới xuất hiện Nhng điều đó rất khó có thể thực hiện bởi vì tín hiệu ra của camera là tơng tự và đợc lu trong các băng từ gây khó khăn cho việc truy xuất, xử lý dữ liệu Đồng thời, tốc độ xử lý của các chíp điện tử còn rất chậm nên phải mất rất nhiều thời gian để phân tích các khối dữ liệu lớn Lý thuyết
về xử lý, nhận dạng ảnh còn cha phát triển
Ngày nay, với sự phát triển vợc bậc của kỹ thuật vi điện tử đã tạo ra các bộ vi xử lý có tốc độ rất cao lên đến hàng GHz Cùng với sự xuất hiện của các camera kỹ thuật số, việc truyền và xử lý dữ liệu trở nên dễ dàng hơn Một hớng phát triển mới của các hãng sản xuất chíp điện tử là phát triển các chíp FPGA chạy các ứng dụng xử lý ảnh một cách độc lập (Nhúng các thuật toán
xử lý ảnh vào các chip)
Cơ sở của nhận dạng ảnh chính là lý thuyết xử lý ảnh số Nhận dạng
ảnh là giai đoạn cuối của các hệ thống xử lý ảnh Nhận dạng ảnh dựa trên lý
Trang 12thuyết nhận dạng (Pattern Recognition) đã đợc đề cập trong nhiều sách về nhận dạng Trong lý thuyết về nhận dạng nói chung và nhận dạng ảnh nói riêng có ba cách tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch không gian
- Nhận dạng dựa vào cấu trúc
- Nhận dạng dựa vào kỹ thuật mạng nơron
Hai cách tiếp cận đầu là cách tiếp cận kinh điển Các đối tợng ảnh quan sát và thu nhận đợc phải trải qua giai đoạn tiền xử lý nhằm tăng cờng chất lợng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trng, cuối cùng mới là giai đoạn nhận dạng Cách tiếp cận thứ ba hoàn toàn khác Nó dựa vào cơ chế đoán nhận, lu trữ và phân biệt đối tợng mô phỏng theo hoạt động của hệ thần kinh con ngời Do cơ chế đặc biệt, các đối tợng thu nhận bởi thị giác ngời không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các mẫu đã lu trữ để nhận dạng
1.1.3 Tính ứng dụng
Việc ứng dụng công nghệ nhận dạng ảnh trong điều khiển Robot mở ra một triển vọng phát triển rất lớn cho ngành nghiên cứu và chế tạo Robot Việc ứng dụng này giúp cho Robot có thể quan sát đợc vật thể, từ đó mà nó có thể
có thêm nhiều tính năng mới giống ở con ngời Có thể ứng dụng công nghệ này trên Robot trong rất nhiều lĩnh vực khác nhau nh:
Trong y học: chế tạo ra các Robot dẫn đờng giúp ngời già, ngời khuyết tật
dTrong ngành vũ trụ: chế tạo ra các Robot thăm ò, có khả năng tự di chuyển và phân tích các mẫu đất, đá
Trong lĩnh vực quân sự: chế tạo ra Robot trinh sát có khả năng dẫn
đờng và tự tìm mục tiêu
Trong lĩnh vực giao thông: đó là các xe ôtô thông minh có khả năng tự lái, tự di chuyển vào bãi đỗ
Trang 13Trong công nghiệp: chế tạo ra các Robot phân loại sản phẩm, xe tự hành vv.…
Trong đời sống: chế tạo ra các Robot bảo mẫu chông trẻ, Robot nội trợ, Robot văn phòng …vv
1.1.4 Tình hình nghiên cứu ứng dụng nhận dạng
ảnh trong điều khiển Robot trên thế giới
Việc ứng dụng Robot trong y học nhằm giúp những ngời tàn tật có thể hội nhập với cộng đồng Với sản phẩm EagleEyes của trờng đại học Boston
sử dụng thiết bị cảm biến và qua một màn hình máy tính, EagleEyes có thể tránh các vật cản trên đờng đi hoặc có thể rẽ trái hoặc phải tùy ý theo tín hiệu của đôi mắt, các tín hiệu từ đôi mắt sẽ đợc một bộ cảm nhận tín hiệu chuyển thành các tín hiệu điện mà EagleEyes Robot có thể hiểu đợc
Trong công nghiệp có các sản phẩm nh:
- Hệ thống 3 cánh tay máy, sản phẩm của công ty Fanuc, vừa đoạt giải thởng robot Nhật Bản 2007 với khả năng gắp 120 chi tiết trong 1 phút từ băng chuyền Nó có thể di chuyển nhanh chóng nhng chính xác dựa trên các dữ liệu hình ảnh từ camera Các cánh tay hoạt động phối hợp nhịp nhàng với nhau và nhặtđồvật bằng giác hút chân không
HOAP 3 là một robot dạng ngời thu nhỏ của công ty Fujitsu cao 60
-cm, có thể di chuyển trên 2 chân Với 2 camera, 1 microphone, các đèn LED biểu thị cảm xúc và khá nhiều cảm biến gắn trên thân, HOAP-3 có thể nhận dạng hình ảnh, điều khiển 28 bậc tự do Ngời sử dụng có thể điều khiển HOAP-3 thông qua mạng LAN không dây và lập trình để thay đổi nhiệm vụ cho robot
Trong sinh hoạt gia đình: iRobo Roomba, có thể lau chùi phòng ăn sạch bóng, di chuyển với một robot “xe jeep” nhỏ gắn máy quay phim “Xe jeep” báo cho Roomba biết các chớng ngại để tránh
Trang 141.1.5 Tình hình nghiên cứu, ứng dụng trong nớc
ở trong nớc, môn xử lý ảnh mới chỉ đợc giảng dạy ở một số trờng trọng điểm về khoa học kỹ thuật nh Đại học Bách khoa Hà nội, Đại học Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh… Và mới chỉ giới hạn trong các ngành nh công nghệ thông tin, điện tử viễn thông Số lợng sách tham khảo về xử lý ảnh bằng tiếng việt còn rất h n chế, chủ yếu ạvẫn là sách viết bằng tiếng Anh nên đã gây khó khăn cho những ngời mới học hoặc đang muốn tìm hiểu Tuy nhiên, do sự phát triển của khoa học kỹ thuật nên công nghệ xử lý ảnh đang đợc rất nhiều nhà khoa học trẻ quan tâm nghiên cứu Các đề tài nghiên cứu khoa học cấp trờng, cấp nhà nớc đã và
đang đợc triển khai hàng năm Trong đó có một số đề tài cho kết quả khả quan và đang đựơc ứng dụng rộng rãi nh đề tài ứng dụng công nghệ nhận dạng ảnh trong việc giải quyết bài toán dò đờng cho robot, phần mềm nhận dạng ảnh biển số xe, phần mềm nén và xử lý ảnh, phần mềm nhận dạng chữ viết …vv Tuy nhiên các ứng dụng của công nghệ xử lý ảnh trong công nghiệp vẫn còn rất hạn chế
Sản phẩm của nhóm nghiên cứu: Nguyễn Đức Thành, Nguyễn Đức Minh, bộ môn điều khiển tự động, Đại học Bách khoa TP Hồ Chí Minh Nhóm nghiên cứu đã sử dụng camera kết hợp mạng nơ ron và giải thuật xử lý
ảnh để nhận dạng, xác định vị trí và hớng của vật Kết quả nghiên cứu đợc dùng để điều khiển robot Scorbot gắp vật và di chuyển đến vị trí định trớc Robot có năm bậc tự do, đợc điều khiển bằng máy tính qua cổng RS232 và phần mềm ACL Nó sử dụng một camera quan sát nhìn từ trên xuống, bao quát vùng hoạt động của cánh tay robot
Trang 15tay Robot di chuyển đến vị trí mong muốn, đợc áp dụng trong việc di chuyển sản phẩm từ máy gia công sang băng tải Đề tài này đã đợc mở rộng bằng cách đa hình ảnh từ Camera vào máy vi tính và sau đó điều khiển di chuyển tay máy dựa trên hình ảnh thu nhận đợc từ Camera
Trong sân chơi quốc tế nh Robocon, trong mấy năm đầu sinh viên Việt Nam luôn đạt thứ hạng cao nhờ trí tuệ và sức sáng tạo của mình Nhng hiện nay, do các bạn sinh viên các nớc có công nghệ phát triển cao nh Nhật Bản, Trung Quốc đã bắt đầu ứng dụng công nghệ nhận dạng ảnh trong việc điều khiển Robot tự động có thể tự tìm đờng đi, tránh chớng ngại vật để tiếp cận mục tiêu Trong khi đó Robot tự động của các đội , sinh viên Việt Nam hoạt
động chủ yếu bằng cách đợc lập trình để dò đờng dựa trên các vạch trắng trên sân thi đấu Robot dò đờng hoạt động không ổn định nên việc dò đờng nhầm, chạy nhầm không phải là hiếm; có trờng hợp lúc chạy thử thì rất tốt, nhng khi thi đấu chính thức lại chạy sai
ở Việt Nam, công nghệ xử lý ảnh không phải là một công nghệ mớiCông nghệ này đã đợc nhắc đến rất nhiều trong cộng đồng Robocon suốt những năm qua nhng cha từng đợc đem vào ứng dụng trong cuộc thi vì công nghệ tơng đối phức tạp Các thí sinh tham gia Robocon cha đủ khả năng, tài chính và thời gian để chiếm lĩnh công nghệ này, mặc dù những ứng dụng của nó là vô cùng hiệu quả và là niềm mơ ớc của bất cứ đội nào
Khi cha có công nghệ xử lý ảnh, thì việc để cho robot chạy đợc giống nh việc để một ngời “mù” lái xe ô tô theo sự chỉ dẫn của một ngời sáng mắt nhng lại hoàn toàn không biết điều khiển phơng tiện này Hiện nay, với việc áp dụng công nghệ xử lý ảnh, ngời ta đã lắp thêm cho ngời mù đôi mắt, làm tăng độ chuẩn xác trong các quyết định điều khiển robot lên rất nhiều
, Hiện nay trên các diễn đàn trao đổi khoa học công nghệ có uy tín nh
dientuvietnam.net, dientuvienthong.net…, đang diễn ra các cuộc thảo luận rất
sôi nổi xung quanh việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh trong
Trang 16điều khiển Robot, nhận dạng chữ viết, mặt ngời… Đây chính là nơi cung cấp tài liệu, kinh nghiệm, giúp cho các bạn sinh viên có thể thực hiện đợc ý tởng sáng tạo của mình
1.2 Các bớc chính trong hệ thống nhận dạng
1.2.1 Thu NHận ảnh
Việc thu nhận ảnh đợc thực hiện thông qua việc chụp ảnh từ camera Chất lợng của ảnh thu đợc từ bớc này phụ thuộc nhiều vào chất lợng camera, tốc độ di chuyển khi chụp, góc nhìn và độ sáng
1.2.2 Tiền xử lí (lấy mẫu, lọc nhiễu, tơng phản, )
Sau bộ thu nhận, ảnh có thể nhiễu và độ tơng phản thấp nên cần đa vào bộ tiền xử lý để nâng cao chất lợng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tơng phản để làm ảnh rõ hơn, nét hơn
Trớc khi áp dụng các phơng pháp nhận dạng ảnh, chúng ta cần xử lý
ảnh để đảm bảo rằng ảnh sẽ thoả mãn một vài giả thiết nào đó Ví dụ nh sau: Lấy mẫu lại để đảm bảo hệ thống tọa độ là đúng Nếu 2 ảnh lấy liên tiếp nhau có sự sai khác quá nhiều thì chúng ta có thể loại bỏ ảnh đó vì t thế của robot lúc chụp không đợc ổn định
Loại bỏ nhiễu để giảm thiểu khả năng xuất hiện các thông tin sai
Tăng độ tơng phản để đảm bảo sẽ xác định đợc các thông tin cần thiết
1.2.3 Phân vùng ( Segmen ati n) t o
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì th cho mục đích phân loại bu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh
và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh
Trang 17phụ thuộc rất nhiều vào công đoạn này
1.2.4 Phân tích hình ảnh (xác định đờng, góc, cạnh, khối, )
Đầu ra ảnh sau phân vùng chứa các điểm ảnh của vùng ảnh (ảnh đã phân vùng) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trng (Feature Selection) gắn với việc tách các đặc tính của ảnh dới dạng các thông tin định lợng hoặc làm cơ sở để phân biệt lớp đối tợng này với đối tợng khác trong phạm vi ảnh nhận đợc Ví dụ: trong nhận dạng ký tự trên phong bì th, chúng
ta miêu tả các đặc trng của từng ký tự giúp phân biệt ký tự này với ký tự khác
1.2.5 Nhận dạng
Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thờng thu
đợc bằng cách so sánh với mẫu chuẩn đã đợc học (hoặc lu) từ trớc Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì th có thể đợc nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh đợc phân theo hai loại nhận dạng ảnh cơ bản:
Trang 18Đến bớc này thì dữ liệu đầu vào chỉ là một phần của dữ liệu ban đầu,
đó có thể là tập các điểm ảnh hoặc một vùng ảnh có khả năng chứa một đối tợng đặc biệt nào đó Quá trình xử lý sẽ qua các bớc sau:
- Thẩm định lại dữ liệu có phù hợp với các yêu cầu cơ bản và đặc biệt
- Ước lợng các tham số đặc biệt
- Phân lớp đối tợng xác định đợc
1.3 Nội dung nghiên cứu
Do lĩnh vực điều khiển Robot là rất rộng lớn, tùy từng ứng dụng khác nhau mà Robot có những tính năng riêng Từ đó mà công việc nhận dạng ảnh cho từng loại Robot cũng có sự khác biệt Trong khuôn khổ của Đồ án này tôi xin trình bày về các phơng pháp nhận dạng và mô phỏng quá trình nhận dạng một đối tợng cụ thể, từ đó sẽ ứng dụng để điều khiển Robot và tính toán các tham số cần thiết cho bộ điều khiển
Trang 193) Robot có thể di chuyển trên ba bánh: hai bánh phát lực ở đằng sau và
1 bánh lái theo nhiều hớng ở phía trớc
4) Robot đợc trang bị thêm một camera đợc gắn trên trục của bánh lái Camera có thể quay trên mặt phẳng ngang và mặt phẳng đứng Mỗi trục quay của camera đều có một encorder tuyệt đối để đo góc quay
5) Để giảm bớt khối lợng tính toán trong xử lý ảnh, giả thiết quả bóng
có màu sẫm còn mặt phẳng chuyển động là màu trắng
Mô hình robot này đợc ứng dụng trong trò chơi robot đá bóng, trong
đó quả bóng thay đổi tốc độ và hớng thờng xuyên, hay Robot tự động trong cuộc thi Robocon
Với giả thiết số 5 và chất lợng hình ảnh từ camera là rất tốt, ta có thể
bỏ qua khâu tiền xử lý ảnh Vì vậy, trong các chơng sau, tôi sẽ trình bày về phân vùng, nhận dạng ảnh, sau đó ứng dụng nhận dạng ảnh cho bài toán điềukhiển robot trên
1.4 mục tiêu và Nội dung của luận văn
1.4.1 Mục tiêu
Do nhận dạng ảnh là giai đoạn cuối cùng của xử lý ảnh vì vậy để trình bày chi tiết các bớc của một quá trình nhận dạng ảnh sẽ làm cho nội dung
của luận văn rất lớn Hơn nữa mục tiêu chính của luận văn là Nghiên cứu ứng
dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot Vì vậy ở trong
phần nhận dạng tôi chỉ trình bày hai bớc chính đó là phân vùng ảnh và nhận dạng ảnh Mục tiêu nghiên cứu của luận văn này là:
- Nghiên cứu các bớc chính của quá trình nhận dạng ảnh số
- ứng dụng nhận dạng ảnh để điều khiển chuyển động của Robot
- Tính toán đợc các tham số cần thiết cho bộ điều khiển Robot
- Mô phỏng đợc quá trình nhận dạng và quá trình điều khiển
1.4.2 Nội dung
Trang 20Tõ môc tiªu trªn, néi dung cña luËn v¨n gåm c¸c phÇn sau:
Ch¬ng 1: Tæng quan vÒ “ øng dông c¸c ph¬ng ph¸p nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot” vµ néi dung cÇn nghiªn cøu
Ch¬ng 2: Ph©n vïng ¶nh
Ch¬ng 3: NhËn d¹ng ¶nh
Ch¬ng 4: øng dông nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot
Ch¬ng 5: M« pháng
Trang 21Chơng II phân vùng ảnh
Để phân tích các đối tợng trong ảnh, chúng ta cần phải phân biệt đợc các đối tợng cần quan tâm với phần còn lại của ảnh Những đối tợng này có thể tìm ra đợc nhờ các kỹ thuật phân vùng ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu cảnh trong ảnh
Vùng ảnh là chi tiết, ột thực thể trong toàn ảnh Nó là ộttập h p ợ các đi ểm có cùng hoặc gần cùng m ột tính chất nào đó: mức xám ,
mức màu, độ nhám… Vùn ản l mg h à ột trong hai th ộc tính ủa nh Nói u c ả
đến vùng ảnh là nói đến tính chất mbề ặt Đờng bao uanh q một vùng ảnh(Boundar ) y là biên ảnh ác C điểm trong m ột vùng ảnh có độ bi ến thiên giátrị m xáức m t ng đối đồng đều h y ính kết cấu tơng đồng ơ a t
Trang 22nh thế nào? Mặc dù không có thuật toán chọn ngỡng vạn năng nào có thể áp dụng cho mọi loại ảnh Chúng ta cũng có nhiều phơng pháp đa ra dới đây:
1
2.1 Ngỡng cố định
Phơng pháp đầu tiên là chọn một ngỡng độc lập với dữ liệu ảnh Nếu chúng ta biết trớc là chơng trình ứng dụng sẽ làm việc với những ảnh có độ tơng phản rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần nh
đồng nhất và rất sáng, thì giá trị ngỡng không đổi 128 trên thang độ sáng từ 0
đến 255 sẽ là một giá trị chọn khá chính xác Chính xác ở đây nên đợc hiểu
theo nghĩa là số lợng các điểm ảnh bị phân lớp sai là cực tiểu
2.1.2 Ngỡng dựa trên lợc đồ
Trong hầu hết các trờng hợp, ngỡng đợc chọn từ lợc đồ độ xám của vùng hay ảnh cần đợc phân vùng Hình 2.1 cho chúng ta một ví dụ về ảnh và lợc đồ độ xám liên kết với nó
Trang 23N N i
1
mang lại, nhằm loại bỏ những dao động nhỏ về độ sáng Tuy nhiên các thuật
toán làm trơn cần phải cẩn trọng không đợc làm dịch chuyển các vị trí đỉnh
của lợc đồ Nhận xét này dẫn đến thuật toán làm trơn lợc đồ dới dây, với
độ rộng của cửa sổ W là N, thông dụng là N=3 hoặc N=5 (bộ lọc trung bình 1
-chiều):
(2- 1)
2.1.2.1 Tuật toán đẳng liệu (Isodata)
Kỹ thuật chọn ngỡng theo kiểu lặp này do Ridler và Calvard đa ra
Thuật toán nh sau:
- Chia lợc đồ thành 2 đoạn bằng một giá trị ngỡng khởi động θ0 =2B-1
,
tức là bằng phần nửa thang độ xám động của ảnh
- Sau đó tính toán độ sáng trung bình của 2 vùng:
- m f , 0 của những điểm ảnh thuộc đối tợng
+
=
θ Quá trình này cứ thế sẽ đợc tiếp tục với các ngỡng mới cho đến khi
nào giá trị ngỡng không thay đổi nữa thì dừng lại Biểu diễn dới dạng công
−
− +
=
θ cho tới khi θk = θk-1
2.1.2.2 Thuật toán tam giác
Thuật toán này do Zack đa ra và đợc minh họa trong hình 2.2 Trong
hình này, chúng ta có thể quan sát thấy một đờng thẳng đ đợc xây dựng ã
bằng cách nối từ giá trị lớn nhất của lợc đồ tại độ sáng bmax đến giá trị nhỏ
nhất của lợc đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin],
Trang 24chúng ta đi tính khoảng cách từ giá trị lợc đồ tại d b là h[b] đến đờng thẳng
đã có Giá trị b0 ứng với khoảng cách lớn nhất sẽ đợc chọn làm giá trị ngỡng
θ
Kỹ thuật lấy ngỡng không nhất thiết phải đợc áp dụng cho toàn bộ
ảnh, mà có thể áp dụng cho từng vùng ảnh một Hai tác giả Chow và Kaneko
đã phát triển một biến thể của kỹ thuật lấy ngỡng bằng cách chia một ảnh có kích thớc M N ra thành nhiều vùng không chồng chất lên nhau Các giá trị xngỡng đợc tính riêng biệt cho từng vùng một và sau đó đợc kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngỡng cho toàn bộ ảnh Trong thuật toán mới này, kích thớc của các vùng cần đợc chọn một cách thích hợp sao cho có một lợng đáng kể các điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lợc đồ và xác định ngỡng tơng ứng Tính hữu ích của thuật toán này, cũng nh nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng dụng cụ thể
2.2 Thuật toán gán nhãn thành phần liên thông
Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn riêng biệt Nhãn thờng là các số tự nhiên bắt đầu từ một đến tổng số các thành phần liên thông có trong ảnh Giải thuật quét ảnh từ trái sang phải và từ
Trang 25trên xuống dới Trong dòng thứ nhất của các pixel đen, một nhãn duy nhất
đợc gán cho mỗi đờng chạy liên tục của pixel đen Với mỗi pixel đen của các dòng tiếp theo, các pixel lân cận trên dòng trớc và pixel bên trái đợc xem xét Nếu bất kì pixel lân cận nào đợc gán nhãn, nhãn tơng tự đợc gán cho pixel đen hiện thời; ngợc lại nhãn tiếp theo cha đợc sử dụng đợc chọn Thủ tục này đợc tiếp tục cho tới dòng cuối của ảnh
Lúc kết thúc tiến trình này, một thành phần liên thông có thể chứa các pixel có các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn pixel “?” trong hình vẽ 2.3 a Pixel đối với lân cận trái và những lân cận trong dòng trớc có thể đợc gán nhãn một cách riêng biệt Một tình huống nh vậy phải đợc xác định và ghi lại Sau tiến trình quét ảnh, việc gán nhãn đợc hoàn tất bằng cách thống nhất các mâu thuẫn các nhãn và gán lại các nhãn cha sử dụng
Để minh hoạ ta có hình biểu diễn sau :
Hình a Trờng hợp Pixel ? không gán đợc nhãn
(P: lân cận trớc, L lân cân trái )
Trang 26sẽ xác định tiêu chuẩn phân ùng Tính đồng nhất v của m mi ả ột ền nh là điểm
c ếu hủ y xác ịnh tính đ hi ệu quả của việc phân vùng Các tiêu chuẩn ha y đợc
dùng là sự thuầ nh n ất về mức xám m, àu sắc đối vớ i ảnh màu, kết cấ su ợi
Về ng yên ắc, ph ng pháp này iể tra ính úng đắ của tiêu chuẩn
đề ra m cách tổng ột thể trên mi lớn ền của ảnh Nếu tiêu chuẩn ợ thỏa m đ c ãn,việc phân vùng coi nh kết thúc
Trong trờ ợ ngợ lại, chia ền ang xét thành nhỏ n.Với mỗi miền nhỏ, áp dụng m cá ột ch đệ quy ph ơ ng pháp trên cho đế khin tất c micả ác ền đều thỏa m đi ãn ều kiện
Trang 27Phơng pháp này ó thể ô tả bằng thuật toán sau : c m
Chia miền đang xét thà h 4 m ền : 1, Z2, Z3, Z4
End
Else exit
End
Tiêu chuẩn xét ền đồng nhất ây có thể dự ào ức xá Ngoài
ra, có thể dựa vào độ lệch chuẩn ha y độ chê gi nh ữa giá trị m ức xám lớn nhất
và giá trị mức xám nhỏ nhất Giả sử Max và Min là giá trị ức xám m lớn nhất
và nhỏ nhất trong ền đmi ang xét N u : ế
ta coi mi đền ang xét đlà ồng nhất Trờng ợ ngợ h p c lại, mi đền ang xét kh ngô
là miền đồng nhất và sẽ ợc hia làm 4 phần.đ c
Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min đợc viết :
Function Examin_Criteria(I, N1, M1, N2, M2, T)
/* Giả thiết ảnh có tối đa 255 mức xám (N1, M1), (N2, M2) là tọa độ
điểm đầu và điểm cuối của miền; T là ngỡng */
Trang 28Thuật toán ày tạo nên ột cây ỗi nút cha có nút con ọi
m ức trừ m ức ngoài cùng Vì thế, cây nà y có tên là cây tứ phân Cây ho ta c hình nh ả n rõ ét về c ấu trúc phân ấp của các vùng ơ c t ng ứng với tiêu chuẩn Một vùng thỏa mãn iềuđ kiện sẽ tạo ên n một nút lá; nếu không nó sẽ tạo nên
một nút tro g và cón 4 nút con ng ng Tiếp tục nh t ơ ứ vậ y cho đế khi phn ân chia xong để đạ các vùng đồng nhất t
3.2
2 Phơ ng pháp c c bộ ụ
ý t ở ng của ph ng pháp là xét ảnhơ từ các mi ền nhỏ nhất rồi nốichúng lại nếu thỏa mãn tiêu chuẩn để đợc một miền đồng nhất lớn hơ n
Ti ếp tục với các miền thu đợ ch đếc o n khi không thể nối êm th đợ nữa.c
Số miền còn l ại cho ta kết quảphân vùng Nh vậy, mi ền nhỏ nhất của bớc
xuất phát là điểm ảnh
Phơng pháp này hoàn toàn ngợc với phơng háp tách Song iều p đquan trọng ở đâ y là ng yên lý nối 2 vùng Việc nối 2 vùng đợc thực hiện theo unguyên tắc sau :
- Hai vùng hải áp ứng êu chuẩn, thí dụ nh cù g àu hay ùng ức p đ ti n m c mxám
- Hai vùng hải kế cận n au p h
Trang 29ng i Khái niệm kế cận: trong xử lý ảnh, ờ ta dùng khái niệm liênthông để xác định tính chất kế cận Có hai khái niệm về liên thông 4 là liênthông và 8 liên thông ới 4 V liên thông một iểm ảnh I(đ x,y) sẽ 4 kế có cậntheo 2 h ớ ng x và y ; trong khi đó với 8 liên hông, t điểm I(x,y sẽ có 4 liên ) thông theo 2 h ớ ng x, y 4 liên thông khác theo và hớng chéo 45o
a) 4 liên thông b) 8 liên thông
Hình 2.4 Khái niệm 4 liên thông và 8 liên thông
Dựa theo nguyên lý ủa ph ng pháp c ơ nối, ta có 2 thuật toán :
- Thuật toán tô àu (Blob Coloring) : ử dụng khái niệmm s 4 liên thông, dùng một cửa sổ di ch yển trên ảnh để u so sánh với tiêu chuẩn nối
- Thuật toán đệ quy cực ộ: sử dụng ph ng pháp tìm b ơ kiếm trong m ột
c làây để m tăng kích th c vùng.ớ
3.3
2 Phơ ng pháp ổng hợp t
ơ Hai ph ng pháp nối (hợp) và tách đều có nhợc đ m Phiể ơ ng pháptách t sẽ ạo nên một cấu trúc phân ấp c và th iết l m ập ối quan hệ giữa cácvùng Tuy nhiên, nó thực hiện việc chia quá chi tiết Ph ơ ng pháp hợp chophép làm giảm số miền liên thông xuống ối t thiểu, nhng cấu trúc hàng ngang dàn trải, không cho ta t ấy rõ mh ối liên hệ giữa các miền
nh đi
Vì ợc ểm này, ngời ta nghĩ đến phối hợp cả 2 ph ơn g pháp
Tr ớ c tiên, dùng ph ng phơ áp tách để tạo nên cây tứ phân, phân vùng theo
h ớ ng từ gốc đế lá.n Ti ếp theo, ến hành ti duyệt cây theo chiề ngợu c l và ại
Trang 30h p ợ các vùng có cùng êu ch ẩn V ti u ới ph ng hápơ p nà y ta thu đợc ột cấu mtrúc ảnh với các miền liên thông có kích t ớh c tối đ a.
Giải thuật tách hợp ồm ột số b chính sau:
1 Kiểm tra tiêu chuẩn đồng nhất
a) Nếu không thỏa mãn tiêu chuẩn đồng nhất và số điểm trong một vùng nhiều hơn 1, tách vùng ảnh làm 4 mi ền (trên, d ớ ph i, ải, trái) bằngcách đệ qu y Nếu kết quả tách xong và không tách đợc n a chuữ yển sa g n
4
2 .1 Phơ ng pháp th ng kê ố
h p với c Tính kết cấu ngẫu nhiên rất phù ợ các đặ trng thống kê Vìvậy, ng i ờ ta có thể dùng các đặc trng ngẫu nhiên để đ o nó nh: Hàm tự
t ơ ng quan (AutoCorrelation Function ACF), các biến đổi ật ộ gờ, a - m đ mtrận tơng tranh … Theo cách tiếp , cận bằng hàm tự t ơ ng quan, độ t hô củakết cấu s i lệ với ợ tỉ độ ộng ủa r c ACF, đợ biểuc di ễn bởi khoảng cá ch x0,
ACF nhờ hàm khởi sinh moment :
Trang 31M(k,l) (m )k(n 2) (m,n)
à
−à
Hình 2.5 Phân tích kết cấu sợi bằ dải tơng quan ng
Trong mô hình này, trờng kết cấu sợi trớc tiên đợc giải chập bởi bộ lọc lấy từ đầu ra của ACF Nh vậy, nếu r(m,n) là ACF thì :
là trờng ngẫu nhiên không tơng quan
L rằng, bộ ọc là ông y nh t, có thể là nhân quả, bán nhânquả hay không nhân quả Các A F ha C y dùng nh M(0, 2 , M( ) 2, 0 , M(1 ) ,1) ,
bình à1, độ phân tán à cũng hay đ2 ợc sử dụng
đNgoài các ặc trng trên, có thể a thêm một số khái niệm và nh nghĩa đ địcác đại lợng dựa trên đó nh: lợc đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám (Grey Level Occurrence Matrices)
ACF
Trích chọn đặc tính
Lọc dải t ơn g quan Phân tích ợc đồl
Đặc tính sợi u(m,n)
Trang 32L ợc đồ hi ệu mức xám:
Lợ đồ iệ ức xám dùng để tả các thông tin ang tính không
gian đợc định nghĩa sa và nh u Cho d=(d1, d2) là vecto dịch chuyển giữa 2
điểm ảnh và g(d ) là ệu ức xám hi m với khoảng cách d :
1 k k
2 k
=
= ( 72- )
Phơng sai đo độ ản mát của t hi m ệu ức xám ại t m ột khoảng cách d
nào đấy K ết cấu tất định thờng có phơng sai σ d t ơ ng đối nhỏ Độ t ơ ng phản cd chính là mô en ủa ợc m c l đồ hg( d g, ) xung quanh =0 và đ đ g o ộ
t nơ g phản của hiệu mức xám
pNgời ta sử dụng entro y để đo đồng nhất cảu lợc hg : độ đồ
=∑N=
1 k
k g k
Trang 33Ma trận xuấ t hiện liên h ệp mức xám i
Giả sử P (k,l,d là xác su ) liên ệp ủa hai iểm ảnh f k và f 1 với các
m ức xám k,l ng ứng cách nhaut ơ m ột khoảng d Xác su ất này dễ dà ng tính
đ c ợ nhờ việc tính số lần xuất hiện n k,l của cặp iểm ảnh (f đ k , f 1 ) có m xám ức
k và l với khoảng cách d Gọi n tlà ổng số cặp liên hi ệp có thể với kho ngả cách d tr ng ảnh Các o phần tử c k,l c ma ủa trận xuất hi ện liên hi mệp ức xám cd
đợc tính nh sau: c d = (c k,l )
Và ck, l = P(k,l,d)= nnkl (2-9)
hi hiệp m m
Ma trận xuất ện liên ức xá C d là ma ận tr vuông NxN phần
tử (N là số mức xám của ảnh) Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian Nếu kết cấu t ngơ đối thô thì các phần tử của ma
trận tập trung xung quanh đờng chéo chính Ng c l ợ ại, nếu kết cấu bề mặt
mịn, giá trị các phần tử của c d sẽ p ân rải h t ơ ng đối rõ
Dựa trên khá ii n ệm này ngời ta định nghĩa về ột số độ o : m đ
- Xác suất c c đại : Pự d = max(k,l) Ck,l (2-10)
Entrop y : Hd -= ∑∑
= =
N 1 k
N 1
l kl kl
)Cln(
1 k
N 1
mCl
k (2- )12
chính vì kh ảng cách -l|o |k m rất nhỏ Id nhỏ có nghĩa, là kết cấu khá thô
Ngời ta cũng còn đa vào m ột số độ đo khác nh hàm tự ơt ng uan phổ q ,
năng lợ g Để áp dụng cách t ếp cận này, cần cài đặt các g ải huật tính các n i i t
đại lợng đo trên
Trang 342 .2 Phơ ng pháp c u trúc ấ
Kết cấu ợ có cấu trúc thuần nhất là những texels xác định, sự xuất
hi ện lặp đi l lặp ại tuân theo m ột luật tất đị nh hay ngẫu nhiên nào đấy Một texel về thực tế là m ột nhóm các điểm ảnh có cùng m ột số tính chất bất bi ến
l ặp trên ảnh Một texel ũng có định nghĩa theo mức xá , theo bề c m m ặt haytính đồng nhất đối với m số các ột tính ch nh ất kích thớc, h ớ ng, l c ợ đồbậc hai ( a trận ng tranh).m t ơ
V các texel đợ phân bố ngẫu nhiên, tính kết ấu ợ ng ng của
nó đợc coi là ếu (Weak) y ngợc với qui lu ật phân bố tất định gọi là khỏe (Strong) Khi tính k ết cấu ợ là s i yếu, luật phân bố có thể o b i:đ ở
Trang 35Chơng III Các phơng pháp nhận dạng ảnh
3 1 Khái quát về nhận dạng
Nhận dạng là quá trình phân loại các đối tợng đợc biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tợng một tên gọi) dựa theo những quy luật và các mẫu chuẩn Quá trình nhận dạng dựa vào
những mẫu học biết trớc gọi là nhận dạng có thày hay học có thày (supervised learning); trong trờng hợp ngợc lại gọi là học không có thày
(non supervised learning) Chúng ta sẽ lần lợt giới thiệu các khái niệm này
3.1.1 Không gian biểu diễn đối tợng, không gian diễn dịch
Không gian biểu diễn đối tợng
Các đối tợng khi quan sát hay thu thập đợc, thờng đợc biểu diễn bởi tập các đặc trng hay đặc tính Nh trong trờng hợp xử lý ảnh, ảnh sau khi đợc tăng cờng để nâng cao chất lợng, phân vùng và trích chọn đặc tính,
đợc biểu diễn bởi các đặc trng nh biên, miền đồng nhất, v ,v Ngời ta thờng phân các đặc trng này theo các loại nh: đặc trng tô pô, đặc trng hình học và đặc trng chức năng Việc biểu diễn ảnh theo đặc trng nào là phụ thuộc vào ứng dụng tiếp theo
ở đây ta đa ra một cách hình thức việc biểu diễn các đối tợng Giả sử
đối tợng X (ảnh, chữ viết, dấu vân tay, v ,v) đợc biểu diễn bởi n thành phần (n đặc trng): X = {x1, x2, , xn}; mỗi xi biểu diễn một đặc tính Không gian biểu diễn đối tợng thờng gọi tắt là không gian đối tợng đợc định nghĩa:X
X= {X1, X2, , Xm}
trong đó mỗi Xi biểu diễn một đối tợng Không gian này có thể là vô hạn Để tiện xem xét chúng ta chỉ xét tập X là hữu hạn
Không gian diễn dịch
Trang 36dKhông gian iễn dịch là tập các tên gọi của đối tợng Kết thúc quá trình nhận dạng ta xác định đợc tên gọi cho các đối tợng trong tập không gian đối tợng hay nói là đã nhận dạng đợc đối tợng Một cách hình thức gọi
Ω là tập tên đối tợng:
Ω= {w1, w2, ,wk} với wi, i = 1, 2, , k là tên các đối tợng
Quá trình nhận dạng đối tợng f là một ánh xạ f: X -> Ω với f là tập các quy luật để định một phần tử trong ứng với một phần tử trong X Ω Nếu tập các quy luật và tập tên các đối tợng là biết trớc nh trong nhận dạng chữ viết (có 26 lớp từ A đến Z), ngời ta gọi là nhận dạng có thày Trờng hợp thứ hai là nhận dạng không có thày Đơng nhiên trong trờng hợp này việc nhận dạng có khó khăn hơn
3.1.2 Mô hình và bản chất của quá trình nhận dạng
3 1.2.1 Mô hình
Việc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô tả mà ngời ta sử dụng để đặc tả đối tợng Trong nhận dạng, ngời ta phân chia làm 2 họ lớn:
- Họ mô tả theo tham số
- Họ mô tả theo cấu trúc
Cách mô tả đợc lựa chọn sẽ xác định mô hình của đối tợng Nh vậy, chúng
ta sẽ có 2 loại mô hình: mô hình theo tham số và mô hình cấu trúc.
• Mô hình tham số: sử dụng một véctơ để đặc tả đối tợng Mỗi phần tử
của véctơ mô tả một đặc tính của đối tợng Thí dụ nh trong các đặc trng chức năng, ngời ta sử dụng các hàm cơ sở trực giao để biểu diễn Và nh vậy ảnh sẽ đợc biểu diễn bởi một chuỗi các hàm trực giao Giả sử C là
đờng bao của ảnh và C(i,j) là điểm thứ i trên đờng bao, i = 1, 2, , N (đờng bao gồm N điểm)
Giả sử tiếp :
Trang 37diện tích, p là chu tuyến
Việc lựa chọn phơng pháp biểu diễn sẽ làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trng nào là hoàn toàn phụ thuộc vào ứng dụng Thí dụ , trong nhận dạng chữ (sẽ trình bày sau), các tham số là các dấu hiệu:
• Mô hình cấu trúc: Cách tiếp cận của mô hình này dựa vào việc mô tả đối
tợng nhờ một số khái niệm biểu thị các đối tợng cơ sở trong ngôn ngữ tự nhiên Để mô tả đối tợng, ngời ta dùng một số dạng nguyên thuỷ nh
đoạn thẳng, cung, v, ,v Chẳng hạn một hình chữ nhật đợc định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một Trong mô hình này ngời ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí hiệu không kết thúc gọi là Vn Ngoài ra có dùng một tập các luật sản xuất để mô tả cách xây
Trang 38dựng các đối tợng phù hợp dựa trên các đối tợng đơn giản hơn hoặc đối tợng nguyên thuỷ (tập Vt) Trong cách tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu Một cách hình thức, ta có thể coi mô hình này tơng đơng một văn phạm G = (Vt, Vn, P, S) với:
Hình 3.1 Mô hình cấu trúc của một đối tợng nhà
3 1.2.2 Bản chất của quá trình nhận dạng
Quá trình nhận dạng gồm 3 giai đoạn chính:
- Lựa chọn mô hình biểu diễn đối tợng
- Lựa chọn luật ra quyết định (phơng pháp nhận dạng) và suy diễn quá trình học
Trang 39Khi mô hình biểu diễn đối tợng đã đợc xác định, có thể là định lợng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học Học là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tợng thành các lớp
Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán
đối tợng vào một lớp hay nói một cách khác gán cho đối tợng một tên
Học có thày (supervised learning)
Kỹ thuật phân loại nhờ kiến thức biết trớc gọi là học có thày Đặc
điểm cơ bản của kỹ thuật này là ngời ta có một th viện các mẫu chuẩn Mẫu cần nhận dạng sẽ đợc đem sánh với mẫu chuẩn để xem nó thuộc loại nào Thí dụ nh trong một ảnh viễn thám, ngời ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có các miêu tả về các đối tợng đó Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tợng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là
Học không có thày(unsupervised learning)
Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số
đặc trng cho từng lớp Học không có thày đơng nhiên là khó khăn hơn Một mặt, do số lớp không đợc biết trớc, mặt khác những đặc trng của các lớp cũng không biết trớc Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất Bắt đầu từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt đợc một phơng án phân loại
Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo sơ đồ sau:
Trang 40Hình 3.2 Sơ đồ tổng quát một hệ nhận dạng
3.2 nhận dạng dựa trên phân hoạch không gian
Trong kỹ thuật này, các đối tợng nhận dạng là các đối tợng định lợng Mỗi đối tợng đợc biểu diễn bởi một véctơ nhiều chiều Trớc tiên, ta xem xét một số khái niệm nh: phân hoạch không gian, hàm phân biệt sau đó
sẽ đi vào một số kỹ thuật cụ thể
3 2.1 Phân hoạch không gian
Giả sử không gian đối tợng X đợc định nghĩa : X = {Xi, i=1, 2, ,m},
Xi là một véctơ Ngời ta nói p là một phân hoạch của không gian X thành các lớp Ci, Ci ⊂ X nếu:
Ci ∩ Cj = Φ với i ≠ j và ∪ Ci = X
Nói chung, đây là trờng hợp lý tởng: tập X tách đợc hoàn toàn Trong thực tế, thờng gặp không gian biểu diễn tách đợc từng phần Nh vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X -> p Công cụ xây dựng ánh xạ này là các hàm phân biệt (Descriminant functions)
3 2.2 Hàm phân lớp hay hàm ra quyết định
Đánh giá
Trả lời Phân lớp