1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên ứu ứng dụng á phương pháp nhận dạng ảnh trong điều khiển robot

114 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Ứng Dụng Các Phương Pháp Nhận Dạng Ảnh Trong Điều Khiển Robot
Tác giả Nguyễn Minh Sơn
Người hướng dẫn TS. Nguyễn Văn Khang
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Tự Động Hóa Xncn
Thể loại luận văn thạc sĩ khoa học
Năm xuất bản 2008
Thành phố Hà Nội
Định dạng
Số trang 114
Dung lượng 2,65 MB

Nội dung

Xuất phát từ nhu cầu thực tiễn trên, Tôi đã chọn đề tài Nghiên cứu ứng Trang 9 Quyển luận văn này sẽ nh một tài liệu tham khảo, giúp ngời đọc có hình dung về khái niệm nhận dạng ảnh,

Trang 1

nguyÔn minh s¬n

Ngêi híng dÉn khoa häc : TS NguyÔn V¨n khang

hµ néi - 2008

Trang 2

Lời cam đoan

Tôi xin cam đoan bản luận văn này đợc thực hiện bởi chính bản thân tôi dới sự hớng dẫn của TS Nguyễn Văn Khang cùng với các tài liệu đã đợc trích dẫn trong phần tài liệu tham khảo ở phần cuối bản luận văn

Nguyễn Minh Sơn

Trang 3

ph¸p nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot”

9B

1.1 Tæng quan vÒ øng dông c¸c ph¬ng ph¸p nhËn d¹ng ¶nh

13B1.1.2 C¬ së khoa häc cña øng dông c¸c ph¬ng ph¸p nhËn d¹ng

17B1.1.4 T×nh h×nh nghiªn cøu øng dông nhËn d¹ng ¶nh trong ®iÒu

19B1.1.5 T×nh h×nh nghiªn cøu, øng dông trong níc 20B7

Trang 4

77B3.1.1 Không gian biểu diễn đối tợng, không gian diễn dịch 78B28

79B3.1.2 Mô hình và bản chất của quá trình nhận dạng 80B29

83B3.1.2.2 Bản chất của quá trình nhận dạng 84B31

86B33

Trang 5

3.4 m¹ng n¬ ron nh©n t¹o vµ NhËn d¹ng theo m¹ng n¬ ron 112B41

Trang 6

4.2 Xây dựng các tham số cho bộ điều khiển camera 142B75

143B4.2.1 Tính toán tốc độ quay theo phơng ngang ϕ 144B75

145B4.2.2 Tính toán tốc độ quay theo phơng đứng ψ 146B77

147B

4.3 Xây dựng các tham số cho bộ điều khiển robot 148B78

149B4.3.1 Các tham số ảnh hởng tới tốc độ của Robot 150B78

151B4.3.2 Tính toán các tham số trong bộ điều khiển 152B79

Trang 7

Danh mục ký hiệu và chữ viết tắt

ξx, ξy Tọa độ của đối tợng trong ảnh

ϕ G óc của camera theo phơng ngang

ψ Góc của camera theo phơng đứng

e Vector sai lệch vị trí

Trang 8

Lời Mở đầu

Sự phát triển của kỹ thuật điện tử và công nghệ thông tin đã kéo theo sự phát triển của một loạt các ngành liên quan Một trong những ngành đó là ngành xử lý – nhận dạng ảnh số Trên thế giới, công nghệ xử lý – nhận dạng ảnh đã và đang đợc phát triển rất mạnh mẽ vì nó có rất nhiều ứng dụng trong hầu hết các lĩnh vực của con ngời Và hiện nay, nếu sản phẩm nào có ứng dụng công nghệ này thì đều đợc coi là sản phẩm thông minh, có sức cạnh tranh lớn Một trong những lĩnh vực rất cần đợc trang bị công nghệ nhận dạng ảnh đó là công nghiệp chế tạo Robot Việc ứng dụng công nghệ này trong điều khiển Robot sẽ làm tăng khả năng nhận thức cho Robot, làm cho nó ngày càng hoàn thiện và giống con ngời

ở trong nớc, môn xử lý ảnh mới chỉ đợc giảng dạy ở một số trờng trọng điểm về khoa học kỹ thuật nh Đại học Bách khoa Hà nội, Đại học Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh… Và mới chỉ giới hạn trong các ngành nh công nghệ thông tin, điện tử viễn thông Hiện, cha có nhiều nghiên cứu để đa công nghệ này vào ứng dụng thực tiễn trong các ngành, các lĩnh vực khác

– Hiện nay, công nghệ xử lý nhận dạng ảnh số đang đợc rất nhiều bạn trẻ quan tâm Đặc biệt là các bạn sinh viên đang hoặc có ý định tham gia trò chơi Robocon quốc tế Bởi vì hầu hết các Robot tự động hiện nay chủ yếu

rò đờng theo vạch kẻ sân và không phân biệt đợc cấu kiện của mình hay của

đội bạn Việc trang bị kỹ thuật nhận dạng ảnh cho Robot tự động sẽ làm giảm bớt các nhợc điểm trên, đồng thời làm tăng khả năng điều khiển linh hoạt cho Robot

Xuất phát từ nhu cầu thực tiễn trên, Tôi đã chọn đề tài Nghiên cứu ứng

dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot

Trang 9

Quyển luận văn này sẽ nh một tài liệu tham khảo, giúp ngời đọc có hình dung về khái niệm nhận dạng ảnh, các phơng pháp nhận dạng ảnh và biết cách ứng dụng công nghệ này trong điều khiển Robot Cụ thể ở đây tôi xây dựng phơng pháp nhận dạng ảnh để điều khiển Robot trong việc tìm và

đuổi bắt mục tiêu đang di động có phơng và vận tốc cha biết

Trong khuôn khổ của một đề tài với quỹ thời gian không cho phép và có một số khó khăn trong việc cập nhập tài liệu cũng nh do hạn chế của bản thân, nên chắc chắn quyển luận văn này không tránh khỏi những thiếu sót Vậy kính mong các thầy cô cùng các bạn yêu thích công nghệ này đóng góp chỉ bảo, phê bình để đề tài này ngày càng hoàn thiện

Trang 10

chơng I Tổng quan về “ ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot” và nội dung

cần nghiên cứu

1.1 Tổng quan về ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot

1.1.1 Tính thời sự

Ngày nay, trớc sự phát triển vợt bậc của khoa học kỹ thuật, các thiết

bị máy móc thay thế hoặc hỗ trợ cho con ngời trong lao động sản xuất, trong sinh hoạt, đòi hỏi ngày càng phải hoàn thiện hơn Trong những năm gần đây

do kỹ thuật vi điện tử phát triển rất mạnh, đã khiến cho tốc độ của các bộ vi xử

lý ngày càng cao, chất lợng của các camera kỹ thuật số ngày càng hoàn thiện Vì vậy, việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh ngày càng sâu rộng trong tất cả các lĩnh vực nh trong công nghiệp, quân sự, an ninh, vũ trụ, y học, giao thông vv… và cả trong cuộc sống hàng ngày

Từ khi xuất hiện cho tới nay, không ai có thể phủ nhận đợc vai trò của Robot trong sản xuất công nghiệp lẫn trong sinh hoạt gia đình Chúng sẽ thực hiện những công việc rất nhàm chán hoặc nguy hiểm, và những công việc mà tốc độ và độ chính xác vợt quá khả năng của con ngời Khi ngời máy trở nên tinh vi hơn, thị giác máy tính sẽ đóng vai trò ngày càng quan trọng Ngời

ta sẽ đòi hỏi ngời máy không những phát hiện và nhận dạng các bộ phận công nghiệp mà còn hiểu đợc những gì chúng thấy và đa ra những hành

động phù hợp Việc phát triển, hoàn thiện các tính năng giúp cho ngời máy ngày càng giống với con ngời đã khiến các nhà khoa học trên thế giới phải tốn nhiều công sức Ngày nay, cùng với sự phát triển tột bậc của khoa học kỹ

Trang 11

thuật, ngời ta đã tạo ra đợc nhiều Robot có khả năng quan sát, làm đợc nhiều việc với độ chính xác cao vv Trong những con Robot này, ngời ta sử …dụng một hay nhiều camera để ghi lại hình ảnh xung quanh Robot Và bằng công nghệ nhận dạng ảnh, xử lý ảnh, máy tính sẽ phân tích và đa ra quyết

định Nh vậy camera, công nghệ nhận dạng ảnh đóng một vai trò rất quan trọng, nó giống nh mắt của con ngời

Việc tìm hiểu, nghiên cứu các kỹ thuật xử lý ảnh, nhận dạng ảnh đã và

đang đợc sự quan tâm của rất nhiều nhà nghiên cứu vì đây là lĩnh vực còn rất mới Bên cạnh đó việc nghiên cứu các kỹ thuật này, sẽ giúp chúng ta bắt nhịp

đợc với sự phát triển công nghệ của thế giới Từ đó ta có thể nắm đợc , nguyên lý để ứng dụng vào các ngành công nghệ khác đồng thời làm chủ đợc các thiết bị hiện có trên thị trờng đang ứng dụng công nghệ này

1.1.2 Cơ sở khoa học của ứng dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot

ý tởng sử dụng camera làm mắt cho robot đã có từ lâu, từ khi camera mới xuất hiện Nhng điều đó rất khó có thể thực hiện bởi vì tín hiệu ra của camera là tơng tự và đợc lu trong các băng từ gây khó khăn cho việc truy xuất, xử lý dữ liệu Đồng thời, tốc độ xử lý của các chíp điện tử còn rất chậm nên phải mất rất nhiều thời gian để phân tích các khối dữ liệu lớn Lý thuyết

về xử lý, nhận dạng ảnh còn cha phát triển

Ngày nay, với sự phát triển vợc bậc của kỹ thuật vi điện tử đã tạo ra các bộ vi xử lý có tốc độ rất cao lên đến hàng GHz Cùng với sự xuất hiện của các camera kỹ thuật số, việc truyền và xử lý dữ liệu trở nên dễ dàng hơn Một hớng phát triển mới của các hãng sản xuất chíp điện tử là phát triển các chíp FPGA chạy các ứng dụng xử lý ảnh một cách độc lập (Nhúng các thuật toán

xử lý ảnh vào các chip)

Cơ sở của nhận dạng ảnh chính là lý thuyết xử lý ảnh số Nhận dạng

ảnh là giai đoạn cuối của các hệ thống xử lý ảnh Nhận dạng ảnh dựa trên lý

Trang 12

thuyết nhận dạng (Pattern Recognition) đã đợc đề cập trong nhiều sách về nhận dạng Trong lý thuyết về nhận dạng nói chung và nhận dạng ảnh nói riêng có ba cách tiếp cận khác nhau:

- Nhận dạng dựa vào phân hoạch không gian

- Nhận dạng dựa vào cấu trúc

- Nhận dạng dựa vào kỹ thuật mạng nơron

Hai cách tiếp cận đầu là cách tiếp cận kinh điển Các đối tợng ảnh quan sát và thu nhận đợc phải trải qua giai đoạn tiền xử lý nhằm tăng cờng chất lợng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trng, cuối cùng mới là giai đoạn nhận dạng Cách tiếp cận thứ ba hoàn toàn khác Nó dựa vào cơ chế đoán nhận, lu trữ và phân biệt đối tợng mô phỏng theo hoạt động của hệ thần kinh con ngời Do cơ chế đặc biệt, các đối tợng thu nhận bởi thị giác ngời không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các mẫu đã lu trữ để nhận dạng

1.1.3 Tính ứng dụng

Việc ứng dụng công nghệ nhận dạng ảnh trong điều khiển Robot mở ra một triển vọng phát triển rất lớn cho ngành nghiên cứu và chế tạo Robot Việc ứng dụng này giúp cho Robot có thể quan sát đợc vật thể, từ đó mà nó có thể

có thêm nhiều tính năng mới giống ở con ngời Có thể ứng dụng công nghệ này trên Robot trong rất nhiều lĩnh vực khác nhau nh:

Trong y học: chế tạo ra các Robot dẫn đờng giúp ngời già, ngời khuyết tật

dTrong ngành vũ trụ: chế tạo ra các Robot thăm ò, có khả năng tự di chuyển và phân tích các mẫu đất, đá

Trong lĩnh vực quân sự: chế tạo ra Robot trinh sát có khả năng dẫn

đờng và tự tìm mục tiêu

Trong lĩnh vực giao thông: đó là các xe ôtô thông minh có khả năng tự lái, tự di chuyển vào bãi đỗ

Trang 13

Trong công nghiệp: chế tạo ra các Robot phân loại sản phẩm, xe tự hành vv.…

Trong đời sống: chế tạo ra các Robot bảo mẫu chông trẻ, Robot nội trợ, Robot văn phòng …vv

1.1.4 Tình hình nghiên cứu ứng dụng nhận dạng

ảnh trong điều khiển Robot trên thế giới

Việc ứng dụng Robot trong y học nhằm giúp những ngời tàn tật có thể hội nhập với cộng đồng Với sản phẩm EagleEyes của trờng đại học Boston

sử dụng thiết bị cảm biến và qua một màn hình máy tính, EagleEyes có thể tránh các vật cản trên đờng đi hoặc có thể rẽ trái hoặc phải tùy ý theo tín hiệu của đôi mắt, các tín hiệu từ đôi mắt sẽ đợc một bộ cảm nhận tín hiệu chuyển thành các tín hiệu điện mà EagleEyes Robot có thể hiểu đợc

Trong công nghiệp có các sản phẩm nh:

- Hệ thống 3 cánh tay máy, sản phẩm của công ty Fanuc, vừa đoạt giải thởng robot Nhật Bản 2007 với khả năng gắp 120 chi tiết trong 1 phút từ băng chuyền Nó có thể di chuyển nhanh chóng nhng chính xác dựa trên các dữ liệu hình ảnh từ camera Các cánh tay hoạt động phối hợp nhịp nhàng với nhau và nhặtđồvật bằng giác hút chân không

HOAP 3 là một robot dạng ngời thu nhỏ của công ty Fujitsu cao 60

-cm, có thể di chuyển trên 2 chân Với 2 camera, 1 microphone, các đèn LED biểu thị cảm xúc và khá nhiều cảm biến gắn trên thân, HOAP-3 có thể nhận dạng hình ảnh, điều khiển 28 bậc tự do Ngời sử dụng có thể điều khiển HOAP-3 thông qua mạng LAN không dây và lập trình để thay đổi nhiệm vụ cho robot

Trong sinh hoạt gia đình: iRobo Roomba, có thể lau chùi phòng ăn sạch bóng, di chuyển với một robot “xe jeep” nhỏ gắn máy quay phim “Xe jeep” báo cho Roomba biết các chớng ngại để tránh

Trang 14

1.1.5 Tình hình nghiên cứu, ứng dụng trong nớc

ở trong nớc, môn xử lý ảnh mới chỉ đợc giảng dạy ở một số trờng trọng điểm về khoa học kỹ thuật nh Đại học Bách khoa Hà nội, Đại học Quốc gia Hà nội, Đại học Bách khoa thành phố Hồ Chí Minh… Và mới chỉ giới hạn trong các ngành nh công nghệ thông tin, điện tử viễn thông Số lợng sách tham khảo về xử lý ảnh bằng tiếng việt còn rất h n chế, chủ yếu ạvẫn là sách viết bằng tiếng Anh nên đã gây khó khăn cho những ngời mới học hoặc đang muốn tìm hiểu Tuy nhiên, do sự phát triển của khoa học kỹ thuật nên công nghệ xử lý ảnh đang đợc rất nhiều nhà khoa học trẻ quan tâm nghiên cứu Các đề tài nghiên cứu khoa học cấp trờng, cấp nhà nớc đã và

đang đợc triển khai hàng năm Trong đó có một số đề tài cho kết quả khả quan và đang đựơc ứng dụng rộng rãi nh đề tài ứng dụng công nghệ nhận dạng ảnh trong việc giải quyết bài toán dò đờng cho robot, phần mềm nhận dạng ảnh biển số xe, phần mềm nén và xử lý ảnh, phần mềm nhận dạng chữ viết …vv Tuy nhiên các ứng dụng của công nghệ xử lý ảnh trong công nghiệp vẫn còn rất hạn chế

Sản phẩm của nhóm nghiên cứu: Nguyễn Đức Thành, Nguyễn Đức Minh, bộ môn điều khiển tự động, Đại học Bách khoa TP Hồ Chí Minh Nhóm nghiên cứu đã sử dụng camera kết hợp mạng nơ ron và giải thuật xử lý

ảnh để nhận dạng, xác định vị trí và hớng của vật Kết quả nghiên cứu đợc dùng để điều khiển robot Scorbot gắp vật và di chuyển đến vị trí định trớc Robot có năm bậc tự do, đợc điều khiển bằng máy tính qua cổng RS232 và phần mềm ACL Nó sử dụng một camera quan sát nhìn từ trên xuống, bao quát vùng hoạt động của cánh tay robot

Trang 15

tay Robot di chuyển đến vị trí mong muốn, đợc áp dụng trong việc di chuyển sản phẩm từ máy gia công sang băng tải Đề tài này đã đợc mở rộng bằng cách đa hình ảnh từ Camera vào máy vi tính và sau đó điều khiển di chuyển tay máy dựa trên hình ảnh thu nhận đợc từ Camera

Trong sân chơi quốc tế nh Robocon, trong mấy năm đầu sinh viên Việt Nam luôn đạt thứ hạng cao nhờ trí tuệ và sức sáng tạo của mình Nhng hiện nay, do các bạn sinh viên các nớc có công nghệ phát triển cao nh Nhật Bản, Trung Quốc đã bắt đầu ứng dụng công nghệ nhận dạng ảnh trong việc điều khiển Robot tự động có thể tự tìm đờng đi, tránh chớng ngại vật để tiếp cận mục tiêu Trong khi đó Robot tự động của các đội , sinh viên Việt Nam hoạt

động chủ yếu bằng cách đợc lập trình để dò đờng dựa trên các vạch trắng trên sân thi đấu Robot dò đờng hoạt động không ổn định nên việc dò đờng nhầm, chạy nhầm không phải là hiếm; có trờng hợp lúc chạy thử thì rất tốt, nhng khi thi đấu chính thức lại chạy sai

ở Việt Nam, công nghệ xử lý ảnh không phải là một công nghệ mớiCông nghệ này đã đợc nhắc đến rất nhiều trong cộng đồng Robocon suốt những năm qua nhng cha từng đợc đem vào ứng dụng trong cuộc thi vì công nghệ tơng đối phức tạp Các thí sinh tham gia Robocon cha đủ khả năng, tài chính và thời gian để chiếm lĩnh công nghệ này, mặc dù những ứng dụng của nó là vô cùng hiệu quả và là niềm mơ ớc của bất cứ đội nào

Khi cha có công nghệ xử lý ảnh, thì việc để cho robot chạy đợc giống nh việc để một ngời “mù” lái xe ô tô theo sự chỉ dẫn của một ngời sáng mắt nhng lại hoàn toàn không biết điều khiển phơng tiện này Hiện nay, với việc áp dụng công nghệ xử lý ảnh, ngời ta đã lắp thêm cho ngời mù đôi mắt, làm tăng độ chuẩn xác trong các quyết định điều khiển robot lên rất nhiều

, Hiện nay trên các diễn đàn trao đổi khoa học công nghệ có uy tín nh

dientuvietnam.net, dientuvienthong.net…, đang diễn ra các cuộc thảo luận rất

sôi nổi xung quanh việc ứng dụng công nghệ xử lý ảnh, nhận dạng ảnh trong

Trang 16

điều khiển Robot, nhận dạng chữ viết, mặt ngời… Đây chính là nơi cung cấp tài liệu, kinh nghiệm, giúp cho các bạn sinh viên có thể thực hiện đợc ý tởng sáng tạo của mình

1.2 Các bớc chính trong hệ thống nhận dạng

1.2.1 Thu NHận ảnh

Việc thu nhận ảnh đợc thực hiện thông qua việc chụp ảnh từ camera Chất lợng của ảnh thu đợc từ bớc này phụ thuộc nhiều vào chất lợng camera, tốc độ di chuyển khi chụp, góc nhìn và độ sáng

1.2.2 Tiền xử lí (lấy mẫu, lọc nhiễu, tơng phản, )

Sau bộ thu nhận, ảnh có thể nhiễu và độ tơng phản thấp nên cần đa vào bộ tiền xử lý để nâng cao chất lợng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tơng phản để làm ảnh rõ hơn, nét hơn

Trớc khi áp dụng các phơng pháp nhận dạng ảnh, chúng ta cần xử lý

ảnh để đảm bảo rằng ảnh sẽ thoả mãn một vài giả thiết nào đó Ví dụ nh sau: Lấy mẫu lại để đảm bảo hệ thống tọa độ là đúng Nếu 2 ảnh lấy liên tiếp nhau có sự sai khác quá nhiều thì chúng ta có thể loại bỏ ảnh đó vì t thế của robot lúc chụp không đợc ổn định

Loại bỏ nhiễu để giảm thiểu khả năng xuất hiện các thông tin sai

Tăng độ tơng phản để đảm bảo sẽ xác định đợc các thông tin cần thiết

1.2.3 Phân vùng ( Segmen ati n) t o

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì th cho mục đích phân loại bu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngời thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh

và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh

Trang 17

phụ thuộc rất nhiều vào công đoạn này

1.2.4 Phân tích hình ảnh (xác định đờng, góc, cạnh, khối, )

Đầu ra ảnh sau phân vùng chứa các điểm ảnh của vùng ảnh (ảnh đã phân vùng) cộng với mã liên kết với các vùng lân cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trng (Feature Selection) gắn với việc tách các đặc tính của ảnh dới dạng các thông tin định lợng hoặc làm cơ sở để phân biệt lớp đối tợng này với đối tợng khác trong phạm vi ảnh nhận đợc Ví dụ: trong nhận dạng ký tự trên phong bì th, chúng

ta miêu tả các đặc trng của từng ký tự giúp phân biệt ký tự này với ký tự khác

1.2.5 Nhận dạng

Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thờng thu

đợc bằng cách so sánh với mẫu chuẩn đã đợc học (hoặc lu) từ trớc Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì th có thể đợc nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh đợc phân theo hai loại nhận dạng ảnh cơ bản:

Trang 18

Đến bớc này thì dữ liệu đầu vào chỉ là một phần của dữ liệu ban đầu,

đó có thể là tập các điểm ảnh hoặc một vùng ảnh có khả năng chứa một đối tợng đặc biệt nào đó Quá trình xử lý sẽ qua các bớc sau:

- Thẩm định lại dữ liệu có phù hợp với các yêu cầu cơ bản và đặc biệt

- Ước lợng các tham số đặc biệt

- Phân lớp đối tợng xác định đợc

1.3 Nội dung nghiên cứu

Do lĩnh vực điều khiển Robot là rất rộng lớn, tùy từng ứng dụng khác nhau mà Robot có những tính năng riêng Từ đó mà công việc nhận dạng ảnh cho từng loại Robot cũng có sự khác biệt Trong khuôn khổ của Đồ án này tôi xin trình bày về các phơng pháp nhận dạng và mô phỏng quá trình nhận dạng một đối tợng cụ thể, từ đó sẽ ứng dụng để điều khiển Robot và tính toán các tham số cần thiết cho bộ điều khiển

Trang 19

3) Robot có thể di chuyển trên ba bánh: hai bánh phát lực ở đằng sau và

1 bánh lái theo nhiều hớng ở phía trớc

4) Robot đợc trang bị thêm một camera đợc gắn trên trục của bánh lái Camera có thể quay trên mặt phẳng ngang và mặt phẳng đứng Mỗi trục quay của camera đều có một encorder tuyệt đối để đo góc quay

5) Để giảm bớt khối lợng tính toán trong xử lý ảnh, giả thiết quả bóng

có màu sẫm còn mặt phẳng chuyển động là màu trắng

Mô hình robot này đợc ứng dụng trong trò chơi robot đá bóng, trong

đó quả bóng thay đổi tốc độ và hớng thờng xuyên, hay Robot tự động trong cuộc thi Robocon

Với giả thiết số 5 và chất lợng hình ảnh từ camera là rất tốt, ta có thể

bỏ qua khâu tiền xử lý ảnh Vì vậy, trong các chơng sau, tôi sẽ trình bày về phân vùng, nhận dạng ảnh, sau đó ứng dụng nhận dạng ảnh cho bài toán điềukhiển robot trên

1.4 mục tiêu và Nội dung của luận văn

1.4.1 Mục tiêu

Do nhận dạng ảnh là giai đoạn cuối cùng của xử lý ảnh vì vậy để trình bày chi tiết các bớc của một quá trình nhận dạng ảnh sẽ làm cho nội dung

của luận văn rất lớn Hơn nữa mục tiêu chính của luận văn là Nghiên cứu ứng

dụng các phơng pháp nhận dạng ảnh trong điều khiển Robot Vì vậy ở trong

phần nhận dạng tôi chỉ trình bày hai bớc chính đó là phân vùng ảnh và nhận dạng ảnh Mục tiêu nghiên cứu của luận văn này là:

- Nghiên cứu các bớc chính của quá trình nhận dạng ảnh số

- ứng dụng nhận dạng ảnh để điều khiển chuyển động của Robot

- Tính toán đợc các tham số cần thiết cho bộ điều khiển Robot

- Mô phỏng đợc quá trình nhận dạng và quá trình điều khiển

1.4.2 Nội dung

Trang 20

Tõ môc tiªu trªn, néi dung cña luËn v¨n gåm c¸c phÇn sau:

Ch¬ng 1: Tæng quan vÒ “ øng dông c¸c ph¬ng ph¸p nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot” vµ néi dung cÇn nghiªn cøu

Ch¬ng 2: Ph©n vïng ¶nh

Ch¬ng 3: NhËn d¹ng ¶nh

Ch¬ng 4: øng dông nhËn d¹ng ¶nh trong ®iÒu khiÓn Robot

Ch¬ng 5: M« pháng

Trang 21

Chơng II phân vùng ảnh

Để phân tích các đối tợng trong ảnh, chúng ta cần phải phân biệt đợc các đối tợng cần quan tâm với phần còn lại của ảnh Những đối tợng này có thể tìm ra đợc nhờ các kỹ thuật phân vùng ảnh, theo nghĩa tách phần tiền cảnh ra khỏi hậu cảnh trong ảnh

Vùng ảnh là chi tiết, ột thực thể trong toàn ảnh Nó là ộttập h p ợ các đi ểm có cùng hoặc gần cùng m ột tính chất nào đó: mức xám ,

mức màu, độ nhám… Vùn ản l mg h à ột trong hai th ộc tính ủa nh Nói u c ả

đến vùng ảnh là nói đến tính chất mbề ặt Đờng bao uanh q một vùng ảnh(Boundar ) y là biên ảnh ác C điểm trong m ột vùng ảnh có độ bi ến thiên giátrị m xáức m t ng đối đồng đều h y ính kết cấu tơng đồng ơ a t

Trang 22

nh thế nào? Mặc dù không có thuật toán chọn ngỡng vạn năng nào có thể áp dụng cho mọi loại ảnh Chúng ta cũng có nhiều phơng pháp đa ra dới đây:

1

2.1 Ngỡng cố định

Phơng pháp đầu tiên là chọn một ngỡng độc lập với dữ liệu ảnh Nếu chúng ta biết trớc là chơng trình ứng dụng sẽ làm việc với những ảnh có độ tơng phản rất cao, trong đó các đối tuợng quan tâm rất tối còn nền gần nh

đồng nhất và rất sáng, thì giá trị ngỡng không đổi 128 trên thang độ sáng từ 0

đến 255 sẽ là một giá trị chọn khá chính xác Chính xác ở đây nên đợc hiểu

theo nghĩa là số lợng các điểm ảnh bị phân lớp sai là cực tiểu

2.1.2 Ngỡng dựa trên lợc đồ

Trong hầu hết các trờng hợp, ngỡng đợc chọn từ lợc đồ độ xám của vùng hay ảnh cần đợc phân vùng Hình 2.1 cho chúng ta một ví dụ về ảnh và lợc đồ độ xám liên kết với nó

Trang 23

N N i

1

mang lại, nhằm loại bỏ những dao động nhỏ về độ sáng Tuy nhiên các thuật

toán làm trơn cần phải cẩn trọng không đợc làm dịch chuyển các vị trí đỉnh

của lợc đồ Nhận xét này dẫn đến thuật toán làm trơn lợc đồ dới dây, với

độ rộng của cửa sổ W là N, thông dụng là N=3 hoặc N=5 (bộ lọc trung bình 1

-chiều):

(2- 1)

2.1.2.1 Tuật toán đẳng liệu (Isodata)

Kỹ thuật chọn ngỡng theo kiểu lặp này do Ridler và Calvard đa ra

Thuật toán nh sau:

- Chia lợc đồ thành 2 đoạn bằng một giá trị ngỡng khởi động θ0 =2B-1

,

tức là bằng phần nửa thang độ xám động của ảnh

- Sau đó tính toán độ sáng trung bình của 2 vùng:

- m f , 0 của những điểm ảnh thuộc đối tợng

+

=

θ Quá trình này cứ thế sẽ đợc tiếp tục với các ngỡng mới cho đến khi

nào giá trị ngỡng không thay đổi nữa thì dừng lại Biểu diễn dới dạng công

− +

=

θ cho tới khi θk = θk-1

2.1.2.2 Thuật toán tam giác

Thuật toán này do Zack đa ra và đợc minh họa trong hình 2.2 Trong

hình này, chúng ta có thể quan sát thấy một đờng thẳng đ đợc xây dựng ã

bằng cách nối từ giá trị lớn nhất của lợc đồ tại độ sáng bmax đến giá trị nhỏ

nhất của lợc đồ tại độ sáng bmin .Với mỗi độ sáng b trong khoảng [bmax, bmin],

Trang 24

chúng ta đi tính khoảng cách từ giá trị lợc đồ tại d b là h[b] đến đờng thẳng

đã có Giá trị b0 ứng với khoảng cách lớn nhất sẽ đợc chọn làm giá trị ngỡng

θ

Kỹ thuật lấy ngỡng không nhất thiết phải đợc áp dụng cho toàn bộ

ảnh, mà có thể áp dụng cho từng vùng ảnh một Hai tác giả Chow và Kaneko

đã phát triển một biến thể của kỹ thuật lấy ngỡng bằng cách chia một ảnh có kích thớc M N ra thành nhiều vùng không chồng chất lên nhau Các giá trị xngỡng đợc tính riêng biệt cho từng vùng một và sau đó đợc kết hợp lại thông qua phép nội suy để hình thành nên một mặt ngỡng cho toàn bộ ảnh Trong thuật toán mới này, kích thớc của các vùng cần đợc chọn một cách thích hợp sao cho có một lợng đáng kể các điểm ảnh ở trong một vùng, nhằm phục vụ cho việc tính lợc đồ và xác định ngỡng tơng ứng Tính hữu ích của thuật toán này, cũng nh nhiêu thuật toán khác, sẽ phụ thuộc vào từng ứng dụng cụ thể

2.2 Thuật toán gán nhãn thành phần liên thông

Kỹ thuật này gán cho mỗi thành phần liên thông của ảnh nhị phân một nhãn riêng biệt Nhãn thờng là các số tự nhiên bắt đầu từ một đến tổng số các thành phần liên thông có trong ảnh Giải thuật quét ảnh từ trái sang phải và từ

Trang 25

trên xuống dới Trong dòng thứ nhất của các pixel đen, một nhãn duy nhất

đợc gán cho mỗi đờng chạy liên tục của pixel đen Với mỗi pixel đen của các dòng tiếp theo, các pixel lân cận trên dòng trớc và pixel bên trái đợc xem xét Nếu bất kì pixel lân cận nào đợc gán nhãn, nhãn tơng tự đợc gán cho pixel đen hiện thời; ngợc lại nhãn tiếp theo cha đợc sử dụng đợc chọn Thủ tục này đợc tiếp tục cho tới dòng cuối của ảnh

Lúc kết thúc tiến trình này, một thành phần liên thông có thể chứa các pixel có các nhãn khác nhau vì khi chúng ta xem xét lân cận của pixel đen, chẳng hạn pixel “?” trong hình vẽ 2.3 a Pixel đối với lân cận trái và những lân cận trong dòng trớc có thể đợc gán nhãn một cách riêng biệt Một tình huống nh vậy phải đợc xác định và ghi lại Sau tiến trình quét ảnh, việc gán nhãn đợc hoàn tất bằng cách thống nhất các mâu thuẫn các nhãn và gán lại các nhãn cha sử dụng

Để minh hoạ ta có hình biểu diễn sau :

Hình a Trờng hợp Pixel ? không gán đợc nhãn

(P: lân cận trớc, L lân cân trái )

Trang 26

sẽ xác định tiêu chuẩn phân ùng Tính đồng nhất v của m mi ả ột ền nh là điểm

c ếu hủ y xác ịnh tính đ hi ệu quả của việc phân vùng Các tiêu chuẩn ha y đợc

dùng là sự thuầ nh n ất về mức xám m, àu sắc đối vớ i ảnh màu, kết cấ su ợi

Về ng yên ắc, ph ng pháp này iể tra ính úng đắ của tiêu chuẩn

đề ra m cách tổng ột thể trên mi lớn ền của ảnh Nếu tiêu chuẩn ợ thỏa m đ c ãn,việc phân vùng coi nh kết thúc

Trong trờ ợ ngợ lại, chia ền ang xét thành nhỏ n.Với mỗi miền nhỏ, áp dụng m cá ột ch đệ quy ph ơ  ng pháp trên cho đế khin tất c micả ác ền đều thỏa m đi ãn ều kiện

Trang 27

Phơng pháp này ó thể ô tả bằng thuật toán sau : c m

Chia miền đang xét thà h 4 m ền : 1, Z2, Z3, Z4

End

Else exit

End

Tiêu chuẩn xét ền đồng nhất ây có thể dự ào ức xá Ngoài

ra, có thể dựa vào độ lệch chuẩn ha y độ chê gi nh ữa giá trị m ức xám lớn nhất

và giá trị mức xám nhỏ nhất Giả sử Max và Min là giá trị ức xám m lớn nhất

và nhỏ nhất trong ền đmi ang xét N u : ế

ta coi mi đền ang xét đlà ồng nhất Trờng ợ ngợ h p c lại, mi đền ang xét kh ngô

là miền đồng nhất và sẽ ợc hia làm 4 phần.đ c

Thuật toán kiểm tra tiêu chuẩn dựa vào độ chênh lệch max, min đợc viết :

Function Examin_Criteria(I, N1, M1, N2, M2, T)

/* Giả thiết ảnh có tối đa 255 mức xám (N1, M1), (N2, M2) là tọa độ

điểm đầu và điểm cuối của miền; T là ngỡng */

Trang 28

Thuật toán ày tạo nên ột cây ỗi nút cha có nút con ọi

m ức trừ m ức ngoài cùng Vì thế, cây nà y có tên là cây tứ phân Cây ho ta c hình nh ả n rõ ét về c ấu trúc phân ấp của các vùng ơ c t ng ứng với tiêu chuẩn Một vùng thỏa mãn iềuđ kiện sẽ tạo ên n một nút lá; nếu không nó sẽ tạo nên

một nút tro g và cón 4 nút con  ng ng Tiếp tục nh t ơ ứ vậ y cho đế khi phn ân chia xong để đạ các vùng đồng nhất t

3.2

2 Phơ ng pháp c c bộ ụ

ý t ở  ng của ph ng pháp là xét ảnhơ từ các mi ền nhỏ nhất rồi nốichúng lại nếu thỏa mãn tiêu chuẩn để đợc một miền đồng nhất lớn hơ n

Ti ếp tục với các miền thu đợ ch đếc o n khi không thể nối êm th đợ nữa.c

Số miền còn l ại cho ta kết quảphân vùng Nh vậy, mi ền nhỏ nhất của bớc

xuất phát là điểm ảnh

Phơng pháp này hoàn toàn ngợc với phơng háp tách Song iều p đquan trọng ở đâ y là ng yên lý nối 2 vùng Việc nối 2 vùng đợc thực hiện theo unguyên tắc sau :

- Hai vùng hải áp ứng êu chuẩn, thí dụ nh cù g àu hay ùng ức p đ ti n m c mxám

- Hai vùng hải kế cận n au p h

Trang 29

ng i Khái niệm kế cận: trong xử lý ảnh, ờ ta dùng khái niệm liênthông để xác định tính chất kế cận Có hai khái niệm về liên thông 4 là liênthông và 8 liên thông ới 4 V liên thông một iểm ảnh I(đ x,y) sẽ 4 kế có cậntheo 2 h ớ  ng x và y ; trong khi đó với 8 liên hông, t điểm I(x,y sẽ có 4 liên ) thông theo 2 h ớ ng x, y 4 liên thông khác theo và hớng chéo 45o

a) 4 liên thông b) 8 liên thông

Hình 2.4 Khái niệm 4 liên thông và 8 liên thông

Dựa theo nguyên lý ủa ph ng pháp c ơ nối, ta có 2 thuật toán :

- Thuật toán tô àu (Blob Coloring) : ử dụng khái niệmm s 4 liên thông, dùng một cửa sổ di ch yển trên ảnh để u so sánh với tiêu chuẩn nối

- Thuật toán đệ quy cực ộ: sử dụng ph ng pháp tìm b ơ kiếm trong m ột

c làây để m tăng kích th c vùng.ớ

3.3

2 Phơ ng pháp ổng hợp t

ơ Hai ph ng pháp nối (hợp) và tách đều có nhợc đ m Phiể ơ ng pháptách t sẽ ạo nên một cấu trúc phân ấp c và th iết l m ập ối quan hệ giữa cácvùng Tuy nhiên, nó thực hiện việc chia quá chi tiết Ph ơ ng pháp hợp chophép làm giảm số miền liên thông xuống ối t thiểu, nhng cấu trúc hàng ngang dàn trải, không cho ta t ấy rõ mh ối liên hệ giữa các miền

nh đi

Vì ợc ểm này, ngời ta nghĩ đến phối hợp cả 2 ph ơn  g pháp

Tr ớ  c tiên, dùng ph ng phơ áp tách để tạo nên cây tứ phân, phân vùng theo

h ớ  ng từ gốc đế lá.n Ti ếp theo, ến hành ti duyệt cây theo chiề ngợu c l và ại

Trang 30

h p ợ các vùng có cùng êu ch ẩn V ti u ới ph ng hápơ p nà y ta thu đợc ột cấu mtrúc ảnh với các miền liên thông có kích t ớh c tối đ a.

Giải thuật tách hợp ồm ột số b chính sau:

1 Kiểm tra tiêu chuẩn đồng nhất

a) Nếu không thỏa mãn tiêu chuẩn đồng nhất và số điểm trong một vùng nhiều hơn 1, tách vùng ảnh làm 4 mi ền (trên, d ớ ph  i, ải, trái) bằngcách đệ qu y Nếu kết quả tách xong và không tách đợc n a chuữ yển sa g n

4

2 .1 Phơ ng pháp th ng kê ố

h p với c Tính kết cấu ngẫu nhiên rất phù ợ các đặ trng thống kê Vìvậy, ng i ờ ta có thể dùng các đặc trng ngẫu nhiên để đ o nó nh: Hàm tự

t ơ ng quan (AutoCorrelation Function ACF), các biến đổi ật ộ gờ, a - m đ mtrận tơng tranh … Theo cách tiếp , cận bằng hàm tự t ơ  ng quan, độ t hô củakết cấu s i lệ với ợ tỉ độ ộng ủa r c ACF, đợ biểuc di ễn bởi khoảng cá ch x0,

ACF nhờ hàm khởi sinh moment :

Trang 31

M(k,l) (m )k(n 2) (m,n)

à

−à

Hình 2.5 Phân tích kết cấu sợi bằ dải tơng quan ng

Trong mô hình này, trờng kết cấu sợi trớc tiên đợc giải chập bởi bộ lọc lấy từ đầu ra của ACF Nh vậy, nếu r(m,n) là ACF thì :

là trờng ngẫu nhiên không tơng quan

L rằng, bộ ọc là ông y nh t, có thể là nhân quả, bán nhânquả hay không nhân quả Các A F ha C y dùng nh M(0, 2 , M( ) 2, 0 , M(1 ) ,1) ,

bình à1, độ phân tán à cũng hay đ2 ợc sử dụng

đNgoài các ặc trng trên, có thể a thêm một số khái niệm và nh nghĩa đ địcác đại lợng dựa trên đó nh: lợc đồ mức xám (Histogram Grey Level Difference), ma trận xuất hiện mức xám (Grey Level Occurrence Matrices)

ACF

Trích chọn đặc tính

Lọc dải t ơn g quan Phân tích ợc đồl

Đặc tính sợi u(m,n)

Trang 32

L ợc đồ hi ệu mức xám:

Lợ đồ iệ ức xám dùng để tả các thông tin ang tính không

gian đợc định nghĩa  sa và nh u Cho d=(d1, d2) là vecto dịch chuyển giữa 2

điểm ảnh và g(d ) là ệu ức xám hi m với khoảng cách d :

1 k k

2 k

=

= ( 72- )

Phơng sai đo độ ản mát của t hi m ệu ức xám ại t m ột khoảng cách d

nào đấy K ết cấu tất định thờng có phơng sai σ d t ơ ng đối nhỏ Độ t ơ ng phản cd chính là mô en ủa ợc m c l đồ hg( d g, ) xung quanh =0 và đ đ g o ộ

t nơ g phản của hiệu mức xám

pNgời ta sử dụng entro y để đo đồng nhất cảu lợc hg : độ đồ

=∑N=

1 k

k g k

Trang 33

Ma trận xuấ t hiện liên h ệp mức xám i

Giả sử P (k,l,d là xác su ) liên ệp ủa hai iểm ảnh f k và f 1 với các

m ức xám k,l  ng ứng cách nhaut ơ m ột khoảng d Xác su ất này dễ dà ng tính

đ c ợ nhờ việc tính số lần xuất hiện n k,l của cặp iểm ảnh (f đ k , f 1 ) có m xám ức

k và l với khoảng cách d Gọi n tlà ổng số cặp liên hi ệp có thể với kho ngả cách d tr ng ảnh Các o phần tử c k,l c ma ủa trận xuất hi ện liên hi mệp ức xám cd

đợc tính nh sau: c d = (c k,l )

Và ck, l = P(k,l,d)= nnkl (2-9)

hi hiệp m m

Ma trận xuất ện liên ức xá C d là ma ận tr vuông NxN phần

tử (N là số mức xám của ảnh) Ma trận này chứa các thông tin hữu ích về tổ chức kết cấu không gian Nếu kết cấu t ngơ đối thô thì các phần tử của ma

trận tập trung xung quanh đờng chéo chính Ng c l ợ ại, nếu kết cấu bề mặt

mịn, giá trị các phần tử của c d sẽ p ân rải h t ơ ng đối rõ

Dựa trên khá ii n ệm này ngời ta định nghĩa về ột số độ o : m đ

- Xác suất c c đại : Pự d = max(k,l) Ck,l (2-10)

Entrop y : Hd -= ∑∑

= =

N 1 k

N 1

l kl kl

)Cln(

1 k

N 1

mCl

k (2- )12

chính vì kh ảng cách -l|o |k m rất nhỏ Id nhỏ có nghĩa, là kết cấu khá thô

Ngời ta cũng còn đa vào m ột số độ đo khác nh  hàm tự ơt ng uan phổ q ,

năng lợ g Để áp dụng cách t ếp cận này, cần cài đặt các g ải huật tính các n i i t

đại lợng đo trên

Trang 34

2 .2 Phơ ng pháp c u trúc ấ

Kết cấu ợ có cấu trúc thuần nhất là những texels xác định, sự xuất

hi ện lặp đi l lặp ại tuân theo m ột luật tất đị nh hay ngẫu nhiên nào đấy Một texel về thực tế là m ột nhóm các điểm ảnh có cùng m ột số tính chất bất bi ến

l ặp trên ảnh Một texel ũng có định nghĩa theo mức xá , theo bề c m m ặt haytính đồng nhất đối với m số các ột tính ch nh ất  kích thớc, h ớ ng, l c ợ đồbậc hai ( a trận  ng tranh).m t ơ

V các texel đợ phân bố ngẫu nhiên, tính kết ấu ợ  ng ng của

nó đợc coi là ếu (Weak) y ngợc với qui lu ật phân bố tất định gọi là khỏe (Strong) Khi tính k ết cấu ợ là s i yếu, luật phân bố có thể o b i:đ ở

Trang 35

Chơng III Các phơng pháp nhận dạng ảnh

3 1 Khái quát về nhận dạng

Nhận dạng là quá trình phân loại các đối tợng đợc biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tợng một tên gọi) dựa theo những quy luật và các mẫu chuẩn Quá trình nhận dạng dựa vào

những mẫu học biết trớc gọi là nhận dạng có thày hay học có thày (supervised learning); trong trờng hợp ngợc lại gọi là học không có thày

(non supervised learning) Chúng ta sẽ lần lợt giới thiệu các khái niệm này

3.1.1 Không gian biểu diễn đối tợng, không gian diễn dịch

Không gian biểu diễn đối tợng

Các đối tợng khi quan sát hay thu thập đợc, thờng đợc biểu diễn bởi tập các đặc trng hay đặc tính Nh trong trờng hợp xử lý ảnh, ảnh sau khi đợc tăng cờng để nâng cao chất lợng, phân vùng và trích chọn đặc tính,

đợc biểu diễn bởi các đặc trng nh biên, miền đồng nhất, v ,v Ngời ta thờng phân các đặc trng này theo các loại nh: đặc trng tô pô, đặc trng hình học và đặc trng chức năng Việc biểu diễn ảnh theo đặc trng nào là phụ thuộc vào ứng dụng tiếp theo

ở đây ta đa ra một cách hình thức việc biểu diễn các đối tợng Giả sử

đối tợng X (ảnh, chữ viết, dấu vân tay, v ,v) đợc biểu diễn bởi n thành phần (n đặc trng): X = {x1, x2, , xn}; mỗi xi biểu diễn một đặc tính Không gian biểu diễn đối tợng thờng gọi tắt là không gian đối tợng đợc định nghĩa:X

X= {X1, X2, , Xm}

trong đó mỗi Xi biểu diễn một đối tợng Không gian này có thể là vô hạn Để tiện xem xét chúng ta chỉ xét tập X là hữu hạn

Không gian diễn dịch

Trang 36

dKhông gian iễn dịch là tập các tên gọi của đối tợng Kết thúc quá trình nhận dạng ta xác định đợc tên gọi cho các đối tợng trong tập không gian đối tợng hay nói là đã nhận dạng đợc đối tợng Một cách hình thức gọi

Ω là tập tên đối tợng:

Ω= {w1, w2, ,wk} với wi, i = 1, 2, , k là tên các đối tợng

Quá trình nhận dạng đối tợng f là một ánh xạ f: X -> Ω với f là tập các quy luật để định một phần tử trong ứng với một phần tử trong X Ω Nếu tập các quy luật và tập tên các đối tợng là biết trớc nh trong nhận dạng chữ viết (có 26 lớp từ A đến Z), ngời ta gọi là nhận dạng có thày Trờng hợp thứ hai là nhận dạng không có thày Đơng nhiên trong trờng hợp này việc nhận dạng có khó khăn hơn

3.1.2 Mô hình và bản chất của quá trình nhận dạng

3 1.2.1 Mô hình

Việc chọn lựa một quá trình nhận dạng có liên quan mật thiết đến kiểu mô tả mà ngời ta sử dụng để đặc tả đối tợng Trong nhận dạng, ngời ta phân chia làm 2 họ lớn:

- Họ mô tả theo tham số

- Họ mô tả theo cấu trúc

Cách mô tả đợc lựa chọn sẽ xác định mô hình của đối tợng Nh vậy, chúng

ta sẽ có 2 loại mô hình: mô hình theo tham số và mô hình cấu trúc.

• Mô hình tham số: sử dụng một véctơ để đặc tả đối tợng Mỗi phần tử

của véctơ mô tả một đặc tính của đối tợng Thí dụ nh trong các đặc trng chức năng, ngời ta sử dụng các hàm cơ sở trực giao để biểu diễn Và nh vậy ảnh sẽ đợc biểu diễn bởi một chuỗi các hàm trực giao Giả sử C là

đờng bao của ảnh và C(i,j) là điểm thứ i trên đờng bao, i = 1, 2, , N (đờng bao gồm N điểm)

Giả sử tiếp :

Trang 37

diện tích, p là chu tuyến

Việc lựa chọn phơng pháp biểu diễn sẽ làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trng nào là hoàn toàn phụ thuộc vào ứng dụng Thí dụ , trong nhận dạng chữ (sẽ trình bày sau), các tham số là các dấu hiệu:

• Mô hình cấu trúc: Cách tiếp cận của mô hình này dựa vào việc mô tả đối

tợng nhờ một số khái niệm biểu thị các đối tợng cơ sở trong ngôn ngữ tự nhiên Để mô tả đối tợng, ngời ta dùng một số dạng nguyên thuỷ nh

đoạn thẳng, cung, v, ,v Chẳng hạn một hình chữ nhật đợc định nghĩa gồm 4 đoạn thẳng vuông góc với nhau từng đôi một Trong mô hình này ngời ta sử dụng một bộ kí hiệu kết thúc Vt, một bộ kí hiệu không kết thúc gọi là Vn Ngoài ra có dùng một tập các luật sản xuất để mô tả cách xây

Trang 38

dựng các đối tợng phù hợp dựa trên các đối tợng đơn giản hơn hoặc đối tợng nguyên thuỷ (tập Vt) Trong cách tiếp cận này, ta chấp nhận một khẳng đinh là: cấu trúc một dạng là kết quả của việc áp dụng luật sản xuất theo theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu Một cách hình thức, ta có thể coi mô hình này tơng đơng một văn phạm G = (Vt, Vn, P, S) với:

Hình 3.1 Mô hình cấu trúc của một đối tợng nhà

3 1.2.2 Bản chất của quá trình nhận dạng

Quá trình nhận dạng gồm 3 giai đoạn chính:

- Lựa chọn mô hình biểu diễn đối tợng

- Lựa chọn luật ra quyết định (phơng pháp nhận dạng) và suy diễn quá trình học

Trang 39

Khi mô hình biểu diễn đối tợng đã đợc xác định, có thể là định lợng (mô hình tham số) hay định tính (mô hình cấu trúc), quá trình nhận dạng chuyển sang giai đoạn học Học là giai đoạn rất quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tợng thành các lớp

Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán

đối tợng vào một lớp hay nói một cách khác gán cho đối tợng một tên

Học có thày (supervised learning)

Kỹ thuật phân loại nhờ kiến thức biết trớc gọi là học có thày Đặc

điểm cơ bản của kỹ thuật này là ngời ta có một th viện các mẫu chuẩn Mẫu cần nhận dạng sẽ đợc đem sánh với mẫu chuẩn để xem nó thuộc loại nào Thí dụ nh trong một ảnh viễn thám, ngời ta muốn phân biệt một cánh đồng lúa, một cánh rừng hay một vùng đất hoang mà đã có các miêu tả về các đối tợng đó Vấn đề chủ yếu là thiết kế một hệ thống để có thể đối sánh đối tợng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là

Học không có thày(unsupervised learning)

Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số

đặc trng cho từng lớp Học không có thày đơng nhiên là khó khăn hơn Một mặt, do số lớp không đợc biết trớc, mặt khác những đặc trng của các lớp cũng không biết trớc Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và chọn lựa cách tốt nhất Bắt đầu từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt đợc một phơng án phân loại

Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận dạng có thể tóm tắt theo sơ đồ sau:

Trang 40

Hình 3.2 Sơ đồ tổng quát một hệ nhận dạng

3.2 nhận dạng dựa trên phân hoạch không gian

Trong kỹ thuật này, các đối tợng nhận dạng là các đối tợng định lợng Mỗi đối tợng đợc biểu diễn bởi một véctơ nhiều chiều Trớc tiên, ta xem xét một số khái niệm nh: phân hoạch không gian, hàm phân biệt sau đó

sẽ đi vào một số kỹ thuật cụ thể

3 2.1 Phân hoạch không gian

Giả sử không gian đối tợng X đợc định nghĩa : X = {Xi, i=1, 2, ,m},

Xi là một véctơ Ngời ta nói p là một phân hoạch của không gian X thành các lớp Ci, Ci ⊂ X nếu:

Ci ∩ Cj = Φ với i ≠ j và ∪ Ci = X

Nói chung, đây là trờng hợp lý tởng: tập X tách đợc hoàn toàn Trong thực tế, thờng gặp không gian biểu diễn tách đợc từng phần Nh vậy phân loại là dựa vào việc xây dựng một ánh xạ f: X -> p Công cụ xây dựng ánh xạ này là các hàm phân biệt (Descriminant functions)

3 2.2 Hàm phân lớp hay hàm ra quyết định

Đánh giá

Trả lời Phân lớp

Ngày đăng: 22/01/2024, 17:02

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w