NHIỆM VỤ LUẬN VĂN Luận văn nhằm nghiên cứu phương pháp xác định các yếu tố hình học của hư hỏng dạng ổ gà ở mặt đường bê tông nhựa bằng phương pháp xử lý hình ảnh.. Đề xuất thủ tục x
NGHIÊN CỨU TỔNG QUAN
Một số dạng hư hỏng của mặt đường BTN
2.1.1 Một số hư hỏng thường gặp
Dựa trên các tiêu chí đánh giá hư hỏng mặt đường bê tông nhựa của Tiêu chuẩn thiết kế áo đường mềm 22TCN 211-06 và căn cứ báo cáo kết quả khảo sát của Công ty Quản lý Cầu đường [3, 4], các dạng hư hỏng mặt đường thường gặp trên các tuyến đường của nước ta được xác định như Bảng sau:
Bảng 2.1: Một số dạng hư hỏng thường gặp
Dạng hư hỏng Số hiệu Tầng mặt nhựa Tiêu chí đánh giá mức độ nghiêm trọng
Nứt dọc, Nứt ngang, Nứt phản ảnh
- Nhẹ: Bề rộng khe nứt < 6 mm không gây xóc khi xe chạy qua;
- Vừa: bề rộng > 6 mm, gây xóc;
- Nặng: nứt rộng, sâu, gây va đập khi xe chạy qua
Nứt mạng lưới (nứt mai rùa hoặc nứt thành miếng)
- Nhẹ: Các đường nứt chưa liên kết với nhau;
- Vừa: Đã liên kết thành mạng;
- Nặng: Nứt lan ra ngoài phạm vi vệt bánh xe và liên kết với nhau như da cá sấu
2.1 Vệt hằn bánh, lún sụt
- Cách đo: Dùng thước 1.22 m đặt ngang vệt hằn; cứ cách 7.5 m đo một chỗ rồi lấy trị số trung bình cho mỗi đoạn
- Vệt hằn sâu trung bình 6-13 mm: nhẹ; 13-25 mm: vừa và > 25 mm: nặng
2.2 Làn sóng, xô dồn - Nghiêm trọng (không phân mức độ) 2.3 Đẩy trượt trồi - Nghiêm trọng (không phân mức độ)
3.1 Chảy nhựa - Diện tích càng lớn thì mức độ hư hỏng càng nặng
Mài mòn, lộ đá - Không phân mức độ nghiêm trọng 3.3 Ổ gà
- Đánh giá theo chủ quan của kỹ sư điều tra; nếu đã vá sửa tốt thì xếp mức độ nhẹ; chưa vá sửa và đang phát triển: nặng
Theo hướng phát triển của đường nứt, các vết nứt xuất hiện trên mặt đường thường bao gồm 4 loại sau: vết nứt ngang, vết nứt dọc, vết nứt mạng lưới hoặc vết nứt phản ảnh Theo chiều rộng vết nứt thì bao gồm vết nứt hẹp, vết nứt trung bình và vết nứt rộng
Vết nứt ngang, dọc: Là các vệt nứt xuất hiện theo chiều ngang và chiều dọc đường
Nứt mạng lưới: Trên mặt đường xuất hiện các vệt nứt dạng lưới, các đường nứt phát triển theo thời gian và dưới tác dụng của khí hậu, tải trọng xe Các lưới có thể chưa liên kết hoặc đã liên kết với nhau thành mạng, hoặc đã nứt ra thành miếng có dạng như da cá sấu
Nứt phản ảnh: Các vệt nứt phản ảnh này xuất hiện khi lớp kết cấu bên dưới mặt đường BTN bị nứt (lớp móng dưới bị nứt, thảm chồng lên lớp BTN cũ đã bị nứt không được xử lý), trong trường hợp thảm mặt đường BTN tại vị trí cống, trên mặt cầu hoặc mặt đường nhựa thảm trên tấm bê tông xi măng Khi chịu tác dụng trùng phục của bánh xe, lớp mặt đường BTN bên trên chịu các ứng suất kéo và có xu hướng sao chép vệt nứt của các lớp kết cấu phía dưới
Hình 2.1: Một số vết nứt thường gặp
Gồm các dạng hư hỏng như: mặt đường bị vệt hằn bánh, lún sụt; làn sóng, xô dồn; đẩy trượt trồi
Vệt hằn bánh, lún sụt: vết lún dài trên mặt đường dọc theo vệt bánh xe, mặt đường mặt đường bị lún lõm cục bộ không còn giữ được độ bằng phẳng Trong một số trường hợp mặt đường bị hiện tượng “cao su”: mặt đường bị biến dạng lớn và rạn nứt dưới tác dụng của bánh xe Khi có tải trọng xe thì lún võng xuống, khi xe đi qua hẳn thì có thể đàn hồi trở lại một phần hoặc toàn bộ, kết cấu mặt đường dần dần sẽ bị phá vỡ một phần hay hoàn toàn
Làn sóng, xô dồn, trồi, trượt: Hiện tượng dồn, trượt và đẩy trồi là một đoạn các đoạn đẩy trồi và lún võng xuất hiện thành dải với chiều dài nhỏ hơn 1.5m doc theo chiều ngang của mặt đường
Lún xô dồn Lún vệt bánh xe
Hình 2.2: Một số loại biến dạng bề mặt
Gồm các dạng hư hỏng như: mặt đường bị chảy nhựa, mặt đường bị bong tróc, rời rạc, lộ đá, mặt đường bị ổ gà
Mặt đường bị chảy nhựa: Mặt đường BTN khi được thiết kế cấp phối với một hàm lượng thừa nhựa (nhựa ở dạng tự do nhiều), khi chịu tác dụng của nhiệt độ do bức xạ mặt trời gây nên cộng thêm tác dụng của tải trọng xe sẽ xuất hiện hiện tượng chảy nhựa (nhựa đường trồi lên trên mặt) làm giảm cường độ của lớp BTN và dễ bị trơn trượt
Hình 2.3: Một số loại hư hỏng bề mặt
Mặt đường bị bong tróc (bong bật), rời rạc, lộ đá: Lớp mặt BTN bị bong khỏi mặt đường dưới sự tác dụng lâu dài của nước làm cho nhựa bị tách ra khỏi các cốt liệu dẫn đến mặt đường bị rời rạc trên mặt và sẽ dần bị bong tróc và cuối cùng sẽ tạo ra các ổ gà Ổ gà: Là những vết lõm xuất hiện trên mặt đường do sự bong bật mạnh mẽ lớp mặt đường tạo thành
2.1.1.4 Các dạng hư hỏng mặt đường theo thời gian
Mặt đường bê tông nhựa sau một thời gian dài sử dụng (trên 2 năm) và dưới tác dụng của các yếu tố khí quyển sẽ có hiện tượng lớp mặt bê tông nhựa bị hóa già, không còn tính đàn hồi và dễ bị bong bật lớp mặt, thường được gọi là mặt đường BTN bị bạc đầu
Là những vết lõm xuất hiện trên mặt đường, lớp mặt BTN bị bong khỏi mặt đường dưới sự tác động lâu dài của nước và sự chuyển động của xe trên nó làm cho nhựa bị tách ra khỏi các cốt liệu dẫn đến mặt đường bị rời rạc trên mặt và sẽ dần bị bong tróc và cuối cùng sẽ tạo ra các ổ gà [3]
Hình 2.4: Bong tróc mặt đường
(c) Hình 2.5: Hư hỏng dạng ổ gà theo từng mức độ nghiêm trọng (a) Nhẹ (b) Trung bình (c) Nặng
2.1.2.2 Nguyên nhân gây hư hỏng
Hai nhân tố chính gây ra hư hỏng dạng ổ gà ở đường BTN là nước và sự lưu thông trên bề mặt đường Nước làm đất bên dưới lớp kết cấu áo đường yếu đi, xe chạy qua những chỗ nứt gây bong tróc mặt đường Mức độ nghiêm trọng của ổ gà tăng dần theo thời gian Đầu tiên, bề mặt đường sẽ trở nên chịu tải kém, dấu hiệu là xuất hiện những vết nứt dạng da cá sấu Cuối cùng, vùng nứt này dần dần rời ra, sau đó lớp mặt BTN bị bong khỏi mặt đường, nhựa bị tách ra khỏi các cốt liệu dẫn đến mặt đường bị rời rạc trên mặt và dần tạo ra các ổ gà
Hình 2.6: Nứt dạng da cá sấu Ổ gà có thể rộng cả mét và thường sâu vài cm hoặc hơn, tùy mức độ nghiêm trọng Nếu chúng đủ lớn, có thể gây cản trở lưu thông hoặc nguy hiểm tới con người, tai nạn nghiêm trọng rất dễ xảy ra, đặc biệt là ở những đường có tốc độ lưu thông cao
Hình 2.7: Ổ gà hình thành do nước và sự lưu thông của xe (a): Nước thấm xuống nền bên dưới mặt đường thông qua vết nứt
(b): Nước giãn nở cùng với tác động của xe, làm yếu đi lớp nền bên dưới (c): Nước bốc hơi, tạo nhiều khoảng trống bên dưới
(d): Mặt đường bong tróc, gãy vụn từ từ do xe lưu thông
Về tổng quan, ổ gà là kết quả của các nguyên nhân sau đây [4]:
Những nhân tố về khí hậu
Mưa: là nhân tố ảnh hưởng tới sức chịu đựng của các vật liệu làm đường Nước mưa đọng trên phần mặt xe chạy và thấm xuống làm cho cường độ mặt và nền đường giảm đi
Bức xạ mặt trời, nhiệt độ, nước…làm cho BTN bị “hoá già”, khả năng biến dạng giảm, dễ nứt nẻ Dưới tác dụng của bức xạ mặt trời, nhiệt độ mặt đường thay đổi - phát sinh ứng suất nhiệt cũng là nguyên nhân làm cho mặt đường nứt, gãy
Chất lượng của đất và các loại vật liệu xây dựng đường
Chất lượng của các loại vật liệu cấu thành mặt đường BTN đóng một vai trò quan trọng đối với kết cấu áo đường Các loại vật liệu có: Cường độ không đạt tiêu chuẩn thiết kế; Cấp phối hạt không đủ quy cách; Vật liệu không đủ sạch sẽ làm cho chất lượng mặt đường kém, nhanh bị hư hỏng
Chất lượng của thiết kế
Các cách thu thập dữ liệu trong khảo sát hư hỏng đường (Methods of
Hiện nay, trên thế giới, ngoài thực hiện thủ công, việc thu thập dữ liệu trong khảo sát hư hỏng đường BTN có rất nhiều phương pháp tự động tiên tiến khác nhau, dùng cho những con đường có cường độ lưu thông cao đòi hỏi sự an toàn đặt lên trên hết Nhiều nỗ lực khảo sát hư hỏng đường thông qua việc sử dụng phương pháp thu ảnh thông thường, sử dụng các bộ cảm biến âm thanh hoặc laser Các cách tiếp cận này cũng đã được khá nhiều sự quan tâm, điển hình như phương pháp
Analog imaging, Digital imaging, Sensor technology [5]…Analog imaging đề cập tới quá trình mà trong đó ảnh được ghi lên film hoặc môi trường khác thông qua hóa học, cơ học…Digital imaging nói đến quá trình hình ảnh được thu bởi dòng điện và lưu trữ trên thiết bị điện tử Mặc dù trước đó, việc thu ảnh được thực hiện bằng phương pháp Analog, phương pháp Digital imaging nhanh chóng trở thành phương pháp phổ biến nhất, do chất lượng hình ảnh có thể sản xuất được, dễ dàng kiểm soát thông tin số liệu đầu vào Phương pháp Sensor technology sử dụng sóng âm, hồng ngoại hoặc laser
Dù tiếp cận bằng phương pháp nào, thì quá trình thực hiện cũng phải qua bước xử lý hình ảnh, chi tiết thể hiện ở lưu đồ sau:
Thu thập ảnh Lưu trữ ảnh Phát hiện
Bên trong phương tiện khảo sát
Bên trong hoặc ngoài phương tiện khảo sát
Hình 2.9: Sơ đồ quá trình thu thập dữ liệu khảo sát đường
Công cụ chủ yếu được dùng trong phương pháp Analog imaging là chụp ảnh (photographic) và quay video (videotaping), thường dùng loại phim 35mm Hình ảnh thu được có thể có được chất lượng tốt, nhưng lại khó khăn trong việc chuyển đổi sang định dạng kỹ thuật số cho việc lưu trữ và thao tác [6] Những năm gần đây phương pháp Analog imaging ít được sử dụng thường xuyên do sự trưởng thành của công nghệ kỹ thuật số (digital technology)
Mặc dù tín hiệu của phương pháp Analog imaging có thể truyền và sao chép qua băng thông hẹp, nhưng lại rất khó để thao tác, sao chép và phân phối các tín hiệu mà không gây nhiễu điện tử vào tín hiệu gốc, điều này làm giảm chất lượng hình ảnh Đây cũng là khó khăn để tích hợp Analog imaging với các loại dữ liệu khác, chẳng hạn như văn bản và đồ họa, trừ khi sử dụng các trang thiết bị cao cấp của video Độ phân giải của Analog imaging cũng tương đối thấp so với một số lựa chọn kỹ thuật số thay thế, do đó, đa số những nơi khảo sát hư hỏng mặt đường đã chuyển sang sử dụng công nghệ kỹ thuật số trên máy tính Tuy nhiên, chất lượng của loại phim 35mm lại rất tốt và đang đóng một vai trò quan trọng với sự hiên diện của mình trong công tác khảo sát hư hỏng mặt đường Điển hình là các dữ liệu khảo sát mặt đường của Long-Term Pavement Performance (LTPP), chương trình của Cục quản lý đường cao tốc liên bang vẫn sử dụng phim trắng đen 35mm để thu thập thông tin của bề mặt đường Thay vì chụp một khung hình tại một thời điểm nào đó, LTPP tiến hành chụp liên tục bề mặt đường trong khi di chuyển Để kiểm soát việc đảm bảo chất lượng ánh sáng của hình ảnh, công việc chụp ảnh thưởng được tiến hành vào ban đêm Hình 2.10 minh họa một hình ảnh được số hóa trong định dạng JPEG của một dải phim 35mm sử dụng trong LTPP Độ phân giải sử dụng trong việc số hóa là 2048 pixel theo phương ngang và trong phạm vi 2 8 hay 256 mức xám (vấn đề này sẽ được trình bày trong chương 3)
Hình 2.10: Ảnh kỹ thuật số được chuyển đổi từ phim 35 mm – 2048 pixel/làn
Cho dù là phim 35mm hay băng video đều không có một giá trị độ phân giải như lĩnh vực kỹ thuật số Để chuyển đổi tín hiệu tương tự từ phim hoặc băng video đòi hỏi một quá trình được gọi là mã hóa hoặc số hóa Trong trường hợp của phim 35mm , quá trình số hóa được thực hiện bởi một máy quét để chuyển đổi hình ảnh trong bộ phim thành định dạng kỹ thuật số, thể hiện ở hình 2.11
Hình 2.11: Quá trình mã hóa phim 35mm sang định dạng kỹ thuật số
Việc sử dụng máy ảnh kỹ thuật số đang trờ thành phương pháp được ưa chuộng trong công tác thu ảnh mặt đường Phương tiện khảo sát cũng tương tự như phương pháp quay video trong Analog imaging, sử dụng một hoặc hai camera để thu ảnh mặt đường trong khi một vài thiết bị khác có thể được sử dụng cho nhiều mục đích khảo sát khác nhau của cơ quan chuyên môn Động lực khá lớn khi chuyển hướng sang sử dụng hình ảnh kỹ thuật số là giảm thiểu được số lượng dữ liệu khảo sát mặt đường cùng với ưu điểm có thể tùy chọn các thông số cho số dữ liệu đó Hình ảnh kỹ thuật số có thể thích ứng với việc tự động phân tích dữ liệu bởi khả năng phân tích các biến thể trong ảnh xám cũng như sự biến đổi liên quan đến bề mặt mặt đường Có hai loại máy ảnh kỹ thuật số đang được sử dụng hiện nay để khảo sát hư hỏng trên bề mặt đường là phương pháp area scan và line scan [5]
2.2.2.1 Area scan Đây là phương pháp chụp ảnh kỹ thuật số cho ra ảnh có hàng ngàn điểm ảnh mô tả bề mặt của mặt đường thường là một nửa hoặc cả bề rộng của một làn xe (3-5m) tùy thuộc vào tính năng, góc, vị trí…của máy ảnh và tốc độ xe Trong khi thu ảnh mặt đường, góc máy ảnh có tầm quan trọng rất lớn, điểm ảnh sẽ méo mó nếu máy ảnh không thẳng đứng so với mặt đường
Ví dụ phổ biến nhất đối với phương pháp line scan là máy fax, công cụ sử dụng một dòng cảm biến pixel (một chiều) để xây dựng một hình ảnh 2D Như vậy, hình ảnh của mặt đường sẽ được quét từng dòng thông qua máy ảnh thành các hàng có kích thước bằng với chiều ngang của làn đường, những dòng này được nối kết với nhau tạo thành một hình ảnh liên tục
2.2.3 Công nghệ cảm biến - Sensor technology
Ngày nay, hầu như mạng lưới khảo sát độ nhám mặt đường ở Mỹ, Canada đều sử dụng phương tiện di chuyển được trang bị một trong 3 loại cảm biến laser, sóng âm hoặc hồng ngoại Nguyên tắc làm việc của một bộ cảm biến rất đơn giản, tín hiệu điện tử phát ra từ bộ cảm biến đi qua mặt phẳng tham chiếu xuống mặt đường và trở ngược lại để đo thời gian phản ánh trên bề mặt mặt đường, thiết lập một bề mặt 3D sau khi công cụ di chuyển dọc theo làn đường Một số nghiên cứu áp dụng phương pháp này có thể cho ra được dữ liệu ghồ ghề và lún của mặt đường Tại thời điểm này, chưa có bằng chứng độc lập nào dựa trên công nghệ có thể cung cấp dữ liệu để khảo sát hư hỏng khác của mặt đường điển hình là hư hỏng dạng ổ gà Mặc dù khá đơn giản về khái niệm, để áp dụng công nghệ này không hề đơn giản, tốc độ xe chạy phải phù hợp với tín hiệu điện tử, linh kiện điện tử công suất lớn và lượng dữ liệu khổng lồ được tạo ra.
Tình hình nghiên cứu xác định mức độ hư hỏng dạng ổ gà trên thế giới 25
Hiện nay, việc xác định mức độ hư hỏng dạng ổ gà của đường BTN ở một số nước phát triển trên thế giới một phần vẫn thực hiên bằng thủ công, một số áp dụng phương pháp tự động hóa Tuy nhiên, các nghiên cứu gần đây cho thấy việc khảo sát dựa trên tự động hóa chỉ dừng lại ở việc phát hiện hoặc phân loại một cách tương đối mức độ hư hỏng, chưa có nghiên cứu nào đưa ra phương pháp xác định các yếu tố hình học của ổ gà Thông thường, có 3 phương pháp để phát hiện ổ gà là Vibration, 3D reconstruction, Vision [7]
Một số dạng hư hỏng của mặt đường như ổ gà, nứt, lún gây một lực tác động lên phương tiện khảo sát, bề mặt đường lúc này có thể được ước tính từ phản ứng của xe khi lái xe trên đường Hệ thống này có ưu điểm là dữ liệu lưu trữ nhỏ, chi phí thấp, hoàn toàn tự động, xử lý dữ liệu thời gian thực Tuy nhiên, nó không cung cấp đầy đủ các chi tiết của dạng hư hỏng mặt đường [8, 9]
Sử dụng hệ thống quét laser, phát hiện các ổ gà trong thời gian thực Một số nghiên cứu cho thấy rằng mức độ và phạm vi của ổ gà có thể được xác định một cách tự động và nhanh chóng [10] Tuy nhiên, chi phí cho thiết bị quét laser rất đáng kể [11], trong khi những nghiên cứu gần đây chỉ chú tâm vào tính chính xác của phương pháp này
Phương pháp tiếp cận dựa trên việc phân tích xử lý ảnh, tập trung khai thác các tính chất đặc trưng của ổ gà và so sánh [12] Phương pháp này không đòi hỏi phải có những thiết bị đắt tiền nhưng đòi hỏi phải có một bộ phận dữ liệu đã được huấn luyện [13] Tập huấn luyện này là những ổ gà làm hình mẫu có thể lấy ở bất cứ đâu, ngay cả trên google search Dữ liệu hình ảnh thu được trong quá trình khảo sát tự động sẽ được so sánh với dữ liệu huấn luyện và phát hiện ra hư hỏng ổ gà nhờ những dặc trưng đã học được.
Nhận xét
Là một trong những dạng hư hỏng trên bề mặt đường, ổ gà thể hiện lên mặt đường rõ nhất, cũng như mang tính nguy hiểm và ảnh hưởng tới sự lưu thông của xe cộ nhiều nhất Ổ gà có thể gây ra thiệt hại như nổ lốp, thiệt hại bánh xe, phanh đột ngột, chấn động tay lái, va chạm, rất dễ gây ra tai nạn nghiêm trọng nghiêm trọng Ngoài ra, ổ gà là đầu mối quan trọng cho thấy khiếm khuyết trong cấu trúc của nhựa đường Chưa có số liệu thống kê chính xác tại nạn giao thông do ổ gà ở nước ta, ở Hàn Quốc, từ năm 2008 tới năm 2013 đã có gần 5000 vụ tai nạn do ổ gà gây ra
Trong đó, chỉ riêng năm 2013 số vụ là hơn 1000 vụ, phần lớn là tại nạn rất nghiêm trọng và không ngừng tăng lên hàng năm [7] Khảo sát, đánh giá hư hỏng dạng ổ gà là một trong những nhiệm vụ quan trọng để xác định các chiến lược thích hợp trong duy tu, sửa chữa kịp thời, hợp lý, công tác bảo dưỡng và phục hồi chức năng mặt đường Tuy nhiên, ở nước ta hiện nay và ngay cả ở một số nước phát triển và đang phát triển khác, công tác đánh giá hư hỏng dạng ổ gà ở mặt đường BTN phần lớn đều thực hiện thủ công (ngăn xe, đo đạc ngay trên đường) rất nguy hiểm và tốn nhiều thời gian, đặc biệt là ở những đường có mật độ lưu thông nhiều, tốc độ cao Việc tìm ra một phương pháp có thể khắc phục được hạn chế của phương pháp thông dụng hiện nay, mà vẫn đảm bảo bài toán chi phí, đơn giản mà chính xác là điều rất cần thiết Đồng thời cũng tạo ra được nhiều sự lựa chọn hơn trong công tác khảo sát đánh giá chất lượng đường, nhất là ở một nước đang phát triển như nước ta, việc khảo sát đánh giá chất lượng đường chưa được thực hiện một cách kịp thời và hợp lý, trong khi đường BTN ngày càng nhiều và hư hỏng dạng ổ gà cũng khá phổ biến Một số nước phát triển đang nghiên cứu và áp dụng việc khảo sát mặt đường bằng phương pháp laser, tuy nhiên chỉ dùng tốt việc xác định lún, độ gồ ghề, nứt và chi phí thì rất cao [11] Vấn đề xác định các yếu tố hình học của hư hỏng dạng ổ gà bằng xử lý ảnh trong luận văn này chưa hề được nghiên cứu trước đây
Sử dụng phương pháp thu ảnh Digital imaging, Vision kết hợp với 3D reconstruction, nghiên cứu này là bước đi đầu tiên cho mục đích trên, tạo tiền đề cho những nghiên cứu tiếp theo.
CHƯƠNG TRÌNH PHÂN TÍCH VÀ XỬ LÝ ẢNH
Giới thiệu khái quát về ảnh số
3.1.1 Khái niệm Ảnh số là tập hợp hữu hạn các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật [14] Số điểm ảnh xác định độ phân giải của ảnh Ảnh có độ phân giải càng cao thì càng thể hiện rõ nét các đặt điểm của tấm hình càng làm cho tấm ảnh trở nên thực và sắc nét hơn Nói nôm na, ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ- được coi là những thành tố của bức ảnh và thường được biết dưới tên gọi là pixel Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định [15] Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh
Có thể mường tượng ảnh số giống như bức tranh trên được tạo nên từ vô số các hạt đậu tương được nhuộm màu Mỗi hạt đậu tương có thể coi như một pixel
Hình 3.2: Minh họa về ảnh số Ảnh số được biểu diễn bởi hai ma trận, một ma trận dữ liệu ảnh và một ma trận màu (còn gọi là bản đồ màu – color map) o Ma trận dữ liệu ảnh được thể hiện bởi mức xám riêng biệt của từng điểm ảnh, các cấp độ của mức xám này thường là một số mũ với cơ số là 2 [16], nghĩa là :
Trong đó: B - số bit trong biểu diễn bit của các cấp độ xám (1, 2, …)
L - số cấp độ mức xám của ảnh o Ma trận màu là một ma trận kích thước m x 3 gồm các thành phần có giá trị trong khoảng [0 1] Mỗi hàng của ma trận xác định thành phần Red, Green, Blue của một màu trong tổng số m màu được sử dụng trong ảnh Giá trị của một phần tử trong ma trận dữ liệu ảnh cho biết màu của điểm ảnh đó nằm ở hàng nào trong ma trận màu [17]
Hình 3.3: Biểu diễn ảnh số bởi ma trận dữ liệu và ma trận màu
3.1.2 Độ phân giải của ảnh
Chất lượng của bức ảnh khi được in hay hiển thị trên màn hình phụ thuộc một phần vào số lượng các pixels tạo nên bức ảnh hay còn được gọi là độ phân giải - resolution Số lượng các pixel càng nhiều thì các chi tiết càng được hiển thị càng rõ, mức độ sắc nét càng tăng đồng nghĩa với việc độ phân giải cũng lớn hơn Nếu như phóng đại bức ảnh số đủ lớn thì mắt người sẽ nhận ra được các pixel này Kích cỡ của ảnh số có thể được biểu thị theo một trong hai cách: theo chiều dài và chiều rộng tính bằng đơn vị pixel hoặc theo tổng số pixel tạo nên bức ảnh Ảnh có kích cỡ 1600 x 1200 pixel cũng tương đương về kích cỡ với ảnh 1.92 triệu điểm ảnh (lấy 1600 nhân với 1200)
Hình 3.4: Một ảnh có kích thước 1600x1200
Số lượng pixel có trong bức ảnh sẽ quyết định kích cỡ ảnh, ảnh hưởng đến độ lớn của file ảnh
Hình 3.5: Minh họa về kích thước của ảnh
Tùy theo giá trị B dùng để biểu diễn điểm ảnh hay còn gọi là mức xám của ảnh được thể hiện ở công thức (3.1) mà người ta phân ra 3 loại ảnh chính: ảnh nhị phân, ảnh xám, ảnh màu
3.1.3.1 Ảnh nhị phân Ảnh nhị phân là ảnh được biểu diễn bởi một ma trận hai chiều Mỗi điểm ảnh được biểu diễn bởi 1 bit (B=1), theo công thức (3.1), ta có L=2 1 =2 Cho nên, chỉ có
2 giá trị mức xám tại mỗi điểm ảnh là 0 và 1, nghĩa là đen hoặc là trắng
Hình 3.6: Minh họa về ảnh nhị phân
3.1.3.2 Ảnh xám (grayscale image) Ảnh xám hay còn gọi là ảnh đơn sắc (monochromatic), là ảnh được biểu diễn bởi một ma trận hai chiều Tại mỗi điểm ảnh có một giá trị mức xám thường được biểu diễn bởi 8 bit (B=1) Theo công thức (3.1), ta có L=2 8 %6 Do đó ảnh xám có giá trị mỗi điểm ảnh nằm trong đoạn [0, 255]
Giá trị điểm ảnh = 0 nghĩa là điểm ảnh đó tối (đen), giá trị điểm ảnh lớn nhất nghĩa là điểm ảnh đó trắng Nói cách khác, giá trị mỗi điểm ảnh càng lớn thì điểm ảnh đó càng sáng
Hình 3.7: Minh họa về ảnh xám
3.1.3.3 Ảnh màu (color image) Ảnh màu hay còn gọi là ảnh truecolor do tính trung thực của nó Ảnh này được biểu diễn bởi một ma trận ba chiều kích thước m x n x 3, với m x n là kích thước ảnh theo pixels Mỗi điểm ảnh của ảnh màu có giá trị gồm 3 màu đỏ (red) + xanh lục (green) + xanh dương (blue) hay còn gọi là hệ màu RGB Mỗi màu được biểu diễn bởi 8 bit có giá trị từ 0 đến 255, nghĩa là mỗi điểm ảnh được biểu diễn bởi 24 bit (B$) Theo công thức (3.1), ta có L=2 24 777216, như vậy sẽ có hơn 16 triệu màu có thể biểu diễn điểm ảnh
Hình 3.8: Ma trận tại mỗi điểm của ảnh màu
Hình 3.9: Minh họa về ảnh màu
Hệ màu RGB (Red, Green, Blue) [18]
Hệ màu này thường được gọi là màu tích cực, màu cộng Nghĩa là tổ hợp ba màu Red-Green-Blue lại với các sắc độ khác nhau, thì sẽ có các màu khác nhau
Mỗi màu đơn được thể hiện bằng 256 sắc độ, từ rất đỏ (R-255) đến rất không đỏ (R-0) và tương tự cho các màu đơn khác Và các màu đơn càng mạnh, thì màu càng sáng Cả ba màu với sắc độ cao nhất tổ hợp lại thì thành màu trắng Khi biểu diễn dưới dạng số (24 bit), các giá trị RGB thông thường được ghi bằng cặp ba số nguyên giữa 0 và 255, mỗi số đại diện cho cường độ của màu đỏ, xanh lục, xanh dương trong trật tự như thế Bảng sau thể hiện một số giá trị cơ bản của RGB:
Bảng 3.1: Một số giá trị cơ bản của hệ màu RGB
(0, 255, 255) xanh ngọc (255, 0, 255) hồng cánh sen
Hình 3.11: Sự biến thiên từng sắc độ trong hệ màu
3.1.4 Histogram - Biểu đồ mức xám của ảnh
Histogram là một biểu đồ biểu diễn độ sáng hay còn gọi là biểu đồ mức xám của một bức ảnh [19] Lược đồ này bao gồm trục hoành biểu diễn mức sáng và trục tung biểu diễn số lượng điểm sáng tương ứng Đối với ảnh xám thông thường, giá trị của trục hoành nằm trong khoảng từ 0 - 255
Nhìn vào biểu đồ ta có thể biết được phân bố cường độ sáng của một ảnh, với những ảnh mà phân bố histogram lệch về bên phải thì ảnh đó là một ảnh có độ sáng tốt Ngược lại thì ảnh đó là một ảnh tối
Hình 3.13: Histogram của ảnh Đối với ảnh màu, để tính histogram của ảnh ta có thể tính Histogram cuả từng kênh màu Giả sử hệ màu đang sử dụng là hệ RGB, khi đó ta có thể tính Histogram của các kênh R, G, B như là với một ảnh xám thông thường.
Xử lý ảnh với Matlab
Con người thu nhận thông tin qua các giác quan trong đó thị giác đóng vai trò quan trọng nhất [20] Sự phát triển nhanh của phần cứng máy tính, xử lý ảnh và đồ họa đã phát triển mạnh mẽ và ngày càng có nhiều ứng dụng trong cuộc sống Xử lý ảnh đóng một vai trò quan trọng trong tương tác người máy
Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi một ảnh đầu vào để cho ra một kết quả mong muốn Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh "tốt hơn" hoặc một kết luận
Hình 3.14: Quá trình xử lý ảnh
Như vậy mục tiêu của xử lý ảnh có thể chia làm ba hướng như sau: Ảnh đầu vào Xử lý ảnh Ảnh tốt hơn
Kết luận o Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn của người dùng (ví dụ: ảnh mờ cần xử lý để được rõ hơn) o Phân tích ảnh để thu được thông tin nào đó giúp cho việc phân loại và nhận biết ảnh (ví dụ: phân tích ảnh vân tay để trích chọn các đặc trưng vân tay) o Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu hơn (ví dụ: ảnh một tai nạn giao thông phác hoạ hiện trường tai nạn)
Các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo Máy ảnh số hiện nay là một thí dụ gần gũi Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh Hình dưới đây mô tả các bước cơ bản trong xử lý ảnh
Hình 3.15: Các giai đoạn xử lý ảnh
3.2.1 Thu nhận ảnh Ảnh được thu từ nhiều nguồn khác nhau: máy ảnh, máy quay phim, máy quét, ảnh vệ tinh…
Mục đích: biến đổi thông tin hình ảnh về các cấu trúc được lưu trữ trong máy tính, có thể hiển thị ra các thiết bị ngoại vi như là máy in, màn hình…
Biểu diễn và mô tả
Nhận dạng và nội suy
Gồm hai tiến trình: o Biến đổi năng lượng quang học thành năng lượng điện o Tổng hợp năng lượng điện thành ảnh hoặc ma trận số
Là quá trình sử dụng các kỹ thuật xử lý ảnh để làm ảnh tốt lên theo mục đích sử dụng
Mục đích: o Điều chỉnh độ chiếu sáng để khắc phục hậu quả của việc chiếu sáng không đều o Giảm nhỏ thành phần nhiễu của ảnh tức là các đối tượng xuất hiện ngoài ý muốn o Hiệu chỉnh giá trị độ sáng giữa nền và đối tượng o Chuẩn hoá độ lớn, màu, dạng của ảnh o Điều chỉnh bộ lọc để khuyếch đại và nén các tần số
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này Kết quả của bước phân đoạn ảnh thường được cho dưới dạng dữ liệu điểm ảnh thô, trong đó hàm chứa biên của một vùng ảnh hoặc tập hợp tất cả các điểm ảnh thuộc về chính vùng ảnh đó Trong cả hai trường hợp, sự chuyển đổi dữ liệu thô này thành một dạng thích hợp hơn cho việc xử lý trong máy tính là hết sức cần thiết, nghĩa là nên biểu diễn một vùng ảnh dưới dạng biên hay dưới dạng một vùng hoàn chỉnh gồm tất cả những điểm ảnh thuộc về nó o Biểu diễn dạng biên cho một vùng phù hợp với những ứng dụng chỉ quan tâm đến các đặc trưng hình dạng bên ngoài của đối tượng, ví dụ như các góc cạnh và điểm uốn trên biên o Biểu diễn dạng vùng lại thích hợp cho những ứng dụng khai thác các tính chất bên trong của đối tượng Ví dụ như vân ảnh hoặc cấu trúc xương của nó
Và trong một số ứng dụng thì cả hai cách biểu diễn trên đều cần thiết
3.2.4 Biểu diễn và mô tả ảnh Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được
Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh như: biên ảnh, vùng ảnh Một số phương pháp biểu diễn thường dùng: o Biểu diễn bằng mã chạy: Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân o Biểu diễn bằng mã xích: Phương pháp này thường dùng để biểu diễn đường biên ảnh o Biểu diễn bằng mã tứ phân: Phương pháp này được dùng để mã hoá cho vùng ảnh
3.2.5 Nhận dạng và nội suy ảnh
Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng
Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản: o Nhận dạng theo tham số o Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh,môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy.
ỨNG DỤNG CHƯƠNG TRÌNH PHÂN TÍCH VÀ XỬ LÝ HÌNH ẢNH ĐỂ XÁC ĐỊNH CÁC YẾU TỐ HÌNH HỌC CỦA Ổ GÀ
Thu thập ảnh
Camera dùng để thu ảnh có độ phân giải 2560x1920 Ảnh sử dụng được resize về độ phân giải 640x480
4.1.1 Ảnh cho phần nhận dạng ổ gà Để phục vụ cho công tác nhận dạng ổ gà, cần xây dựng cơ sở dữ liệu cho mạng neural Cơ sở dữ liệu ở đây sẽ là tổng hợp những hình ảnh mang tính chất đặc trưng của ổ gà và những ảnh không chứa ổ gà Dữ liệu này phải có những đặc tính sau: o Hình ảnh mang tính chất đặc trưng của ổ gà: chỉ những ổ gà đơn giản và nằm trọn trong bức ảnh
Xác định diện tích ổ gà
Xác định chiều sâu ổ gà Đưa ra kết quả, nhận xét
Hình 4.2: Một số ổ gà cơ bản o Hình ảnh không chứa ổ gà: bao gồm những ảnh không chứa ổ gà, hình có vạch sơn, vạch giảm tốc trên đường
Hình 4.3: Một số hình ảnh không chứa ổ gà
4.1.2 Ảnh cho phần xác định các yếu tố hình học Ở một số nước phát triển, việc lấy ảnh phục vụ cho công tác nghiên cứu về hư hỏng trên đường BTN thường được thực hiện một cách tự động [21, 22] Một hoặc hai camera (theo đề tài này cần 2 camera) sẽ được cố định trên một trục ngang hoặc dọc của phương tiện dùng để khảo sát (thường là ô tô) Camera được đặt ở một khoảng cách cố định so với mặt đường Xe di chuyển dọc theo đoạn đường muốn khảo sát, hai camera sẽ làm việc liên tục, đồng bộ ghi lại toàn bộ hình ảnh của đoạn đường Hình ảnh ở hai camera này sẽ đại diện cho 2 hướng khác nhau của ổ gà
Hình 4.4: Phương tiện dùng để thu ảnh tự động
Kết quả của quá trình này là thu được những hình ảnh ổ gà từ đoạn video, sau đó sẽ tiến hành xử lý theo mục đích của nghiên cứu
Hình 4.5: Hình ảnh ổ gà thu được từ một camera
Việc thu ảnh bằng cách này rất tiện lợi, an toàn và nhanh chóng, tuy nhiên lại đòi hỏi phải có đầy đủ thiết bị kỹ thuật bổ trợ [21] Như đã nói ở trên, trong giới hạn của đề tài này, bỏ qua công tác thu ảnh tự động, chỉ tập trung phần xử lý một số dạng ổ gà điển hình Tuy vậy, việc lấy ảnh bằng cách thủ công cũng phải tuân thủ một số điều kiện, trong đề tài này phải tuân thủ điều sau: o Camera phải đặt cách mặt đường 1m o Khoảng cách giữa 2 lần chụp là 10cm (để mô phỏng cho 2 camera đặt cách nhau 10cm) o Mỗi ổ gà cần chụp ít nhất 2 bức, hai lần chụp cho 1 ổ gà phải diễn ra gần như đồng thời trong cùng một điều kiện
Công cụ để lấy ảnh ổ gà bằng thủ công gồm có: 1 thước thủy bình (để đảm bảo cho 2 lần chụp ở cùng một khoảng cách so với mặt đường), 1 thước dây thép, 1 camera (máy chụp ảnh)
Hình 4.6: Công cụ thu ảnh
Hình 4.7: Một số ảnh thu được từ hiện trường)
Nhận dạng ổ gà
Có hai phương pháp nhận dạng phổ biến hiện nay dựa trên các đặc trưng tổng thể như phương pháp PCA, LDA, LFA Trong đó, PCA là phương pháp trích rút đặc trưng nhằm giảm số chiều của ảnh tuy đơn giản nhưng mang lại hiệu quả tốt Nhận dạng ổ gà dùng PCA kết hợp với mạng neural là phương pháp mang lại hiệu quả nhận dạng cao bởi nó phát huy được ưu điểm của PCA và mạng neural [23] Hình 4.8 mô tả các bước nhận dạng ổ gà cơ bản trong một hệ thống
Hình 4.8: Hệ thống nhận dạng ổ gà cơ bản
4.2.1 Hệ thống nhận dạng ổ gà - Phương pháp PCA (Principal Components Analysis)
Quá trình tiền xử lý đối với ổ gà nhằm nâng cao chất lượng ảnh, chuẩn hóa dữ liệu, kích thước ảnh Các ảnh trong nghiên cứu này là có chất lượng tương đối tốt nên ta không cần dùng các thuật toán nâng cao chất lượng ảnh mà ta chỉ cần chuẩn hóa ảnh (normalize image), đưa ảnh về cùng một kích thước hoặc một kích thước nhỏ hơn làm quá trình rút đặc trưng thêm nhanh chóng
Trích rút đặc trưng là kỹ thuật sử dụng các thuật toán để lấy ra những thông tin mang những đặc điểm riêng biệt của ổ gà Đề tài này sử dụng phương pháp PCA [24]
Phương pháp PCA - Principal Component Analysis [25]:
Phân tích thành phần chính (Principal Component Analysis – PCA) là một trong những phương pháp phân tích dữ liệu nhiều biến đơn giản nhất Trong thống kê, thông thường cần phải “nghiên cứu” dữ liệu trước khi xây dựng các mô hình suy diễn dựa trên dữ liệu đó Tuy nhiên đôi khi dữ liệu có số chiều lớn, không thể hình Ảnh
Nhận dạng dung được trong không gian 2 hay 3 chiều, do đó cần phải tìm cách đưa dữ liệu về không gian có số chiều nhỏ hơn
PCA là một trong những phương pháp như thế với những đặc tính sau: o Giúp giảm số chiều của dữ liệu, o Thay vì giữ lại các trục tọa độ của không gian cũ, PCA xây dựng một không gian mới ít chiều hơn, nhưng lại có khả năng biểu diễn dữ liệu tốt tương đương không gian cũ, nghĩa là đảm bảo độ biến thiên (variability) của dữ liệu trên mỗi chiều mới o Các trục tọa độ trong không gian mới là tổ hợp tuyến tính của không gian cũ, do đó về mặt ngữ nghĩa, PCA xây dựng các đặc trưng mới dựa trên các đặc trưng đã quan sát được Điểm hay là những đặc trưng này vẫn biểu diễn tốt dữ liệu ban đầu o Trong không gian mới, các liên kết tiềm ẩn của dữ liệu có thể được khám phá, mà nếu đặt trong không gian cũ thì khó phát hiện hơn, hoặc những liên kết như thế không thể hiện rõ o Nói một cách ngắn gọn, mục tiêu của PCA là tìm một không gian mới (với số chiều nhỏ hơn không gian cũ) Các trục tọa độ trong không gian mới được xây dựng sao cho trên mỗi trục, độ biến thiên của dữ liệu trên đó là lớn nhất có thể
Một ví dụ kinh điển là hình ảnh về con lạc đà Cùng là một con lạc đà nhưng nếu nhìn từ bên hông thì ta có được đầy đủ thông tin nhất, trong khi nhìn từ phía trước thì thật khó để nói nó là lạc đà
Hình 4.9: Phép chiếu lên các trục tọa độ khác nhau có thể cho cách nhìn rất khác nhau về cùng một dữ liệu
Một ví dụ thuyết phục hơn được minh họa trong hình sau:
Hình 4.10: Tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao nhất
Giả sử tập dữ liệu ban đầu được quan sát trong không gian 3 chiều như Hình 4.10 (a) Rõ ràng 3 trục này không biểu diễn được tốt nhất mức độ biến thiên của dữ liệu PCA do đó sẽ tìm hệ trục tọa độ mới Sau khi tìm được không gian mới, dữ liệu sẽ được chuyển sang không gian này để được biểu diễn như trong Hình 4.10 (b) Rõ ràng hình bên phải chỉ cần 2 trục tọa độ nhưng biểu diễn tốt hơn độ biến thiên của dữ liệu so với hệ trục 3 chiều ban đầu
Trong đề tài này thuật toán PCA được thực hiện theo các bước tóm tắt sau:
Hình 4.11: Quá trình trích rút đặt trưng
Thuật toán được tham khảo từ người có chuyên môn trong lĩnh vực liên quan Chi tiết phần code trình bày trong phụ lục ở phần sau của luận văn
Những đặc trưng sau khi được trích rút sẽ đưa vào khối nhận dạng để phân lớp đối tượng Trong đề tài này ta dùng mạng neural nhân tạo [26] để nhận dạng các đối tượng
4.2.2 Mạng neural nhân tạo (Artificial Neural Network-ANN)
Mạng neural nhân tạo hay thường gọi ngắn gọn là mạng neural là một mô hình toán học hay mô hình tính toán được xây dựng dựa trên các mạng neural sinh học
Nó gồm có một nhóm các neural nhân tạo (nút) nối với nhau, và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút ANN giống như bộ não con người, được học bởi kinh nghiệm (thông qua huấn luyện), có khả năng lưu giữ những kinh nghiệm hiểu biết (tri thức) và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết
Mạng neural với các trọng số và ngõ vào tương ứng
Ngõ vào Ngõ ra Điều chỉnh trọng số Đích
Hình 4.12: Mô tả toán học tổng quát mạng neural
Tín hiệu ngõ vào sau khi qua mạng neural sẽ được tính toán và ngõ ra của mạng sẽ được so sánh với tín hiệu đích mong muốn Mạng sẽ tiếp tục cập nhật và điều chỉnh trọng số và ngưỡng cho đến khi thỏa mãn ngõ ra yêu cầu
Có nhiều cấu trúc mạng neural khác nhau như mạng hồi qui (feedback), mạng tự tổ chức (self-organizing), mạng truyền thẳng (feedforward) Đề tài này tập trung với mạng truyền thẳng đa lớp [27]
Hình 4.13: Mạng neural đa lớp truyền thẳng
Trong mạng neural đa lớp truyền thẳng, các lớp được phân chia thành 3 loại [28]: o Lớp vào (input): là lớp neural đầu tiên nhận tín hiệu vào, mỗi tín hiệu vào sẽ được đưa đến tất cả các neural của lớp neural đầu tiên, chúng được phân phối trên các trọng số có số lượng đúng bằng số neural của lớp này Thông thường, các neural đầu vào không làm biến đổi các tín hiệu vào, chúng chỉ đóng vai trò phân phối các tín hiệu o Lớp 1 (hidden): Là lớp neural dưới lớp vào, chúng không trực tiếp liên hệ với bên ngoài như lớp neural vào và ra o Lớp 2 (output): Là lớp neural tạo các tín hiệu ra cuối cùng
4.2.3 Nhận diện ổ gà bằng việc kết hợp mạng neural nhân tạo và phương pháp PCA
Cơ sở dữ liệu cho bài toán nhận dạng được phân thành tập huấn luyện và tập kiểm tra Trong đó tập huấn luyện có tổng cộng 30 ảnh, bao gồm 24 ảnh có chứa ổ gà và 6 ảnh ko có ổ gà Tập kiểm tra gồm 5 ảnh có chứa ổ gà và không nằm trong số
24 ảnh có chứa ổ gà của tập huấn luyện Sau khi kiểm tra, thuật toán nhận dạng chính xác 100% tập ảnh kiểm tra.
Xác định diện tích ổ gà
Giả sử h là khoảng cách từ camera tới ổ gà cần chụp (h0cm), s là diện tích ổ gà Đặt giới hạn diện tích ổ gà chiếm trên ảnh dao động từ 2 55% (vẽ một hình tròn đường kính gần bằng với chiều cao ảnh, hình tròn đó sẽ chiếm khoảng 55% diện tích ảnh) tương đương từ 170 4694cm 2 Tỉ số giới hạn phần tính diện tích ổ gà là:
ℎ≤ 46.9 (4.1) Giới hạn này sẽ là cơ sở để xây dựng thuật toán xác định diện tích ổ gà Sơ đồ chung xác định diện tích ổ gà:
Hình 4.14: Sơ đồ chung xác định diện tích ổ gà
4.3.1 Tách ổ gà từ ảnh chụp
4.3.1.1 Phương pháp phân ngưỡng tự động
Có nhiều phương pháp để tách đối tượng cần khảo sát từ hình ảnh của chúng
Các phương pháp này có thể liệt kê gồm: phương pháp phân ngưỡng, phát hiện biên sử dụng thuật toán canny, phát hiện biên sử dụng thuật toán sobel, phát hiện cạnh
[16] Nghiên cứu này sử dụng phương pháp phân ngưỡng để tách ổ gà
Ngưỡng trong kỹ thuật phân ngưỡng, ngưỡng thường được cho bởi người sử dụng Kỹ thuật phân ngưỡng đặt ngưỡng để hiển thị các tông màu liên tục Các điểm trong ảnh được so sánh với ngưỡng định trước Giá trị của ngưỡng sẽ quyết định điểm có được hiển thị hay không, do vậy ảnh kết quả sẽ mất đi một số chi tiết
Ví dụ: Trong một ảnh xám có 256 mức xám nằm trong phạm vi [0, 255], nghĩa là ta có 254 ngưỡng có thể chọn (bỏ ra 2 giá trị 0 và 256 tương đương màu đen và Ảnh
Tính diện tích trắng) Nếu ta chọn ngưỡng với giá trị là 127, các điểm có giá trị điểm ảnh lớn hơn
127 sẽ là 1, ngược lại là 0
Do vậy, nếu thuật toán chọn ngưỡng nằm trong mức [0, 255], mỗi vòng lặp tăng lên 1 đơn vị mức xám như sơ đồ trên thì có thể gây cho thuật toán trở nên nặng nề và hoạt động chậm Để đơn giản hơn, chọn ngưỡng thay đổi trong mức [0, 1] thay vì [0, 255], mỗi lần tăng ngưỡng sẽ là 0.01 đơn vị Nghĩa là một giá trị 0.01 sẽ tương ứng với 2.55 đơn vị mức xám
Kỹ thuật phân ngưỡng tự động nhằm tìm ra ngưỡng một cách tự động dựa vào biểu đồ tần suất thể hiện cường độ sáng của ảnh, có thể sử dụng tốt đối với cả ảnh có chất lượng tốt và ảnh có độ tương phản thấp, mức sáng của đối tượng thấp hơn so với nền Ở đây ta sử dụng thêm phương pháp phân ngưỡng tự động kết hợp với kiểm tra đối tượng có trong ảnh: loại bỏ các đối tượng chứa biên ảnh, loại bỏ các đối tượng có kích thước quá nhỏ Hình 4.14 thể hiện lưu đồ của quá trình tách ổ gà bằng phương pháp phân ngưỡng tự động
Start Đọc vào ảnh màu có chứa ổ gà
Chuyển ảnh màu thành ảnh xám
Chuyển ảnh xám thành ảnh nhị phân Xử lý
Kiểm tra đối tượng có phải là ổ gà
Hình 4.15: Lưu đồ phương pháp phân ngưỡng tự động
Từ lưu đồ trên có thể xác đinh các bước cơ bản để tách và định vị ổ gà bao gồm: o Bước 1: Chuyển ảnh màu thành ảnh xám, o Bước 2: Phân ngưỡng sau đó chuyển ảnh xám thành ảnh nhị phân, o Bước 3: Xử lý xóa bỏ các đối tượng nhỏ trong ảnh, điền đầy các đối tượng bên trong, loại bỏ các đối tượng chứa đường biên Bước này dùng để loại bỏ bớt các thành phần nhiễu ngoài ổ gà o Bước 4 : Định vị ổ gà và xóa các đối tượng nhỏ Nếu bước này không nhận ra được ổ gà với ngưỡng đặt ra ở bước 2, thuật toán sẽ tự động tăng ngưỡng và bắt đầu lại từ bước 2
Mỗi điểm ảnh của ảnh màu thường có giá trị màu trong khoảng từ 0 đến
16777216 Mỗi điểm ảnh của ảnh xám có giá trị xám từ 0 đến 255 [15], ít hơn nhiều so với giá trị màu của ảnh màu Do đó, để việc phân ngưỡng được thuận lợi hơn, ảnh màu thường được chuyển thành ảnh xám Hình 4.15 thể hiện ảnh của ổ gà trước và sau khi được chuyển về ảnh độ xám
Hình 4.16: Ảnh ổ gà trước và sau khi chuyển thành ảnh xám
(a) Ảnh màu ban đầu (b) Ảnh độ xám Để dễ hiểu, ta mô tả sơ bộ thêm giai đoạn đầu của quá trình phân ngưỡng tự động (Chi tiết của cả quá trình này sẽ được trình bày ở giai đoạn đã xác định được ngưỡng chính thức) Giai đoạn đầu này thuật toán sẽ cho ngưỡng là 0.01 (thresh 0.01) Hình 4.16 mô tả ảnh sau khi phân ngưỡng và trải qua các bước xử lý chính
(c) (d) Hình 4 17: Ảnh sau khi phân ngưỡng (thresh = 0.01) và trải qua các bước xử lý chính (a): Ảnh nhị phân
(b): Ảnh nhị phân sau khi xóa các đối tượng nhỏ
(c): Ảnh nhị phân sau khi điền đầy các đối tượng bên trong
(d): Ảnh nhị phân sau khi xử lý các đối tượng nhỏ hơn 2% diện tích ảnh
Giả thuyết ổ gà chỉ nằm ở vùng lân cận tâm ảnh Giả thuyết này là hợp lý vì có thể chỉ khảo sát các ảnh tách ra từ video có ổ gà nằm ở vùng lân cận tâm ảnh Để chắc chắn rằng đối tượng đó là ổ gà, không phải là đối tượng nhiễu hoặc không xác định được ổ gà, kiểm tra đối tượng đó có điểm ảnh nào nằm trong vùng tâm ảnh không Các bước thực hiện được minh họa ở Hình 4.17, bao gồm: o B1: Xác định điểm tâm của ảnh o B2: Định diện tích vùng tâm, chọn vùng tâm là hình vuông, có tâm trùng với tâm của ảnh là cạnh có độ lớn bằng 0.02 lần kích thước chiều cao ảnh o B3: Tìm các điểm ảnh chung giữa đối tượng và hình ở tâm o B4: Kiểm tra nếu có các điểm ảnh chung giữa đối tượng và hình tại tâm thì kết luận đối tượng đó là vùng ảnh chứa ổ gà
Hình 4.18: Minh họa thuật toán lấy ổ gà nằm trong vùng tâm ảnh Ảnh trích chọn ổ gà sau cùng phải có điều kiện sau: ổ gà phải nằm ở tâm ảnh và phải lớn hơn 2% diện tích ảnh
Xem lại Hình 4.16d, ta thấy không còn đối tượng nào trong ảnh nên chưa trích được đối tượng Lúc này, tăng ngưỡng lên một bậc (thresh = 0.02) rồi quay lại từ bước chuyển ảnh xám thành ảnh nhị phân, việc này được lặp đi lặp lại cho đến khi nào tìm được nhiều hơn 1 đối tượng thỏa mãn các điều kiện trên
Khi ngưỡng thresh = 0.38 (ngưỡng cuối cùng có được bằng phương pháp phân ngưỡng tự động cho ảnh ban đầu, Hình 4.15a) thu được các kết quả như hình Hình
4.18 Với ngưỡng có giá trị 0.38, thu được ảnh nhị phân như Hình 4.18b Tiếp đó, tiến hảnh xử lý để loại bỏ các đối tượng nhiễu ngoài ổ gà, gồm 3 bước chính minh họa ở các Hình 4.18c đến Hình 4.18e Những đối tượng trắng, nhỏ, nhiễu của ảnh nhị phân sau khi phân ngưỡng tự động thu được, chắc chắn không phải là ổ gà sẽ được loại bỏ (Hình 4.18c) Sau khi loại bỏ các đối tượng nhỏ, ảnh thu được sẽ bao gồm nhiều khối hình lớn chứa những đối tượng đen bên trong Tiến hành điền đầy các đối tượng bên trong để các khối trở nên thống nhất như Hình 4.18d Những khối lớn nằm sát đường biên ảnh sẽ được loại bỏ ở bước này gọi là loại bỏ các đối tượng Ảnh có chứa ổ gà
Vùng ảnh nhị phân có thể chứa ổ gà chứa đường biên Ảnh thu được sau bước này chỉ còn những đối tượng nằm trọn trong ảnh, Hình 4.18e
Hình 4.19: Ảnh sau khi phân ngưỡng (thresh = 0.38) và trải qua các bước xử lý (a) Ảnh xám của ổ gà
(b) Ảnh sau khi áp ngưỡng
(c) Ảnh sau khi xóa các đối tượng nhỏ trong ảnh
(d) Ảnh sau khi điền đầy các đối tượng bên trong
(e) Ảnh sau khi loại bỏ các đối tượng chứa đường biên
(f) Ảnh ổ gà sau khi định vị và xóa các đối tượng nhỏ hơn 2% diện tích ảnh
Quan sát hình 4.18e, ảnh lúc này gồm đối tượng ổ gà ở tâm ảnh và những phần nhiễu xung quanh, sau khi định vị và xóa các đối tượng nhiễu đó, thu được hình sau cùng là 4.18f
4.3.1.2 Kiểm tra một số yếu tố có thể ảnh hưởng tới quá trình tách ổ gà bằng phương pháp phân ngưỡng tự động
Bằng trực quan, có thể thấy Hình 4.18f sau khi tách ổ gà bằng phân ngưỡng tự động có độ chính xác khoảng 95% so với ảnh màu ban đầu Chọn các thông số của Hình 4.15a làm chuẩn để kiểm tra mức độ ảnh hưởng của một số yếu tố tới quá trình tách ổ gà a Độ sáng của ảnh Độ sáng của ảnh là tổng hợp độ sáng của từng điểm ảnh trong ảnh, thay đổi trong phạm vi [0,255], được thể hiện qua biểu đồ histogram [29, 30] Ảnh sáng hay tối phụ thuộc vào thời điểm chụp, ánh sáng mặt trời, hoặc do chất lượng của thiết bị thu ảnh
Gọi Br là thông số đại diện cho độ sáng trung bình của ảnh Cách thức thay đổi độ sáng của ảnh:
Hình 4.20: Thang đo sáng tối của ảnh
Hình 4.20 thể hiện quá trình tăng giảm độ sáng của ảnh ban đầu và biểu đồ mức sáng của nó (biểu đồ histogram)
(d) Hình 4.21: Ảnh trước và sau khi thay đổi độ sáng (a): Ảnh có độ sáng trung bình Br = 97
(b): Ảnh có độ sáng trung bình Br = 50 (c): Ảnh có độ sáng trung bình Br = 150 (d): Ảnh có độ sáng trung bình Br = 200
Hình 4.21 cho thấy ảnh các ổ gà với những độ sáng khác nhau sau khi tách ổ gà bằng phương pháp phân ngưỡng tự động:
Br = 150 Br = 200 Hình 4.22: Ổ gà sau khi tách được bằng phân ngưỡng tự động ở các độ sáng trung bình khác nhau
Xác định chiều sâu ổ gà
Sơ đồ xác định chiều sâu ổ gà:
Hình 4.32: Sơ đồ xác định chiều sâu ổ gà
Camera Calibration (gọi tắt là Calib) là một phương pháp tính toán và thực nghiệm nhằm tìm ra các thông số của camera cho việc tái tạo không gian 3D của một cảnh nào đó trong thực tế bằng những ảnh mà camera đó chụp lại được Ảnh được tạo ra từ 2 camera đã được Calib kết hợp với tìm điểm đặc trưng tương đồng sẽ cung cấp cho ta thông tin độ lệch của 2 điểm tương đồng trên 2 ảnh
Tìm điểm tương đồng Xác định độ lệch
Tính chiều sâu ổ gà đó [33, 34] Kết quả này sẽ là căn cứ để ta xác định được khoảng cách của ổ gà so với camera, từ đó rút ra được chiều sâu của ổ gà
Hình 4.33: Mô phỏng cách lấy ảnh của 2 camera
4.4.1.2 Cách thực hiện Ở bước này, Calib sẽ cung cấp tọa độ không gian cần thiết, bao gồm: tọa độ không gian giả định (X, Y, Z) (world coordinates) và tọa độ xoay của camera (XR,
YR, ZR) (rotation of camera) [35] Calib được thực hiện bởi một calibration grid (Hình 4.33), được chụp ở nhiều vị trí khác nhau ở cả 2 camera (Hình 4.34) Kích thước của calibration grid này đã được biết trước với đơn vị là cm
Tập ảnh calibration grid này có đặc điểm như sau: o Kích thước : 30x30cm o Được chụp từ khoảng cách bất kì so với camera o Gồm 18 cặp ảnh, mỗi cặp ảnh là 2 góc độ chụp ở 2 vị trí camera cách nhau 10cm, tổng cộng thu được 36 ảnh ( giao động từ 10 tới 20 cặp ảnh [36])
Hình 4.35: Ảnh mô phỏng giai đoạn sử dụng calibration grid
Sau khi có được các cặp ảnh của calibration grid (Hình 4.35), kết quả thu được là một không gian ảnh giả định (Hình 4.36) Kết quả này còn được dùng để hiệu chỉnh ảnh cho cả 2 hình chiếu của ảnh trên mặt phẳng ảnh sao cho 2 mặt phẳng này nằm trên cùng một mặt phẳng chung với nhau Bước hiệu chỉnh này sẽ làm đơn giản hóa về mặt hình học cũng như giảm thiểu sự tính toán cần thiết trong quá trình xác định chiều sâu ổ gà [35]
Hình 4.36: Một số ảnh calibration grid
Hình 4 37: Không gian giả định của Calib
Bước hiệu chỉnh trên còn gọi là bước chuẩn hóa đường epipolar (epipolar standard geometry) Kết quả thu được giả định rằng 2 camera sẽ nằm trên cùng 1 mặt phẳng và thẳng hàng với nhau (Hình 4.37)
Định nghĩa đường đường epipolar
Giả sử có mọi x’ luôn lằm trên đường l’ trên mặt phẳng ảnh thứ 1, thì mọi điểm x sẽ luôn nằm trên đường l trên mặt phẳng ảnh thứ 2 Đường l , l’ này được gọi là đường epipolar (Hình 4.38)
Nếu hai mặt phẳng trùng với nhau, đường epipolar lúc này là đường nằm ngang trên mặt phẳng ảnh như Hình 4.39
Hình 4.40: Đường epipolar nằm ngang
4.4.2 Tìm điểm đặc trưng – Xác định độ lệch – Phương pháp Surf
Phương pháp Surf (trích chọn sử dụng điểm đặc trưng dựa trên các điểm nổi bật), là các điểm bất biến với sự thay đổi của ảnh như xoay, co giãn, che lấp một phần…
Hình 4.41: Hai ảnh trên có thể được nhận ra là cùng một cảnh bởi SURF
SURF (Speeded Up Robust Features) [38, 39, 40] được giới thiệu lần đầu tiên vào năm 2006 bởi nhóm các nhà nghiên cứu bao gồm Herbert Bay, Tinne
Tuytelaars và Luc Van Gool SURF sử dụng không gian scale để tìm điểm đặc trưng, các đặc trưng được mô tả dưới dạng vector và có kèm thêm hướng Hai phần chính trong thuật toán này là “phát hiện” (detection) và “mô tả” (description) o Phát hiện : Việc phát hiện đặc trưng dựa trên không gian scale và sử dụng ma trận Hessian, tuy nhiên để đơn giản cho việc tính toán người ta chỉ sử dụng một xấp xỉ của ma trận này o Mô tả : Việc mô tả đặc trưng sử dụng đặt trưng Haar Wavelet Một lần nữa Integral Images lại được sử dụng để tăng tốc độ tính toán Mỗi điểm đặc trưng sẽ được thêm 1 hướng, dùng để nhận dạng khi ảnh bị xoay
Mô tả điểm đặc trưng được thể hiện dưới dạng vector gồm 64 thành phần chứa thông tin biến thiên trên ảnh
Với mỗi điểm ảnh trên ảnh thứ nhất ta tìm đường epipoplar tương ứng ở ảnh thứ hai Sau đó kiểm tra tất cả các điểm ảnh trên đường này và chọn ra một điểm gần giống nhất (Hình 4.41)
Hình 4.42: Minh họa cách tìm điểm tương đồng
Cặp ảnh ổ gà trước và sau khi tìm điểm tương đồng:
Hình 4.43: Ảnh trước và sau khi tìm điểm tương đồng
(a) Ảnh trái (b) Ảnh phải (c) Ảnh sau khi tìm điểm tương đồng (d) Ảnh sau khi hiệu chỉnh
Trong thực tế, khi chụp một vật từ 2 camera bằng thủ công, không phải lúc nào đường epipolar cũng nằm ngang Cho nên, việc hiệu chỉnh như đã trình bày ở trên là cần thiết (Hình 4.42d)
Chiều sâu của mỗi điểm ảnh trên ổ gà so với camera được tính theo công thức sau [35]:
𝑑 (4.3) Trong đó : f – độ dài tiêu cự máy ảnh d – độ lệch của 2 điểm ảnh tương đồng b – khoảng cách giữa 2 camera z – chiều sâu của ổ gà so với camera
Hình 4.44: Mô phỏng cách tính chiều sâu của 1 điểm ảnh
Trong mô hình này (Hình 4.43), độ lệch được xác định bằng hiệu số x1-x2, khoảng cách giữa 2 điểm ảnh trên mặt phẳng chiếu của ảnh Từ công thức 4.3, ta thấy giá trị chiều sâu và độ lệch tỷ lệ nghịch với nhau, đồng nghĩa với việc điểm ảnh nào ở xa hơn so với camera trong không gian thực sẽ có độ lệch thấp hơn trên mặt phẳng chiếu của ảnh Độ chính xác của công thứ 4.3 tăng lên khi khoảng cách 2 camera tăng Có được chiều sâu của mỗi điểm ảnh trên ổ gà so với camera, trừ đi 100cm (khoảng cách của camera so với mặt đường) là chiều sâu mỗi điểm ảnh của ổ gà so với mặt đường, ta xác định được chiều sâu trung bình của ổ gà
Một số ổ gà thực tế nằm trên địa bàn huyện Củ Chi dùng để tính toán (Hình 4.44) (a) đường Liêu Bình Hương, (b) đường Cây Bài, (c) đường Nguyễn Văn Ni Ảnh trái Ảnh phải
(c) Hình 4.45: Một số cặp ảnh ổ gà thực tế và chiều sâu của nó
Bảng 4.3: Chiều sâu trung bình của một số ổ gà thực tế
Hình Tính toán (cm) Thực tế (cm) Sai số (%)
Sai số trung bình: 11.5 4.4.4 Kết luận
Kết quả cho ta thấy sai số ở mức tương đối, nguyên nhân do đa phần từ công tác thu ảnh cho tới công tác lấy mẫu calib đều làm bằng thủ công, dẫn tới tính chính xác chưa cao Nếu được đầu tư nghiên cứu kĩ lưỡng hơn, về máy móc, công cụ chuyên dụng thì kết quả sẽ tốt hơn.
Giới thiệu sơ lược về giao diện của phương pháp đề xuất
Hình 4.46 thể hiện giao diện chính của phần mềm Giao diện này dùng để nhận diện và tính diện tích ổ gà
Hình 4.47: Giao diện tính chiều sâu ổ gà
(b) Hình 4.48: Nhận diện ổ gà (a) Minh họa về hình không có ổ gà (b) Ví dụ về hình có ổ gà
Hình 4.49: Diện tích tính toán của ổ gà
Hình 4.50: Chiều sâu của ổ gà
KẾT LUẬN VÀ KIẾN NGHỊ
Kết quả tính toán có thể giúp chúng ta có được những đánh giá, nhận xét nhanh chóng hơn về loại hư hỏng, mức độ hư hỏng.Tuy nhiên kết quả thu được nằm trong những điều kiện cụ thể Việc ứng dụng hệ thống vào thực tế sẽ gặp những vấn đề thách thức như cải thiện sai số, xây dựng một hệ thống hoàn chỉnh, các yếu tố khác về chất lượng ảnh ảnh hưởng tới kết quả, chính sách của nhà nước về ứng dụng vấn đề nghiên cứu…
Về mặt lý thuyết, phương pháp đánh giá hư hỏng ổ gà ở mặt đường BTN bằng xử lý hình ảnh thể hiện nhiều ưu điểm hơn với phương pháp thủ công, tiện dụng hơn, an toàn hơn và chi phí thấp hơn so với phương pháp kỹ thuật tiên tiến trên Tuy nhiên, ở Việt Nam việc sử dụng công nghệ này rất hạn chế, hầu như chưa từng được chú ý tới Do đó, bước đầu từ nghiên cứu này có thể là tiền đề cho các ứng dụng công nghệ rộng rãi cho Việt Nam và cũng là cơ sở cho các nghiên cứu tiếp theo.