Với mục đích bảo vệ rừng và hạn chế các hậu quả của cháy rừng, nhiều biện pháp phòng chống cháy rừng đã được áp dụng như đặt các trạm, chòi canh gác nhằm quan sát cháy rừng rừng U Minh,
GIỚI THIỆU ĐỀ TÀI
Giới thiệu đề tài
Không phải ngẩu nhiên mà Trái Đất được gọi là hành tinh xanh Với diện tích lớn là biển, rừng và tầng ôzôn bao quanh, Trái Đất là nơi bắt nguồn cho sự sống – một điều mà chưa hành tinh nào có Đặc biệt, rừng là một yếu tố quan trọng ảnh hưởng trực tiếp đến môi trường sống của con người
Rừng là một hệ sinh thái mà quần thể cây rừng giữ vai trò chủ đạo trong mối quan hệ tương tác giữa sinh vật với môi trường Có vai trò rất quan trọng đối với cuộc sống của con người cũng như môi trường: cung cấp nguồn gỗ, củi, điều hòa, tạo ra oxy, điều hòa nước, là nơi cư trú động thực vật và lưu trữ các nguồn gen quý hiếm, bảo vệ và ngăn chặn gió bão, chống xói mòn đất, đảm bảo cho sự sống, bảo vệ sức khỏe của con người…
Do chức năng quang hợp của cây xanh, rừng là một nhà máy sinh học tự nhiên thường xuyên thu nhận CO2 và cung cấp O2 Đặc biệt ngày nay khi hiện tượng nóng dần lên của trái đất do hiệu ứng nhà kính, vai trò của rừng trong việc giảm lượng khí CO2 là rất quan trọng Vai trò điều hòa nguồn nước, giảm dòng chảy bề mặt bằng cách ngấm xuống đất vào tầng nước ngầm Khắc phục hiện tượng xói mòn đất, hạn chế lắng đọng lòng sông, lòng hồ, điều hòa dòng chảy của các con sông, con suối (tăng lượng nước sông, nước suối vào mùa khô, giảm lượng nước sông suối vào mùa mưa)
Rừng bảo vệ độ phì nhiêu và bồi dưỡng tiềm năng của đất: ở vùng có đủ rừng thì dòng chảy bị chế ngự, ngăn chặn được nạn bào mòn, nhất là trên đồi núi dốc tác dụng ấy có hiệu quả lớn, nên lớp đất mặt không bị mỏng, mọi đặc tính lý hóa và vi sinh vật học của đất không bị phá hủy, độ phì nhiêu được duy trì
GVHD: TS ĐỖ HỒNG TUẤN 2
Rừng liên tục tạo chất hữu cơ Điều này thể hiện ở qui luật phổ biến: rừng tốt tạo ra đất tốt, và đất tốt nuôi lại rừng tốt Nếu rừng bị phá hủy, đất bị xói mùn, quá trình đất mất mùn và thoái hóa dễ xảy ra rất nhanh chóng và mãnh liệt Ước tính ở nơi rừng bị phá hoang trơ đất trống mỗi năm bị rửa trôi mất khoảng 10 tấn mùn/ ha [1]
Rừng có vai trò rất lớn trong việc: chống cát di động ven biển, che chở cho vùng đất bên trong nội địa, rừng bảo vệ đê biển, cải hóa vùng chua phèn, cung cấp gỗ, lâm sản, dược liệu
Rừng nơi cư trú của rất nhiều các loài động vật: Động vật rừng nguồn cung cấp thực phẩm, dược liệu, nguồn gen quý, da lông, sừng thú là những mặt hàng xuất khẩu có giá trị
Vì vậy tỷ lệ đất có rừng che phủ của một quốc gia là một chỉ tiêu an ninh môi trường quan trọng (diện tích đất có rừng đảm bảo an toàn môi trường của một quốc gia tối ưu là 45% [1] tổng diện tích) Sự quan hệ của rừng và cuộc sống đã trở thành một mối quan hệ hữu cơ Không có một dân tộc, một quốc gia nào không biết rõ vai trò quan trọng của rừng trong cuộc sống Vai trò của rừng trong việc bảo vệ môi trường đang trở thành vấn đề thời sự và lôi quấn sự quan tâm của toàn thế giới
Tại Việt Nam, những năm đầu thế kỉ 20, độ che phủ của rừng nguyên sinh vào khoảng 70%, giữa thế kỷ còn 43%, đến những năm 1979 - 1981 chỉ còn 24%
(Theo số liệu của Viện Điều tra quy hoạch rừng năm 2014) Nếu như vào khoảng giữa thế kỷ 20 ở nước ta độ che phủ của rừng còn lại 43% diện tích đất tự nhiên
Thì sau 30 năm chiến tranh tiếp theo là giai đoạn mà rừng Việt Nam bị thu hẹp lại khá nhanh Hơn 80 triệu lít chất diệt cỏ cùng 13 triệu tấn bom đạn, bom cháy rừng cùng với đội xe ủi đất khổng lồ đã tiêu hủy hơn 2 triệu ha rừng nhiệt đới các loại và diện tích rừng chỉ còn khoảng 9,5 triệu ha, chiếm 29% diện tích cả nước
GVHD: TS ĐỖ HỒNG TUẤN 3
Theo số liệu thu được nhờ phân tích ảnh Landsat chụp năm 1979 – 1981 và KATE 140 trong cùng thời gian, cho thấy trong giai đoạn này rừng chỉ còn lại 7,8 triệu ha, chiếm khoảng 24% diện tích cả nước ( Theo số liệu Viện Điều tra và Quy hoạch rừng năm 2014), trong đó 10% là rừng nguyên sinh Ở nhiều tỉnh rừng tự nhiên giàu còn lại rất thấp, như Lai Châu còn 7,88%, Sơn La 11,955% và Lào Cai 5,38% Sự suy giảm về độ che phủ rừng ở các vùng này là do mức độ gia tăng dân số nhanh đã tạo nhu cầu lớn về lâm sản và đất trồng trọt Kết quả đã dẫn tới việc đốt rừng thành đất trồng trọt và nhà ở Những khu rừng còn lại ở vùng núi phía Bắc đã xuống cấp, trữ lượng gỗ thấp và bị chia cắt thành những đám rừng nhỏ phân tán
Theo số liệu Báo cáo Chương trình điều tra, theo dõi và đánh giá tài nguyên rừng toàn quốc (NFIMAP) chu kỳ III năm 2014, hơn 2/3 diện tích rừng tự nhiên của Việt Nam được coi là rừng nghèo; Rừng giàu và rừng trung bình chỉ chiếm 4,6% tổng diện tích rừng và phần lớn phân bố tại các vùng núi cao, vùng sâu, vùng xa
Nhiều khu rừng ngập mặn và rừng Tràm tại vùng đồng bằng ven biển có vai trò quan trọng trong việc duy trì đang dạng sinh học dường như đã biến mất Báo cáo cũng cho thấy chất lượng và đa dạng sinh học rừng tiếp tục bị suy giảm Trong giai đoạn 1999 – 2005, diện tích rừng tự nhiên giàu giảm 10,2% và rừng trung bình giảm 13,4% Nhiều diện tích rừng tự nhiên rộng lớn tại vùng Tây Nguyên, Đông Nam Bộ và Tây Bắc đã bị mất trong giai đoạn từ 1991 – 2001
Với tình trạng rừng ngày càng suy giảm thì thiên tai như hạn hán, lũ lụt xảy ra với tần suất và cường độ ngày càng tăng gây ra những thiệt hại nghiêm trọng
Dọc theo chiều dài đất nước từ Hà Giang, Tuyên Quang, Yên Bái, Lào Cai đến Thái Nguyên, Hà Nội, Huế, Sài Gòn, Cần Thơ, Cà Mau thiệt hại vật chất là 11.600 tỉ đồng, chết và mất tích 415 người (2007) Năm 2008, chỉ 6 tháng đầu năm thiệt hại là 814 tỉ, riêng thủ đô Hà Nội với trận lụt lịch sử tháng 11 “ngập chìm trong nước” thiệt hại vật chất đã hơn 3.000 tỷ đồng, 20 người chết Trước thực trạng đó vấn đề
Tổng quan tình hình nghiên cứu
Các nghiên cứu về phát hiện lửa đã được nghiên cứu từ những năm 90 Tuy nhiên, việc phát hiện khói trong việc phát hiện giai đoạn đầu tiên của lửa thì chỉ được áp dụng trong những năm gần đây Lý do cho việc phát hiện khói là khói thường xuất hiện trước khi có lửa và trong các ứng dụng phát hiện lửa ở các khu vực có phạm vi rộng như: sân bay, trung tâm mua sắm hay rừng thì việc quan sát lửa thường rất khó khăn khi mà lửa ở giai đoạn đầu có diện tích rất nhỏ và khi đạt tới ngưỡng cháy thì hậu quả gây ra lại rất lớn Ngược lại, khói ở giai đoạn đầu của lửa thường rất lớn và phát tán nhanh trong khung cảnh của camera, vì thế camera dễ dàng nhận ra khói hơn là lửa với các ứng dụng ngoài trời và phạm vi rộng, đặc biện là giám sát cháy rừng Vì khói không có hình dạng và đặc trưng cố định nên nguyên lý chủ yếu trong việc phát hiện khói là dựa trên màu sắc và chuyển động chậm kèm theo với những đặc trưng theo được khảo sát theo thời gian Tuy nhiên, hình dạng không cố định, sự thay đổi màu sắc, sự chuyển động phụ thuộc vào điều kiện bên ngoài hay các đặc trưng không cố định của khói nên các nghiên cứu hiện nay trong việc phát hiện khói vẫn còn tồn tại phát hiện sai Nguyên nhân phổ biến của việc phát hiện sai là nhiễu, sự thay đổi của ánh sáng, sự rung của camera, hay các vật thể có tính chất gần giống khói tồn tại trong khung hình như: sương mù, mây
Với công nghệ hiện nay, chúng ta không thể tạo ra một hệ thống phát hiện khói có độ tin cậy cao mà không có sự giám sát của con người Tuy nhiên, nhiều hệ thống đã được nghiên cứu và phát triển để phục vụ trong phát hiện sớm cháy rừng
Các hệ thống này có thể được tổng hợp lại như sau: Hệ thống sử dụng ảnh vệ tinh, hệ thống sử dụng camera giám sát và cảm biến không dây [2] Cụ thể:
Về hệ thống sử dụng ảnh vệ tinh, hình ảnh vệ tinh được thu thập chủ yếu bởi hai vệ tinh chính đó là AVHRR (the Advanced Very High Resolution Radiometer, được sử dụng vào năm 1998) (http://noaasis.noaa.gov/NOAASIS/ml/avhrr.html) và
GVHD: TS ĐỖ HỒNG TUẤN 7
MODIS (the Moderate Resolution Imaging Spectroradiometer, sử dụng vào năm 1999) (http://modis.gsfc.nasa.gov/) Ảnh vệ tinh có thể cung cấp hình ảnh của toàn bộ khu rừng giám sát, nhưng nhược điểm lớn nhất của vệ tinh là cần tới hai ngày để đưa ra hình ảnh của khu rừng, bên cạnh đó, chất lượng hình ảnh vệ tinh còn bị ảnh hưởng bởi điều kiện thời tiết
Về hệ thống sử dụng camera giám sát và mạng cảm biến không dây Đây là phương pháp được sử dụng phổ biến hiện nay Với sự phát triển nhanh chóng của công nghệ, nhiều loại cảm biến đã được nghiên cứu và phát triển như: (i) visible camera dùng để thu nhận hình ảnh có bước sóng trong vùng nhìn thấy được của con người, (ii) infrared (IR), thermal camera hoạt động dựa trên sự bức xạ nhiệt của vật thể, (iii) IR spectrometers, dùng để phân thu thập phổ của đối tượng từ đó có thể xác định các tính chất hóa học của đối tượng, (iv) light detection and ranging systems – LIDAR, hoạt động dựa trên sự phản xạ của xóng laser Dựa trên từng loại cảm biến, nhiều giải thuật đã được xây dựng để phát hiện sớm cháy rừng
AlarmEYE là một hệ thống cảnh báo cháy rừng dựa trên camera giám sát, hệ thống hoạt động dựa trên IR camera và visible camera Mục đích của visible camera là phát hiện các vùng khói và IR camera sẽ xác định các vùng khói đó có phải thực sự là khói không dựa trên bản đồ nhiệt mà camera thu được Hệ thống được nghiên cứu và lắp đặt tại Thái Lan, chịu trách nhiệm InnoSusIndustriesInc [2][3]
EYEfi SPARC Hệ thống cảnh báo sớm cháy rừng được phát triển bởi
EYEfi, Australia Hệ thống bao gồm các thiết bị: visible camera, thermal camera, trạm khí tượng thủy văn, cảm biến ánh sáng, hệ thống truyền dẫn và hệ thống nguồn phát Năm 2010, EYEfi SPARC không cung cấp chức năng phát hiện khói ở tầm xa, tuy nhiên chức năng này đang được nghiên cứu và sẽ được áp dụng.[2][3]
GVHD: TS ĐỖ HỒNG TUẤN 8
UraFire Hệ thống được nghiên cứu và pháp triển bởi Uratek, Pháp Hệ thống hoạt động dựa trên phát hiện khói theo nguyên lý phát hiện chuyển động của đối tượng Visible camera được sử dụng chính trong hệ thống này.[2][3]
ForestFireFinder Hệ thống được phát triển bởi NGNs-IngeniousSolution,
Bồ Đào Nha Hệ thống hoạt động dựa trên phân tích hóa học của không khí xung quanh thông qua hệ thống phân tích quang phổ Hệ thống phân tích sự hấp thụ và phản xạ của ánh sáng mặt trời trong không khí với nguyên lý các chất hóa học sẽ hấp thu và phản xạ lại ánh sáng mặt trời với mức năng lượng khác nhau, vì thế khói sẽ có mật độ quang phổ nhất định khi thu bằng hệ thống phân tích quang phổ Hệ thống có khả năng nhận dạng khói rừng và khói công nghiệp với khoảng cách lên tới 15km [2]
Hình 1.2 Forest Fire Finder System
GVHD: TS ĐỖ HỒNG TUẤN 9
ForestVu Hệ thống phát triển bởi AngloDesignHoldings PLC, Vương quốc
Anh Hệ thống phát triển theo hướng phát hiện khói, hệ thống được lắp đặt tại Bồ Đào Nha, Úc và Hy Lạp [3]
FireWatch Công ty phát triển: German Aerospace Institute (DLR), Đức Là một trong hai hệ thống cảnh báo cháy rừng được sử dụng rộng rãi tại Châu Âu hiện nay Hệ thống được lắp đặt tại Đức (178 trạm, 22 trung tâm điều khiển), Estonia (5 trạm, 1 trung tâm điều khiển), Cyprus (2 trạm), và Mexico (1 trạm) Hệ thống sử dụng camera PTZ với độ phân giải cao dùng để quét khu rừng 360 độ, hoạt động 24/7 Hệ thống có khả năng phát hiện khói rừng với khoảng cách lên tới 15km [2]
ForestWatch Hệ thống phát triển bởi EnviroVisionSolutions PTY Ltd, Bắc
Mỹ Hệ thống bao gồm hai phần chính là trạm quan sát và trung tâm kiểm soát Hệ thống được sử dụng và lắp đặt tại các nước Bắc Mỹ (83 trạm), Thụy điển (5 trạm), Mỹ (22 trạm), Chile (20 trạm), Canada (4 trạm) và Slovakia (4 trạm) Khoảng cách phát hiện khói 16-20 km [2]
GVHD: TS ĐỖ HỒNG TUẤN 10
FIRESENSE (Fire Detection and Management through a Multisensor Network for the Protection of Cultural Heritage Areas from the Risk of Fire and Extreme Weather Conditions, FP7-ENV-2009-1-244088-FIRESENSE) Đây là một dự án được liên minh Châu Âu thông qua nhằm phát triển hệ thống cảnh báo sớm hỏa hoạn ở khoảng cách xa FIRESENSE là một hệ thống rất phức tạp bao gồm: cảm biến, visible camera, IR camera, thermal camera kết hợp với dữ liệu của đài khí tượng thủy văn Hệ thống này được xây dựng dựa trên các giải thuật và hệ thống rất phức tạp [4]
GVHD: TS ĐỖ HỒNG TUẤN 11
Libelium là một công ty chuyên về sản xuất cảm biến không dây và các ứng dụng thông minh như: smart city, cảnh báo cháy rừng … Trong ứng dụng cảnh báo cháy rừng, các cảm biến sẽ được lắp đặt rải rác trong rừng để đo các thông số như độ ẩm, nhiệt độ, nồng độ CO, CO2 để phát hiện lửa [4]
Bên cạnh các hệ thống thương mại trong phát hiện sớm cháy rừng, các giải thuật để phát hiện khói bằng xử lý ảnh đã và đang được phát triển với độ chính xác ngày một tăng lên
Mục tiêu, đối tượng và phạm vi nghiên cứu
Khảo sát đặc trưng của khói rừng
Xây dựng và phát triển thuật toán nhằm phát hiện khói rừng vào ban ngày trong điều kiện thời tiết nắng, ít mây và sương mù
Xây dựng mô hình hệ thống cảnh báo sớm cháy rừng
3.2 Đối tượng nghiên cứu Đề tài tập trung nghiên cứu các đặc tính, đặc điểm của khói rừng ở giai đoạn đầu tiên của cháy rừng dựa trên các dữ liệu thu được từ camera giám sát, giai đoạn mà cháy rừng mới được hình thành và có thể dập tắt được nhằm ngăn chặn tối đa thiệt hại mà cháy rừng có thể gây ra
3.3 Phạm vi nghiên cứu Đề tập tập trung nghiên cứu khói rừng dựa trên các điều kiện sau:
GVHD: TS ĐỖ HỒNG TUẤN 15
Sương mù có thể chấp nhận được và khi khói xuất hiện thì vẫn nỗi bật hơn trong khung hình
Điều kiện gió ổn định và ít có sự thay đổi
Khói rừng tạo ra ở phạm vi lớn và có sự lan tỏa rộng
Khoảng cách quan sát khói từ 2km – 4km
Thiết bị sử dụng cho việc quan sát khói là cảm biến, Visible Camera và Thermal Camera.
Nội dung và phương pháp nghiên cứu
Đề tài bao gồm các nội dung nghiên cứu sau:
Nghiên cứu tổng quan các phương pháp phát hiện khói rừng, ưu, nhược điểm và độ chính xác của từng phương pháp
Phân tích các đặc trưng tiêu biểu của khói rừng trong việc phát hiện khói
Cách trích xuất đặc trưng của khói rừng dựa trên hình ảnh camera thu nhận được
Thống kê và tối ưu hóa các đặc trưng của khói trong việc nhận dạng khói
Thiết kế giải thuật phát hiện khói
Tổng kết và đánh giá
4.2 Phương pháp nghiên cứu Đề tài tiếp cận các phương pháp sau:
Phương pháp khảo sát và thống kê màu của khói rừng
Phương pháp khảo sát chuyển động của khói từ lúc xuất hiện cho đến khi tạo lửa
Phương pháp khảo sát ảnh khói rừng trong miền tần số
Phương pháp trích xuất đặc trưng của ảnh dựa trên Co-occurrence matrix
GVHD: TS ĐỖ HỒNG TUẤN 16
Ý nghĩa đề tài
Trình bày phương pháp trích xuất đặc trưng của khói sử dụng ma trận Co-
Khảo sát các thông tin đặc trưng của khói
Tạo ra hệ thống cảnh báo sớm cháy rừng góp phần giảm thiểu tối đa tác hại mà cháy rừng mang lại
Cảnh báo nguy cơ cháy rừng thông qua phát hiện khói rừng từ đó hạn chế và giảm thiệt hại cháy rừng gây ra
Tuyên truyền và giáo dục ý thức người dân về rừng thông qua các đoạn tư liệu được camera thu thập được
GVHD: TS ĐỖ HỒNG TUẤN 17
CƠ SỞ LÝ THUYẾT
Tổng quan về xử lý ảnh và thị giác máy tính
Một hệ thống xử lý ảnh điển hình có xử lý số tín hiệu được biểu diễn trong hình 2.1 Nguồn ảnh đầu vào I(x,y) là một vật thể hoặc cảnh tự nhiên, nhưng nó có thể tạo ra bởi môt hệ thống khác Bộ số hóa chuyển tín hiệu nguồn đầu vào thành tín hiệu điện Sau đó chuỗi f(n1,n2) được xử lý bởi một thuật toán xử lý ảnh số Kết quả sau khi xử lý được hiển thị cho người xem, nhưng đôi khi lại là đầu vào của một hệ thống xử lý khác
Hình 2.1: Hệ thống xử lý ảnh điển hình
Thị giác máy tính (computer vision) bao gồm lý thuyết và các kỹ thuật liên quan nhằm mục đích tạo ra một hệ thống nhân tạo có thể nhận thông tin từ các hình ảnh thu được hoặc các tập dữ liệu đa chiều Máy móc càng ngày càng thông minh, nó không chỉ thay con người làm những công việc nặng nhọc và nhàm chán mà nó còn có một số khả năng bắt chước động vật và con người Một trong số những khả năng đó là nhận biết được thế giới qua “mắt” của nó Bằng việc kết hợp với các mô hình khác nữa như máy học, mạng nơron … giúp cho chúng dần tiến tới một hệ thống nhân tạo có những quyết định linh hoạt và chính xác hơn Lĩnh vực nghiên cứu của thị giác máy tính rất rộng, và đặc điểm chung là các bài toán về thị giác máy đều không có một đề bài chung và cách giải quyết duy nhất Mỗi giải pháp giải quyết vấn đề được một kết quả nhất định cho những trường hợp cụ thể
GVHD: TS ĐỖ HỒNG TUẤN 18
Một số ứng dụng của thị giác máy tính:
Điều khiển tiến trình (VD: robot trong công nghiệp, hay các thiết bị, xe tự hành…)
Phát hiện sự thay đổi (VD: các thiết bị giám sát…)
Tổ chức thông tin (VD: chỉ số kho dữ liệu các ảnh hoặc chuỗi ảnh liên tục…)
Mô hình hóa đối tượng (VD: quá trình kiểm tra trong môi trường công nhiệp, xử lý ảnh trong y học…)
Hiện nay, có rất nhiều nghiên cứu khác nhau trong việc phát hiện khói Dựa trên mục đích của ứng dụng, phương pháp phát hiện khói được chia làm hai loại chính, đó là: phát hiện khói tầm gần (nhỏ hơn 1km) và tầm xa (lớn hơn 1km) Việc chia này dựa trên giải thuật và nhận xét của người nghiên cứu Cụ thể là khói tầm gần sẽ dễ dàng nhận biết dựa trên màu sắc và các thông tin trong hình ảnh được biểu diễn rõ rang, ví dụ: khói tầm gần khi xuất hiện thì năng lượng trong biến đổi Wavelet sẽ giảm một cách nhanh chóng, ngược lại khói tầm xa thường xuất hiện rất nhỏ và phương pháp chủ yếu để phát hiện là màu sắc, chuyển động chậm và các tính chất khác như: khuếch tán, đi chuyển lên trên… Phát hiện khói rừng được đưa vào phát hiện khói ở tầm xa, giải thuật chủ yếu được xử dụng trong đề tài này là: màu sắc, chuyển động chậm và trích xuất thông tin từ ma trận Co-Occurrence.
Xử lý ảnh trong các ứng dụng nhận dạng đối tượng
Hình ảnh là sự tổ hợp giá trị pixel với một kích thước cố định Xử lý ảnh là công việc dựa trên các giá trị pixel của bức ảnh và dùng các phương trình toán học để có thể chuyển đổi bức ảnh, video ngõ vào thành các quyết định, nhận dạng hay trích xuất các thông tin từ bức ảnh đó Đa phần các kỹ thuật xử lý ảnh được áp dụng trên các ảnh 2 chiều và được áp dụng các hầu hết các kỹ thuật xử lý tín hiệu trong quá trình xử lý Khi các đặc trưng hay thông tin của bước ảnh được trích xuất ra,
GVHD: TS ĐỖ HỒNG TUẤN 19 các thông tin này sẽ được xem xét và quyết định đó có phải là đối tượng mình cần nhận dạng hay không
Quy trình của một quá trình xử lý ảnh trong việc nhận dạng đối tượng như sau:
Hình 2.2 Mô hình xử lý ảnh trong nhận dạng đối tượng
Các thông tin ngoài môi trường được thu thập thông qua camera, lưu thành các hình ảnh hay video tùy thuộc vào ứng dụng Các hình ảnh được đặc trưng bởi các pixel và độ phân giải Chất lượng hình ảnh tùy thuộc vào chất lượng camera và môi trường lấy dữ liệu Hình ảnh thu được từ camera thường là hình ảnh RGB (Red, Green, Blue)
GVHD: TS ĐỖ HỒNG TUẤN 20
Khi các sóng tín hiệu đi vào camera để tạo ra hình ảnh, hình ảnh ngỏ ra thường sẽ có nhiễu, các nhiễu này làm cho các pixel không phản ánh đúng màu sắc của đối tượng Bộ tiền sử lý nhằm đưa ra các phương pháp để triệt nhiễu không mong muốn Bên cạnh đó, đối với một vài ứng dụng, bộ tiền xử lý còn làm thêm nhiệm vụ tìm vùng nghi ngờ của đối tượng Ví dụ trong phát hiện khói, khói không thể xuất hiện trên toàn bộ khung hình vì vậy việc tính toán toàn bộ hình ảnh gây tốn thời gian và bộ nhớ máy tính Vì vậy việc tìm ra vùng nghi ngờ là cần thiết cho việc tăng hiệu suất của chương trình
Khi hình ảnh đã được tiền xử lý xong, việc tiếp theo trong quá trình xử lý ảnh là trích xuất đặc trưng của hình ảnh Các giá trị của pixel sẽ được tính toán dựa trên các công thức toán học nhằm tìm ra tính chất riêng biệt của đối tượng cần nhận diện Tùy thuộc vào đặc điểm, màu sắc, hành động hay cách thức xuất hiện … mà chúng ta có thể áp dụng các công thức từ đơn giản đến phức tạp
Phân loại, đây là quá trình đánh giá dữ liệu lấy được từ hình ảnh Các thông tin của hình ảnh khi được lấy ra sẽ được đưa vào một mô hình phân loại được tạo trước Mô hình này có được bằng cách thu thập các dữ liệu mẫu (negative và possitive), sau đó áp dụng các giải thuật như SVM, K-NN hay Bayer để phân tách các dữ liệu này thành 2 hay nhiều khối tùy thuộc vào mục đích phân loại Khi phân tách xong ta được một mô hình chuẩn dựa trên các dữ liệu mẫu Khi thông tin hình ảnh được đưa vào, nó sẽ xem xét thông tin mới vào nằm trong vùng nào (negative hay possitive) để có thể đưa ra quyết định về dữ liệu được đưa vào đó Bộ phân loại này có một hạn chế rất lớn là cần số lượng lớn dữ liệu mẫu để có thể bao quát hết các trường hợp xảy ra của dữ liệu
Bộ quyết định, sau khi dữ liệu được xác định nằm ở đâu trong mô hình phân loại, bộ quyết định sẽ thực thi các quyết định cho trước ứng với không gian mô hình đó
GVHD: TS ĐỖ HỒNG TUẤN 21
Trích xuất đặc trưng và ma trận Co-Occurrence
3.1 Giới thiệu Ảnh số là ảnh sau khi được lấy mẫu từ ảnh thực tế được thể hiện bằng các giá trị pixels trong ma trận ảnh Vì vậy để có thể dự đoán đối tượng đang quan sát là khói hay không phải khói, ta cần dựa trên các giá trị pixels này, tuy nhiên các giá trị này phân bố một cách ngẫu nhiên và không tuân theo quy luật bất kì nào Để có thể đưa các giá trị pixels này, ta cần một giải thuật, phép biến đổi nhằm chuyển các giá trị này về một không gian mà ta có thể khai thác thông tin được Hiện nay, có khá nhiều giải thuật để hỗ trợ việc này, tuy nhiên trong phạm vi để tài, ta sẽ tìm giải thuật phân tích Texture – giải thuật này được Haralick nghiên cứu và phát triển vào những năm 1970 Giải thuật này tập trung xem xét và tính toán các thông số đặc trưng mà mỗi ảnh có thông qua ma trận Co-occurrence
Có ba cách tiếp cận chính trong xử lý texture: thống kê, cấu trúc, phổ Trong nội dung đề tài này, ta tập trung vào cách tiếp cận thống kê bởi tính đơn giản và phổ biến của nó Một trong những cách tiếp cận đơn giản nhất của nó là thống kê cường độ histogram Tuy nhiên nếu chỉ dựa trên điều này thì không thể hiện được mối liên quan giữa các pixel của ảnh Do đó ta phải đồng thời xử lý cả hai điều trên bằng cách sử dụng ma trận co-occurrence và các đặc trưng texture Để lấy được các đặc trưng texture, trước tiên ta phải chuyển ma trận ảnh số sang ma trận co-ocurence Ma trận này là ma trận vuông có kích thước NxN, với N là giá trị max của các pixels thuộc ma trận ảnh số Các giá trị pixels trong ma trận co-occurrence chính là số lần thay đổi từ giá trị pixels này sang pixels khác của ma trận ảnh số theo một hướng cố định Có khá nhiều hướng để triển khai ma trận này, tuy nhiên thông thường có 4 hướng chính là 0 o , 45 o ,90 o và 135 o Tùy vào tính chất của ảnh mà chúng ta có thể triển khai theo từng hướng riêng biệt
GVHD: TS ĐỖ HỒNG TUẤN 22
Phương trình để chuyển từ ma trận số sang ma trận ảnh được biểu diễn như sau:
C(i;j) : là giá trị của pixel tại cột i hàng j trong ma trận Co-occurrence
I(p,q) : là vị trí pixel tại thời điểm xét
i, j : là giá trị của pixel trong ảnh số
∆x, ∆y: là hướng triển trai ma trận
Hình 2.3 Ví dụ cách tính ma trận Co-occurrence
Khi đã chuyển hoàn toàn ảnh số về ma trận Co-occurrent, công việc của chúng ta là khảo sát trên ma trận Vấn đề đặt ra ở đây là làm sao để có thể nhận biết đối tượng cần quan sát Thông qua ma trận Co-Occurrence, Halarick [14] đã đưa ra 14 đặc trưng có thể trích xuất được từ ma trận, từ đó, các đặc trưng này sẽ được sử dụng để nhận dạng và phân biệt đối tượng
GVHD: TS ĐỖ HỒNG TUẤN 23
3.3 Đặc trưng từ ma trận Co-Occurrence
Ma trận co-ocurence có nhiều thông số đặc trưng, nhưng ở đây ta chỉ xét đến 4 thông số cơ bản là: Energy, Entropy, Contrast, Homogeneity Trước khi tính toán 4 thông số cơ bản, ta phải chuẩn hóa các giá trị pixel trong ma trận co-occurrence
Thông số này biểu thị sự chuẩn hóa tông màu trong ma trận Co-occurrent, tức là trên ma trận giá trị các pixels không còn là một giá trị ngẫu nhiên nữa mà sẽ được chuẩn hóa về phạm vi [0;1] Khi đó nó sẽ tạo ra một vùng để chúng ta có thể tính xác suất một cách dễ dàng để có thông tin cần thiết Giá trị pixels Cd(i,j): là giá trị biểu thị số lần thay đổi màu sắc ứng với một cặp màu sắc cho trước và được gán vào giá trị pixels trong ma trận
Thông số biểu thị mức độ ngẫu nhiên của những phần tử trong ma trận, khi tất cả những phần tử của ma trận là ngẫu nhiên tối đa thì entropy có giá trị cao nhất
Bởi vậy một ảnh đồng nhất (các giá trị pixel gần giống nhau) có entropy thấp hơn ảnh không đồng nhất
Energy = ∑ ∑ N 𝑖 𝑗 d 2(i,j) Ý nghĩa: là tổng bình phương tất cả các giá trị pixels chuẩn hóa trên ma trận, việc làm này thể hiện tính đồng dạng, mức độ tương đồng giữa các pixels trong ảnh
GVHD: TS ĐỖ HỒNG TUẤN 24
Thông số này đo sự tương phản của bức ảnh, khi bức ảnh càng thô tức là càng có nhiều góc cạnh thì thông số này càng cao
Yếu tố này dùng để đo sự đồng nhất của bức ảnh, tức là nếu bức ảnh càng trơn thì thông số này càng cao.
Bộ phân loại Support Vector Machine (SVM)
Bài toán tự động phân loại là một trong những bài toán kinh điển trong lĩnh vực xử lý, nhận dạng hình ảnh Đây là vấn đề có vai trò quan trọng khi phải xử lý một số lượng lớn dữ liệu Trên thế giới đã có nhiều công trình nghiên cứu đạt những kết quả khả quan về hướng này Tuy vậy, các nghiên cứu và ứng dụng đối với xử lý khói còn có nhiều hạn chế Phần nhiều lý do là vì khói có hình dạng không cố định và các thông tin của khói khó có thể mô tả bằng mô hình thống kê Trong những năm gần đây, phương pháp phân loại sử dụng bộ phân loại vector hỗ trợ (SVM) được quan tâm và sử dụng nhiều trong những lĩnh vực nhận dạng và phân loại SVM là một họ các phương pháp dựa trên cơ sở các hàm nhân (kernel) để tối thiểu hóa rủi ro ước lượng Phương pháp SVM ra đời từ lý thuyết học thống kê do Vapnik và Chervonenkis xây dựng và có nhiều tiềm năng phát triển về mặt lý thuyết cũng như ứng dụng trong thực tiễn Các thử nghiệm thực tế cho thấy, phương pháp SVM có khả năng phân loại khá tốt đối với bài toán phân loại hình ảnh như trong nhiều ứng dụng: như nhận dạng chữ viết tay, phát hiện mặt người trong các ảnh, ước lượng hồi quy… So sánh với các phương pháp phân loại khác, khả năng phân loại của SVM là tương đương hoặc tốt hơn đáng kể
GVHD: TS ĐỖ HỒNG TUẤN 25
4.1 Cơ sở lý thuyết của SVM
Vấn đề nhận dạng dưới góc nhìn của xác suất thống kê:
Giả sử ta có dãy l quan sát gồm các vector xi ∈ R n và yi là kết quả học tương ứng của xi Các mẫu xi được phát sinh ngẫu nhiên theo một hàm phân bố xác suất F(x) nào đó chưa biết Thường thì yi là kết quả của một hàm f(x) nào đó đơn trị Tuy nhiên trong trường hợp tổng quát thì yi được xác định theo một hàm phân bố điều kiện F(y|x) cũng chưa biết Với x tuân theo phân bố F(x), y tuân theo phân bố F(y|x) do đó hàm phân bố của cặp (x,y) là F(x).F(y|x) = F(x,y) Bây giờ với một mẫu x*, vấn đề của máy học là xác định một hàm f0(x) để có thể xác định tốt nhất giá trị y* tương ứng Ta đổi quy tắc viết hàm f0(x) thành hàm tham số f(x,α) Trong đó α tham số huyến luyện yi ∈ {1,-1} trong trường hợp nhận dạng hai lớp Nếu yi=1 thì xi thuộc lớp thứ nhất và yi = -1 thì xi thuộc lớp thứ 2 Và f(x,α) cũng có miền giá trị là {1,-1}
Sai số thật (Actual risk):
𝑅(𝛼) = ∫(𝑦 − 𝑓(𝑥, 𝛼)) 2 𝑑𝐹(𝑥, 𝑦) Ý nghĩa của R(α) là nếu chọn hàm f(x,α) để xấp xỉ y từ x thì R(α) là sai số trung bình trên toàn bộ dữ liệu huấn luyện f(x,α) là kì vọng của y theo x theo phân bố điều kiện F(x,y) Việc tìm ra α tương ứng với việc tìm R(α) bé nhất
Sai số thực nghiệm(sai số huấn luyện)
Vì ta chỉ biết được hữu hạn các mẫu xi nên để tìm α ta phải dựa trên sai số thực nghiệm:
GVHD: TS ĐỖ HỒNG TUẤN 26
Vapnik và Chervonenkis đã đưa ra mối liên hệ giữa sai số thật với sai số thực nghiệm:
Trong đó: 0≤η≤1 và h được gọi là VC dimension Biểu thức thứ hai bên vế phải được gọi là VC confidence
VC dimension của một tập hàm f(x,α) là con số h lớn nhất của các xi mà tập hàm có thể phân tách(gán nhãn 1 hoặc -1) được theo 2 l phương án
Từ bất đẳng thức trên ta có thể thấy Thay vì tìm R(α) nhỏ nhất ( khó thực hiện vì ta không biết được hàm phân bố xác suất F(x,y)) ta có thể tìm cực tiểu của vế bên phải Hay tìm một hàm f(x,α) để cực tiểu vế phải Điều này dẫn đến hai vấn đề cần phải giải quyết: Thứ nhất nếu ta tìm một hàm có khả năng mạnh (có thể phân tách nhiều xi) thì ta có thể giảm được được sai số thực nghiệm Remp(α) nhưng lại làm tăng VC confidence (do h lớn) Và ngược lại, nếu ta chọn một hàm có khả năng yếu thì sẽ có VC confidence nhỏ nhưng Remp(α) lại lớn Cả hai vấn đề này đều không đảm bảo được sai số thật R(α) nhỏ
Hai vấn đề trên đều dưới góc độ VC dimension Điều này sẽ thế nào nếu ta thay đổi số lượng mẫu: Khi l lớn ta sẽ có VC confidence nhỏ và R(α) sẽ xấp xỉ với Remp(α) Do đó việc cực tiểu R(α) sẽ dựa trên cực tiểu Remp(α) còn gọi là phương pháp ERM(Empirical Risk Minimization) Còn khi l nhỏ VC confidence sẽ lớn, Remp(α) nhỏ, điều này không đảm bảo rằng R(α) sẽ nhỏ
Như vậy phương pháp ERM thích hợp với l lớn, thế còn khi l nhỏ sẽ thế nào? Để xử lý vấn đề này Vapnik đã đưa ra một phương pháp SRM(Structural Risk Minimization) cũng chính là phương pháp được sử dụng trong đề tài
GVHD: TS ĐỖ HỒNG TUẤN 27
Phương pháp SRM: Đây là phương pháp đồng thời cực tiểu Remp(α) và VC confidence đối với số lượng mẫu l nhỏ để cho sai số thật R(α) nhỏ Phương pháp này thiết lập nên một cấu trúc lồng nhau như sau:
Sk là tập hợp các hàm f(x,α) Do các S lồng nhau như vậy nên dẫn đến h1 < h2 < …< hn
Phương pháp SRM sẽ được thực hiện như sau:
Tìm trong các tập Sk hàm f(x,α) có Remp(α) nhỏ nhất, ta sẽ có sai số giới hạn tương ứng là Rk(α)
Trong các Rk(α) trên ta chọn lấy một tập mà có Rk(α) nhỏ nhất
Bước cuối cùng là trong tập S có Rk(α) nhỏ nhất chọn lấy một hàm f(x,α) làm hàm nhận dạng
Từ các điều trên ta có thể thấy phương pháp SRM là sự kết hợp giữa cực tiểu VC confidence và sai số thực nghiệm Remp(α)
Lý thuyết học thống kê tập trung vào việc tìm hàm nhận dạng tốt nhất dựa trên số lượng mẫu huấn luyện giới hạn
GVHD: TS ĐỖ HỒNG TUẤN 28
Lý thuyết học thông kê đã đưa ra hai phương pháp để tìm hàm nhận dạng là ERM và SRM Phương pháp ERM tối ưu khi số lượng mẫu huấn luyện mẫu lớn và có VC dimension là hữu hạn Còn phương pháp SRM hiệu quả ngay cả khi dữ liệu huấn luyện nhỏ
Cả hai phương pháp trên đều là những nguyên tắc lý thuyết SVM là mô hình cụ thể thực thi Sau đây ta sẽ đi tìm hiểu SVM trong các trường hợp cụ thể
4.2 SVM trong trường hợp khả tách tuyến tính
Ta sẽ bắt đầu ở trường hợp đơn giản nhất Ta có một tập dữ liệu huấn luyện {xi,yi}, i = 1,2,…, N, yi ∈ { -1, 1}, xi ∈ R n
Trong đó mẫu là các vector đối tượng được phân loại thành các mẫu dương và mẫu âm:
Các mẫu dương là các mẫu xi thuộc lĩnh vực quan tâm và được gán nhãn yi
Các mẫu âm là các mẫu xi không thuộc lĩnh vực quan tâm và được gán nhãn yi= −1;
Hình 2.5 Phân loại SVM tuyến tính
GVHD: TS ĐỖ HỒNG TUẤN 29
Trong trường hợp này, bộ phân loại SVM là mặt siêu phẳng phân tách các mẫu dương khỏi các mẫu âm với độ chênh lệch cực đại, trong đó độ chênh lệch – còn gọi là lề (margin) xác định bằng khoảng cách giữa các mẫu dương và các mẫu âm gần mặt siêu phẳng nhất Mặt siêu phẳng này được gọi là mặt siêu phẳng lề tối ưu Các mặt siêu phẳng trong không gian đối tượng có phương trình: w.x + b = 0, trong đó w là vector pháp tuyến của mặt siêu phẳng, |b|/||w|| là khoảng cách vuông góc từ mặt siêu phẳng đến điểm gốc, ||w|| là chuẩn Euclid của w
Mục tiêu của phương pháp SVM là ước lượng w và b để cực đại hóa lề giữa các lớp dữ liệu dương và âm Các giá trị khác nhau của lề cho ta các họ mặt siêu phẳng khác nhau, và lề càng lớn thì năng lực của máy học càng giảm Quá trình phân loại là tối ưu khi sai số phân loại là cực tiểu Nếu tập dữ liệu huấn luyện là khả tách tuyến tính, ta có các ràng buộc sau: xi.w + b ≥ +1 với yi = +1 xi.w + b ≤ −1 với yi = −1
Lúc đó những support vector xi thỏa mãn phương trình xi.w + b = −1 thì nằm trên mặt siêu phẳng H1, phương trình xi.w + b = +1 thì nằm trên mặt siêu phẳng H2
Khoảng cách có dấu d1 từ gốc tọa độ đến H1 là: d1=(1-b)/||w||
Khoảng cách có dấu d2 từ gốc tọa độ đến H2 là: d2=(-1-b)/||w||
Suy ra khoảng cách phân hoạch d giữa H1 và H2 là: d=|d1-d2|=2/||w||
Do đó để có d lớn nhất thì ||w|| phải nhỏ nhất hay nói cách khác phải đi tìm cực tiểu của ||w|| 2 /2
Vậy tại sao ta lại phải cực đại lề của mặt phẳng phân hoạch? Điều này thể hiện trong phương pháp SRM Nếu ta phân tách được tập huấn luyện sang hai lớp tách biệt nghĩa là sai số huấn luyện Remp(α)=0 Vapnik đã chứng minh nếu các xi
GVHD: TS ĐỖ HỒNG TUẤN 30 nằm trong các hình cầu bán kính R trong không gian R n và ||w|| ≤ A thì siêu phẳng VC dimension của tập các siêu phẳng w.x+b=0 là h ≤ min{R 2 A 2 ,n}+1 nếu d lớn thì A sẽ nhỏ dẫn đến h sẽ nhỏ
Thay vì tìm cực tiểu của ||w|| 2 /2 ta tìm cực tiểu của hàm Larange:
𝑖 𝑖 Để đơn giản thay vì tìm cực tiểu LP ta chuyển sang tìm cực đại của bài toán đối ngẫu của nó:
𝑖 αi là các hệ số lagrange cần được tối ưu hóa bằng cách cực đại LD Để xác định b ta vận dụng điều kiện KKT (Karush–Kuhn–Tucker) cho bài toán gốc:
𝛼 𝑖 (𝑦 𝑖 (𝑤 𝑥 𝑖 + 𝑏) − 1) = 0 ∀𝑖 Do đó đối với một i có 2 trường hợp xảy ra:
αi=0: trong trường hợp này yi(xi w + b) – 1 > 0 suy ra xi không nằm trên siêu phẳng biên H1 hay H2 Vì αi=0 nên xi không tham gia vào việc cấu trúc w
GVHD: TS ĐỖ HỒNG TUẤN 31
Những xi này là không cần thiết và có thể được bỏ đi mà không gây ảnh hưởng tới w
αi>0: lúc này yi(xi w + b) – 1 = 0 suy ra xi nằm trên siêu phẳng biên H1 hay H2 xi được gọi là support vector và tham gia vào việc tính w Thường thì số lượng support vector nhỏ hơn nhiều so với số lượng mẫu
HỆ THỐNG CẢNH BÁO SỚM CHÁY RỪNG
Mô hình hệ thống
Hệ thống cảnh báo sớm cháy rừng được chia làm hai phần chính đó là: các trạm giám sát và trung tâm điều khiển (Hình 3.1)
Hình 3.1 Mô hình hệ thống cảnh báo sớm cháy rừng
Các trạm giám sát: được lắp đặt rải rác trong rừng, mỗi trạm bao gồm các thiết bị như: visible camera, thermal camera, các cảm biến, máy tính xử lý và thiết bị truyền dẫn (Hình 3.2) Visible camera dùng để thu nhận các hình ảnh để người giám sát có thể quan sát dễ dàng, đồng thời, hình ảnh này cũng được dùng để xử lý ảnh để phát hiện khói Thermal camera dùng dể thu nhận tín hiệu nhiệt của đối tượng quan sát để tăng độ chính xác cho hệ thống Các cảm biến thu thập các thông số môi trường để việc phát hiện khói chính xác hơn
GVHD: TS ĐỖ HỒNG TUẤN 38
Hình 3.2 Thiết bị tại trạm giám sát
Trung tâm điều khiển: bao gồm các công cụ lưu trữ thông tin và các công cụ hỗ trợ khi cháy rừng xảy ra như GIS, gọi thoại hay SMS … (Hình 3.3) Tại trung tâm điều khiển, người giám sát sẽ có nhiệm vụ xác nhận thông tin đối tượng mà các trạm giám sát gửi về là có phải khói hay không Nếu là khói thì các công cụ hỗ trợ sẽ thông báo cho các cơ quan chức năng để đảm báo cháy rừng được khắc phục một cách nhanh nhất
Hình 3.3 Chức năng tại trung tâm điều khiển
Camera Máy tính xử lý
GVHD: TS ĐỖ HỒNG TUẤN 39
Hệ thống phát hiện sớm hiện tại được phát triển theo các tiêu chí sau (Hình 3.4):
Phát hiện khói – lửa trong phạm vi bán kính 5km
Thời gian phát hiện khói rừng tối đa là 10 phút, tính từ khi khói phát sinh
Độ chính xác của hệ thống trong việc phát hiện khói xấp xỉ 80%
Phán đoán nguồn lửa, hướng và tốc độ lây lan của cháy rừng
Cung cấp các thông tin hỗ trợ nhằm ngăn chặn sự lây lan của cháy rừng
Điều kiện thời tiết: hệ thống hoạt động được trong các thời tiết khác nhau, nhưng chưa được khảo sát hoạt động trong điều kiện sương mù dày đặc
Hình 3.4 Tiêu chí phát triển của hệ thống
Về nguyên lý hoạt động của hệ thống cảnh báo sớm cháy rừng, các trạm giám sát sẽ được xây dựng với mật độ phù hợp trong rừng để quan sát và thu thập dữ liệu trên một khu vực rộng nhất có thể Trên trạm giám sát, camera, cảm biến, thiết bị xử lý sẽ được lắp đặt để thu thập và xử lý một cách tự động các thông tin của rừng (hình ảnh, nhiệt độ, độ ẩm …) để đưa ra cảnh báo có cháy rừng hay không Các thông tin này sẽ được truyền dẫn không dây về trung tâm điều khiển Ở đây, các thông tin sẽ được lưu trữ phục vụ cho việc truy xuất và thống kê sau này, bên cạnh
GVHD: TS ĐỖ HỒNG TUẤN 40 đó, các chương trình hỗ trợ thông tin để ngăn chặn cháy rừng (bản đồ số, gọi thoại, SMS …) sẽ được lắp đặt nhằm dẳm bảo cho việc ứng phó và ngăn chặn cháy rừng hiệu quả nhất
Phát hiện khói rừng sử dụng xử lý ảnh
Giải thuật xử lý ảnh để phát hiện khói rừng được thể hiện qua hình 3.5:
Hình 3.5 Sơ đồ giải thuật khối xử lý ảnh
Lấy hình ảnh từ camera
Bộ phát hiện màu sắc
Bộ phát hiện chuyển động
Trích xuất vùng nghi ngờ
Trích xuất đặc trưng Đưa ra phán đoán
GVHD: TS ĐỖ HỒNG TUẤN 41
Hình ảnh thu được từ camera thường sẽ mang theo nhiễu, các nhiễu này sẽ gây ra các tác động không mong muốn, làm giảm hiệu suất và độ chính xác của chương trình Vì vậy, chúng ta cần triệt nhiễu trước khi xử lý, các loại nhiễu thường ảnh hưởng trực tiếp tới hình ảnh như nhiễu nhiệt (nhiễu gây ra từ bộ cảm biến hình ảnh), hay nhiễu do tần số dòng điện, nhiễu lượng tử (xuất hiện tại các camera IP) Điều đáng lo ngại hơn là nhiễu tác động lên các pixel, làm chúng không phản ánh đúng thực tế thông tin màu sắc của đối tượng Đây là lý do chính để chúng ta cần phải triệt nhiễu
Có nhiều loại phương pháp khác nhau để triệt nhiễu Bộ loc median để triệt nhiễu muối tiêu, hay bộ loc Gaussian để lọc nhiễu Gauss Tùy thuộc vào loại nhiễu mà chúng ta chọn bộ lọc tương ứng Tuy nhiên, nhược điểm của lọc nhiễu đó là sự mất mát thông tin, khi lọc các thông tin hình ảnh sẽ không còn nguyên vẹn, hình ảnh cũng sẽ không còn rõ nét so với ảnh trước khi xử lý, nhưng việc này có thể chấp nhận được vì khi xử lý ảnh, chúng ta cần hình ảnh càng ít nhiễu càng tốt nhằm tránh trường hợp trích xuất sai thông tin Ví dụ như hình 3.6 là một hình ảnh chưa được triệt nhiễu, vì thế khi phân tích histogram thì biểu đồ có hình dáng không được trơn, điều này có nghĩa là các giá trị pixel trong hình không đồng nhất và có sự chênh lệch không đáng kể, đối với mắt thường thì ta không nhận ra điều này nhưng khi xử lý, sự chênh lệch này có thể gây ra sai số dẫn đến giảm độ chính xác của chương trình
GVHD: TS ĐỖ HỒNG TUẤN 42
Hình 3.6 Ảnh và histogram cùa hình chưa xử lý nhiễu
Trong phạm vi đề tài, đề tài này áp dụng phương pháp triệt nhiễu Gauss nhằm loại bỏ các sai số chênh lệch giữa các pixel Bộ lọc nhiễu Gauss là một bộ lọc thông thấp, tức là bộ lọc sẽ mà mượt hình ảnh và làm mờ các góc cạnh Tùy thuộc vào mức độ hình ảnh ta thu nhận được mà cửa sổ cùa bộ lọc nhiễu Gauss là cao hay thấp Bên cạnh đó, việc chọn chính xác cửa sổ bộ lọc là một điều rất quan trọng vì nó sẽ ảnh hưởng tới độ nhạy của chương trình Như ta được viết, bộ lọc Gauss làm mờ hình ảnh, vì thế, cửa sổ lọc càng cao thì thông tin hình ảnh sẽ càng mất nhiều hơn, dẫn đến giảm độ nhạy của chương trình Ngược lại, nếu bộ lọc có cửa sổ quá thấp, thì nhiễu sẽ còn tồn tại trong hình ảnh gây ra giảm độ chính xác của chương trình Dưới đây là hai ví dụ về bộ lọc Gauss với hai cửa sổ khác nhau
GVHD: TS ĐỖ HỒNG TUẤN 43
Hình 3.7 Lọc nhiễu Gauss với cửa sổ 3x3
Hình 3.8 Lọc nhiễu với bộ lọc Gauss cửa sổ 9x9
Dựa vào hình 3.7 và 3.8, ta nhận thấy bộ lọc 9x9 sẽ tốt hơn, các đường histogram của hình sẽ mượt hơn nhưng khi nhìn về hình ảnh thì hình sẽ rất mờ, các vật thể hầu như không còn nhận dạng rõ rệt được Ngược lại, tuy bộ lọc 3x3 chưa cho ta một histogram đẹp nhưng các chi tiết trong hình sau khi xử lý vẫn còn được lưu lại, vì thế chúng ta có thể xử lý tiếp tục
GVHD: TS ĐỖ HỒNG TUẤN 44
Tóm lại, trước khi hình ảnh được đưa vào bộ xử lý ảnh, nó cần phải được thông qua các bộ lọc nhiễu nhằm tăng hiệu suất của hình ảnh và giảm sai số cho chương trình Trong đề tài, bộ lọc Gaussian 3x3 được áp dụng trong bộ tiền xử lý
2.1 Bộ phát hiện màu sắc
Phát hiện màu sắc là bước đầu tiên trong việc nhận dạng khói Không gian màu chủ yếu để nhận dạng là RGB, ngoài ra còn có các không gian màu khác như:
HSI, YUV Không gian màu RGB được xử dụng phổ biến trong các ứng dụng giám sát thời gian thực Không gian màu RGB biểu diễn màu sắc của một vật thể dựa trên ba trục màu chính là Reb, Green và Blue và có giá trị chạy từ 0 tới 255 trong ảnh số Màu sắc của khói dựa trên việc quan sát và các tài liệu [5][9] thì khói có màu sắc từ màu đen tới trắng tùy thuộc vào vật liệu cháy Dựa trên các dữ liệu thu thập tại rừng Đà Nẵng, thì khi khói rừng vượt tán cây thường chuyển sang màu xám hoặc trắng, tương ứng với thang không gian màu sắc và có giá trị từ 120 – 255 tùy thuộc vào điều kiện thời tiết và chất lượng hình ảnh mà camera tạo ra Trong không gian màu RGB, màu sắc của khói tập trung chủ yếu tại đường chéo của khối lập phương, tương ứng với các giá trị màu của RGB bằng nhau hoặc xấp xỉ nhau
Hình 3.9 Không gian màu RGB và HSI
Màu sắc của khói có mức xám từ màu đen tới màu trắng tùy thuộc vào vật liệu cháy Tuy nhiên, khi khảo sát các khu vực rừng tại Đà Nẵng thì khi khói vượt
GVHD: TS ĐỖ HỒNG TUẤN 45 ngưỡng của tán cây thì thường là màu xám tới trắng, tương ứng với giá trị thang xám pixel trong ảnh từ 140 – 255 tùy thuộc vào điều kiện thời tiết và chất lượng hình ảnh thu được
Hình 3.10 Màu sắc của khói trong không gian RGB
RGB biểu diễn không gian màu theo hình lập phương dựa trên ba trục màu là Reb, Green và Blue vì vậy độ đa dạng và sự chính xác của màu sắc mà RGB biểu diễn chưa chính xác Vì vậy, các không gian màu khác nhau được đưa vào trong việc biểu diễn màu sắc của khói nhằm nâng cao hiệu quả của bộ phát hiện màu sắc của khói Không gian màu HIS là không gian biểu diễn màu sắc theo hình nón với các trục tương ứng là Hue, Intensity và Saturation (Hình 2.2) Dựa trên sơ đồ hình ảnh, màu sắc của khói tập trung xung quanh trục Intensity với Saturation nhỏ
Như vậy điều kiện để một pixel được xem xét là một pixel có màu khói phải thỏa các điều kiện sau: Điều kiện 1: Max(R,G,B) – Min(R,G,B) < T1 Điều kiện 2: S < T2 Điều kiện 3: I < T3
GVHD: TS ĐỖ HỒNG TUẤN 46
Với T1, T2, T3 lần lượt là các ngưỡng được khảo sát trước dựa trên những dữ liệu mà thu thập được Các giá trị S, I lần lượt là Saturation và Intensity trong không gian màu HSI Khi một giá trị pixel thỏa mãn các điều kiện trên thì nó được xem là pixel khi ngờ màu khói, tuy nhiên có khá nhiều vật thể mang màu sắc của khói như mây, sương mù, xe hoặc mặt hồ Vì vậy, khi qua bộ loc màu sắc còn rất nhiều vật thể không phải khói được đi qua Vì vậy đặc trưng tiếp theo, phát hiện chuyển động chậm dùng để loại bỏ hầu hết các đối tượng nhiễu đó (Hình 3.11)
Hình 3.11: Kết quả sau khi lọc màu sắc của khói phải khói
2.2 Bộ phát hiện chuyển động
Phát hiện chuyển động là một trong những ứng dụng quan trọng và được xử dụng rộng rãi trong xử lý ảnh Trong việc phát hiện khói rừng, phát hiện chuyển động chậm được xem xét là một trong những đặc trung của khói vì khói có chuyển động chậm, kèm theo đó là sự lan tỏa Dựa trên đặc trưng màu sắc và chuyển động, vùng nghi ngờ khói sẽ được xác định và phân tích tiếp để xác định là khói hay không
Các giải thuật phát hiện chuyển động hiện nay có thể được chia làm các phương pháp sau: background subtraction (BS), temporal differencing và optical
GVHD: TS ĐỖ HỒNG TUẤN 47 flow Trong ba phương pháp này, optical flow là phương pháp phát hiện chuyển động dựa trên việc nội suy sự thay đổi của các pixel theo các frame liên tiếp nhau, vì vậy việc này dẫn đến việc tính toán nhiều, phức tạp và thời gian tính toán lâu
Temporal differencing sử dụng sư khác biệt của các đặc trưng như màu sắc, cạnh của bức ảnh và quan sát trong một thời gian cố định để tính toán pixel đó là pixel chuyển động hay không, tuy nhiên, khói là một vật thể không cố định, và có thể chuyển động nhanh hay chậm tùy thuộc vào điều kiện môi trường, vì vậy phương pháp này vẫn tồn tại nhược điểm Trong phạm vi đề tài, tôi khảo sát phương pháp BS trong việc phát hiện khói rừng
KẾT QUẢ ĐỀ TÀI
Chương trình phát hiện khói
Về đặc trưng của khói, ngoài các thông số như màu sắc và sự chuyển động chậm của đối tượng, các đặc trưng từ ma trận Co-Occurrence đã biểu thị được sự thay đổi của khói khi khói xuất hiện (Hình 4.1)
Hình 4.1 Sự thay đổi của các thông số đặc trưng khi khói xuất hiện
Hình 4.1 được trích xuất trong video từ giai đoạn không có khói, khi đó các thông số như CONTRAST và CORRELATION dao động rất thấp với biên độ nhỏ, trong khi đó ENERGY có biên độ cao, khi khói xuất hiện trong hình ENERGY sẽ giảm đi nhanh chóng trong khi đó các thông số còn lại sẽ dao động với biên độ lớn Điều này xảy ra vì khi khói xuất hiện các thông tin của hình ảnh sẽ bị nhiễu loạn, bên cạnh đó, khói sẽ lan dẫn ra điều này dẫn đến năng lượng của hình ảnh sẽ bị giảm xuống một cách nhanh chóng Để kiểm tra sự thay đổi của các đặc trưng, đề tài cũng thử nghiệm trên các video khác như: video có sương mù và video vừa có sương mù và khói Kết quả được thể hiện qua hình 4.2 và 4.3
Contrast_v Contrast_h Energy_vEnergy_h Correlation_v Correlation_h
GVHD: TS ĐỖ HỒNG TUẤN 59
Hình 4.2 Đặc trưng của video sương mù
Hình 4.3 Đặc trưng của video vừa có sương mù vừa có khói
Dựa trên hình 4.2 và 4.3, khi có sương mù, các thông số hầu như không thay đổi, trong khi đó có sương mù và khói, ENERGY của hình ảnh rất thấp, điều này xảy ra vì khi có sương mù hay có khói thì năng lượng của hình ảnh rất thấp vì chủ yếu là màu của sương mù và khói Tuy nhiên, thông số CONTRAST và CORRELATION lại dao động rất lớn, như vậy dù có sương mù thì các đặc trưng vẫn biểu thị được khói
Contrast_v Contrast_h Energy_v Energy_h Correlation_v Correlation_h
Contrast_v Contrast_h Energy_vEnergy_h Correlation_v Correlation_h
GVHD: TS ĐỖ HỒNG TUẤN 60
Bảng 1: Độ chính xác của giải thuật dựa trên dữ liệu mẫu
Số lượng hình khói phát hiện được (A)
Số lượng hình khói trong video
Bên cạnh việc khảo sát các đặc trưng của khói, đề tài còn thử nghiệm giải thuật trên 14 video mẫu được lấy từ Internet và quay được tại các địa điểm thực tế
Bảng 1 thể hiện số lượng hình khói mà giải thuật phát hiện được và độ chính xác là
GVHD: TS ĐỖ HỒNG TUẤN 61 tỉ lệ giữa số lượng hình phát hiện được và tổng số hình khói trên video Theo như chạy thử nghiệm thì độ chính xác của giải thuật là 0.87 đối với dữ liệu mẫu.
Hệ thống cảnh báo sớm cháy rừng
Hiện tại, hệ thống đang được dự kiến quay thử nghiệm tại Đà Nẵng với mô hình như hình 4.1
Hình 4.4 Mô hình thử nghiệm hệ thống
Trạm quan sát được xây dựng tại vị trí thuận lợi đạt tầm nhìn quan sát tốt toàn diện khu rừng và có độ cao vượt qua các tán cây Trạm quan sát được đặt trên tầm cao trung bình khoảng 20m để camera có thế thu thập được dữ liệu trong vòng bán kính 4-5 km Tại trạm quan sát, các cảm biến được lắp đặt ngay tại trạm để thu thập thông tin về môi trường xung quanh trạm Ngoài ra, các thiết bị khác như năng lượng gió, mặt trời cũng được lắp đặt để đảm bảo thiết bị hoạt động 24/24 và tiết kiệm năng lượng
GVHD: TS ĐỖ HỒNG TUẤN 62
Về hệ thống truyền dẫn, việc truyền dữ liệu trong rừng sẽ rất khó khăn nếu chúng ta sử dụng cáp vì thế các trạm quan sát sẽ được gắn một thiết bị truyền dẫn wireless với băng thông tối đa là 30MB và khoảng cách truyền là 30km để đảm bảo sự liên lạc giữa trạm cảm biến và trung tâm điều khiển
Hiện tại, đề tài đã tạo lập một vài cơ sở dữ liệu và thử nghiệm hệ thống trong phòng thí nghiệm, sau đây là một vài chức năng cơ bản của hệ thống Đầu tiên là phần “Giám sát mạng”, tại đây, tất cả các camera trên toàn bộ khu vực rừng được hiển thị và giám sát trực tiếp bởi người quản lý, bên cạnh đó, khi có cháy rừng thì giao diện này cũng thông báo cho người giám sát biết vị trí của cháy rừng là ở trạm giám sát nào để cho người quản lý dễ dàng phát hiện Bên cạnh đó giao diện còn cung cấp thêm các thông tin như thời gian hiện tại của trạm quan sát, cấp dự báo cháy rừng ngay tại trạm vào ngày hôm đó Người giám sát có thể dễ dàng phân tích tình hình cháy rừng hiện tại mà không cần phải đo hay tính toán các thông số môi trường Hình bên dưới mô tả giao diện của “Giám sát mạng và các chức năng hiện có của chương trình
Hình 4.5 Giao diện giám sát mạng
GVHD: TS ĐỖ HỒNG TUẤN 63
Khi người giám sát muốn xem các thông tin cụ thể của từng trạm thì người giám sát chỉ đơn giản chọn khu vực bằng cách chọn vào hình của trạm người quan sát muốn xem, khi đó một giao diện khu vực sẽ được hiển thị Tại màn hình này, chương trình cung cấp các thông tin như các hình ảnh thu được tại trạm sẽ rõ và có độ phân giải cao hơn, các thông tin về nhiệt độ, độ ẩm, tốc độ gió sẽ được hiển thị
(các thông tin này thu thập và hiển thị thời gian thực dựa trên các cảm biến được lắp đặt ngay tại trạm) Bên cạnh đó, vào 13h thì hệ thống sẽ tính toán các công thức nhằm đưa ra cấp dự báo cháy rừng phục vụ cho việc tiên đoán khả năng cháy rừng vào ngày hôm đó
Hình 4.6 Giao diện thông tin trạm giám sát
Khi trạm cảm biến phát hiện ra khói, chương trình sẽ cung cấp các thông tin như hình ảnh xử lý, tọa độ đám cháy và phần trăm nguy cơ khói Nhiệm vụ tiếp theo của người quan sát đó là xác nhận lại đó có phải là cháy rừng hay không vì trên thực tế không một hệ thống nào có thể thay thế hoàn toàn con người được
GVHD: TS ĐỖ HỒNG TUẤN 64
Hình 4.7 Phát hiện khói rừng với khoảng cách 4km
Khi cháy rừng đã được xác nhận, các công việc tiếp theo như in ấn, định vị tri bản đổ đều được chương trình tích hợp sẵn Các thống kê về vụ cháy rừng phục vụ công việc khảo sát sau này cũng được đưa vào chương trình
Hình 4.8 Báo cáo thống kê và bản đồ số
Bên cạnh đó, hệ thống cũng cung cấp bản đồ số gồm các thông tin về đường đi, sông suối và định vị cháy rừng trên bản đồ phục vụ công tác định vị cháy ngoài thực địa Tuy nhiên chức năng này vẫn đang phát triển và hoàn thiện
GVHD: TS ĐỖ HỒNG TUẤN 65
Chạy thử nghiệm hệ thống tại khu vực Huyện Bình Chánh
Nhằm khảo sát tính khả thi của giải thuật, đề tài được đưa vào chạy thử nghiệm tại khu vực huyện Bình Chánh với sơ đồ bố trí như hình 4.9
Hình 4.9: Sơ đồ lắp đặt hệ thống thử nghiệm
Theo hình 4.9, hệ thống được lắp đặt tại tháp canh 1 và 2, sau đó các vị trí đốt lửa để tạo khói rừng lần lượt cách trạm là 0.5km, 1.5km và 2.0km Các kết quả về thử nghiệm cho thấy, hệ thống phát hiện được khói rừng ở tất các cách khoản cách, tuy nhiên, sự ổn định của hệ thống chưa thực sự cao Nguyên nhân cho việc này là:
Tháp canh được dụng để lắp đặt hệ thống chưa tốt, hay bị rung vì vậy ảnh đầu vào của hệ thống không được ổn định
GVHD: TS ĐỖ HỒNG TUẤN 66
Hệ thống chỉ có camera mà không có các thiết bị khác như sensor hay camera nhiệt, vì vậy, độ chính xác thực sự bị giảm đáng kể vì thông tin cung cấp không đủ
Tuy nhiên, về mặt giải thuật, ma trận Co-Occurrence có thể được sử dụng để trích xuất đặt trưng của khói trong nhận dạng khói rừng Sau đây là các kết quả thu được sau khi chạy thử nghiệm hệ thống
Hình 4.10: Vị trí 2 – Khoảng cách 0.5km
Hình 4.11: Vị trí 1 – Khoảng cách 1.5km
GVHD: TS ĐỖ HỒNG TUẤN 67
Hình 4.12: Đường Lê Đình Chi – Khoảng cách 2km
GVHD: TS ĐỖ HỒNG TUẤN 68