Phân tích bài tốn

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 52)

Chƣơng 3 : CHƢƠNG TRÌNH THỬ NGHIỆM

3.2. Phân tích bài tốn

Phân tích đối tượng chuyển động đóng một vai trị quan trọng trong lĩnh vực thị giác máy tính. Các bước cơ bản cho quá trình theo dõi và phát hiện đối tượng đối tượng được thể hiện trong Hình 3.1. Việc phân tích video liên quan đến phát hiện đối tượng chuyển động, phân loại đối tượng, theo dõi đối tượng từ khung này sang khung khác.

43

Phát hiện đối tượng liên quan đến việc xác định các đối tượng từ khung video. Phân loại đối tượng dựa vào các đặc trưng của đối tượng được phân loại là vật chuyển động. Theo dõi đối tượng liên quan đến việc lựa chọn khu vực quan tâm và theo dõi chuyển động và vị trí của đối tượng từ khung video.

Hình 3.1. Các bƣớc quá trình phát hiện và theo dõi đối tƣợng

- Phát hiện đối tượng chuyển động là bước đầu tiên cho quy trình phân tích video. Điều này được thực hiện trong mỗi và mọi khung hình hoặc khi đối tượng đầu tiên xuất hiện trong video, xử lý với loại bỏ các đối tượng nền tĩnh chuyển động của đối tượng quan tâm. Sau các kỹ thuật về cơ bản tập

44

trung vào việc phát hiện các đối tượng chuyển động chủ yếu là nguồn thơng tin chính của đối tượng.

+ Phương pháp so sánh khác biệt khung: Sự khác biệt giữa hai hình ảnh liên tiếp là được tính tốn, mà xác định thêm đối tượng. Đối với các động lực khác nhau môi trường, phương pháp này có khả năng thích ứng mạnh mẽ, nhưng kết quả chính xác của việc phát hiện đối tượng khơng đứng n khơng chính xác vì rất khó để có được hồn chỉnh phác thảo của đối tượng chuyển động đó.

+ Phương pháp trừ nền: Mơ hình nền là bước đầu tiên của nền phép trừ, được sử dụng để lấy mơ hình tham chiếu. Mơ hình tham chiếu này được so sánh với mỗi video trình tự để xác định sự biến đổi có thể có. Các sự tồn tại của đối tượng chuyển động được xác định bởi sự khác biệt giữa khung video hiện tại và khung hình xun suốt tính theo pixel.

+ Luồng quang học: Phương pháp này là để tính tốn luồng lưu lượng quang học và thực hiện một quy trình được gọi là phân cụm dựa trên đặc điểm phân bố luồng quang của ảnh. Trong khi sự phức tạp trong tính tốn, hiệu suất chống ồn kém khiến nó khơng đáng tin cậy cho các ứng dụng đòi hỏi thời gian thực.

- Phân loại đối tượng được thực hiện dựa trên đặc điểm hình dạng của chúng trong vùng chuyển động.

+ Phân loại dựa trên chuyển động có một gợi ý mạnh mẽ là thuộc tính tuần hồn được thể hiện bởi một khớp nối không cứng nhắc chuyển động của đối tượng. Các đối tượng động không cứng nhắc như con người có thể có dịng dư trung bình lớn hơn và hiển thị một thành phần tuần hoàn, trong khi các đối tượng cứng nhắc dự kiến sẽ có ít dịng chảy dư.

45

phần của hình ảnh được tính theo kết cấu kỹ thuật. Sau đó, nó được tính tốn bằng cách sử dụng chồng chéo chuẩn hóa tương phản cục bộ trên một lưới dày đặc các ơ cách đều nhau để cải thiện độ chính xác.

- Phân loại dựa trên hình dạng: Biểu diễn của các điểm, hộp và đốm màu là khác nhau vùng chuyển động có sẵn để phân loại chuyển động đối tượng dựa trên thơng tin hình dạng. Hỗn hợp các thơng số dựa trên hình ảnh và dựa trên cảnh như khu vực đốm hình ảnh, thu phóng máy ảnh và rõ ràng tỷ lệ khung hình của hộp giới hạn đốm màu đóng vai trị là đầu vào các tính năng của mạng. Từng đốm màu ở mọi khung hình trải qua phân loại và biểu đồ giữ các kết quả.

+ Phân loại dựa trên màu sắc: Màu sắc dễ thu được và tương đối ổn định dưới các biến thể góc nhìn, khơng giống như hình ảnh khác đặc trưng. Trong thời gian thực để phát hiện và theo dõi các phương tiện, thuật toán dựa trên biểu đồ màu được sử dụng. Để phân đoạn hình ảnh thành nền và đối tượng và để mô tả sự phân bố màu sắc bên trong chuỗi hình ảnh.

- Theo dõi đối tượng là bước tiếp theo sau phát hiện đối tượng, là một kỹ thuật được sử dụng để theo dõi và cũng là hướng di chuyển của các đối tượng. + Dựa trên điểm: Là nhiệm vụ chung của thị giác máy với các ứng dụng khác nhau liên quan đến trong quá trình theo dõi các đối tượng chuyển động được hiển thị bằng các điểm đặc trưng của đối tượng. Theo dõi điểm là một vấn đề lớn, đặc biệt là trong việc phát hiện bất thường và tỷ lệ khớp.

+ Dựa trên khu vực: Thường được thực hiện bởi tính tốn đối tượng không đứng yên mà hiển thị bởi vùng đối tượng chuyển động từ một khung này sang khung khác.

46

hảo của hình dạng đối với những đối tượng đó sẽ được cung cấp bởi cách tiếp cận này. Mục tiêu của cơ chế theo dõi này là phát hiện vùng đối tượng trong mọi khung hình với sự trợ giúp của một mơ hình đối tượng thu được bởi các khung trước đó.

3.3. Xây dựng chƣơng trình thử nghiệm

Để minh họa cho những kỹ thuật đã được nghiên cứu ở Chương 2 và những nội dung phân tích về bài tốn nêu trên, luận văn tiến hành thử nghiệm cho bài toán ứng dụng cụ thể. Bài toán được ứng dụng cài đặt thử nghiệm bằng ngơn ngữ lập trình Visual C++ trên nền tảng bộ công cụ Microsoft Visual Studio phiên bản 2015. Các bước chính để giải quyết bài tốn được thể hiện trong sơ đồ sau:

47

- Video đầu vào: Video đầu vào được thu từ camera giám sát đặt ở vị trí

cố định với mức ánh sáng tốt và ảnh nền không thay đổi.

- Lấy khung hình từ video: Lấy từng khung hình từ video đưa vào.

- Khởi tạo Background: Lấy khung hình đầu tiên làm Background.

- Trừ nền: Áp dụng kỹ thuật trừ nền, tìm sự khác biệt giữa background

và foreground. Trừ các giá trị điểm ảnh giữa ảnh khung hình và ảnh nền để tìm được ảnh khác biệt.

- Gom nhóm, đưa ra ảnh nhị phân: Xử lý đưa ra ảnh nhị phân. Sau khi

tìm được ảnh khác biệt thì tiến hành chuyển đổi ảnh khác biệt, tìm ngưỡng và dựa vào ngưỡng đưa ra ảnh nhị phân.

- Xác định đối tượng: Từ ảnh nhị phân, tiếp tục tiến hành sử dụng các

phương pháp phân loại đối tượng và theo dõi đối tượng để phân tích đánh giá các đặc tính của đối tượng và khoanh vùng các đối tượng. Dựa vào mặt nạ thực hiện khoanh vùng đối tượng trên hình ảnh màu, xác định đối tượng chuyển động.

- Kết quả: Video chứa các đối tượng chuyển động đã được khoanh vùng

màu xanh và được đếm số thứ tự tăng dần.

3.3.1. Thiết lập thử nghiệm

- Trong quá trình thử nghiệm kết quả, các video mẫu sẽ được truyền vào trực tiếp trong phần Crowd Property của chương trình bằng đường dẫn tuyệt đối. Cụ thể là đưa đường dẫn trực tiếp vào ô Command.

- Các mẫu video thử nghiệm được thu thập từ nguồn:

https://motchallenge.net/data/2D_MOT_2015/?chl=2&orderBy=frame_ rate&orderStyle=DESC

48

Hình 3.3. Cách truyền video vào chƣơng trình thử nghiệm

- Sau khi thực hiện, chương trình sẽ hiện lên 03 khung màn hình:

+ Màn hìnhChuyendong: Màn hình chính của chương trình, hiển thị màn hình màu trắng đen dùng để so sánh giữa các khung hình khác khi phát hiện đối tượng chuyển động.

+ Màn hình Phathien: Thể hiện kết quả phát hiện đối tượng chuyển động trong tổng số đối tượng được ghi nhận và được nhận dạng bằng cách khoanh vùng đối tượng một hình vng màu xanh.

+ Màn hình Theodoi: Thể hiện kết quả số lượng phát hiện đối tượng, được đánh số thứ tự tăng dần đối tượng phát hiện.

- Quan sát trực tiếp và ghi nhận đối tượng và ước tính mật độ đối tượng tại một thời điểm nhất định.

3.3.2. Kết quả thử nghiệm

Qua quan sát trực tiếp từ 03 khung màn hình bằng mắt thường tại 10 mẫu video, thời gian ghi nhận số lượng đối tượng phát hiện là 20 giây/video. Kết quả đạt được như sau:

49

- Video 01 có kích thước khung hình là 1920*1080, độ dài thời gian là 20 giây, số khung hình/giây là 30, tổng số khung hình là 600. Số đối tượng được phát hiện là 52 người trên tổng số đối tượng được ghi nhận là 56 người. Tỷ lệ phát hiện là 92,9%, mật độ đối tượng trên mỗi khung hình là 11 người.

Hình 3.4. Kết quả chạy chƣơng trình thử nghiệm video 01

- Video 02 có kích thước khung hình là 1920*1080, độ dài thời gian 22 giây, số khung hình/giây là 30, tổng số khung hình là 654. Số đối tượng được phát hiện là 47 người trên tổng số đối tượng được ghi nhận là 53 người. Tỷ lệ phát hiện là 88,7%, mật độ đối tượng trên mỗi khung hình là 11 người.

Hình 3.5. Kết quả chạy chƣơng trình thử nghiệm video 02

- Video 03 có kích thước khung hình là 640*480, độ dài thời gian 60 giây, số khung hình/giây là 14, tổng số khung hình là 837. Số đối tượng được phát hiện là 41 người trên tổng số đối tượng được ghi nhận là 45 người. Tỷ lệ phát hiện là 91,1%, mật độ đối tượng trên mỗi khung hình là 6 người.

50

Hình 3.6. Kết quả chạy chƣơng trình thử nghiệm video 03

- Video 04 có kích thước khung hình là 640*480, độ dài thời gian 61 giây, số khung hình/giây là 14, tổng số khung hình là 1000. Số đối tượng được phát hiện là 35 người trên tổng số đối tượng được ghi nhận là 37 người. Tỷ lệ phát hiện là 94,6%, mật độ đối tượng trên mỗi khung hình là 8 người.

Hình 3.7. Kết quả chạy chƣơng trình thử nghiệm video 04

- Video 05 có kích thước khung hình là 768*576, độ dài thời gian 114 giây, số khung hình/giây là 7, tổng số khung hình là 795. Số đối tượng được phát hiện là 17 người trên tổng số đối tượng được ghi nhận là 18 người. Tỷ lệ phát hiện là 94,4%, mật độ đối tượng trên mỗi khung hình là 8 người.

51

- Video 06 có kích thước khung hình là 1920*1080, độ dài thời gian 225 giây, số khung hình/giây là 2.5, tổng số khung hình là 450. Số đối tượng được phát hiện là 14 người trên tổng số đối tượng được ghi nhận là 15 người. Tỷ lệ phát hiện là 93,3%, mật độ đối tượng trên mỗi khung hình là 3 người.

Hình 3.9. Kết quả chạy chƣơng trình thử nghiệm video 06

- Video 07 có kích thước khung hình là 640*480, độ dài thời gian 85 giây, số khung hình/giây là 14, tổng số khung hình là 1194. Số đối tượng được phát hiện là 24 người trên tổng số đối tượng được ghi nhận là 25 người. Tỷ lệ phát hiện là 96,0%, mật độ đối tượng trên mỗi khung hình là 11 người.

Hình 3.10. Kết quả chạy chƣơng trình thử nghiệm video 07

- Video 08 có kích thước khung hình là 640*480, độ dài thời gian 31 giây, số khung hình/giây là 14, tổng số khung hình là 440. Số đối tượng được phát hiện là 36 người trên tổng số đối tượng được ghi nhận là 40 người. Tỷ lệ phát hiện là 90,0%, mật độ đối tượng trên mỗi khung hình là 7 người.

52

Hình 3.11. Kết quả chạy chƣơng trình thử nghiệm video 08

- Video 09 có kích thước khung hình là 1920*1080, độ dài thời gian 17 giây, số khung hình/giây là 30, tổng số khung hình là 500. Số đối tượng được phát hiện là 50 người trên tổng số đối tượng được ghi nhận là 59 người. Tỷ lệ phát hiện là 84,7%, mật độ đối tượng xuất hiện trên mỗi khung hình là 10 người.

Hình 3.12. Kết quả chạy chƣơng trình thử nghiệm video 09

- Video 10 có kích thước khung hình là 1238*374, độ dài thời gian 106 giây, số khung hình/giây là 10, tổng số khung hình là 1059. Số đối tượng được phát hiện là 21 người trên tổng số đối tượng được ghi nhận là 23 người. Tỷ lệ phát hiện là 91,3%, mật độ đối tượng trên mỗi khung hình là 9 người.

53

3.4. Đánh giá kết quả thử nghiệm

Sau khi thực hiện chương trình thừ nghiệm cho 10 video mẫu, kết quả đầu ra cho thấy. Số đối tượng được phát hiện là 337 người trên tổng số đối tượng được ghi nhận là 371 người, tỷ lệ phát hiện đạt được 91,7% (Bảng 3.1).

Như vậy, với một số kỹ thuật áp dụng cho phát hiện và theo dõi đối tượng chuyển động trong bài tốn phân tích đám đơng, có thể khẳng định rằng, đây là phương pháp tối ưu, mang lại hiệu quả cao, đồng thời cho ra kết quả tương đối chính xác và nhanh chóng.

Bảng 3.1. Kết quả đánh giá chƣơng trình thử nghiệm trên 10 video

Tên video

Các tham số đầu vào của video

Kết quả đầu ra đƣợc quan sát và ghi nhận trực tiếp bằng mắt thƣờng (Tính trong

thời gian 20 giây )

Kích thƣớc khung hình Số khung hình / giây Tổng số khung hình Độ dài thời gian (giây) Số đối tƣợng đƣợc phát hiện Tổng số đối tƣợng đƣợc ghi nhận Tỷ lệ phát hiện (%) Ƣớc tính mật độ (người / khung hình Video1 1920*1080 30 600 20 52 56 92,9 11 Video2 1920*1080 30 654 22 47 53 88,7 11 Video3 640*480 14 837 60 41 45 91,1 6 Video4 640*480 14 1000 61 35 37 94,6 8 Video5 768*576 7 795 114 17 18 94,4 8 Video6 1920*1080 2.5 450 225 14 15 93,3 3 Video7 640*480 14 1194 85 24 25 96,0 11 Video8 640*480 14 440 31 36 40 90,0 7 Video9 1920*1080 30 500 25 50 59 84,7 10 Video10 1238*374 10 1059 106 21 23 91,3 9 Tổng cộng 337 371 91,7

54

3.5. Kết luận Chƣơng 3

Chương này đã giới thiệu một số dạng bài tốn, phân tích một số kỹ thuật nhằm giải quyết các bài toán một các hiệu quả nhất từ đó xây dựng chương trình thử nghiệm, đồng thời đánh giá kết quả đạt được sau khi thử nghiệm và đã tiến hành cài đặt thử nghiệm chương trình được trình bày trong Chương 2. Kết quả đạt được là sự thành cơng từ ý tưởng và áp dụng các thuật tốn đã đưa ra của luận văn.

55

KẾT LUẬN VÀ KIẾN NGHỊ

1. Kết quả đạt đƣợc của luận văn

Trong nội dung nghiên cứu đề tài “Nghiên cứu kỹ thuật phân tích đám

đơng trong giám sát tự động dựa vào thị giác máy” bản thân đã tìm hiểu các kỹ thuật trừ nền, phân cụm và áp dụng các phương pháp phát hiện đối tượng, theo dõi đối tượng để giải quyết bài toán đặt ra. Qua nghiên cứu, những kết quả chính mà luận văn đã đạt được như sau:

- Khái quát về một số kỹ thuật phân tích đám đơng.

- Phân tích các phương pháp, tính năng trong giám sát tự động dựa vào thị giác máy thông qua các video.

- Cài đặt thử nghiệm thuật toán áp dụng các kỹ thuật phân tích và xuất ra video đã phát hiện đối tượng chuyển động và ước tính mật độ đối tượng trong đám đơng, đồng thời chạy thử nghiệm chương trình trên dữ liệu là các video tự thu thập.

2. Kiến nghị và hƣớng nghiên cứu tiếp theo

Kỹ thuật phân tích đám đơng trong giám sát tự động dựa vào thị giác máy là đề tài đã, đang và tiếp tục được nhiều nhà nghiên cứu trong và ngồi nước nghiên cứu vì có nhiều ứng dụng to lớn, có tầm quan trọng trong khoa học, thực tiễn. Những hạn chế trong phân tích hành vi đám đơng vẫn cịn.

Trong q trình thực hiện đề tài, do hạn chế về mặt trình độ và thời gian thực hiện luận văn có hạn, chương trình chỉ là phần demo các thuật toán phát hiện chuyển động, phát hiện đối tượng, bám sát đối tượng dựa vào video. Để triển khai thực tế cần đòi hỏi nhiều cải tiến hơn nữa. Hy vọng trong tương lai,

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu kỹ thuật phân tích đám đông trong giám sát tự động dựa vào thị giác máy (Trang 52)

Tải bản đầy đủ (PDF)

(69 trang)