1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân tích tự động dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung

121 447 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 121
Dung lượng 3,79 MB

Nội dung

Phân tích tự động dữ liệu video số hỗ trợ truy tìm thông tin thị giác dựa vào nội dung

Trang 1

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung



PHAN VĨNH PHÝỚC -0112275

KHÓA LUẬN CỬ NHÂN TIN HỌC

GIÁO VIÊN HÝỚNG DẪN Th.s LÝ QUỐC NGỌC

id3289046 pdfMachine by Broadgun Software - a great PDF writer! - a great PDF creator! - http://www.pdfmachine.com http://www.broadgun.com

Trang 2

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Luận vãn của chúng em sẽ rất khó hoàn thành nếu không có sự truyền đạt kiến thức quắ báu và sự hýớng dẫn tận tình của Thầy Lý Quốc Ngọc Chúng em xin chân thành cám õn sự chỉ bảo của thầy

Chúng con xin gửi tất cả lòng biết õn, sự kắnh trọng đến ông bà, cha mẹ, cùng toàn thể gia đình, những ngýời đã nuôi dạy, đã cho chúng con niềm tin và nghị lực để výợt qua mọi khó khãn

Chúng em xin trân trọng cám õn quý Thầy cô trong Khoa Công nghệ thông tin trýờng Đại học Khoa học Tự nhiên Tp.Hồ Chắ Minh đã tận tình giảng dạy, truyền đạt những kiến thức quý báu và tạo điều kiện cho chúng em đýợc thực hiện luận vãn này

điểm khó khãn nhất, tiếp thêm động lực và ý chắ, giúp chúng tôi hoàn thành đýợc luận vãn

Mặc dù đã cố gắng nỗ lực hết sức mình, song chắc chắn luận vãn không khỏi còn nhiều thiếu sót Chúng em rất mong nhận đýợc sự thông cảm và chỉ bảo tận tình của quý Thầy cô và các bạn

Trang 3

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

NHẬN XÉT CỦA GIÁO VIÊN HÝỚNG DẪN

Trang 4

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

Trang 5

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

1 Giới thiệu tổng quan 13

2 Các hýớng nghiên cứu liên quan ðến ðề tài 17

3 Qui trình chính ðýợc thực hiện trong luận vãn 19

3.1 Giai ðoạn ngoại tuyến (off-line) 19

3.2 Giai ðoạn trực tuyến (on-line) 20

2.2 Không gian màu RGB 27

2.3 Không gian màu CMY 29

2.4 Không gian màu HSV 30

3 Lýợc ðồ màu (Color Histogram) 33

3.1 Ðịnh nghĩa 33

3.2 Thuật toán tính lýợc ðồ màu : 34

3.3 Ý nghĩa của lýợc ðồ màu 38

3.4 Ðánh giá ýu ðiểm, khuyết ðiểm 38

3.5 Ứng dụng 39

4 Lýợc ðồ týõng quan màu (Color Correlogram) 40

4.1 Giới thiệu lýợc ðồ týõng quan màu 40

4.2 Tính lýợc ðồ týõng quan màu 40

4.3 Lýợc ðồ tự týõng quan màu 40

4.4 Ứng dụng 41

5 Biên dạng (Edge) 41

Trang 6

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

1 Giới thiệu sõ lýợc phân ðoạn ðoạn cõ sở 55

2 Một số tài liệu in, bài báo ðiển hình về phân ðoạn cõ sở 57

2.1 Kỹ thuật mô hình Markov ẩn (The Hidden Markov Model) 57

2.2 Phát hiện chuyển cảnh dựa vào phân tích và týõng tác nghe nhìn 59

2.3 Phát hiện chuyển cảnh dựa vào lýợc ðồ 59

2.4 So sánh các kỹ thuật phát hiện biên ðoạn cõ sở 60

3 Các hýớng tiếp cận phân ðoạn ðiển hình 61

3.1 Sự sai biệt về lýợc ðồ màu 61

3.2 Tỉ số thay ðổi biên cạnh 62

3.3 Sự phân tích ðặc trýng âm thanh 62

3.4 Sự phân tích phát hiện chuyển ðộng 63

2 Tổ chức các ðoạn cõ sở theo cấu trúc cây nhị phân 80

2.1 Giải thuật phân lớp phân cấp 80

2.2 Tạo liên kết lân cận 81

Trang 7

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.4 Cụ thể hóa giai ðoạn phân lớp trong giải thuật phân lớp phân cấp ở mục 2.1 ở trên 83

3 Xây dựng bảng mục lục và chỉ mục 85

4 Xác ðịnh các lớp của các ðoạn cõ sở và phần tử ðại diện của lớp 88

4.1 Lớp của các ðoạn cõ sở 88

4.2 Phần tử ðại diện của lớp 89

5 Khung hình chính ðại diện cho ðoạn cõ sở 89

2 Các thuật toán cài ðặt 116

2.1 Không gian màu : 116

2.2 Các thuật toán phân ðoạn 116

Trang 8

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hình 7 Chuyển cảnh tiệm tiến 25

Hình 8 Không gian màu độ xám 26

Hình 9 Không gian RGB 27

Hình 10 Không gian RGB 28

Hình 11 Không gian RGB 28

Hình 12 Không gian CMY 29

Hình 13 Các thành phân tạo nên không gian màu HSV 30

Hình 14 Không gian màu HSV dýới dạng đối týợng hình nón 32

Hình 15 Lýợc đồ màu 33

Hình 16 Mắt ngýời không nhạy cảm với sự thay đổi màu sắc 36

Hình 17 Không gian màu HSV đã đýợc định lýợng 37

Hình 18Các màu đã đýợc định lýợng trong không gian HSV 38

Hình -19 Những ảnh khác nhau nhýng có lýợc đồ màu giống nhau 39

Hình 20 42

Hình 21 44

Hình 22 46

Hình 23 Biên đoạn cõ sở 55

Hình 24.Tắnh sự khác biệt đặc trýng giữa những khung hình liên tiếp 56

Hình 25 Đýờng sai biệt về đặc trýng lýợc đồ giữa các khung hình liên tiếp 56

Hình 26Sõ đồ giải thuật phân đoạn 57

Hình 27 Chuyển cảnh tức thì dễ phát hiện 63

Hình 28 Chuyển cảnh tiệm tiến khó phát hiện 64

Hình 29 65

Hình 30 Kết quả phân đoạn bằng phýõng pháp 2 ngýỡng 67

Hình 31 Đýờng sai biệt lýợc đồ màu toàn cục 68

Hình 32 69

Hình 33 70

Hình 34 Đýờng cong ban đầu (ở trên) và sau khi qua toán tử hình thái học (ở dýới) Đýờng màu đỏ là những nõi phát hiện chuyển cảnh 71Hình 35 Phân đoạn theo lýợc đồ tự týõng quan màu và toán tử hình thái học, giải thuật

Trang 9

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hình 36 Liên kết lân cận cho bảng mục lục 81

Hình 37 Liên kết lân cận cho bảng chỉ mục 82

Hình 38 Dãy liên kết lân cận ban ðầu 83

Hình 39Kết quả sau khi liên kết 2 ðoạn cõ sở có khoảng cách bé nhất 84

Hình 40Kết quả của giai ðoạn phân lớp phân cấp 85

Hình 41 86

Hình 42 Cây sau khi rút gọn 87

Hình 43 88

Hình 44 Các khung hình trong ðoạn cõ sở 90

Hình 45 Khung hình chính của ðoạn cõ sở trên 90

Hình 56 Truy vấn với dữ liệu nhập là ðoạn cõ sở 114

Hình 57 Truy vấn với dữ liệu nhập là ðoạn video 115

Hình 58 Truy vấn với dữ liệu nhập là ảnh tĩnh 116

Trang 10

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Bảng 1 Bảng thống kê kết quả phân ðoạn 76Bảng 2 Kết quả truy tìm 100

Trang 11

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hỗ trợ truy tìm thông tin thị giác là việc ðýa ra một phýõng pháp mới trong việc

việc truy tìm sẽ trở nên dễ dàng hõn, tiện lợi hõn, chính xác hõn, và nhanh chóng hõn Hýớng nghiên cứu này ðang thu hút ðýợc sự quan tâm của nhiều ngýời do nhu cầu ngày càng tãng về lýu trữ và truy vấn dữ liệu video số Trong khuôn khổ luận vãn này, chúng tôi trình bày một số phýõng pháp phân ðoạn, xây dựng cây phân cấp phân lớp, truy tìm video, và tích hợp các phýõng pháp này vào một chýõng trình cài ðặt

Trang 12

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

CHÝÕNG 1 MỞ ÐẦU

Chýõng này giới thiệu tổng quan về tình hình sử dụng dữ liệu video trên thế giới, những vấn ðề phát sinh, các hýớng nghiên cứu giải quyết Trong chýõng này cũng giới thiệu sõ lýợc qui trình xử lý chính trong luận vãn và cấu trúc báo cáo luận vãn

Nội dung của chýõng :

1 Giới thiệu tổng quan

2 Các hýớng nghiên cứu liên quan ðến ðề tài

4 Cấu trúc luận vãn

Trang 13

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

1.Giới thiệu tổng quan

nhất Nhờ có thị giác mà chúng ta tiếp nhận thông tin từ thế giới bên ngoài một cách

giữ lại những thông tin thị giác tiếp nhận đýợc Mới đầu chỉ là những hình thù đýợc khắc một cách thô sõ trong các hang động, trên những tảng đá, để truyền lại kinh nghiệm cho thế hệ sau Trải qua một quãng thời gian sau, con ngýời phát minh ra giấy viết Từ đây, thông tin thị giác đýợc lýu giữ dýới hình thức mới tiện lợi hõn Rồi con ngýời phát minh ra máy ảnh để chụp ảnh tĩnh, và máy quay phim để thu ảnh động

thu đýợc rất chắnh xác, gần nhý giống với những gì mắt ta cảm nhận đýợc Không những vậy mà nó còn là những đoạn video thể hiện một cách sống động thế giới và những gì mắt ta thấy đýợc Con ngýời nhý có đýợc quyền nãng đóng bãng thời gian và không gian Nhờ đó, kiến thức của con ngýời về thế giới ngày càng tãng, trình độ khoa học kỹ thuật càng lúc càng cao

Và máy tắnh xuất hiện Sự ra đời của máy tắnh đánh dấu một kỷ nguyên mới, thời kỳ của máy tắnh và kỹ thuật số Tất cả đều đýợc số hóa nếu có thể Điều này dẫn đến sự bùng nổ về thông tin thị giác, khiến chúng trở thành một phần không thể thiếu

nắm đýợc thông tin, ngýời đó có sức mạnh trong tay Thông tin thì không thiếu, thậm chắ quá nhiều dẫn đến thừa thông tin Vấn đề là việc chọn lọc tìm kiếm, lýu giữ, và sử dụng nhý thế nào cho hợp lý

Phần lớn dữ liệu video số hiện nay đýợc lýu giữ dýới dạng thô và đýợc gán nhãn, đánh chỉ mục bằng vãn bản.Chẳng hạn nhý trong một cõ sở dữ liệu video có

Trang 14

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

này đýợc đánh chỉ mục và gán nhãn là Ộeuro2004_France_EnglandỢ, cho biết đây là

đoạn video về trận đấu ở Euro 2004 giữa hai đội bóng Pháp và Anh Sở dĩ hiện nay phýõng pháp gán nhãn chỉ mục dựa vào vãn bản này đýợc sử dụng nhiều vì nó đõn giản, cho kết quả tìm kiếm nhanh Tuy nhiên không lúc nào kết quả cũng làm vừa lòng ngýời truy tìm, thậm chắ ngýời dùng phải mất khá nhiều công sừc Vắ dụ nhý trong cõ sở dữ liệu video đề cập ở trên có thể còn có nhiều đoạn video týõng tự nhý

euro2004_Portugal_Spain.mpg, euro2004_Russia_Greece.mpg , Ầ Một ngýời nào đó muốn truy tìm những cảnh ghi bàn thắng trong Euro 2004 Ngýời đó sẽ tìm kiếm các

đoạn video với từ khóa là Ộeuro 2004Ợ Kết quả truy tìm là rất nhiều đoạn video có liên

duyệt qua các đoạn video vừa tìm đýợc, mỗi đoạn video phải duyệt từ đầu đến cuối,

duyệt tiếp Độ dài trung bình một đoạn video về trận đấu bóng đá là 90 phút, nếu đuợc nén dýới dạng MPEG1 thì có dung lýợng khoảng 800MB Euro 2004 có tổng cộng 31 trận đấu Nhý vậy, để hoàn thành công việc, ngýời truy tìm phải tải một dung lýợng

46.5 giờ để duyệt dữ liệu video Nếu duyệt với tốc độ nhanh gấp 5 lần, tức là chỉ xem

lýớt qua, thì cũng phải mất 9.3 giờ, chýa kể thời gian tải dữ liệu video Rõ ràng cách

các đoạn video một cách thủ công, lại thêm một lần nữa mất rất nhiều thời gian và công sức Mà thông tin không chỉ có thể thao, mà còn ở nhiều lĩnh vực khác, và dữ liệu ngày càng nhiều, càng phong phú, và tãng thêm rất nhanh mỗi ngày, việc gán nhãn chỉ mục thủ công càng tốn nhiều chi phắ Chýa kể đến sự khác biệt về ngôn ngữ tự nhiên Chẳng hạn nhý kho dữ liệu đó do những nguời Nhật gán nhãn chỉ mục theo tiếng Nhật, bắt buộc chúng ta cũng phải biết tiếng Nhật mới có thể truy tìm đuợc thông tin Đây là

Trang 15

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

nhý nhau với mọi nguời, mọi ngýời đều cảm nhận giống nhau, không phân biệt ngôn ngữ, sắc tộc

Những công việc gán nhãn chỉ mục trên đều đýợc làm thủ công do cách thức lýu trữ chýa hợp lý, chýa phát triển kịp với sự bùng nổ của thông tin Từ đó nảy sinh

nhiều ngữ nghĩa hõn, để con ngýời có thể tìm kiếm và sử dụng hiệu quả thông tin thị giác

Bây giờ, giả sử một ngýời lại tìm thông tin về những bàn thắng trong Euro 2004, nhýng là tìm trong những bài viết, những bài báo, vãn bản mô tả những cảnh ghi bàn đó Công việc trở nên dễ dàng hõn nhiều, chúng ta chỉ cần vào một trang tìm kiếm nào đó trên mạng internet, gõ vào các từ khóa Ộsút tung lýới, ghi bàn, euro 2004Ợ, sẽ có rất nhiều bài viết đýợc tìm thấy Lúc này, cách thức tìm kiếm đi trực tiếp vào nội dung vãn bản cần tìm nên kết quả chắnh xác và dễ chấp nhận hõn Vậy tại sao chúng ta không tìm kiếm thông tin thị giác dựa vào nội dung?

Luận vãn của chúng tôi tìm hiểu và phát triển một phýõng pháp giúp phân tắch tự động cấu trúc video số giúp lýu trữ, quản lý, tìm kiếm một cách hiệu quả thông tin

chúng ta chỉ cần có một đoạn video nhỏ mô tả cảnh quả bóng đang bay vào khung thành, và chúng ta dùng đoạn video đó làm Ộtừ khóaỢ để truy tìm các bàn thắng trong

dữ liệu video, với ý nghĩa là : tìm những đoạn video nào mà có cảnh quả bóng bay vào

Trang 16

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Ví dụ :

Ðoạn video dùng ðể truy vấn là cảnh ảnh trái bóng ðang bay vào khung thành

Hình 1 Ðoạn video dùng dể truy vấn

Kết quả truy vấn :

Trang 17

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.Các hýớng nghiên cứu liên quan đến đề tài

Trýớc nhu cầu ngày càng lớn trong việc quản lý dữ liệu video, nhiều nhóm nghiên cứu đã nhảy vào cuộc Đã có nhiều thuật toán về nén dữ liệu video số cho kết quả rất khả quan và đang đýợc áp dụng rộng rãi Các định dạng file video MPEG1,

chứ không giải quyết đýợc việc lýu trữ hiệu quả để truy tìm

vào thực tế một số phýõng pháp lýu trữ và truy tìm dựa vào nội dung, cho thấy đây là một hýớng phát triển mới và rất có triển vọng Sau đây là một số nhóm tiêu biểu:

Đại học Carnegie Mellon

Nhóm phát triển thuộc Đại học Carnegie Mellon đang thực hiện một dự án thý viện thông tin cho phép ngýời dùng truy tìm video bằng ngôn ngữ tự nhiên Các býớc xử lý để tạo nên thý viện video : phát hiện các đoạn cõ sở bằng cách sử dụng phýõng pháp độ sai biệt về lýợc đồ màu, rồi rút trắch khung hình chắnh, nhận dạng khuôn mặt, nhận dạng chữ viết qua video, và tìm ảnh dựa vào đặc trýng lýợc đồ màu trong các không gian màu và vân khác nhau

Nhóm nghiên cứu của IBM

Nhóm nghiên cứu của IBM đã phát triển một hệ thống truy tìm video theo nội

Hệ thống sử dụng IBM Cue Video để phát hiện đoạn cõ sở và lựa chọn khung hình chắnh một cách tự động

Trang 18

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Đại học Johns Hopkins

Nhóm nghiên cứu JHU/APL đã phát triển một hệ thống truy tìm tự động video dựa vào nội dung của các khung hình video số Mỗi khung hình chắnh đýợc đánh chỉ số bởi chắnh đặc trýng lýợc đồ màu và vân ảnh của nó

Có thể thấy rằng, hiện nay, lĩnh vực xử lý video theo nội dung khá hấp dẫn và thu hút đýợc sự quan tâm của ngày càng nhiều nhóm nghiên cứu vì những nhu cầu và ứng dụng thực tế của nó Tuy nhiên, phần lớn những nghiên cứu vẫn còn ở trong lý thuyết, còn những hệ thống đã cài đặt áp dụng thì chỉ có kết quả týõng đối Vì vậy, trong luận vãn này, chúng tôi nghiên cứu và thực hiện cài đặt một số phýõng pháp giúp lýu trữ và

mạnh mẽ hiện nay

Trang 19

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

3.Qui trình chắnh đýợc thực hiện trong luận vãn

Gồm 2 giai đoạn : Giai đoạn ngoại tuyến và giai đoạn trực tuyến (xem hình)

Hình 3 Qui trình chắnh

Mục đắch của giai đoạn này phân tắch và lýu trữ những đặc trýng cấp cao của dữ liệu video, gồm các býớc :

Đầu tiên, dữ liệu video dýới dạng tập tin video thông thýờng (avi, mpeg) đýợc đýa vào bộ phân đoạn để phân tắch đoạn video ban đầu thành các đoạn cõ sở

Trang 20

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Tiếp theo, tiến hành rút trắch đặc trýng của các đoạn cõ sở để tạo thành cõ sở dữ liệu các đặc trýng của các đoạn cõ sở Các đặc trýng có thể là đặc trýng màu, đặc trýng chuyển động, đặc trýng biên cạnh, Ầ

Kế đến, phân lớp các đoạn cõ sở và chọn phần tử đại diện, tạo nên cõ sở dữ liệu các lớp của các đoạn cõ sở với phần tử đại diện

một cõ sở dữ liệu có thể truy vấn Giai đoạn này thực hiện truy vấn dữ liệu

Đýa đoạn video cần truy vấn vào, phân tắch đoạn video này thành các đoạn cõ sở giống nhý ở giai đoạn ngoại tuyến trên

Sau đó tiến hành rút trắch đặc trýng của các đoạn cõ sở của đoạn video truy vấn, rồi thực hiện phân chia các đoạn cõ sở và chọn phần tử đại diện So sánh các đặc trýng của các đoạn cõ sở của đoạn video truy vấn với các đặc trýng của các đoạn cõ sở đýợc lýu trong cõ sở dữ liệu tạo ra ở giai đọan ngoại tuyến Ứng với mỗi đoạn cõ sở của đoạn video truy vấn, chọn ra và xếp hạng những đoạn cõ sở gần nhất với nó, ta có kết quả của truy vấn

3.3.Các lĩnh vực liên quan: Xử lý ảnh số và video số Xử lý tắn hiệu số

Trang 21

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

4.Cấu trúc luận vãn

4.1.CHÝạNG 1 : MỞ ĐẦU

Chýõng này giới thiệu tổng quát về xử lý video trên thế giới, sõ lýợc về đề tài, lý do chọn, hýớng tiếp cận đề tài, các nghiên cứu đã và đang đýợc thực hiện 4.2.CHÝạNG 2 : MỘT SỐ KHÁI NIỆM VÀ ĐẶC TRÝNG TRONG XỬ LÝ

ẢNH SỐ VÀ VIDEO SỐ

Nội dung chắnh của chýõng này là giới thiệu một số khái niệm, đặc trýng hay sử dụng trong xử lý ảnh số và video số nhý : các không gian màu, lýợc đồ màu, đặc trýng chuyển động, Ầ

4.3.CHÝạNG 3 : PHÂN TÍCH TỰ ĐỘNG VIDEO SỐ THÀNH CÁC ĐOẠN Cạ SỞ

Chýõng này trình bày về vấn đề phân tắch video thành các đoạn cõ sở, bao gồm các khái niệm cõ bản, một số phýõng pháp thýờng dùng, các phýõng pháp cải tiến đýợc dùng trong luận vãn

4.4.CHÝạNG 4 : TỔ CHỨC CÁC ĐOẠN Cạ SỞ THEO CẤU TRÚC CÂY Nội dung chắnh của chýõng là các thuật toán tổ chức các đoạn cõ sở theo cấu trúc cây, xây dựng bảng mục lục và bảng chỉ mục và phân lớp các đoạn cõ sở 4.5.CHÝạNG 5 : TRUY VẤN DỮ LIỆU VIDEO SỐ

Chýõng này nói về các thuật toán dùng cho việc truy vấn, truy tìm video số 4.6.CHÝạNG 6 : HỆ THỐNG ĐÃ CÀI ĐẶT

Chýõng này giới thiệu về chýõng trình đã cài đặt, các chức nãng chắnh của chýõng trình, các thuật toán đã cài đặt, và hýớng dẫn sử dụng

4.7.CHÝạNG 7 : KẾT LUẬN

Ở phần này, chủ yếu là những kết quả đạt đýợc, những đóng góp mới và hýớng phát triển trong týõng lai

Trang 22

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Nội dung của chýõng :

1 Một số khái niệm, ðịnh nghĩa trong xủ lý video 2 Không gian màu

3 Lýợc ðồ màu

4 Lýợc ðồ týõng quan màu 5 Biên cạnh

6 Ðặc trýng chuyển ðộng

7 Các ðặc trýng toàn cục của ðoạn cõ sở 8 Tóm tắt chýõng

Trang 23

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

1.Một số khái niệm, ðịnh nghĩa trong xử lý video

Một ðoạn video gồm nhiều ảnh tĩnh ðặt liên tiếp nhau tạo nên chuyển ðộng

Vd :

Hình 4 Các khung hình

Ðể ðoạn video có thể tạo cảm giác chuyển ðộng, các khung hình phải ðýợc quay với tốc ðộ phù hợp Vì mắt ngýời chỉ có thể nhận ðýợc 24 hình/giây, nên nếu nhý

ðýợc sự rời rạc giữa những khung hình, mà chỉ thấy những cảnh liên tục Có nhiều hệ video và mỗi hệ có tốc ðộ quay khác nhau nhý : NTSC 30 hình/giây, PAL 24 hình/giây, SECAM 29.99 hình/giây

thì một giây có 30 khung hình, vậy một phút có 1800 khung hình, một giờ có

Trang 24

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

đoạn cõ sở là thắch hợp nhất cho việc duyệt và truy tìm thông tin dựa vào nội dung 1.3.Chuyển cảnh

Nhý đã nói ở trên, chuyển cảnh là những đýờng biên phân chia các đoạn cõ sở Ngoài các chuyển cảnh tự nhiên thì ngày càng xuất hiện nhiều chuyển cảnh do chỉnh sửa video tạo nên Các phần mềm xử lý phim nổi tiếng nhý Adobe Premiere hoặc Ulead MediaStudio cung cấp hõn 100 kiểu chỉnh sửa video để tạo nên những đoạn chuyển cảnh khác nhau Tuy nhiên, hõn 99% rõi vào một trong những loại chuyển cảnh sau :

Chuyển Cảnh

Trang 25

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Lànhững chuyển cảnh rõ ràng, dứt khoát, ngay lập tức và dễ nhận biết

Hình 6 Chuyển cảnh tức thì

ðối týợng mờ dần và chìm vào nền của ảnh hoặc cảnh cũ mờ dần và ðan

Hình 7 Chuyển cảnh tiệm tiến

Trang 26

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.Không gian màu

Một không gian màu là một mô hình ðại diện cho màu về mặt giá trị ðộ sáng; một không gian màu xác ðịnh bao nhiêu thông tin màu ðýợc thể hiện Nó ðịnh nghĩa không

những giá trị ðộ sáng Một thành phần màu còn ðýợc gọi là một kênh màu

Mỗi ðiểm ảnh trong ảnh có thể ðýợc ðại diện bởi một ðiểm trong không gian màu 3 chiều Những không gian màu thýờng ðýợc dùng ðể bao gồm RGB, CMY, Munsell,

Hình 8 Không gian màu ðộ xám

Trang 27

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.2.Không gian màu RGB

Không gian RGB là không gian màu ðýợc sử dụng rộng rãi trong việc hiển thị hình ảnh Ý týởng tạo ra không gian màu RGB ðến từ cái cách mà mắt con ngýời hoạt ðộng Nó có những cõ quan cảm nhận ðể phát hiện ra 3 màu khác nhau : ðỏ(red), lục (green), lam (blue) Không gian màu RGB cũng gồm có 3 thành phần màu : Red, Green, và Blue Những thành phần này ðýợc gọi là màu gốc ðể cộng vào, vì mỗi màu ðýợc tạo nên bằng cách cộng thêm các phần tử vào màu ðen(0,0,0)

Hình 9 Không gian RGB

Trang 28

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hình 10 Không gian RGB

Trang 29

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.3.Không gian màu CMY

Không gian CMY ðýợc dùng chủ yếu trong in ấn CMY là viết tắt của

ứng với ba màu mực in Chúng ðýợc gọi là những màu gốc ðể trừ, vì mỗi màu

sự chiếu sáng của màu ðỏ, Magenta hấp thu màu xanh lục, Yellow hấp thu màu

Hình 12 Không gian CMY

Mối quan hệ giữa RGB và CMY :

111

Trang 30

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

2.4.Không gian màu HSV

Mô hình HSV(Hue, Saturation, Value), còn gọi là HSB (Hue, Saturation,

Hue, loại màu (chẳng hạn màu đỏ, xanh, hay vàng) Có giá trị từ 0 - 360 hoặc từ 0 - 2đ

Saturation, độ thuần khiết của màu

Có giá trị từ 0 Ờ 100%, thýờng đýợc chuẩn hoá về 0 Ờ 1

Độ thuần khiết của một màu càng thấp, độ xám của màu đó càng nhiều và màu đó càng mờ

Value, độ sáng của màu

Có giá trị từ 0 Ờ 100%, thýờng đýợc chuẩn hóa về 0 Ờ 1

Mô hình HSV đýợc tạo ra từ nãm 1978 bởi Alvy Ray Smith Nó là một phép biến đổi phi tuyến của không gian màu RGB Mô hình HSV giúp tách bạch màu (H, S) và độ sáng (V), phù hợp với cảm nhận của con ngýời

Hình 13 Các thành phân tạo nên không gian màu HSV

Trang 31

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Mô hình HSV thýờng đýợc dùng nhiều trong các ứng dụng đồ họa máy tắnh Trong các chýõng trình ứng dụng, khi một ngýời dùng phải chọn một màu

Hình) Trong đó, thành phần loại màu Hue đýợc thể hiện bằng một vùng hình

tròn, còn một vùng tam giác riêng biệt thýờng đuợc dùng để thể hiện thành phần

Saturation và Value Trục đứng của tam giác ứng với Saturation, và trục ngang ứng với Value Bằng cách này, một màu có thể đýợc chọn bằng cách đầu tiên

chọn loại màu từ vùng hình tròn, rồi chọn độ thuần khiết và độ sáng týõng ứng

Một phýõng thức khác hình dung về mô hình HSV là hình nón Trong cách thể hiện này, thành phần Hue đýợc mô tả nhý là một dạng hình nón 3 chiều

của bánh xe màu Thành phần Saturation đýợc thể hiện bằng khoảng cách đến

tâm của vòng tròn cắt hình nón, và thành phần Value là khoảng cách đến điểm

cuối của hình nón Cách thể hiện khác là sử dụng một hình nón lục giác (có đáy và thiết diện là hình lục giác) thay vì hình nón tròn Phýõng thức này thắch hợp với việc hình dung toàn bộ không gian màu HSV trong một đối týợng đõn

Trang 32

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hình 14 Không gian màu HSV dýới dạng ðối týợng hình nón

Trang 33

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

3.Lýợc ðồ màu (Color Histogram)

3.1.Ðịnh nghĩa

Lýợc ðồ màu của ảnh cho biết sự phân bố của các màu trong ảnh

nini

Trang 34

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

3.2.Thuật toán tắnh lýợc đồ màu :

Giải thuật tạo lýợc đồ ảnh màu trong không gian RGB Býớc 1 Tạo mảng 3 chiều histogram, kắch thýớc 2b

x2bx2b(b : số bit

Býớc 2 Với mọi giá trị r, g, b nằm trong khoảng [0-2b

] Histogram[r][g][b] = 0

Býớc 3 Với mọi điểm ảnh có toạ độ x, y

Rút trắch thành phần màu r, g, b của điểm ảnh đó Histogram[r][g][b] += 1

Phần lớn các ảnh đýợc sử dụng trong máy tắnh hiện nay đều sử dụng không gian màu RGB gồm có 224

một ảnh RGB cần tốn nhiều chi phắ lýu trữ và thời gian tắnh toán Ngoài ra, khi lýợc đồ màu đýợc ứng dụng vào việc truy tìm ảnh số hay video số thì không

Mô hình màu HSV giúp tách bạch giữa màu sắc(H,S) và độ sáng (V), phù hợp cho việc truy tìm ảnh số và video số Nhýng những ảnh thông thýờng hay những đoạn video số lýu trong máy tắnh thýờng sử dụng không gian màu RGB, nên phải chuyển đổi từ RGB sang không gian HSV

Trang 35

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Thuật toán chuyển từ RGB sang HSV

Gọi R,G,B là giá trị nhập của RGB với giá trị trong khoảng [0,1] hay [0,255]

Procedure RGB_to_HSV(in R, G, B; out H, S, V) {

V := Max(R, G, B); Min := Min(R, G, B); If (V >= 0) then

S := (V - Min)/V; Else S := 0;

If (S <= 0) then {

H := -1; Return; }

Diff := V-Min;

If (H <= 0) H := H + ð/2; }

Trang 36

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

sáng, nhýng nó vẫn chýa thực sự phù hợp với cách truy tìm thông thị giác của

nhỏ là mắt ngýời không phân biệt đýợc, do đó, có những ảnh nhìn rất giống

Hình 16 Mắt ngýời không nhạy cảm với sự thay đổi màu sắc

Để cải tiến phù hợp cho việc ứng dụng trong tìm kiếm, các màu trong không

lýợng, một trong những cách đó là

ành 3 vùng

Trang 37

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Khi đó, tổng số màu bằng HxSxI = 162 màu, chi phắ tắnh toán và lýu trữ giảm đi rất nhiều, và lýợc đồ màu này rất thắch hợp cho việc truy tìm thông tin thị giác

Hình 17 Không gian màu HSV đã đýợc định lýợng

Trang 38

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Hình 18Các màu đã đýợc định lýợng trong không gian HSV

3.3.Ý nghĩa của lýợc đồ màu

Đối với một màu ci, Hci(I) thể hiện số điểm ảnh có màu ci trong ảnh I Nói cách

khác, với mỗi điểm ảnh trong ảnh I, Hci(I) thể hiện xác suất điểm ảnh đó có màu là

ci Không có mang thông tin về không gian

3.4.Đánh giá ýu điểm, khuyết điểm Ýu điểm

Tắnh toán lýợc đồ màu ắt tốn chi phắ, đõn giản, nhanh chóng

Lýợc đồ màu bất biến đối với một số phép biến đổi hình học nhý phép biến đổi Affine : tịnh tiến, xoay, sự co, giãn

Trang 39

Phân tích tự ðộng dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

Khuyết ðiểm

Lýợc ðồ màu chỉ xét phân bố toàn cục về màu của ảnh mà không xét ðến yếu tố cục bộ về vị trí, làm mất thông tin về quan hệ không gian giữa các màu Dẫn ðến việc có thể có nhiều ảnh khác nhau nhýng lại có cùng lýợc ðồ màu.(Hình)

Trang 40

Phân tắch tự động dữ liệu video số hỗ trợ truy tìm thông tin dựa vào nội dung

4.Lýợc đồ týõng quan màu (Color Correlogram)

4.1.Giới thiệu lýợc đồ týõng quan màu

phân bố theo không gian, Một đặc trýng mới đýợc giới thiệu gọi là lýợc đồ týõng quan màu

Lýợc đồ týõng quan màu hứa hẹn mô tả không chỉ là phân phối màu của các điểm ảnh mà còn là sự týõng quan về không quan giữa các cặp màu

4.2.Tắnh lýợc đồ týõng quan màu

Gọi [D] là tập gồm D khoảng cách d1,d2, ,dD đýợc đo bằng độ đo L Lýợc đồ týõng quan màu của ảnh I đýợc xác định với cặp màu  c ,icj và khoảng cách d nhý sau:

    Pr [ 2 || 1 2| ]

Trong đó I là ảnh, kắch thýớc MxN (Điểm ảnh), Ic pI|I  pc , lýợc đồ týõng quan màu thể hiện xác suất cặp điểm ảnh bất kỳ p1 và p2 chịu sự ràng buộc về màu (p1có màu ci,p2 có màu cj ) và vị trắ ( p1 p2 L d)

4.3.Lýợc đồ tự týõng quan màu

Nếu chúng ta xét đến tất cả sự kết hợp có thể có của các cặp màu, kắch thýớc của lýợc đồ týõng quan màu sẽ rất lớn, hõn nữa, thời gian tắnh toán sẽ lâu Do đó, một phiên bản đõn giản hõn đýợc sử dụng, gọi là lýợc đồ tự týõng quan màu Lýợc đồ này chỉ quan tâm đến sự týõng quan về không gian giữa những

màu giống nhau và do đó giảm đýợc số chiều và chi phắ tắnh toán Lýợc đồ tự týõng quan màu đýợc xác định nhý sau:

( (,)

c  

Ngày đăng: 10/11/2012, 08:12

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w