1. Trang chủ
  2. » Luận Văn - Báo Cáo

Cấu trúc dữ liệu đa phương tiện và mô hình cơ sở dữ liệu hình ảnh

120 2,5K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 120
Dung lượng 3,04 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Trần Thanh Lưu CẤU TRÚC DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ MÔ HÌNH CƠ SỞ DỮ LIỆU HÌNH ẢNH LUẬN VĂN THẠC SỸ Hà nội, 2006 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Trần Thanh Lưu CẤU TRÚC DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ MÔ HÌNH CƠ SỞ DỮ LIỆU HÌNH ẢNH Ngành: Công nghệ thông tin Mã số: 1.01.10 LUẬN VĂN THẠC SỸ Người hướng dẫn khoa học : PGS.TS. Đỗ Trung Tuấn Hà nội, 2006 1 Mục lục MỞ ĐẦU 7 Chƣơng 1 8 TỔNG QUAN 8 1.1 Các kịch bản đa phƣơng tiện 12 1.3. Các ứng dụng khác 18 1.3.1. Các dịch vụ đa phƣơng tiện trong giáo dục 18 1.3.2 Ứng dụng trong hội nghị điện tử 19 1.3.3. Ngành công nghiệp giải trí 19 1.4. Kết luận 20 Chƣơng 2 21 CẤU TRÚC DỮ LIỆU ĐA CHIỀU 21 2.1 Mở đầu 21 2.2 Cây k-d (k-d Trees) 22 2.2.1 Cấu trúc nút 22 2.2.2 Chèn và tìm kiếm trong cây 2-d 23 2.2.3 Huỷ bỏ trong cây 2-d 27 2.2.4 Truy vấn khoảng trong cây 2-d 29 2.2.5 Cây k-d với k2 32 2.3 Cây tứ phân điểm (Point Quadtrees) 32 2.3.1 Chèn và tìm kiếm trong cây tứ phân điểm 33 2.3.2 Thao tác xoá cây tứ phân điểm 35 2.3.3 Truy vấn khoảng trong cây tứ phân điểm 37 2.4 Cây tứ phân matrix MX (MX-Quadtrees) 37 2.4.1 Chèn và tìm kiếm trong MX-Quadtree 38 2.4.2 Thao tác xoá trong MX-Quadtrees 40 2.4.3 Truy vấn khoảng trong MX-Quadtrees 41 2.4.4 PR-Quadtrees 41 2.5 Cây R (R-Trees) 41 2.5.1 Chèn và tìm kiếm trong R-Trees 43 2.5.2 Xoá cây trong R-Trees 45 2.6 Kết luận 46 Chƣơng 3 48 CƠ SỞ DỮ LIỆU ẢNH 48 3.1 Ảnh thô 48 3.2 Biểu diễn ảnh nén 52 3.2.1 Biến đổi Fourier rời rạc (DFT–Discrete Fourier Transform) 53 3.2.2 Biến đổi cosin rời rạc (DCT–Discerte Cosine Transform) 53 3.3 Xử lý ảnh: Phân đoạn 54 3.4 Truy vấn trên cơ sở tƣợng tự 60 2 3.4.1. Tiệm cận thƣớc đo 61 3.4.2 - Tiệm cận biến đổi 64 3.5 Các hình mẫu khác của CSDL ảnh. 68 3.6. Biểu diễn IDB bằng các quan hệ 68 3.6.1 Truy vấn biểu diễn quan hệ trong IDB 70 3.7 Biểu diễn CSDL ảnh với R-Trees 77 3.7.1 Biểu diễn CSDL ảnh bằng cây R tổng quát 81 3.8 Truy vấn ảnh bằng bố trí không gian 83 3.9 Cài đặt 85 3.10 Kết luận 86 Chƣơng 4 87 CƠ SỞ DỮ LIỆU ĐA PHƢƠNG TIỆN 87 4.1 Thiết kế và kiến trúc CSDL đa phƣơng tiện 87 4.1.1 Các kiến trúc tổ chức nội dung . 87 4.2 Tổ chức dữ liệu đa phƣơng tiện trên cơ sở nguyên lý thống nhất 91 4.3 Trừu tƣợng media 92 4.4 Ngôn ngữ truy vấn dữ liệu đa phƣơng tiện 97 4.4.1 Truy vấn SMDS (Biểu diễn thống nhất) 97 4.4.2 Truy vấn dữ liệu đa phƣơng tiện của biểu diễn lai 100 4.5 Những đánh giá về thực trạng ứng dụng dữ liệu đa phƣơng tiện tại Việt Nam nói chung. 103 4.6. Đề xuất về việc xây dựng một hệ thống quản lý dữ liệu đa phƣơng tiện thống nhất. 103 4.7 Kết luận 104 KẾT LUẬN 106 Tài liệu tham khảo 107 Phụ lục 109 3 Lời cam đoan Tôi xin cam đoan các kết quả của luận văn là do bản thân chuẩn bị. Nội dung của luận văn chƣa đƣợc xuất bản, báo cáo tại nơi đâu. Tôi xin chịu hoàn toàn về trách nhiệm, nếu có sai sót gì về nội dung trình bày trong luận văn. 4 Lời cảm ơn Trƣớc hết xin cám ơn gia đình, cha mẹ và anh em đã hỗ trợ tinh thần và vật chất cho quá trình học tập của tôi. Để có đƣợc thành công nhất định nhƣ ngày hôm nay, tôi đã có đƣợc sự quan tâm, động viên, hỗ trợ to lớn cả tinh thần và vật chất trong suốt quá trình học tập của tôi. Tôi xin trân trọng cảm ơn các thầy giáo, cô giáo đã giảng dạy và hƣớng dẫn tôi trong quá trình học tập trong trƣờng Đại học và chƣơng trình sau đại học. Dù rằng , trong quá trình học tập, có nhiều lúc gặp phải những khó khăn trong việc tiếp thu kiến thức cũng nhƣ sƣu tầm tài liệu học tập, nhƣng với sự nhiệt tình và tâm huyết của thầy cô cộng với những nỗ lực của bản thân đã giúp tôi vƣợt qua đƣợc những trở ngại đó. Trong quá trình thực hiện luận văn, mặc dù gặp phải nhiều khó khăn trong việc sắp xếp thời gian, công việc cũng nhƣ việc tìm kiếm tài liệu tham khảo nhƣng tôi đã nhận đƣợc sự tận tình hƣớng dẫn, chỉ bảo của thầy giáo hƣớng dẫn khoa học PSG.TS Đỗ Trung Tuấn giúp tôi hoàn thành luận văn này. Tôi xin chân thành cảm ơn các bạn trong khóa học đã hỗ trợ tôi trong suốt quá trình học tập, đặc biệt là trong chƣơng trình sau đại học. Tôi cũng xin đƣợc gửi lời cảm ơn đến ban lãnh đạo, các đồng nghiệp tại Ngân hàng TMCP Sài Gòn Công thƣơng – Chi nhánh Hà Nội, nơi tôi đang công tác đã tạo điều kiện về thời gian và giúp đỡ tôi trong công việc giúp tôi có thể hoàn thành khóa học và thực hiện xong luận văn. Để có thể hoàn tất khoá học sau đại học tại Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội tôi đã nhận đƣợc rất nhiều sự động viên giúp đỡ của gia đình, thầy cô, đặc biệt là thầy giáo hƣớng dẫn khoa học PGS.TS Đỗ Trung Tuấn, đồng nghiệp và bè bạn. Một lần nữa tôi xin chân thành cảm ơn. Học viên Trần Thanh Lƣu 5 Bảng các từ viết tắt Số thứ tự Tên viết tắt Tên đầy đủ 1 CSDL Cơ sở dữ liệu 2 MMDBMS Multimedia Database Management System 3 GIS Geographic Infomation System 4 IDB Image Database 5 R Tree Rectangle Tree 6 DFT Discrete Fourier Transform 7 DCT Discerte Cosine Transform 8 LLINK LEFT LINK 9 RLINK RIGHT LINK 10 XLB X Lower Bound 11 XUB X Upper Bound 12 NW North West 13 SW South West 14 NE North East 15 SE South East 16 MX Matrix 17 Reg Region 18 RGB Red Green Blue 19 PropName PropertyName 20 PropValue PropertyName 21 b/w Black/ White 22 bwalgo Black/ White Algorithm 23 GI Grid Image 24 Cr Compressed Representation 25 fe Feature Extrationn Function 6 26 TS Transformaion Sequence 27 ObjID Object Identification 28 Gr-Tree GeneralizeRectangle Tree 29 ATTR Attributes 30 Var Variable 31 SMDS Structured mutlimedia database system 32 subst Substitue 33 HM-SQL hybrid-multimedia SQL 7 MỞ ĐẦU Thế kỷ 21 hứa hẹn những bƣớc phát triển nhảy vọt hơn nữa trong lĩnh vực công nghệ thông tin, nhƣ đã từng có trong những thập niên 90 thế kỷ trƣớc. Những ứng dụng công nghệ thông tin vào đời sống thực tiễn và nghiên cứu khoa học đƣợc đánh giá sẽ rất triển vọng, hứa hẹn mở ra những thành công to lớn. Dữ liệu đa phƣơng tiện ngày càng đóng vai trò không thể thiếu trong cuộc sống ngày nay, các trang thiết bị hiện đại phục vụ cho đời sống, nghiên cứu khoa học, quân sự sử dụng một khối lƣợng khổng lồ các loại dữ liệu đa phƣơng tiện khác nhau. Việc xây dựng các hệ thống quản lý cơ sở dữ liệu đa phƣơng tiện phục vụ cho những mục đích đó là yêu cầu thực sự quan trọng. Trong đó, việc sử dụng các cấu trúc dữ liệu hợp lý để biểu diễn các loại dữ liệu nhƣ vậy, phục vụ những yêu cầu của hệ thống cơ sở dữ liệu là vấn đề cần phải giải đáp. Trong luận văn, chủ yếu tập trung vào tìm hiểu loại dữ liệu là hình ảnh (Image Data), giới thiệu các cấu trúc dữ liệu đa phƣơng tiện để thể hiện dữ liệu hình ảnh, mô hình hoá cơ sở dữ liệu hình ảnh, và đề cập đến việc xây dựng cơ sở dữ liệu đa phƣơng tiện . 8 Chƣơng 1 TỔNG QUAN Ngay từ ban đầu, máy tính đã đƣợc coi là các thiết bị xử lý biểu tƣợng (symbolic) – các thiết bị có đầu vào là các biểu tƣợng theo luật alphabet và đầu ra là tập các biểu tƣợng của cùng dạng trên. Điều nay đã trở thành mô hình cho các môi trƣờng tính toán chuẩn dựa trên cơ sở máy Turing đã quen thuộc. Tuy nhiên, trong những năm gần đây xuất hiện nhu cầu vô cùng lớn về khả năng khai thác xử lý dữ liệu với số lƣợng khổng lồ mà nó là điều không dễ dàng diễn tả chỉ với việc sử dụng các ký tự. Dƣới đây là một số thí dụ về các kiểu dữ liệu nhƣ vậy: Dữ liệu ảnh (Image data): Dữ liệu hình ảnh có thể nói là một trong những kiểu dữ liệu đuợc sử dụng phổ biến và thông dụng nhất trên thế giới hiện nay. Rất nhiều những ứng dụng trong các lĩnh vực khoa học khác nhau sử dụng hình ảnh làm nguồn dữ liệu để thực thi công việc một cách hiệu quả. Ví dụ trong lĩnh vực Y học, một ví dụ cụ thể chẳng hạn một học viên phẫu thuật ở Miami mong muốn thực hành một ca phẫu thuật trên một bệnh nhân ảo có những triệu chứng sinh lý nào đó. Trên thực tế để tìm ra bệnh nhân với những triệu chứng mong muốn, học viên phẫu thuật phải truy vấn cơ sở dữ liệu (CSDL) ảnh phân tán và kích thƣớc lớn chứa ảnh X quang hay MRI (Magnetic Resonance Imaging) của các bệnh nhân với các triệu chứng tƣơng tự. Đôi khi các triệu chứng có thể dễ dàng mô tả bằng văn bản. Tuy nhiên trong nhiều trƣờng hợp khác, nó có thể dễ dàng hơn cho học viên phẫu thuật nếu có thể trình diễn hình ảnh của loại mẫu (pattern) mà anh ta đang tìm kiếm trong các ảnh X quang của bệnh nhân. Trong cả hai trƣờng hợp này, một CSDL hình ảnh phải đƣợc duy trì. Nó có thể đƣợc truy vấn trên cơ sở các tiêu chí rất khác nhau - đầu vào là văn bản hay ảnh phù hợp [17]. Dữ liệu Video (Video data): Tƣơng tự nhƣ vậy, cùng với sự phát triển bùng nổ của các thiết bị nghe nhìn nhƣ hiện nay thì kiểu dữ liệu Video đang ngày càng tràn ngập trên khắp mọi nơi. Bên cạnh đó khi mà công nghệ lƣu trữ hiện đại ngày [...]... kiểu dữ liệu này trên cùng một MMDBS cũng đòi hỏi những cách thức tổ chức dữ liệu phức tạp và rất đáng quan tâm Trong luận văn, kiểu dữ liệu đƣợc tập trung xem xét đó là kiểu dữ liệu hình ảnh, các cấu trúc dữ liệu sử dụng để lƣu trữ kiểu dữ liệu hình ảnh, giới thiệu mô hình biểu diễn CSDL hình ảnh, cuối cùng đề cập tới việc thiết kế, truy vấn CSDL đa phƣơng tiện 21 Chƣơng 2 CẤU TRÚC DỮ LIỆU ĐA CHIỀU... hơn mà cơ quan cảnh sát phải đối phó sẽ đƣợc thảo luận Mỗi một vấn đề đặt ra ở trên chỉ tiếp cận với một hình thức dữ liệu riêng lẻ Mặc dù khái niệm về dữ liệu đa phƣơng tiện đã trở nên phổ biến thông qua các dữ liệu nghe nhìn nhƣng thực tế rằng dữ liệu đa phƣơng tiện không phải chỉ có dữ liệu tiếng nói và dữ liệu audio mà còn rất nhiều kiểu dữ liệu khác nhau các dữ liệu dạng các ghi chú, dữ liệu văn... phải tiếp cận đến các hình thức thƣờng khác nhau của dữ liệu quan hệ, dữ liệu hình ảnh và các thuật toán xử lý ảnh 1.3 Các ứng dụng khác Các kịch bản mẫu về ứng dụng đa phƣơng tiện trên đây đã mô tả phần lớn các hình thức dữ liệu multimedia và các lập luận có thể bắt gặp Tuy nhiên ta còn thấy nhiều thí dụ khác về đa phƣơng tiện từ các lĩnh vực khác nhau 1.3.1 Các dịch vụ đa phương tiện trong giáo dục... chụp ảnh với Jose Orojuelo Với nhiệm vụ này có thể đòi hỏi phải tiếp cận với: Cơ sở dữ liệu thẻ căn cƣớc chứa tên cũng nhƣ hình ảnh của mọi ngƣời Cơ sở dữ liệu các hình ảnh chứa các ảnh chụp liên quan đến các vụ điều tra Các dữ liệu video theo dõi để thấy đƣợc cuộc gặp gỡ giữa một kẻ khả nghi và Jose Orojuelo đã đƣợc ghi lại trƣớc đó Các thuật toán xử lý ảnh để xác định ai xuất hiện trong bức ảnh chụp... công nghệ nói chung và các ngành liên quan đến ứng dụng đa phƣơng tiện nói riêng, các nguồn dữ liệu đa phƣơng tiện đƣợc tạo ra là vô cùng lớn và đóng vai trò quan trọng trong nhiều lĩnh vực của đời sống Dẫn tới nhu cầu về việc quản lý, lƣu trữ và sử dụng chúng một cách hiệu quả Với tính đa dạng về các kiểu dữ liệu nên các cấu trúc dữ liệu đƣợc sử dụng để lƣu trữ hiệu quả các kiểu dữ liệu này là rất khác... dạng các ghi chú, dữ liệu văn bản, dữ liệu quan hệ, dữ liệu về địa lý, các bản đồ địa hình, các mô hình không gian 3 chiều Do vậy một truy vấn phức tạp hơn là việc 17 trộn và tìm ra dữ liệu tƣơng tự từ các nguồn khác nhau Làm đƣợc điều đó sẽ cho phép cơ quan cảnh sát đặt ra các yêu cầu tiếp cận các nguồn dữ liệu tập trung trong các gói dữ liệu phức tạp và trên các phƣơng tiện (media) khác nhau sử dụng... năng là vùng hoạt động của tội phạm Hình 1.1 là sơ đồ về các kiểu khác nhau của dữ liệu và các bộ phận mềm trọn gói đƣợc sử dụng trong các mẫu về kịch bản đa phƣơng tiện, cần chú ý rằng các nguồn về hình thức dữ liệu đề cập trên chỉ là mẫu nhỏ của nguồn dữ liệu đa dạng và phong phú, có sẵn trong một ứng dụng Với sự bùng nổ về khả năng ứng dụng dữ liệu đa phƣơng tiện, mỗi một lĩnh vực ứng dụng (dù trong... thác dữ liệu, các phƣơng pháp cập nhật đã đƣợc phát triển cho nhiều loại CSDL nhƣ quan hệ, CSDL hƣớng đối tƣợng, CSDL không gian, thời gian và các CSDL khác Mỗi một ngôn ngữ này là sự mở rộng, cải tiến của các ngôn ngữ trƣớc đó và các thuật toán đƣợc áp dụng cho các kiểu dữ liệu mới và quan trọng, hay các mô hình lý luận Với dữ liệu đa phƣơng tiện, nó cũng tƣơng tự theo góc độ này Những cái mới và dữ liệu. .. Trong trƣờng hợp này cấu trúc dữ liệu phải có khả năng lƣu trữ thông tin về các vùng Hình 2.1b biểu diễn cùng bản đồ nhƣng chứa một số vùng quan tâm 22 a) Hình 2.1 b) Chƣơng này chỉ ra cách biểu diễn dữ liệu bản đồ trên hình 2.1b bằng các loại cấu trúc là : cây k-d, cây tứ phân và cây R 2.2 Cây k-d (k-d Trees) Cây k-d đƣợc sử dụng để lƣu trữ dữ liệu điểm k - chiều nhƣ chỉ ra trên hình 2.1a Cây k-d không... nguồn dữ liệu và kiểu media rất lớn và đa dạng từ ứng dụng này sang ứng dụng khác Trở lại các kịch bản đa phƣơng tiện mẫu đã đề cập phần trên, một số câu truy vấn hay gặp mà ngƣời sử dụng hệ thống đa phƣơng tiện cảnh sát (ở đây là lực lƣợng cảnh sát) có thể hay sử dụng để giải quyết công việc của mình Query 1.1 (Image Query) Giả sử rằng một cảnh sát có bức ảnh ngay trƣớc mắt anh ta Thí dụ, đó là bức ảnh . loại dữ liệu là hình ảnh (Image Data), giới thiệu các cấu trúc dữ liệu đa phƣơng tiện để thể hiện dữ liệu hình ảnh, mô hình hoá cơ sở dữ liệu hình ảnh, và đề cập đến việc xây dựng cơ sở dữ liệu. dữ liệu nghe nhìn nhƣng thực tế rằng dữ liệu đa phƣơng tiện không phải chỉ có dữ liệu tiếng nói và dữ liệu audio mà còn rất nhiều kiểu dữ liệu khác nhau các dữ liệu dạng các ghi chú, dữ liệu. NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Trần Thanh Lưu CẤU TRÚC DỮ LIỆU ĐA PHƯƠNG TIỆN VÀ MÔ HÌNH CƠ SỞ DỮ LIỆU HÌNH ẢNH LUẬN VĂN THẠC SỸ Hà nội, 2006

Ngày đăng: 01/07/2015, 19:49

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w