23 Mô hình CO’ sở dữ liệu đối tượng quan hệ
2.4.8 Truy cập dữ liệu đa phương tiện
Các truv cập dữ liệu truyền thống thường liên quan đến dữ liệu quan hệ, điều đó có nghĩa là xác định nội dung dữ liệu cần truy cập. Để xác định nội dung dữ liệu đa
phưong tiện cần tniy vấn trong Oracle InterM edia, ta có thể sừ dụng các đối tượng O RDIm age, ORDAudio, ORDVideo và ORDDoc thông qua các công cụ như SỌL. PL/SQL-, OCI hoặc Java.
Truy cập dừ liệu đa phương tiện thực chất là xác định nội dung dừ liệu đa phương tiện. N him ç hiện giờ, ìhao tác truy vấn được áp dụng với ý nghĩa là định vị siêu dừ liệu của ứng dụng trên các server. Tức là dữ liệu đa phương tiện được truy vấn qua siêu dữ liệu trích từ các cột của bảng quan hệ với sự hỗ trợ của Oracle InterM edia. Một sổ các phương thức khác dùng đề truy cập dữ liệu đa phương tiện như:
> Sừ dụng các lớp Java trong Oracle InterMeđia;
> Truvền liên tục nội dung từ CSDL Oracle;
> Sử dụng công nghệ Web;
> Sừ dụng nguồn đừ liệu tuỳ biến interM edia và các lớp DataSink cho JMF (Java M edia Framework) 2.0/2.1 ;
-48-
a Optional Elxtemal File Storago
H ình 2.4: K iến trú c O racle In te rM e d ia
2.4.8. ỉ Các lớp Java trong Oracle inter Media
Các lóp Java trong Oracle /rtfórMedia cho phép các ứng dụng Java xử lý trên bất cứ thành phần liên kết nào (máy khách, máy chủ cài ứng đụng hay CSDL) và thay đổi dữ liệu âm thanh, hình ảnh hoặc dữ liệu hỗn hợp lưu trong một CSDL. Các lớp Java trong Oracle /n/erM edia giúp cho việc kết nối với CSDL Java (JDBC - Java Database Connectivity) gồm cả dữ liệu quan hệ truyền thống và các đổỉ tượng mterM edia. Sự hỗ trợ đó giúp các ứng dụng có thể dễ đàng lựa chọn và thao tác trên tập hợp kết quả có chửa các cột /«/erM edia và dữ liệu quan hệ khác. Các lớp này cũng cho phép truy cập các thuộc tính đối tượni’ và đổi mới các phương pháp đối tượng.
2.4. S. 2 Truyền tiên tục (Streaming) nội dung từ CSDL Oracle
Nội dung lưu trong CSDL đùng plug-in (tính năng phụ gắn thêm vào phần mềm) /H/tvMedia trên một máy chù hỗ trợ streaming có thể truyền liên tục và phân phối nội dung để chạy trên một máy khách có công cụ player hồ irợ trình duyệt có streaming.
Tính năng phụ (píug-in hay phụ kiện cho một phần mềm) Oracle m/erM edia cho các máy chủ RealNetworks
Oracle m /erM eđia Plug-in for RealNetworks, RealSystem RealServer 7.0, RealSystem iQ Server 8.0, and Helix Universal Server cho phép các mảy chù RealNetworks truyền liên tục dừ liệu đa phương tiện trực tiếp đển một máy khách nầm ngoài CSDL. Phụ kiện này được cài đặt trèn máy chù RealNetworks và được định nghĩa trong các tệp cẩu hình máy chủ RealNetworks. Dữ liệu được yêu cầu cùng một URL chứa thông tin cần thiết để chọn dữ liệu đa phương tiện từ CSDL.
2.4.8.3 Sử dụng các công nghệ Web
Sử dụng m tórM edia hỗ trợ các công nghệ Web, giúp tích hợp dễ dàng dừ liệu đa phương tiện vào các ứng dụng W eb và Java. Điều này cũng có nghĩa là việc lưu trữ, truy xuất và quàn lý nội dung phong phú trong CSDL.
Các lớp Java trong Oracle m /erM edia cho các Servlets và JSP (Java Server Pages)
Các lớp Java trong Oracle /'«/erMedia cho phép các Servlets và JSP làm cho việc tải íên và truy xuất dừ liệu đa phương tiện trong CSDL dùng các kiểu đổi tượng
A /rt/érMedia OrdAudio, OrdDoc, Ordlmage và OrdVideo dễ dàng hơn. Tuy nhiên, các lớp Java trong Oracle /tt/êrM edia cho các Servlets và JSP cũng có thể dùng để điều khiển trực tiếp tải lên và truy xuất dữ liệu BLOB.
Lớp OrdHttpResponseHandler dùng để truy xuất dữ liệu multim edia từ CSDL và cung cấp cho một trinh duyệt hay ứng dụng khách có HTTP khác từ một trang Java Servlet. Lớp O rdllttpJspR esponseH andler dành cho JSP có cùng chức năng.
- 50 -
C hú ý: Các m áv JSP không đòi hỏi phài hỗ trợ iruv cập dòng xuất nhị phân cùa servlet. Vì vậy. không phải tất cả các máy JSP hỗ trợ phân phối dữ liệu đa phương tiện sử dụng lóp OrdHttpJspResponseHandler.
Dữ liệu cùa các biểu mẫu HTM L được mã hoá và gừi đi theo tệp có các yêu cầu Post sừ dụng định dạng dữ liệu form. Lớp OrdHttpUploadFormData !àm dề dàng việc xử lý các yêu cầu bằng cách phân tích dữ liệu Post và làm cho nội dung của các trường chính quy cùa mẫu và nội dung của các file được tải lên có thề truy cập một cách dễ dàng đối với một Java servlet hay các îrang JSP. Xừ lý các tệp được tài lên được thực hiện đễ dàng bàng lớp OrdHtîpUploadFile. Lớp này cuna cấp các hàm API dễ dùng mà các ứng dụng gọi đề nạp dừ liệu âm thanh, hình ảnh hay dữ liệu đa phương tiện hỗn hợp vào CSDL.
Tải liệu Javadoc mò tả cách sử dụng các lớp Java nằm trong Oracle m/erM edia cho các servlet và JSP. Tích hçfp với cổng máy chủ chạy ứng dụng Oracle (Oracle A pplication Server Portal), c ổ n g máy chù chạy ứng dụng Oracle được dùng để tạo các cổng cho doanh nghiệp hấp dẫn và hữu dụng, M ột đặc điểm then chốt của khung Oracle A pplication Server Portal là các portlet cung cấp một cách truy cập thuận tiện bất cử kiểu dữ liệu nào bao gồm nội dung phong phú hình ảnh và âm thanh. Oracle Application Server Portal có các thành phần để các nhà phát triển tạo các đổi tượng để thâu tóm, xử lý và hiển thị dữ liệu từ một bàng hay khung nhìn (view) Oracle. Các thành phần Oracle Application Server Portai này có thể được kết nối với các ứng dụng Web áp dụng trực tiếp trên CSDL doanh nghiệp. Các đối tượng mfórMedia lưu trong các bảng Oracle có thể được bao gồm trong các kiểu có trong các thành phần Oracle Application Server Portal.
H ai thành phần Oracle Application Server Portal được định nghĩa trước là: Oracle Application Server Forms Services (các địch vụ mẫu biểu) và Oracle Application Server Reports Services (các dịnh vụ báo cảo). Oracle Application Server Portal chứa các w izard đề đễ dàng tạo một biểu mẫu tương tác với dữ liệu trong các bàng hay khung nhìn cùa một hoặc nhiều CSDL. Thành phần dịch vụ biểu mẫu trên máy chủ chạy ứng dụng
Oracle xây dim s một giao điện Web ấn urợng và đề người dùng tương tác với dữ liệu - họ có thể thêm, truy vấn, cập nhật vã xoá thông tin lưu trong CSDL. Nội dung phong phủ có thể dược tài lên xuống giữa CSDL và khung cổng (portal framework) bầng cách xây dựng m ột biểu m ẫu trên các bàng chứa đối tượng w ierM edia.
Thêm vào các biểu mẫu, Oracle Application Server Porta! cung cấp một thành phẩn báo cáo. Thành phần các dịch vụ báo cáo được dùng để hiển thị dữ liệu động trong các báo cáo dạng cột qua m ột giao diện Web. Nội dung truyền thông phong phú trong các bàng có thể được tải xuổng. Các wizard một lần nữa íại giúp tạo các báo cáo một cách dễ đàng.
Tích họp với BC4J
Đ ẻ phát triển nhanh các ứng dụng W eb giàu tư liệu truyền thông, Oracle cung cấp cho các nhà phát triển một môi trường phát triển (IDE) tích hợp Java (Oracle JDeveloper lOg) và một khung ứng dụng (Oracle Bussiness Component cho Java (BC4J)) để tận dụng hỗ trợ kiểu dữ liệu giàu hình ảnh và âm thanh trong CSDL. Oracle JDeveloper lOg cho phép các nhà phát triển xây dựng m ultitier (công cụ đa liên kết), các ứng dụng Internet đóng gói thành phần trong Java một cách nhanh chóng và hiệu quả- Oracle BC4J lả một khung hỗ trợ mạnh XML để tạo quan hệ logic về kinh doanh và có thể sử dụng lại. M ột gói tích hợp Oracle w/erM edia/BC4J gồm các lớp vùng (domain classes) media xác định và nhóm các tiện ích. Các lớp vùng giới hạn các lớp của Oracle /«/¿/'Media Java Classes và thừa kể tất cả các phương pháp truy xuất, tâi ỉên và xừ lý đa phương tiện bên dưới. Các lớp vùng hỗ trợ các hàm API của khung BC4J và cung cấp khả năng tích hợp đa phương tiện, còn các lớp tiện ích hồ trợ truy xuất, biến dổi và tải lên nội dung đa phương tiện. Sự kết hợp cả hai lớp trên cung cấp một môi truờng phát triển ứng dụng được tich hợp nhiều đặc trung mà nhà phát triển sau đó có thể làm được những công việc sau:
> Viết và kiểm tra logic vấn đề kinh doanh trong các thành phần được tự động tích hợp vào CSDL quan hệ.
> Truv cập và cập nhật các khung nhìn từ các servlet, các trang JSP và các ímg dụng khách Java Swing nhò.
> Tuỳ biến các hàm ứng dụng mà không đòi hòi phải biến đồi ứng dụng được phân phối.
Các ủng đụng khách tương thích WebDAV
Các ứng dụng khách tương thích W ebDAV như Adobe GoLive, Macromedia Ultra Dev, M icrosoft’s Web Folders và nhiều sàn phẩm phần mềm khác được đùng để truy xuất các đối lượng da phương tiện. Các ứng dụng khách dùng W ebDAV chi có thể đọc d ữ liệu đa phương tiện từ CSDL.
2.4.8.4 Nguồn dữ liệu tuỳ biến inter Media và các ỉớp DaíaSink cho JMF (Java Media Framework) 2.0/2. ỉ
N guồn dữ liệu tuỳ biến /'«/erMedia và các lớp DataSink cùa Oracle là một mờ rộng cho phần khung Java media (JMF - Java M edia Framework) phiên bàn 2.0/2.1 cùa Sun Microsystems. Phần mềm này cho phép một ứng dụng JM F tải lên và truy xuất dữ liệu media trong CSDL dùng các dối tượng OrdAudio và OrdVideo.
2.4.8.5 Hỗ trợ iníerMedia để tạo ảnh cao cấp bằng Java (JAI - Java Advanced Imaging)
Các lớp Java của Oracle míeriVledia mô tả ba kiểu đối tượng stream. Chúng cung cấp các giao diện cho đừ liệu BLOB và BFILE, có thể được sử dụng bời JAI. Các lóp này cho phép một ứng dụng JAI đọc và ghi dữ liệu ảnh trong GSDL dùng các đối tượng ỉn/erM edia Orđlm age, hay trong các BLOB và BFILE.
2 .4 .9 P h â n p h ổ i n ộ i d u n g d ữ liệu đ a p h ư o n g tiệ n
Oracle InterM edia cung cấp khả năng truy vấn dữ liệu dựa trên nội dung cho các ảnh số. Vấn đề truy vấn dữ liệu dựa trên nội dung thực chất là tỉm kiếm đổi tượng ảnh (nhu m àu sắc, kích thước, hình dạng) trong CSDL. Truy vấn dữ liệu dựa trên nội dung là
- 52 -
mịii phương pháp rât phù hợp cho việc tìm kiêm các ánh trong thê giới thực, chứ không tập trung vào việc nhận biết các mẫu chuyên biệt như mẫu vàn tay hoặc mẫu khuôn mặt hoặc các hình ảnh dùng trong y học.
Các kiểu dữ liệu có thể luôn được phân phối từ CSDL đến máy client ờ dạng batch (tập các tệp) theo cơ chế đồng bộ. Một sổ kiểu đữ liệu chuyên biệt được phân phối qua các dịch vụ sẵn có. Ví dụ với các định dạng audio và video, các kiểu đối tượns, đa phương tiện có thể được phân phối với thời gian là như nhau, cùng một cấu trúc, được sử dụng và tiếp nhận qua giao thức RTSP. Tương tự như vây, ảnh cỏ thể được phân phối qua giao thức cụ thể như IIP. Oracle InterM edia hỗ trợ cho các giao thức cụ thể này thông qua các Server cùng inức
H ìn h 2.5: C ác p h ư ơ n g th ứ c p h â n phối nội d u n g d ử liệu đa p h ư ơ n g tiện
2.4.10 Phương thức truy vấn dữ liệu đa p hư ơng tiện theo nội dung
M ột trong số các phương thức truy vấn đừ liệu đa phương tiện từ CSDL là phương thức truy vẩn dữ liệu dựa trên nội dung. Để hiểu rõ cách thực hiện truy vấn, phần này trình bày tổng quát cách thức truy vấn dừ liệu ảnh với những nội đung sau:
Khái niệm tổng quát và lợi ích của việc truy vấn dữ liệu đa phưcmg tiện dựa trên nội dung;
Thực hiện truy vấn dừ liệu trên nội dung thône qua các thuộc tính trực quan của dữ liệu đa phương tiện, ví dụ đối với dữ liệu ảnh ta có thể truy vấn dừ liệu dựa >
> Ánh xạ ảnh là một phương pháp so sánh cho phép tim ra ảnh trong CSDL RÍổne với ảnh cần tim dựa trên cách đánh giá về trọng số, điểm, độ tượng tự (mức độ giống nhau của ảnh) và giá trị ngưỡng.
> Cách thức sừ dụng chi mục so sánh các dấu hiệu của dừ liệu đa phương tiện làm tăng khả năng truy vấn dữ liệu dựa trên nội dung.
> Trên thực tế con người có khả năng so sánh nhanh giữa đối tượng này với đối tượng khác hoặc tìm kiếm đổi tượng giống với đổi tượng đ ấ cho nhanh hơn rất nhiều so với máy tính. Vì vậy, phương pháp lựa chọn dữ liệu mẫu trước khi ánh xạ được xem lả phương pháp khá hữu dụng và thực tế.
2.4.10. Ị Khái niệm tổng quát và lợi ích
Công nghệ lưu trữ ảnh cho phép tập hợp m ột khối lượng lởn các ảnh kỹ thuật sổ. Tuy nhiên, khi CSDL ảnh ngày càng lớn thì việc tìm kiếm ảnh cũng ngày càng khó khăn. Đe giải quyết khó khăn này có 2 cách tiếp cận, cả hai cách đều sử dụng siêu dữ liệu đề truy vấn dừ liệu ảnh.
> Sử dụng thông tin nhập vào bảng CSDL như tiêu đề, các từ khỏa ngắn gọn mang tích chất mô tả, và các lược đồ phân loại được định trước.
> Sử dụng cách trích xuất đặc điểm ảnh tự động và khả năng nhận biết đối tượng từ sự phân loại nội đung ảnh. Đây chỉnh là cách thức truy vấn dựa trên nội dung cùa đữ liệu.
Với Oracle InterM edia, ta có thể sử dụng kết hợp hai cách tiếp cận trên tronc phần thiết kế bảng để tìm kiếm ảnh: sử đụng các cột ký tự (text) truyền thống mô tả dấu hiệu về ý nghĩa của ành (ví dụ như khi nhìn thấy có 6 hoặc 8 trục xylanh của một ô tô ta có thể hiểu ý nghĩa cùa nó thể hiện cho hình ảnh động cơ ô tô), và sử dụng kiểu O RDIm ageSignature đề truy vấn dựa trên nội dung của ảnh (tức là truy vẩn các thuộc tính đặc trưng của ánh) như hình đáng, màu sắc cùa dữ liệu cần tim cỏ phù hợp với dữ liệu cho trước hay không.
- 54 -
Thêm một sự lựa chọn cho việc dịnh nghĩa các thuộc tính của ảnh trong các cột của bàng CSDL, người thiết kế CSDL cỏ thể tạo ra kiều dừ liệu hỗn hợp chuyên biệt tức là có sự kết họp của đối tượng ORDImage với các thuộc tính dạng ký tự, số và ngày tháng.
Ưu điểm chính cùa việc truy vấn dữ liệu dựa trên nội dung là tiết kiệm thời gian tìm kiếm mà vẫn đáp ứng được các thông tin về ảnh. Với các thao tác như thêm mới hoặc sừa đổi ánh thực hiện thường xuyên trên CSDL lớn, thì CSDL sẽ không thể thường xuyên đáp úng các yêu cầu liên quan đến tất cả các thuộc tính từ các câu lệnh truy vẩn thòng thường. Do vậy, phương thức truy vấn dừ liệu dựa trên nội dung cung cấp tinh mềm dẻo và có giá trị thực tể. Phưcmg thức này rất hữu dụng trong việc cung cấp khả năng truy vấn kết cấu hay hình dạng ảnh vì đấy là một trong những thuộc tính khó cỏ thể sử dụng các từ khóa để tìm kiếm.
Ví dụ cho các ứng dụng CSDL cần sử dụng phương thức truy vẩn dựa trên nội đung chẳng hạn như khi truy cập vào một trang Web bán lè các mẫu quần áo thì nó phải cho phép người xem tìm kiếm các mẫu mã sản phẩm và giá cả, hoặc tìm kiếm theo các thuộc tính của ảnh như mầu sắc, hình dáng, hoặc tìm kiếm các mẫu quần áo trong một khung giả cụ thể. Tương tự như vậy, các nhà thiết kế thời trang có thể sử dụng một CSDL ành liên quan đến các bộ sưu tập vải, các mẫu vài, các bức vẽ phác thảo và các mẫu quần áo đã được thiết ké để thuận tiện cho sự sáng tạo cùa họ. Một số ví dụ nêu trên cho thấy vai trò quan trọng trong việc truy vấn dữ liệu ảnh theo yêu cầu từ một tập dữ liệu đã có.
2.4.10.2 Thực hiện truy vấn dữ liệu dụ a trên nội dung
Phương thức truy vẩn dựa trên nội dung tức là xử lý thông tin chửa trong dữ liệu ảnh qua các (huộc tính trực quan. Vi thể, mỗi một ảnh khi được chèn vào CSDL sẽ được phân tích và cô đọng lại sự thể hiện nội đung của ảnh được lưu trữ trong một vectơ hoặc