lý thuyết và các thử nghiệm trong lĩnh vực thương mại, với sự hỗ trợ tối đa từ các công nghệ đang có (không có sự phát minh lại) trong khi đang quên đi các hướng mới. Ví dụ một ngôn ngữ truy vấn CSDL hình ảnh nên quan tâm và tận dụng thành tựu của các ngôn ngữ truy vấn CSDL đã được nghiên cứu trong hơn 30 năm, hơn là bắt đầu từ một cái tạp nham. Hoàn toàn tương tự cho các hình thức khác của dữ liệu cũng như các chủ đề nghiên cứu khác (chỉ mục, khai thác, cập nhật, phiên giao dịch, ). 1.1 Các kịch bản đa phương tiện Hãy xem xét một cuộc điều tra với quy mô lớn của cảnh sát về tình hình buôn bán ma túy. Thông thường, để thực hiện thành công một cuộc điều tra như vậy lực lượng cảnh sát sử dụng một số lượng lớn các thiết bị điện tử để thực hiện theo dõi các đối tượng nghi ngờ dính líu đến các tổ chức ma tuý. Với một cuộc điều tra như vậy có thể sử dụng các thiết bị dưới đây để thu thập thông tin: 1. Cảnh sát có thể sử dụng camera theo dõi (surveillance camera) để ghi lại các hình ảnh về hoạt động đang diễn ra tại các địa điểm khác nhau. Ví dụ mỗi camera theo dõi có thể giám sát các hoạt động đang diễn ra tại một địa điểm trong một khoảng thời gian tương đối dài (có thể là trong 6 tháng). Tại mỗi địa điểm họ thu được khoảng vài triệu hình ảnh. Vì chỉ mỗi một cuộc điều tra như vậy đã đòi hỏi từ 50 đến 100 camera theo dõi đặt tại các địa điểm khác nhau, do đó số hình ảnh video cần được quản lý là nhiều đáng kể. Quan trọng hơn nữa là với thúc ép của pháp luật, cần thực hiện hàng trăm cuộc điều tra như vậy tại những địa điểm xác định trong một khoảng thời điểm tại nhiều vùng khác nhau với rất nhiều hình thức tội phạm tương tự như cuộc điều tra về ma tuy như điều tra về các đường dây lừa đảo, các tội phạm liên quan đến tài chính, các cuộc điều tra về khủng bố, các cuộc điều tra về gián điệp… Số lượng dữ liệu video thu được theo cách đó phục vụ cho các cuộc điều tra là lớn khủng khiếp. 2. Một tình huống khác, lực lượng cảnh sát được lệnh thực hiện các cuộc nghe trộm điện thoại (telephone wiretaps) tại một địa điểm sau đó tập hợp lại các dữ liệu âm thanh là các cuộc đàm thoại cho là đáng ngờ. Mặc dù số lượng các cú điện thoại có thể khác nhau giữa các tội phạm, nhưng các tổ chức tội phạm (như đường dây ma tuy) rất hay sử dụng liên lạc điện thoại. Theo chiều hướng đó số lượng các chuỗi âm thanh thu được trong một khoảng thời gian từ các cuộc điều tra là rất lớn. Do vậy việc tổ chức và tìm kiếm dữ liệu audio này có ý nghĩa vô cùng lớn. 3. Ngoài tất cả những gì trình bày ở trên, lực lượng cảnh sát có thể có một số lượng lớn các bức ảnh chụp (still photographs) từ các điều tra viên (có thể trong quá trình theo dõi một kẻ tình nghi). Hơn nữa, trong các cuộc điều tra tội phạm quy mô lớn có thể phát hiện ra số lượng đáng kể các tội phạm với tội danh nhẹ (ví dụ hình ảnh những kẻ buôn bán ma tuý lẻ bị chụp khi đang tiến hành bán ma tuý hay một hành vi liên quan đến ma tuý có thể được phát hiện mà bản thân nó có liên quan đến người trong bức ảnh). Tất cả những hình ảnh này phải được lưu lại dưới dạng kỹ thuật số, sẵn sàng cho các công việc tìm kiếm và khai thác khi cần. 4. Cảnh sát cũng có thể phải xem xét một số lượng lớn các tư liệu (document) đã tìm được tại những nơi có liên quan đến những vụ án đang điều tra hay những vụ án khác. Một lượng lớn tư liệu có thể liên quan trực tiếp đến vụ án nhưng vào thời điểm ban đầu thì chúng có thể không được rõ ràng. Khi một cuộc điều tra về ma tuý đang diễn ra, mọi cái trở nên minh bạch khi mà ngày càng có nhiều mối liên hệ với các chứng cứ đã thu được trong cuộc điều tra này hay các cuộc điều tra trước đây cũng có thể là những cuộc điều tra đang diễn ra cùng thời điểm. 5. Một tình huống khác, cảnh sát có thể xâm nhập đến các dữ liệu có quan hệ cấu trúc (structured relational data). Dữ liệu dạng này có thể bao gồm, thí dụ như dữ liệu trong các giao dịch ngân hàng của một vài tội phạm. Điều này là đặc biệt quan trọng bởi vì một số trùm ma tuý sử dụng rất nhiều hình thức rửa tiền, việc “Lần theo dấu vết đồng tiền” thường khám phá được rất nhiều điều thú vị. Các dữ liệu khác thuộc thể loại này có thể bao gồm những thông tin chán ngắt như những cuốn danh bạ điện thoại để xác định, nhận dạng người bị tình nghi. 6. Cảnh sát cũng có thể sử dụng hệ thống thông tin địa lý (GIS) chứa đựng những dữ liệu địa lý liên quan đến cuộc điều tra ma tuý đang được triển khai. Ví dụ cảnh sát nghi ngờ rằng một tuyến đường nào đấy đang được sử dụng để vận chuyển ma tuý. Để kiểm tra giả thuyết trên, họ phong toả một trong những tuyến đường đó (có lẽ ban đầu là kiểm tra một cách khắt khe trên tuyến đường này), theo cách đó làm tập trung hướng vận chuyển ma tuý. Mẫu (pattern) của luồng ma tuý sẽ cung cấp cho cảnh sát các thông tin rất quan trọng về các vị trí đầu mối của ma tuý. Để thực thi chiến dịch trên, cảnh sát có thể sử dụng các hệ thống GIS để quản lý dữ liệu địa lý. Các hệ thống GIS này quản lý các thông thông tin bao gồm thông tin về bản đồ đường đi, cũng có thể là các thông tin thu được về địa hình của những vùng lân cận của những thủ phủ trên núi (như Medellin, Colombia). Nhận thức về địa hình cũng như các hình thức sử dụng các phương tiện để vận chuyển ma tuý có thể mang lại cho cảnh sát những đầu mối có giá trị để xác định được các tuyến đường đi qua các địa hình có khả năng là vùng hoạt động của tội phạm. Hình 1.1 là sơ đồ về các kiểu khác nhau của dữ liệu và các bộ phần mềm trọn gói được sử dụng trong các mẫu về Kịch bản đa phương tiện. Cần chú ý rằng các nguồn về hình thức dữ liệu đề cập trên chỉ là mẫu nhỏ của nguồn dữ liệu đa dạng và phong phú, có sẵn trong một ứng dụng. Với sự bùng nổ về khả năng ứng dụng dữ liệu đa phương tiện, mỗi một lĩnh vực ứng dụng (dù trong ngành công nghiệp du lịch hay trong các hoạt động luật pháp) có thể có nguồn dữ liệu và kiểu media rất lớn và đa dạng từ ứng dụng này sang ứng dụng khác. Trở lại các kịch bản đa phương tiện mẫu đã đề cập phần trên, bây giờ chúng ta đưa ra một số câu truy vấn hay gặp mà người sử dụng hệ thống đa phương tiện cảnh sát (ở đây là lực lượng cảnh sát) có thể hay sử dụng để giải quyết công việc của mình. · Query 1.1 (Image Query). Giả sử rằng một cảnh sát có bức ảnh ngay trước mắt anh ta. Thí dụ, đó là bức ảnh chụp chính diện từ các cuộc điều tra mới đây. Cơ quan điều tra có thể nghi ngờ một người trong bức ảnh đang sử dụng một bí danh nào đó. Do vậy họ mong muốn giải quyết được vấn đề đặt ra là ”Tìm tất cả các bức ảnh từ thư viện ảnh trong đó có sự xuất hiện của người đang bị nghi ngờ ”. Đây là một vấn đề rất thú vị bởi vì nó có thể được giải quyết bởi một trong hai khả năng. Thứ nhất là cảnh sát có thể biết trước tên của người trong bức ảnh. Trong trường hợp này truy vấn được thực hiện bằng việc sử dụng thông tin văn bản đã biết trước về các bức ảnh khác nhau trong thư viện ảnh để tìm ra một bức ảnh có kết hợp ghi chú bằng văn bản. Hoặc với cách khác, cảnh sát có thể cần đến việc áp dụng các kỹ thuật xử lý ảnh để tìm sự tương đồng giữa khuôn mặt trong bức ảnh vừa chụp với các khuôn mặt trong các bức ảnh có sẵn trong thư viện ảnh căn cước. Phương án thứ 2 thường được thực hiện ngay sau khi phương án thứ nhất thất bại. · Query 1.2 (Audio Query). Trong một trường hợp khác, khi cơ quan cảnh sát đang nghe lại một băng ghi âm theo dõi những đối tượng tình nghi. Thí dụ, nội dung băng là một cuộc đàm thoại giữa một nhân vật A (người đang bị theo dõi ) với một nhân vật B (người đang tiếp xúc với A). Dựa vào nội dung của cuộc đàm thoại, cơ quan cảnh sát mong muốn tìm kiếm thông qua CSDL các mẫu giọng nói để có thể xác định được người B. Nếu yêu cầu như trên thành công thì nó có thể cung cấp cho cảnh sát những chứng cứ hay có thể là những định hướng cho quá trình điều tra tội phạm. Error! Truy vấn trên đây chỉ bao hàm xử lý tiếng nói. Đặc điểm của lời nói được lưu trữ một cách đặc biệt trong một véctơ đặc trưng (feature vector) phản ánh các giá trị của các tham số khác nhau là “quan trọng” và liên quan đến quá trình ghi âm vừa qua. Để xác định xem một mẫu lời nói (giọng nói của nhân vật B) có tương đồng với một vector trong cơ sở dữ liệu tiếng nói hay không, chúng ta cần một số kỹ thuật dựa vào các CSDL tiếng nói có thể được đánh chỉ mục để thuận tiện hơn trong việc khai thác một cách nhanh chóng các dãy âm thanh tương tự (similar). · Query 1.3 (Text Query). Mặt khác, cơ quan cảnh sát có thể xem qua các tập tài liệu như các file văn bản lưu trữ các bài báo cũ. Đó là hồ sơ cảnh sát về những vụ án giết người chưa được giải quyết, về các chứng cứ… Cảnh sát mong muốn giải quyết vấn đề đặt ra bằng cách đưa ra câu truy vấn như “Tìm tất cả các tư liệu (từ tập các tài liệu văn bản) liên quan đến mối quan hệ trong các giao dịch tài chính của tổ chức thuốc phiện Cali với ABC Corp”. Lần nữa, chúng ta thấy đây là một truy vấn khá thú vị, nó hướng vào lĩnh vực CSDL văn bản. Một từ khoá tìm kiếm đơn giản thông qua tập hợp các tài liệu không đảm bảo sẽ đảm bảo cho chúng ta kết quả chính xác, ngay cả khi chỉ mục cho việc tìm kiếm trong tài liệu văn bản này đã tồn tại. Cuối cùng nó càng không có sự đảm bảo là các tài liệu sẽ đề cập đến các từ “Cali”, “finance” và “ABC Corp”. Ví dụ một tư liệu nói về việc chuyển tiền từ tài khoản ngân hàng của Jose Orojuelo sang tài khoản của John Smith có thể là một tư liệu có giá trị. Nó có ý nghĩa vì Jose Orojuelo là một người đứng đầu nhóm buôn bán thuốc phiện tại Cali và John Smith là một quan chức cao cấp trong ABC Corp. Văn bản phải được đánh chỉ mục không chỉ theo từ khóa mà còn dựa trên nội dung ngữ nghĩa của từ khóa. Chỉ khi nào thực hiện được điều đó thì mới có hy vọng thu được các kết quả một cách chính xác và cô đọng. · Query 1.4 (Video Query) Hãy xem xét một ví dụ sau, cơ quan cảnh sát đang kiểm tra một đoạn băng video theo dõi, ghi lại một nạn nhân bị tấn công nhưng đáng tiếc là kẻ tấn công đã giấu mặt trong khi gây án. Trong trường hợp này cơ quan cảnh sát mong muốn giải quyết vấn đề bằng đưa ra câu hỏi truy vấn ”Tìm tất cả các đoạn băng video mà có sự xuất hiện của nạn nhân trong vụ tấn công”. Với việc kiểm tra các đoạn băng video, cảnh sát hy vọng có thể thu được một số thông tin bổ ích cho việc nhận dạng kẻ gây án. Đặc biệt là trong trường hợp kẻ gây án có quen biết với nạn nhân. Một kịch bản tương tự cũng có thể nảy sinh trong khi cuộc buôn bán ma tuý đang diễn ra giữa hai tổ chức buôn bán ma tuý. Cũng cần chú ý rằng trong trường hợp trên cảnh sát không đòi hỏi cung cấp các khung (frame) video về các hành động đã xảy ra. Thay vào đó họ yêu cầu các đoạn (segment) video (có lẽ là liên tiếp nhau) trong đó có hành động xảy ra. Điều này đòi hỏi MMDBMS không chỉ có khả năng tìm ra các frame video về các hành động đã xảy ra mà nó còn phải có khả năng tổng hợp các frame này thành những đoạn video liền mạch. Bây giờ chúng ta sẽ thảo luận một vấn đề phức tạp hơn mà cơ quan cảnh sát phải đối phó. Mỗi một vấn đề đặt ra ở trên chỉ tiếp cận với một hình thức dữ liệu riêng lẻ. Mặc dù khái niệm về dữ liệu đa phương tiện đã trở nên phổ biến thông qua các dữ liệu nghe nhìn nhưng chúng ta phải biết rằng dữ liệu đa phương tiện không phải chỉ có dữ liệu tiếng nói và dữ liệu audio mà còn rất nhiều kiểu dữ liệu khác như các dữ liệu dạng các ghi chú, dữ liệu văn bản, dữ liệu quan hệ, dữ liệu về địa lý, các bản đồ địa hình, các mô hình không gian 3 chiều… Do vậy một truy vấn phức tạp hơn là việc trộn và tìm ra dữ liệu tương tự từ các nguồn khác nhau. Làm được điều đó sẽ cho phép cơ quan cảnh sát đặt ra các yêu cầu tiếp cận các nguồn dữ liệu tập trung trong các gói dữ liệu phức tạp và trên các phương tiện (media) khác nhau sử dụng các kỹ thuật lưu trữ khác nhau. · Query 1.5 (Simple Heterogeneous Query) Giả sử rằng cơ quan cảnh sát đưa ra một vấn đề ”Tìm tất cả những tù nhân đã bị kết án về tội mưu sát tại Mỹ và những người này trong thời gian gần đây đã thực hiện việc chuyển tiền điện tử từ ABC Corp vào tài khoản riêng của họ”. Xét bề ngoài của yêu cầu trên có vẻ như đây không có gì khác biệt với các truy vấn thông thường. Trước hết, nó chỉ bao hàm việc xử lý các câu truy vấn dựa vào các CSDL văn bản chuẩn ban đầu. Nhưng đáng tiếc là thực tế không phải như vậy, bất kỳ ai trong cơ quan pháp luật đều hiểu rằng giải quyết vấn đề trên là một công việc hết sức khó khăn. Lý do thứ nhất là để tìm được những người đã chuyển tiền điện tử từ ABC Corp vào tài khoản ngân hàng của họ thì phải đủ khả năng giám sát các hoạt động chuyển tiền điện tử của ABC Corp. Thực tế là ABC Corp có tài khoản trong hàng trăm ngân hàng trên khắp thế giới. Nếu nhìn nhận một cách lạc quan, chúng ta giả sử rằng cảnh sát đã có trong tay danh sách tài khoản của ABC Corp trong các ngân hàng trên khắp thế giới, hơn nữa, họ có quyền giám sát các giao dịch về tài chính liên quan đến các tài khoản này. Tuy nhiên các ngân hàng này có thể nằm rải rác trên khắp thế giới và một điều chắc chắn là các ngân hàng khác nhau sẽ xây dựng các báo cáo về các giao dịch đáng ngờ dưới các hình thức khác nhau. Việc thu thập danh sách tài khoản nhận tiền của ABC Corp từ các báo cáo của những ngân hàng này đòi hỏi khả năng tự động xử lý báo cáo với định dạng khác nhau. Thứ hai, nhiệm vụ còn lại là xác định những ai đã nhận tiền từ . ảnh. Trong trường hợp này truy vấn được thực hiện bằng việc sử dụng thông tin văn bản đã biết trước về các bức ảnh khác nhau trong thư viện ảnh để tìm ra một bức ảnh có kết hợp ghi chú bằng. sang tài khoản của John Smith có thể là một tư liệu có giá trị. Nó có ý nghĩa vì Jose Orojuelo là một người đứng đầu nhóm buôn bán thuốc phiện tại Cali và John Smith là một quan chức cao cấp. chỉ có khả năng tìm ra các frame video về các hành động đã xảy ra mà nó còn phải có khả năng tổng hợp các frame này thành những đoạn video liền mạch. Bây giờ chúng ta sẽ thảo luận một vấn đề