Hệ thống truy xuất thụng tin (IR)

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Thu thập và tổ chức các đoạn video clip nhằm phát huy trí tuệ cho học sinh trung học phổ thông Luận văn ThS. Công nghệ thông tin (Trang 26)

1.6 .Tỡm kiếm dữ liệu đa phƣơng tiện

1.6.1 Hệ thống truy xuất thụng tin (IR)

Ngoài cỏc DBMS , cú loại hệ thụ́ng quản lý thụng tin khỏc tập t rung vào việc truy xuất tài liệu văn bản. Loại hệ thống này được gọi là hệ thống truy xuất thụng tin IR (Information Retrieval). Kỹ nghệ IR khỏ quan trọng trong hệ thống quản lý thụng tin đa phương tiện vỡ hai lý do chớnh. Một là chỳng tồn tại một lượng lớn cỏc văn bản trong nhiều dạng tổ chức , vớ dụ như cỏc thư viện . Văn bản là một nguụ̀n thụng tin quan trọng trong bất kỳ một tổ chức nào. Để sử dụng cỏc thụng tin đó được lưu trữ trong cỏc tài liệu này, cần cú một hệ thống IR hiệu quả. Hai là, văn bản cú thể được sử dụng để chỳ giải cỏc truyền thụng khỏc như õm thanh , hỡnh ảnh , video. Thụng thường thỡ cỏc kỹ nghệ IR cú thể dược sử dụng cho việc phu ̣c hồi thụng tin đa truyền thụng . Tuy nhiờn, việc sử dụng chỉ để xử lý dữ liệu truyền thụng phải tuõn theo cỏc giới hạn sau:

 Văn bản chỳ giải chưa đầy đủ và cũn mang tớnh chủ quan.

 Cỏc kỹ nghệ IR khụng thể điều khiển cỏc cõu hỏi từ cỏc dữ liệu khỏc (như õm thanh và ảnh).

 Một vài đặc tớnh của đa phương tiện như bố cục hỡnh ảnh và cỏc dạng đối tượng là khỏc nhau, nếu khụng thỡ cũng chỉ là cựng mụ tả một văn bản.

Từ nhận xột trờn, người ta thấy rằng cỏc DBMS và IR khụng thể đỏp ứng đầy đủ cỏc yờu cầu về chỉ số hoỏ và truy xuất đa phương tiện , vỡ vậy cần cú cỏc cụng nghệ mới để vận dụng những đặc trưng riờng của đa phương tiện. Tuy vậy, vẫn nhận thấy rằng cỏc DBMS và IR vẫn đúng vai trũ quan trọng trong cỏc MDBMS. Cỏc phần của dữ liệu đa phương tiện như ngày và tỏc giả tạo lập của tài liệu đa phương tiện là cú cấu trỳc. Dữ liệu cú kết cấu này cú thể được điều khiển bằng cỏc kỹ nghệ DBMS. Văn bản chỳ giải vẫn là phương phỏp hiệu lực trong việc ghi lại nội dung.

Túm lại, một cỏch tiếp cận tớch hợp tổ hợp cỏc DBMS với IR, và cỏc kỹ thuật đặc tả để xử lý dữ liệu đa phương tiện được đũi hỏi để phỏt triển MIRS hiệu quả và cú hiệu lực.

1.6.2 Hệ thống truy xuất thụng tin đa phƣơng tiện MIRS

Sự cần thiết đối với MIRS (Multimedia Information Retrieval System) cú thể được giải thớch bằng ba yếu tố sau: trước hết, dữ liệu đa phương tiện đang được dựng ngày càng nhiều và đang được chỳ ý. Để sử dụng thụng tin đú (chứa trong dữ liệu đú), đũi hỏi cú một hệ thống truy xuất và chỉ số hoỏ hiệu quả và cú hiệu lực. Thứ hai, dữ liệu đa phương tiện cú những đặc tớnh và những yờu cầu đặc biệt khỏc nhau đỏng kể so với số liệu bảng chữ cỏi. Bởi vậy, DBMS truyền thống khụng thớch hợp cho việc xử lý dữ liệu đa phương tiện. Thứ ba, mặc dự cỏc kỹ thuật IR cú thể giỳp chỳng ta trong việc truy xuất multimedia nhưng chỉ một mỡnh chỳng thỡ chưa đủ để xử lý dữ liệu multimedia một cỏch cú hiệu quả [18].

Cỏc mục thụng tin trong cơ sơ dữ liệu đó được xử lý trước để rỳt ra cỏc đặc trưng và nội dung ngữ nghĩa, được chỉ rừ dựa trờn cỏc đặc trưng và ngữ nghĩa này. Trong suốt quỏ trỡnh phục hồi thụng tin, một cõu hỏi của người sử dụng được xử lý và đặc điểm chớnh được rỳt ra. Cỏc đặc trưng này sau đú được chuẩn bị cựng với cỏc đặc trưng của mỗi mục thụng tin trong cơ sở dữ liệu. Cỏc đặc trưng của mục thụng tin hầu hết đều tương đồng để cỏc cõu hỏi được gọi ra trước người sử dụng.

Hỡnh 1.9. Một mẫu truy xuất thụng tin tổng quỏt

Cú rất nhiều ấn bản đuợc viết theo mẫu trờn trờn. Vớ dụ, cỏc mục thụng tin cú thể được kết nối bất kỳ với cỏc loại truyền thụng. Làm thế nào để rỳt ra được những đặc trưng từ cỏc tin tức truyền thụng này? Phải lưu và xõy dựng được cỏc đặc trưng này như thế nào để việc truy tỡm cú hiệu quả? Phải đo độ “ tương đồng” như thế nào giữa hai tin tức truyền thụng? Cần phải làm gỡ để giao diện sử dụng cú thể đảm nhận được những cõu hỏi phức tạp , rối rắm, linh hoạt? Phải so sỏnh như như thế nào về việc biểu diễn cỏc quỏ trỡnh truy tỡm giữa cỏc MIRS khỏc nhau? Làm thế nào để đáp ứng cỏc yờu cầu tạm thời trong suốt quỏ trỡnh truyền và biểu diễn dữ liệu đa phương tiện?

MIRS được cho rằng hiệu quả và linh hoạt. Khả năng của nú được mimh hoạ trờn cỏc dạng cõu hỏi mà chỳng cú thể hỗ trợ. Cỏc kiểu cõu hỏi mong đợi cú dạng sau:

1. Cõu hỏi dựa trờn metadata: Đõy là cõu hỏi chỉ ra những thuộc tớnh thụng thường của cỏc mục cơ sở dữ liệu như tờn tỏc giả và ngày tạo lập. Mụ ̣t vớ dụ là cõu hỏi theo yờu cầu trờn video (VOD) cú thể là “liệt kờ tờn cỏc phim được sản xuất vào năm 1997”. Loại này được vận dụng bằng DBMS.

2. Cõu hỏi dựa trờn chỳ giải: Đõy là cõu hỏi chỉ ra cỏc mụ tả dạng văn bản trong nội dung của cơ sở dữ liệu . Cỏc cõu hỏi đều ở trong từ khoỏ hoặc trong phần văn bản miễn phớ và việc truy tỡm dựa trờn sự tương đồng giữa cõu hỏi và phần chỳ giải . Vớ dụ, cõu hỏi cú thể là “chỉ ra phõn đoạn quay video khi người đàn ụng đang

chạy”. Loại cõu hỏi giả định này được chỳ giải thớch đỏng và xử lý bởi kỹ nghệ IR.

3. Cõu hỏi dựa trờn mẫu dữ liệu hoặc tớnh năng: Đõy là cõu hỏi chỉ ra thụng tin dạng thống kờ, như: õm thanh, mầu sắc, độ mịn. Một vớ dụ: “Chỉ ra cảnh video với sự phõn bổ màu như THIS”. Để trả lời dang cõu hỏi này, thụng tin liệt kờ về mục cơ sở dữ liệu nờn được sưu tập trước và lưu trữ.

4. Cõu hỏi dựa theo thớ dụ: Đõy là cõu hỏi trong cỏc đối tượng đa truyền thụng như hinh ảnh, phỏc thảo, đoạn õm thanh. Vớ dụ: “chỉ ra một bộ phim mà cú cảnh tương tự như bức tranh này”. Loại cõu hỏi này cú thể bị làm rối lờn bởi mối liờn hệ về khụng gian và thời gian giữa cỏc đối tượng.

5. Cỏc cõu hỏi dạng chuyờn: Cỏc cõu hỏi dạng chuyờn cú rất nhiều loại. Vớ dụ, cõu hỏi dựa trờn thụng tin chi tiết và cụ thể như kớch cỡ 1 đối tượng và quỏ trỡnh già hoỏ của 1 người.

Cỏc MIRS được mong mỏi cú thể đưa ra nhiều loại cõu hỏi khỏc nhau, do đú cú ứng dụng rộng rói, bao gồm:

 Y tế. Một bỏc sĩ đưa ra ảnh chụp súng siờu õm mới và muốn tỡm lại ảnh với mức độ cú thể so sỏnh được của sự phỡnh tõm thất trỏi từ một ảnh chụp siờu õm cơ sở.

 Bảo mật. Một cảnh sỏt đưa ra hệ thống với một bức tranh vẽ mặt người và muốn phục hồi lại những hỡnh ảnh khỏc vào hồ sơ hiện thời của những người giống với bức tranh này từ cơ sở thụng tin bảo mật.

 Giỏo dục. Một sinh viờn quột chụp một tranh động vật và muốn truy tỡm tất cả cỏc thụng tin khỏc về con vật (bao gồm õm thanh, hỡnh ảnh, văn bản mụ tả). Tiếp theo, một sinh viờn khỏc thờm õm thanh cho con vật và muốn khụi phục lại bức tranh và thụng tin mụ tả loại động vật này.

 Bỏo chớ. Một bỏo cỏo viờn viết một bài bỏo về một người và muốn truy tỡm bức tranh của người đú và cỏc thụng tin tổng hợp đó xuất hiện trờn cỏc bỏo và tivi 20 năm trước

 Giải trớ . Một quan sỏt viờn muốn truy tỡm một đoa ̣n băng tương tự với những gỡ mà anh ta đó xem trờn một cơ sơ dữ liệu video lớn hơn.

 Đăng ký nhón hiệu. Một cỏn bộ gia cụng một nhãn hiệu đăng ký nào đú muốn quyết đinh xem đó cú một nhón hiệu nào trước đú giống như vậy đó được đăng ký chưa. Để làm điều này, anh ta cần một cơ sở dữ liệu về nhón hiệu để so sỏnh cỏc nhón hiệu giống nhau nhất hiện cú để làm ra một nhón hiệu hoàn toàn mới.

Cuối cựng, cỏc MIRS sẽ tập trung vào chớnh thụng tin thay thế cỏc loại truyền thụng và việc miờu tả chỳng cú thể được sắp xếp hoặc dịch ra từ loại truyền thụng này đến loại truyền thụng khỏc . Vớ dụ, một video tài liệu cần phải được sử dụng video, hỡnh ảnh, văn từ, õm thanh, lời núi và những thứ tương tự như vậy. Vỡ vậy phương tiện dũ tỡm phải kết nối cỏc cõu hỏi (dữ liệu) với cỏc mục cơ sở dữ liệu.

Cỏc loại truyền thụng khỏc nhau cần cỏc kỹ nghệ phục hồi và cỏch biểu thị khỏc nhau. Cỏc kỹ nghệ khỏc nhau được sử dụng cho từng loại truyền thụng khỏc nhau. Người sử dụng cú thể thấy thớch những thụng tin xỏc đỏng mà bất chấp sự khỏc nhau về cỏc loại truyền thụng. Vấn đề là làm thế nào để tớch hợp được cỏc loại kỹ nghệ khỏc nhau để truy tỡm thụng tin cần tỡm trong việc trả lời cỏc cõu hỏi của người sử dụng. Cú rất nhiều cỏc ấn phẩm được viết để giải quyết vấn đề này, như ghi rừ cõu hỏi và xử lý, khoản phụ cấp thờm tương xứng, ghộp cỏc miờu tả đối tượng.

Để việc truy tỡm cú hiệu quả , cần cú một cṍu trỳc cỏc khoản mục hợp lý . Bởi vỡ cỏc vector đặc tớnh đều đa dạng về kớch cỡ và việc truy tỡm cỏc khoản mục trong cỏc MIRS dựa trờn sự tương đồng thay cho việc kết nụ́i chớnh xỏc , cấu trỳc mục lục được sử dụng trong cỏc DBMS khụng thớch hợp với cỏc MIRS. Khuynh hướng của cỏc yờu cầu bao gồm hệ số trễ và độ giật , gọi là chất lượng dịch vụ (QoS), cõ̀n cú trong việc truyền và mụ tả dữ liệu truyền thụng.

Trong cỏc DBMS, tiến hành chớnh liờn quan đến hiệu quả (thời gian trả lời cõu hỏi). Nú rất quan trọng bởi kớch cỡ lớn của đa phương tiện. Ngoài ra, hiệu quả truy tỡm cũng rất quan trọng (khả năng truy tỡm cỏc mục thớch hợp và khả năng loại bỏ cỏc mục khụng cần đến). Bởi cỏc MIRS truy tỡm cỏc mục chọn dựa trờn cơ sở đo sự tương đồng , sử dụng luật tương ứng thay thế cho kết nối chớnh xỏc. Trừ khi nú trở nờn quỏ khú đối với việc thiết kế cỏc độ đo tương đồng

thỡ cần xỏc định một cách chớ nh xỏc bằng úc phỏn đoỏn của con người, giống như một vài khoản mục được hệ thống xỏc định là thớch hợp nhưng người dựng lại cho là khụng thich hợp và một số mục thớch hợp lại khụng được truy xuất.

1.7. Kết luận chương 1

Trong chương 1 của luận văn, tỏc giả đó tỡm hiểu và làm rừ cỏc vấn đề sau:  Khỏi niệm dữ liệu đa phương tiện, cỏc loại dữ liệu đa phương tiện

và một số đặc tớnh chung của dữ liệu đa phương tiện;

 Giới thiệu về dữ liệu hỡnh động và quỏ trỡnh thu nhận dữ liệu hỡnh động cựng với những ưu, nhược điểm của quỏ trỡnh;

 Nờu khỏi niệm cơ sở dữ liệu đa phương tiện, hệ quản trị cơ sở dữ liệu đa phương tiện với cỏc khả năng mụ tả, khai bỏo, tạo lập, lưu trữ, xử lý, truy vấn và kiểm soỏt cỏc loại dữ liệu trong cơ sở dữ liệu đa phương tiện; Bờn cạnh đú chương 1 luận văn cũng chỉ rừ cỏc mục đớch, yờu cầu và cỏc vấn đề của một hệ quản trị cơ sở dữ liệu đa phương tiện;

 Trong chương này, luận văn cũng đó đề cập đến quỏ trỡnh chỉ số húa, trớch rỳt đặc trưng trong cơ sở dữ liệu đa phương tiện, cũng như vấn đề tỡm kiếm dữ liệu đa phương tiện thụng qua hệ thống truy xuất thụng tin đa phương tiện MIRS.

Trờn đõy là những vấn đề quan trọng làm cơ sở cho tỏc giả tỡm hiểu và xõy dựng một cơ sở dữ liệu video phục vụ cho quỏ trỡnh dạy và học trong nhà trường mà sẽ được tỏc giả đề cập trong chương 3 của luận văn. Chương 2 của luận văn tỏc giả sẽ nghiờn cứu và đỏnh giỏ những tỏc động của đa phương tiện đối với hoạt động dạy và học trong trường phổ thụng, đặc biệt là vai trũ của đa phương tiện trong việc phỏt huy năng lực sỏng tạo, từ đú giỳp phỏt triển trớ tuệ cho học sinh.

Chƣơng 2

VAI TRề CỦA ĐA PHƢƠNG TIỆN ĐỐI VỚI HỌC SINH

2.1 Nhu cầu phỏt triển trớ tuệ học sinh

2.1.1 Khỏi niệm trớ tuệ và phỏt triển trớ tuệ

Khỏi niệm trớ tuệ (intellect) xuất phỏt từ tiếng Latin dựng để chỉ năng lực chung, nú tạo ra và sử dụng những tri thức nhờ hiểu biết và tư duy trong cỏc quan hệ. Năng lực trớ tuệ (intellectual capability) là phức hợp cỏc năng lực giỳp cho mỗi cỏ nhõn cú khả năng làm việc và đạt những mục tiờu đề ra. Đặc trưng của trớ tuệ khụng chỉ nằm ở nội dung cỏi được phản ỏnh (những tỏc động từ thế giới khỏch quan được chủ thể tiếp nhận, làm giàu cú vốn nhận thức và nhõn cỏch) mà cũn gắn với phương thức phản ỏnh (cỏch, phương phỏp tiếp nhận cỏc tỏc động từ thế giới quan).

Theo định nghĩa trong từ điển tõm lý học của Ray Corsini (xuất bản năm 2002 tại New York) thỡ trớ tuệ (intellect) là chức năng nhận thức của trớ úc, nú bao gồm cả khả năng suy luận, hỡnh thành quan niệm, phỏn xột và liờn kết; Trớ thụng minh là khả năng nhận biết, phõn biệt cỏc đối tượng một cỏch minh bạch, sỏng suốt, đỳng đắn, hợp với chõn lý khỏch quan của mỗi người mà khụng bị bế tắc, trở ngại. Như vậy, xột về mặt bản chất, trớ tuệ và trớ thụng minh cựng chỉ khả năng nhận biết hiện thực và thớch nghi với hiện thực. Trớ tuệ dựng với nghĩa khỏi quỏt cao nhất năng lực này của con người, trớ thụng minh cụ thể hơn.

Khi đề cập đến trớ thụng minh người ta thường hay xột tới trớ thụng minh IQ và trớ thụng minh cảm xỳc EI (Emotional Intelligence). Theo thuyết đa trớ thụng minh của nhà tõm lý học Howard Gardner, trớ thụng minh IQ gồm tỏm kiểu thụng minh khỏc nhau [8]:

 Thụng minh ngụn ngữ: Là khả năng suy nghĩ bằng từ ngữ và vận dụng ngụn ngữ để diễn tả những khỏi niệm phức tạp. Sự thụng minh này cho phộp con người hiểu được trật tự, ý nghĩa của từ, học ngữ phỏp rất nhanh và ỏp dụng cỏc kỹ năng ngụn ngữ thành thạo.  Trớ thụng minh về logic toỏn học: Là khả năng tớnh toỏn, xỏc định

số lượng, cõn nhắc cỏc giả thuyết và thực hiện những hoạt động toỏn học hoàn hảo. Những cỏ nhõn bộc lộ năng khiếu về toỏn học thường liờn quan đến khả năng tư duy xử lý những bài toỏn, những phương trỡnh thường gặp trong bài toỏn trắc nghiệm.

gồm trớ tưởng tượng, suy luận trong khụng gian, vận dụng hỡnh ảnh, cỏc kỹ năng đồ họa và nghệ thuật.

 Thụng minh về õm nhạc: Là khả năng cảm nhận độ cao, thấp, nhịp điệu, õm sắc hay núi chung là nhạy cảm với cỏc kiểu loại õm thanh.  Thụng minh về cơ thể, cử chỉ, vận động: Là khả năng vận động và

dựng rất nhiều kỹ năng đa dạng của cơ thể. Nú bao gồm khả năng điều khiển hoàn hảo những cử động của mỡnh, gồm cả cảm giỏc về tớnh toỏn thời gian và sự kết hợp giữa tõm trớ và cơ thể.

 Thụng minh về xó hội, giao tiếp giữa con người: Là khả năng hiểu và tương tỏc hiệu quả với người khỏc, bao gồm khả năng giao tiếp hiệu quả bằng lời, khả năng nhận biết sự độc đỏo của mỗi người, nhạy cảm với tõm trạng của người khỏc. Người sở hữu trớ thụng minh kiểu này cú khả năng thấu cảm tõm lý của người khỏc.

 Trớ thụng minh về nội tõm: Là khả năng hiểu được bản thõn một cỏch sõu sắc, hiểu những suy nghĩ, cảm xỳc của bản thõn và sử

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Thu thập và tổ chức các đoạn video clip nhằm phát huy trí tuệ cho học sinh trung học phổ thông Luận văn ThS. Công nghệ thông tin (Trang 26)

Tải bản đầy đủ (PDF)

(81 trang)