Bài viết Đánh giá chất lượng luật quyết định đa trị dựa trên tiếp cận hàm ý thống kê giới thiệu một tiếp cận mới trong việc đánh giá chất lượng luật quyết định đa trị dựa trên phân tích hàm ý thống kê (statistical implicative analysis).
Kỷ yếu Hội nghị Quốc gia lần thứ VIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ Phan Tấn Tài1, Lê Đức Thắng1, Huỳnh Xuân Hiệp1,2 Khoa Công nghệ Thông tin & Truyền thơng, Trường Đại học Cần Thơ Nhóm nghiên cứu liên ngành DREAM-CTU/IRD, Trường Đại học Cần Thơ pttai@ctu.edu.vn, ldthang@ctu.edu.vn, hxhiep@ctu.edu.vn TĨM TẮT - Trong viết chúng tơi giới thiệu tiếp cận việc đánh giá chất lượng luật định đa trị dựa phân tích hàm ý thống kê (statistical implicative analysis) Nghiên cứu xem xét hệ thống thông tin định đa trị (set-valued decision information system) với tập luật định đa trị sinh tương ứng Từ đây, tập luật định đa trị phân tích đánh giá chất lượng sở phân tích hàm ý thống kê Với kết đánh giá chất lượng tập luật định đa trị, luật định đa trị xếp theo mức độ ưu tiên khác dựa độ đo số hàm ý (implication indice) cường độ hàm ý (implication intensity) Các kịch thực nghiệm luật định đa trị tốt, luật định đa trị chưa tốt vai trò luật định đa trị Đây vấn đề mà mơ hình luật định đa trị trước chưa thể Từ khóa - Hệ thống thơng tin đa trị, lớp tương đồng tối đại, luật định đa trị, hàm ý thống kê I GIỚI THIỆU Lý thuyết tập thô (rough sets theory) [2][3][15] cơng cụ phân tích liệu hiệu quả, sử dụng mơ hình đại diện thuộc tính-giá trị để mơ tả phụ thuộc thuộc tính đánh giá ý nghĩa thuộc tính với luật định Ngồi ra, sinh luật hệ thống thơng tin không đầy đủ (rules in incomplete information systems) [11], kỹ thuật khối thích hợp tối đại cho việc sinh luật hệ thống thông tin không đầy đủ (maximal consistent block technique for rule acquisition in incomplete information systems) [12], tập thơ nghiên cứu để phân tích định đa tiêu chí (rough sets theory for multicriteria decision analysis) [6] nghiên cứu có nhiều ứng dụng đem lại hiệu định Đặc biệt có nhiều tiếp cận việc sinh luật định đa trị hệ thống thông tin định đa trị [7][10] xuất thời gian gần Lý thuyết tập thô cổ điển dựa mối quan hệ không phân biệt nghiên cứu chủ yếu dựa hệ thống thông tin đầy đủ Tuy nhiên, số đặc điểm thuộc tính hệ thống thơng tin đa giá trị Hơn nữa, thuộc tính đơi có miền trị có thứ tự thứ tự đặc điểm thuộc tính đóng vai trị quan trọng [17] Ngoài ra, mối quan hệ ngữ cảnh hình thức hệ thống thơng tin đa trị ngữ cảnh chuyển đổi thành hệ thống thông tin đa trị giá trị [15] Ở khía cạnh khác, quan hệ mờ hệ thống thông tin đa trị (Fuzzy Set-valued Information Systems (FSVISs)) đề cập đến [18] Điều này, cho ta thấy nhiều khía cạnh khác lý thuyết tập thô, vấn đề hệ thống thông tin đa trị luật định đa trị nghiên cứu mạnh mẽ Tuy nhiên, Hiện luật định đa trị sinh từ hệ thống thông tin định đa trị chưa đánh giá chất lượng, “Vai trò” luật định đa trị Nói cách khác chưa xem xét độ đo “hấp dẫn” cần thiết cho luật định đa trị, để từ đánh giá chất lượng, vai trò khuynh hướng khách quan tập luật định đa trị Trong viết này, đề xuất tiếp cận việc đánh giá chất lượng luật định đa trị dựa tiếp cận hàm ý thống kê [4][5] Phân tích hàm ý thống kê (Statistical Implicative Analysis – SIA) đề xuất Gras [4][5], nhằm phát khuynh hướng tập hợp thuộc tính SIA cung cấp phương pháp để đánh giá độ hấp dẫn luật cấu trúc chúng việc khám phá mối quan hệ luật mức độ hàm ý khác Để đánh giá chất lượng luật định đa trị, hệ thống thông tin định đa trị tập luật định đa trị chuyển dạng thức phân tích xếp theo mức độ ưu tiên phân tích hàm ý thống kê Bài viết gồm phần: phần thứ giới thiệu tổng quan, phần thứ hai trình bày luật định đa trị, phần thứ ba giới thiệu hàm ý thống kê, phần thứ tư trình bày mơ hình đánh giá chất lượng luật định đa trị, phần thứ năm giới thiệu thực nghiệm sau phần kết luận 120 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ II LUẬT QUYẾT ĐỊNH ĐA TRỊ A Các hệ thống thông tin Hệ thống thông tin đơn trị hệ thống thông tin đa trị Một hệ thống thông tin định nghĩa gồm bốn , , , , đó, O tập hữu hạn khơng rỗng gồm N đối tượng , , … , }, tập hữu hạn khơng rỗng gồm n thuộc tính }, , , … , với V miền giá trị thuộc tính , : → hàm thơng tin, nghĩa , , với ∈ ∪ ∈ Nếu ứng với đối tượng x , , , , thuộc tính ∈ tương ứng hệ thống thơng tin , , , có giá trị (a unique attribute value) , , , gọi hệ thống thông tin đơn trị (a singlevalued information system) ngược lại , , , gọi hệ thống thông tin đa trị (Set-valued (multi-valued) information system) [7][13][14] Ví dụ xem xét tập liệu đơn giản cho bảng 1, tập O, AT, V, f xác định sau: 0, 1, 2} (các giá trị cột bảng 1), 1, 0, 2} (các giá O= , , , , }, AT= , , , }, trị thuộc tính bảng 1),…và 0, , , Bảng Hệ thống thông tin đơn trị , , , , , gồm đối tượng 0 2 1 1 , , , } thuộc tính { , , , } 1 2 Hệ thống thông tin đầy đủ hệ thống thông tin không đầy đủ Xét hệ thống thông tin , , , , miền giá trị thuộc tính chứa ký hiệu đặc biệt * để giá trị thuộc tính khơng biết Miền giá trị thuộc tính khác với ký hiệu đặc biệt * gọi miền giá trị thuộc tính quy Một hệ thống thơng tin mà miền giá trị thuộc tính quy gọi hệ thống thông tin đầy đủ (complete information system), ngược lại gọi hệ thống thơng tin khơng đầy đủ (incomplete information system) [11] Ví dụ xét hệ thống thông tin , , , trường hợp hệ thống thông tin không đầy đủ Bảng Hệ thống thông tin không đầy đủ , , , * * 0, 1, 3,∗} nên cho bảng 2, , gồm đối tượng 4 1 2 * 1 , , , , , } thuộc tính , , , , , } Quan hệ không phân biệt Xét hệ thống thông tin đơn trị đầy đủ , , , ) ⊆ , quan hệ khơng phân biệt (indiscernibility relation) [11], ký hiệu định nghĩa: , ∈ /∀ ∈ , , } Với ⊆ , quan hệ tương } ta có , , } Ví dụ xét bảng 1, , , tập đối tượng có quan hệ khơng phân biệt với ∈ đương phận Nếu gọi Theo bảng 1, với , , }, ta có , } / , ∈ }, hiển nhiên ∈ Xét hệ thống thông tin không đầy đủ , , , ) ⊆ , quan hệ tương tự (similarity relation) [11], ký hiệu định nghĩa: , ∈ /∀ ∈ , , , | , ∗ , } Nếu gọi tập đối } ta có , , | , ∗} Ví dụ từ bảng 2, , , ∈ / , ∈ } Theo bảng 2, với }, ta có tượng có quan hệ tương tự với , , ∈ , } , B Hệ thống thơng tin định đa trị Hệ thống thông tin định đa trị 4: , ∪ }, , [7] Trong đó: tập hợp hữu hạn khác rỗng đối tượng, tập hợp hữu hạn khác rỗng thuộc tính điều kiện, thuộc tính định, ∪ , với hợp miền giá trị thuộc tính điều kiện, miền giá trị thuộc tính định, ∩ } ∅, Phan Tấn Tài, Lê Đức Thắng, Huỳnh Xuân Hiệp 121 ánh xạ từ ∪ } đến cho: : ánh xạ đơn trị, ∀ ∈ : , : }→ → 2| | ánh xạ đa trị, ∀ ∈ , ∈ ∶ , , Một hệ thống thông tin định đa trị trình bày dạng bảng, cịn gọi bảng định đa trị Ví dụ hệ thống thông tin định đa trị minh họa bảng bên Bảng Hệ thống thông tin định đa trị gồm 10 đối tượng , , , thuộc tính định {1} {0,1} {0} {0} {2} {0,2} {1} {0} {1} {1} {0,1} {2} {1,2} {1} {1} {1} {0,2} {2} {0,1} {1} {0} {1,2} {1} {1} {0,1} {0,1} {0,1} {1} {0,2} {2} }, thuộc tính điều kiện {1,2} {0} {0,1} {1} {0} {0} {1} {0} {1} {0,1} {2} {0} {0} {0, 2} {1} {1} {2} {0,1} {2} {2} , ,…, } 1 2 3 C Lớp tương đồng Trong hệ thống thông tin định đa trị , ∪ }, , , với thuộc tính ∈ quan hệ tương đồng , / , ∈ : ∩ ∅} Với tập hợp thuộc tính theo b ký hiệu định nghĩa sau: , / , ∈ ⋀ ∀ ∈ : ∩ ∅} điều kiện ⊆ quan hệ tương đồng theo B định nghĩa: ⋂ ∈ Khi , ∈ người ta nói x tương đồng với y theo B, ký hiệu [7] Trong hệ thống thông tin định đa trị , ∪ }, , / ∈ , ∀ ∈ : ∩ ∅} lớp tương đồng ∈ Theo bảng 1, gọi , , , }, } , y ∈ O / , ta định nghĩa [7] dựa tập thuộc tính điều kiện ⊆ ta có , }, , , , }, }, , , , }, , } , }, D Lớp tương đồng tối đại Các khái niệm Khi lớp tương đồng theo ∀ ∈ \ tồn ∈ gọi lớp tương đồng tối đại (maximal tolerance class) theo phủ : đồng tối đại theo ⋃ ∈ cho y không tương đồng với x theo [7] Nếu gọi tập hợp tất lớp tương Lớp tương đồng tối đại có đặc trưng sau: xét tập hợp lớp tương đồng tối đại Giả sử có thuộc , , … , } Đặc trưng lớp tương đồng tối đại ∈ định nghĩa sau: tính ,⋂ ∈ , ,⋂ ∈ } Đặc trưng lớp tương đồng tối đại mô tả giá trị chung thuộc tính ⋂ ∈ điều kiện đối tượng thuộc lớp tương đồng tối đại Giải thuật phân lớp tương đồng tối đại Chúng đề xuất giải thuật phân lớp tương đồng tối đại sau: • • • Dữ liệu đầu vào: hệ thống thông tin định đa trị gồm 4: , ∪ }, , Trong đó: tập hợp hữu hạn khác rỗng gồm đối tượng, tập hợp hữu hạn khác rỗng thuộc tính điều ∪ , với hợp miền giá trị thuộc tính điều kiện, thuộc tính định, ∩ } ∅, miền giá trị thuộc tính định, ánh xạ từ ∪ } đến cho: : → 2| | kiện, ánh xạ đơn trị ánh xạ đa trị : }→ Dữ liệu đầu ra: lớp tương đồng tối đại 1, 2, … Giải thuật: 1; Với ∈ , ta thực sau: ∗ Khởi tạo: { } // lớp tương đồng tối đại chứa ; {Giá trị tương đồng }= , / ∀ ∈ } } ∗ Với ∈ 1, 2, , ∧ ∉ Nếu ∀ ∈ , ∀ , ∈ : , ⋂ , ∅ }; , ⋂ , / ∀ ∈ , ∀ , ∈ }; } { 122 ĐÁNH GIÁ Á CHẤT LƯỢNG G LUẬT QUYẾT T ĐỊNH ĐA TRỊ DỰA TRÊN TIẾ ẾP CẬN HÀM Ý THỐNG KÊ ∗ Ngược lạại bỏ qua Nếu ( ,∀ :1 ( lớ ớp tương đồng g tối đại xáác định trước đđó)) { Ghi nhậận N là một llớp tương đồng đối đại; 1} 3 Ví dụ minhh họa giải thuậật phân lớp tươ ơng đồng Xét hệ thống thông ttin định đa trị ch ho bảng g 3, kết ápp dụng giải thuuật phân lớp tương đồng cho c lớp tươn ng đồng tối đạii bảng Bảng Kết quuả phân lớp tươ ơng đồng tối đạii đặc trưnng tương ứng Lớp tương đđồng tối đại , , , , , Đặc trưng , } , } } } } 0 2 1 1 {0, 1} 1 0 1⋁2 2⋁3 III HÀM M Ý THỐNG G KÊ A A Khái niệm hàm ý thốống kê Phân tícch hàm ý thốnng kê cung cấpp phương g pháp để đánh h giá độ hấp ddẫn luuật cấu trúc chúng trrong việc kháám phá mối quuan hệ luậật mức độ đ khác Gọi tập gồm n đối tượợng mô tả tập hữu hạnn biến (thhuộc tính) Vớ ới ∈ , ∈ , giá trrị đối tượợng biến ký hiệu a(x) Trường T hợp ta nóii đối tượng thỏa biến Vấn đề đặt là: "có thể tin đến m mức độ để biến b biến a làà đúng"? Nóii cách khác, làm n để biết cácc đối tượng ∈ có thỏa bbiến b hay khô ông biết rằằng đối tượợng thỏa bbiến a Một cáách trực quann, xxét A ⊂ O o cho } Gọi ), ; gọi , lư ượng ngẫuu nhiên theo , , ⋀ / ⋀ ⋂ }, B ⊂ O saao cho Khi đó, Luật → / định Hình Biểuu diễn tập đối tượng dựa trêên tiếp cận hàm m ý thống kê Trong trường t hợp A ⊂ B → Tuy T nhiên tron ng thực tế kháá phổ biến vài đối tượng t thỏa biến b a khơng k thỏa biếến b luật → cần xem xét Luật → chho cchấp nhận với ngưỡng g cho trướcc xác suấất xuất trường hợp ⋂ lớ ớn ⋂ nhỏ hơ ơn [4][5], với hai tập , llần lượt có số phần tử , tương ứng ứ Nghĩa là: Pr ⋂ ⋂ B B Chỉ số hàm m ý cường độ hàm ý Chỉ số hàm h ý (impliccation indice) [4][5] → ⋀ , định h nghĩa saau: Cường độ hàm ý (im mplication intennsity) [4][5] luật → định ngghĩa là: , , IV MƠ Ơ HÌNH ĐÁN NH GIÁ CHẤT LƯỢNG LUẬT L QUYẾ T ĐỊNH ĐA TRỊ A A Biểu diễn luật l địn nh đa trị ⊂ ⋁∈ Trong m hệ thống tthông tin quyếết định đa trị , ∪ } Khi ta đặt /∃ ∈ , K đó: , làà luật quyyết định xác định [7] }, , , với ∈ →⋁∈ lớpp tương đồng tối t đại theo , hay ⋀ ∈ ,⋂ ∈ → Phan Tấn Tài, Lê Đức Thắng, Huỳnh Xuân Hiệp 123 Theo bảng 4, tập luật định đa trị sinh sau: 1,0,0, 1, → , , 0,2,1, 0, → , , 0,1,1, 1, → , ⋁ , , 2,1, 0,1 , 0, → , , 1,1,2, 1,2 → , ⋁ , Sau tách vế phải, tập luật biểu diễn sau: 1,0,0, 1, → , , 0,2,1, 0, → , , 0,1,1, 1, → , , 0,1,1, 1, → , , 2,1, 0,1 , 0, → , , 1,1,2, 1,2 → , , 1,1,2, 1,2 → , B Giải thuật chuyển hệ thống thông tin định đa trị sang dạng nhị phân Để chuyển hệ thống thông tin định đa trị sang dạng nhị phân, đề xuất giải thuật làm tương tự Apriori sau: Dữ liệu đầu vào: hệ thống thông tin định đa trị gồm 4: , , , Trong đó: tập ∪ }, tập hợp hữu hạn khác rỗng thuộc tính điều kiện, hợp hữu hạn khác rỗng đối tượng, ∪ , với hợp miền giá trị thuộc tính điều kiện, miền giá trị thuộc tính định, ∩ } ∅, }→ thuộc tính định, ánh xạ từ ∪ } đến cho: : → 2| | ánh xạ đa trị, : ánh xạ đơn trị Dữ liệu đầu ra: hệ thống thông tin định đa trị nhị phân gồm 4: " "/∀ ∈ ,∀ ∈ tập hợp hữu hạn khác rỗng đối tượng, đến cho: : → ánh xạ nhị phân , , Ta gọi hàm ( ∈ • hàm kiểm tra xem tập giá trị đối tượng , , hay khơng? Khi đó, đượ đị ĩ : , , ∈ }, , , , 0, 1}, thuộc tính ∈ , ế ∈ , ế ∉ Trong đó: ánh xạ từ , , có chứa giá trị Giải thuật: Với đối tượng ∈ , thực hiện: o với thuộc tính ∈ , thực hiện: { với { ∈ , , , cần xét: gán ," " 1, ngược lại gán ," " 0} } C Đánh giá chất lượng luật định đa trị Với luật định đa trị có dạng → định lượng ngẫu nhiên theo , , ⋀ độ đo số hàm ý hay cường độ hàm ý Sau tập luật định lượng ngẫu nhiên độ đo luật xếp theo thứ tự giá trị độ đo từ cao đến thấp, đề xuất chọn luật tốt theo có hai hướng: (i) chọn luật tốt dựa vào ngưỡng cho trước, (ii) chọn m luật có tốt (có giá trị độ đo cao nhất) Ngồi ra, ta xem xét thêm luật cho “xấu nhất”, theo hai hướng: (i) dựa vào ngưỡng cho trước, (ii) lấy k luật có giá trị độ đo thấp D Giải thuật tổng quát đánh giá chất lượng tập luật định đa trị Giải thuật tổng thể đánh giá chất lượng tập luật định đa trị tiến hành sau: i Thực tiền xử lý liệu gốc đưa hệ thống thông tin định đa trị (SDIS) ii Sinh tập luật định đa trị (R) từ SDIS iii Chuyển R sang tập luật định đa trị (R ) cho vế phải có giá trị (tách luật định đa trị có vế phải nhiều giá trị định thành nhiều luật định đa trị mà vế phải có giá trị định tương ứng) iv Chuyển SDIS sang dạng nhị phân SDIS v Chuyển tập luật định đa trị R sang dạng nhị phân (R vi Với luật định đa trị dạng nhị phân: a → b ∈ R ¾ Dựa vào SDIS : thống kê tính: n, n , n n ⋀ ¾ Tính giá trị độ đo số hàm ý giá trị độ đo cường độ hàm ý dựa giá trị n, n , n n ⋀ vii Sắp xếp thứ tự tập luật R dựa giá trị số hàm ý giá trị cường độ hàm ý viii Chọn lọc luật định đa trị tốt dựa ngưỡng β cho trước hay chọn m luật V THỰC NGHIỆM A Bài toán thực nghiệm Vai trị cố vấn học tập (CVHT) trường đại học tư vấn học tập, nghiên cứu khoa học rèn luyện cho sinh viên Tuy nhiên làm để CVHT tư vấn cho tất sinh viên lớp chuyên ngành có hiệu thời gian nhất, vấn đề cấp thiết đặt Một giải pháp đề xuất tổ chức mơ hình tư vấn học tập nhóm dựa sở tiếp cận lớp tương đồng tối đại hệ thống thông tin định đa trị [13] Theo đó, CVHT tổ chức tư vấn theo nhóm sinh viên tương đồng kết học tập mức độ: “yếu-kém”, “trung 124 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ bình-khá” “giỏi-xuất sắc” Nghĩa sinh viên có kết xếp loại yếu hay tư vấn cấp “độ yếu kém”, sinh viên có kết xếp loại trung bình hay tư vấn cấp độ “trung bình-khá” sinh viên có kết xếp loại giỏi hay xuất sắc tư vấn cấp độ “giỏi-xuất sắc” Để tổ chức tư vấn theo nhóm sinh viên, ta cần thực phân nhóm sinh viên tương đồng Thơng thường phân nhóm sinh viên tương đồng dựa xếp loại học tập năm, cách làm có hạn chế định Ví dụ sinh viên có xếp loại học tập học kỳ thứ “khá”, học kỳ thứ hai “yếu”, năm “trung bình” Khi phân nhóm sinh viên tương đồng dựa vào xếp loại năm, sinh viên thuộc nhóm sinh viên tương đồng “trung bình” (thực tế sinh viên có kết học tập giảm) Trong đó, với tiếp cận hệ thống thông tin đa trị, “kết học tập” xem thuộc tính đa trị qua nhiều học ký phân nhóm sinh viên tương đồng, sinh viên thuộc hai nhóm sinh viên: tương đồng “yếu” tương đồng “khá” Điều dẫn đến sinh luật định đa trị cho kết khác so với cách giải vấn đề dựa tiếp cận hệ thống thông tin đơn trị Từ phân tích trên, vấn đề thực nghiệm đặt cần đưa vào độ đo hấp dẫn (interestingness measure) để đánh giá chất lượng luật định đa trị sinh từ tập liệu kết học tập số lớp chuyên ngành hệ thống thông tin Trường Đại học Cần Thơ năm học Kết thực nghiệm sở khách quan giúp phát đặc điểm có tính quy luật phổ biến đặc điểm có tính bất thường Từ đó, hướng tư vấn tốt cho sinh viên dựa vào luật có độ đo hấp dẫn tốt B Dữ liệu thực nghiệm Dữ liệu gốc Dữ liệu gốc điểm tổng kết học kỳ học kỳ 2, năm 2014-2015 lớp ngành Hệ thống thơng tin khóa 37, 38, 39, 40 kết xuất từ Hệ thống quản lý đào tạo Trường Đại học Cần Thơ [8] Bảng điểm tổng kết gồm có 297 dịng (tương ứng với 297 sinh viên) cột: mã số sinh viên (giá trị mssv thay đổi), trung bình học kỳ 1, rèn luyện học kỳ 1, trung bình học kỳ 2, rèn luyện học kỳ xếp loại năm (bảng 9) Bảng Bảng điểm tổng kết năm học 2014-2015 gồm 10 sinh viên lớp ngành hệ thống thơng tin khóa 37-40 mssv s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 tbhk1 3.16 2.28 3.41 2.56 1.75 2.31 2.36 2.91 2.58 3.57 rlhk1 84 82 93 90 67 78 76 83 78 97 tbhk2 2.71 1.95 2 3.32 3.08 rlhk2 72 78 95 83 80 76 74 85 76 92 xlcn Khá Trung bình Giỏi Trung bình Yếu Trung bình Trung bình Khá Khá Giỏi Tiền xử lý liệu gốc , , ,…., Dữ liệu gốc xử lý đưa hệ thống thông tin định đa trị gồm gồm 297 đối tượng , kqrl } 01 thuộc tính định (có dạng bảng 10) với 02 thuộc tính điều kiện kqht Bảng Hệ thống thông tin định đa trị gồm 297 đối tượng , , ,…., tính định s1 s2 s3 s4 s5 s6 s7 s8 s9 s10 {4, 1} {3, 4} {5, 6} {4, 2} {2, 3} {3, 3} {3, 3} {4, 5} {4, 4} {5, 6} {6, 5} {6, 5} {7, 7} {7, 6} {4, 6} {5, 5} {5, 5} {6, 6} {5, 5} {7, 7} }, 02 thuộc tính điều kiện , }, } 01 thuộc 2 2 2 Miền giá trị thuộc tính kết học tập “ ” 1, 2, 3, 4, 5, 6}, giá trị có ý nghĩa sau [7]: 1=“kém điểm trung bình ( d, ) (4,6) -> ( d, ) (4,6) -> ( d, ) (6,7) -> ( d, ) (3,6) -> ( d, ) (3,6) -> ( d, ) 10 11 12 (3,5) -> ( d, ) (3,5) -> ( d, ) (4,5) -> ( d, ) (4,5) -> ( d, ) (4,5) -> ( d, ) (5,6) -> ( d, ) 13 14 15 16 17 18 (5,6) -> - ( d, ) (1,6) -> - ( d, ) (1,6) -> - ( d, ) (2,4) -> - ( d, ) (2,4) -> - ( d, ) (4,{7,7 7}) -> ( d, ) 19 20 21 22 23 24 (4,{7,7})) -> ( d, ) (2,5) -> ( d, ) (2,5) -> ( d, ) (2,6) -> ( d, ) (2,6) -> ( d, ) (1,{5,5})) -> ( d, ) 225 226 227 228 229 (1,{5,5}) -> > ( d, ) (2,7) -> ( d, ) (2,7) -> ( d, ) (3,4) -> ( d, ) (3,4) -> ( d, ) E E Xác định c giá trị độ đđo hàm ý choo luật quyếết định đa trị “tư vấn học tậ tập” 1 Chuyển hệ thống thông ttin địnhh đa trị sang dạạng nhị phân Kết quảả chuyển hệ thhống thông tinn định đa trị “kết qu uả học tập” vềề dạng nhị phâân bảng nhị phân gồm g 297 dòngg (tương ứng vvới 297 sinh viiên) 16 cột (hình minh họa 10 dịng số 297 ddịng) Hình Kết qquả chuyến hệ thhống thông tin định đa trrị “kết học tập” sang dạngg nhị phân 2 Chuyển tậpp luật địịnh đa trị “tư vvấn học tập” sang s dạng nhị phân Kết quảả chuyển tập lluật địnhh đa trị “tư vấấn học tập” vềề dạng nhị phâân bảngg nhị phân gồm 29 dòng (tương ứng vớ ới 29 luật quyếết định đa trị) vvà 16 cột (hình minh họa dịng số 29 dịng) Hình Kết chuyểển tập luật quyếtt định đa trị “tư vấn học tập” saang dạng nhị phhân 3 Xác định c giá trị độ đđo hàm ý thốngg kê cho tập lu uật định h đa trị “tư vấnn học tập” Mỗi luậật định đa trị “tư vấn học tập” (bản ng 11) đánh đ giá chất llượng haai độ đo số ố hàm ý cường c độ hàm m ý Kết thhực nghiệm đánh giá chất lượng l 29 luật dựa đđộ hàm ý, luật quyế ết định chưa c xếpp thứ tự (hình minh họa 100 luật địịnh cù ùng với độộ đo hàm ý) Phan P Tấn Tài, Lê Đức Thắng, Huỳỳnh Xuân Hiệp 127 Hình G Giá trị số hàm m ý, cường độ hàm h ý 10 lu uật định đđa trị số luật F F Đánh giá chất c lượng cáác luật đđịnh đa trị “tư vấn học tập” ” 1 Đánh giá chất c lượng luậtt định “ttư vấn học tập p” dựa độ đo cường độ hàm ý Tập 29 luật địnnh đa trị đượcc xếp thứ tự giiảm dần dựa trrên độ đo cườờng độ hàm ý (bảng 12) Nế ếu chọn tập 15 luật q định đa ttrị có giá trị cường độ hàm ý cao o (hay giiá trị ngưỡng ββ= 0.7269): {((4,6) -> (d, 2), (4,5) -> (d,,2), (1,{5,5}) > (d,1), (2,5)) -> (d,1), (6,7 7) -> (d,3), (1,6) -> (d,1), (44,{7,7}) -> (d,,2), (2,4) -> (d d,1), (3,6) > (d,2), (2,6) -> - (d,1), (5,6) -> (d,3), (2,7)) -> ( d, ), (3,4) -> (d, 1), (5,6) -> (d,2)), (5,6) -> (d,22), (3,5) -> (d,,1)} tập 15 luật q định đa ttrị ccác khuynh hư ướng sau: (i) Khuynhh hướng tư vấấn mức phù hợp lực học tập sinh s viên, có tậập 11 luật sauu: { (4,6) -> (d d,2), (4,5) > (d,2), (1,{5,55}) -> (d,1), ((2,5) -> (d,1),, (6,7) -> (d,3), (1,6) -> (d,1), (4,{7,7}) > (d,2), (2,4)) -> (d,1), (3,6 6) -> (d,2), (2,6) -> (d,1), (5,6) -> (d,3)}} Chẳng hạn: Luật (4,6) -> (d, 2), có ngh hĩa (học tậpp ( 4) , rèn luyện giỏ ỏi ( 6) ) → (tư vấn họọc tập mức đđộ “trung bìnhh-khá”, 2)); Luật (4,5) -> > (d,2) có nghhĩa (học tậpp ( 4), rèn luyện k ( 5) ) → (tư vấn học tập mức đđộ “trung bình-khá”, 2)); Luật (1,{5,55}) -> ( d, ) ccó nghĩa (họ ọc tập ( 4), rèn luuyện ( 5) ) → (tư vvấn học tập mức độ “yếu-kém”, 1)) (ii) Khuynnh hướng tư vvấn mức caoo lự ực học tập a sinh viên, cóó luật (2,77) -> ( d, ) yếu y ( 2), rèn r luyện xuấtt sắc ( 7) ) → (tư vấn học h tập mức độ “trung bình nh-khá” , 2) (học tập (iii) Khuynnh hướng tư vvấn mức thấp ấp lự ực học tập a sinh viên, cóó tập luật sauu: {(3,4) -> (d d,1), (5,6) > (d,2), (5,6) -> (d,2), (3,5)) -> (d,1)} C Chẳng hạn: Lu uật (3,4) -> (d d,1), có nghĩaa (học tập ttrung bình ( 3), rèn lu uyện trung bình ( 4) ) → (tư vấấn học tập mức m độ “yếu-k kém”, 1);; Luật (5,6) -> > (d,2), có nghĩa (học tập giỏi ( 6) ) → (tư vấn họ ọc tập mức độ đ “trung bìnhh-khá”, 2) 5), rèn luyện giỏi ( Nếu chọn tập 11 luật đđịnh đa trị đầu u tiên có giá trịị cường độ hààm ý cao {(4,6) -> (d d,2), (4,5) > (d,2), (1,{5,55}) -> (d,1), ((2,5) -> (d,1),, (6,7) -> (d,3), (1,6) -> (d,1), (4,{7,7}) > (d,2), (2,4)) -> (d,1), (3,6 6) -> (d,2), (2,6) -> (d,1), (5,6) -> (d,3) tập luật quuyết định đa trị có m khuynh hhướng tư vấn mức phù hợ ợp lực học h tập sinnh viên Bảng Kếết xếp ccác luật định đ đa trị dựa trrên giá trị cườnng độ hàm ý giảảm dần Stt S Luat quyett dinh (4,6) -> ( d, ) (4,5) -> ( d, ) (1,{5,5})->>(d,1) (2,5) -> ( d, ) (6,7) -> ( d, ) (1,6) -> ( d, ) (4,{7,7})->>(d,2) (2,4) -> ( d, ) (3,6) -> ( d, ) 10 (2,6) -> ( d, ) 11 (5,6) -> ( d, ) 12 (2,7) -> ( d, ) 13 (3,4) -> ( d, ) 14 (5,6) -> ( d, ) 15 (3,5) -> ( d, ) n 297 297 297 297 297 297 297 297 297 297 297 297 297 297 297 na 81 78 27 118 17 15 25 72 58 18 23 18 131 nb naab_ I_intensity y 170 10 1.0000 170 1.0000 110 0.9999 110 47 0.9992 17 0.9982 110 0.9907 170 0.9837 110 0.9553 170 23 0.9198 110 29 0.8933 17 12 0.8862 170 0.8270 110 11 0.8199 170 0.7296 110 77 0.7269 Stt Luat quyet q dinh 16 (3,5)) -> ( d, ) 17 (4,{7 7,7})->( d,3) 18 (4,6)) -> ( d, ) 19 (4,5)) -> ( d, ) 20 (3,6)) -> ( d, ) 21 (2,7)) -> ( d, ) 22 (3,4)) -> ( d, ) 23 (2,6)) -> ( d, ) 24 (2,4)) -> ( d, ) 25 (1,6)) -> ( d, ) 26 (2,5)) -> ( d, ) 27 (4,6)) -> ( d, ) 28 (4,5)) -> ( d, ) 29 (1,{5 5,5})->(d,2) n 297 297 297 297 297 297 297 297 297 297 297 297 297 297 na 131 15 81 78 72 23 58 25 17 118 81 78 27 nnb 1170 17 17 17 1110 1110 1170 1170 1170 1170 1170 1110 1110 1170 nab_ I_intensity 54 0.6062 14 0.5150 78 0.4257 77 0.3431 49 0.2930 0.2877 12 0.2450 29 0.1996 16 0.0522 14 0.0063 71 0.0019 74 0.0006 72 0.0005 26 0.0000 128 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ Đánh giá chất lượng luật định “tư vấn học tập” dựa giá trị số hàm ý Tập 29 luật định đa trị xếp thứ tự giảm dần dựa độ đo số hàm ý (bảng 13) Nếu chọn tập 15 luật định đa trị có giá trị số hàm ý cao {(1,{5,5}) -> (d,2), (4,5) -> (d, 1), (4,6) -> (d,1), (2,5) -> (d,2), (1,6) -> (d,2), (2,4) -> (d,2), (2,6) -> (d,2), (3,4) -> (d,2), (2,7) -> (d,1), (3,6) -> (d,1), (4,5) -> (d,3), (4,6) -> (d,3), (4,{7,7}) -> (d,3), (3,5) -> (d,2), (3,5) -> (d,1)} tập 15 luật định đa trị khuynh hướng sau: (i) Khuynh hướng tư vấn mức phù hợp lực học tập sinh viên, có tập luật sau: { (3,4) -> (d,2 ), (2,7) -> (d,1), (3,5) -> (d,2)} (ii) Khuynh hướng tư vấn mức cao lực học tập sinh viên, có tập luật sau: { (1,{5,5}) -> (d,2), (2,5) -> (d,2), (1,6) -> (d,2), (2,4) -> (d,2), (2,6) -> (d,2), (4,5) -> (d,3), (4,6) -> (d,3), (4,{7,7}) -> (d,3) } (iii) Khuynh hướng tư vấn mức thấp lực học tập sinh viên, có tập luật sau: { (4,5) -> (d,1), (4,6) > (d,1), (3,6) -> (d,1), (3,5) -> (d,1) } Bảng Kết xếp luật định đa trị dựa giá trị số hàm ý giảm dần Stt Luat quyet dinh (1,{5,5}) -> (d,2) (4,5) -> ( d, ) (4,6) -> ( d, ) (2,5) -> ( d, ) (1,6) -> ( d, ) (2,4) -> ( d, ) (2,6) -> ( d, ) (3,4) -> ( d, ) (2,7) -> ( d, ) 10 (3,6) -> ( d, ) 11 (4,5) -> ( d, ) 12 (4,6) -> ( d, ) 13 (4,{7,7}) -> (d,3) 14 (3,5) -> ( d, ) 15 (3,5) -> ( d, ) n 297 297 297 297 297 297 297 297 297 297 297 297 297 297 297 na 27 78 81 118 17 25 58 23 72 78 81 15 131 131 nb 170 110 110 170 170 170 170 170 110 110 17 17 17 170 110 nab_ I_indice 26 4.2540 72 3.2661 74 3.2206 71 2.8919 14 2.4964 16 1.6240 29 0.8431 12 0.6903 0.5601 49 0.5446 77 0.4040 78 0.1873 14 -0.0376 54 -0.2695 77 -0.6036 Stt 16 17 18 19 20 21 22 23 24 25 26 27 28 29 Luat quyet dinh (5,6) -> ( d, ) (3,4) -> ( d, ) (2,7) -> ( d, ) (5,6) -> ( d, ) (2,6) -> ( d, ) (3,6) -> ( d, ) (2,4) -> ( d, ) (4,{7,7}) ->(d,2) (1,6) -> ( d, ) (6,7) -> ( d, ) (2,5) -> ( d, ) (1,{5,5})->(d,1) (4,6) -> ( d, ) (4,5) -> ( d, ) n 297 297 297 297 297 297 297 297 297 297 297 297 297 297 na 18 23 18 58 72 25 15 17 118 27 81 78 nb 170 110 170 17 110 170 110 170 110 17 110 110 170 170 11 12 29 23 47 10 I_indice -0.6117 -0.9149 -0.9423 -1.2064 -1.2442 -1.4036 -1.6990 -2.1378 -2.3547 -2.9129 -3.1668 -3.8806 -4.1861 -4.5632 VI KẾT LUẬN Đánh giá chất lượng tập luật định đa trị dựa tiếp cận hàm ý thống kê hướng tiếp cận mới, thực nhằm vai trò luật định đa trị dựa giá trị độ đo hàm ý thống kê Thông qua giá trị độ đo hàm ý thống kê, luật định đa trị đánh giá xếp thứ tự Để chọn luật tốt, chúng tơi đề xuất việc chọn lựa theo hai hướng, dựa vào giá trị ngưỡng cho trước hay chọn m luật định đa trị có giá trị độ đo hàm ý thống kê cao Ngoài ra, chúng tơi đề xuất xem xét thêm luật định đa trị “xấu nhất” dựa vào ngưỡng cho trước lấy k luật định đa trị có giá trị độ đo hàm ý thống kê thấp Phân tích hàm ý thống kê cho phép đánh giá hấp dẫn luật cấu trúc chúng để phát mối quan hệ mức độ chi tiết khác làm bật thuộc tính trội luật định đa trị Bài viết đề xuất giải thuật tổng quát đánh giá chất lượng luật định đa trị dựa tiếp cận hàm ý thống kê VII LỜI CẢM ƠN Nhóm tác giả xin chân thành cảm ơn hỗ trợ Nguyễn Minh Kỳ, Trường Đại học Kỹ thuật Công nghệ Cần Thơ, việc lập trình R VIII TÀI LIỆU THAM KHẢO [1] Abedin, J., Das, K., K., “Data Manipulation with R” (ISBN 978-1-78528-881-4), Packt, Second Edition, 2015 [2] B Walczak, B., Massart, D.,L., Rough sets theory, International Journal of Information Sciences 47, SpringerVerlag, pp.1-16,1999 [3] Cios, K J., Pedrycz, W., Swiniarski, R.W.: “Rough Sets: Data Mining: Methods for Knowledge Discovery”, pp.27-45 Kluwer Academic Publishers, Boston/Dordrecht/London, 1998 [4] Gras, R., Kuntz, P.: “An overview of the Statistical Implication Analysis (SIA) development”, Statistical Implicative Analysis - Studies in Computational Intelligence (Volume 127), Springer-Verlag, pp.11-40, 2008 Phan Tấn Tài, Lê Đức Thắng, Huỳnh Xuân Hiệp 129 [5] Gras, R., Suzuki, E., Guillet, F., Spagnolo, F., “Statistical Implicative Analysis, Methodology and concepts for SIA”, Springer-Verlag Berlin Heidelberg (ISBN 978-3-540-78982-6), pp.8-70, 2008 [6] Greco, S., et al.: “Rough sets theory for multicriteria decision analysis”, European Journal of Operational Research 129, pp.1-47, 2001 [7] Guan, Y.-Y., Wang, H.-K.: “Set-valued Information Systems”, International Journal of Information Sciences 176, Elsevier, pp.2507-2525, 2006 [8] Hà, T., T., el al.: Hệ thống quản lý (https://htql.ctu.edu.vn/htql/login.php), Trường Đại học Cần Thơ, 2015 [9] Hà, T., T., Qui định công tác học vụ, Trường Đại học Cần Thơ (Số: 2736 /QĐ-ÐHCT), 2014 [10] Huỳnh, M.T., Phan, T.T., Huỳnh, X.H., “Cảnh báo cháy rừng với luật định đa trị”, Hội thảo quốc gia lần thứ XVII số vấn đề chọn lọc công nghệ thông tin & truyền thông, Nhà xuất khoa học kỹ thuật, pp.402-408, 2014 [11] Kryszkiewicz, M.: “Rules in Incomplete Information Systems”, International Journal of Information Sciences 113, pp.271-292, 1999 [12] Leung, Y., Li, D.: “Maximal Consistent Block Technique for Rule Acquisition in Incomplete Information systems”, International Journal of Information Sciences 153, pp.85-106, 2003 [13] Phan, T.T et al.: “Tư vấn học tập nhóm bậc đại học sở tiếp cận lớp tương đồng lớn hệ thống thông tin đa trị”, Tạp chí khoa học Đại học Cần Thơ (ISSN 1859-2333), pp.123-133, 2013 [14] Phan, T.T., Huynh, X.H.: “Mơ hình trao đổi thông tin nhiều chiều dựa tiếp cận hệ thống thông tin định đa trị”, Hội thảo khoa học hệ thống thông tin, Đại học Đà Năng, pp.23-31, 2014 [15] Song, X.,-X., Zhang,W.,-X., “Rough Sets and Knowledge Technology”, Formal Concept Analysis and Set-Valued Information Systems (Volume 4481), Springers (ISBN: 9783540724582 – 9783540724575), pp.395-402, 2007 [16] Spector, P., “Data Manipulation with R”, Springers (ISBN: 978-0-387-74730-9), 2008 [17] Wang, G.,Yang, Q., Zhang, Q., “Rough Sets, Fuzzy Sets, Data Mining and Granular Computing”, Disjunctive SetValued Ordered Information Systems Based on Variable Precision Dominance Relation (Volume 6743), Springer, pp.207-210, 2011 [18] Zhu, D., Feng, B., Guan, T., “MICAI 2005: Advances in Artificial Intelligence”, Rough Sets and Decision Rules in Fuzzy Set-Valued Information Systems (Volume 3789), Springer, pp.204-213, 2005 EVALUATING THE QUALITY OF SET-VALUED DECISION RULES BASED ON STATISTICAL IMPLICATIVE APPROACH Phan Tan Tai, Le Duc Thang, Huynh Xuan Hiep ABSTRACT - In this paper, we introduce a new approach for evaluating the quality of set-valued decision rules based on statistical implicative analysis The research is begun to consider the set-values decision information system and appropriate generated setvalues decision rules From here, the obtained set-values decision rules will consider and assess the quality of the rules based on statistical implicative analysis Through this result, the set-valued decision rules will be arranged according to the different priority levels based on two measures: implication indice, implication intensity The experimental scenarios are deployed on good set-valued decision rules, bad set-valued decision rules and the role of the set-valued decision rules This is a problem that the set-valued decision rules model not previously researched ... 128 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ Đánh giá chất lượng luật định “tư vấn học tập” dựa giá trị số hàm ý Tập 29 luật định đa trị xếp thứ tự giảm dần dựa. .. LUẬN Đánh giá chất lượng tập luật định đa trị dựa tiếp cận hàm ý thống kê hướng tiếp cận mới, thực nhằm vai trò luật định đa trị dựa giá trị độ đo hàm ý thống kê Thông qua giá trị độ đo hàm ý thống. ..120 ĐÁNH GIÁ CHẤT LƯỢNG LUẬT QUYẾT ĐỊNH ĐA TRỊ DỰA TRÊN TIẾP CẬN HÀM Ý THỐNG KÊ II LUẬT QUYẾT ĐỊNH ĐA TRỊ A Các hệ thống thông tin Hệ thống thông tin đơn trị hệ thống thông tin đa trị Một hệ thống