1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Tạp chí Thông tin và Truyền thông: Số 2/2019

60 28 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 60
Dung lượng 21,51 MB

Nội dung

Tạp chí Thông tin và Truyền thông: Số 2/2019 trình bày các nội dung chính sau: Tăng tốc độ phát hiện dị thường trên ảnh đa phổ và siêu phổ ứng dụng trong tìm kiếm cứu nạn, song song hóa thuật toán Lamport trong loại trừ tương hỗ phân tán, toán tử lân cận mới cho thuật toán Tabu Search và PSO giải bài toán lập lịch luồng công việc trong môi trường điện toán đám mây,... Mời các bạn cùng tham khảo để nắm nội dung chi tiết của tạp chí.

ISSN 1859 - 3526 CÁC CƠNG TRÌNH NGHIÊN CỨU PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Tập 2019 Số Tháng 12 ISSN: 1859-3526 Tập 2019, Số 2, Tháng 12 TỔNG BIÊN TẬP: VŨ CHÍ KIÊN CÁC CƠNG TRÌNH NGHIÊN CỨU PHÁT TRIỂN CƠNG NGHỆ THƠNG TIN VÀ TRUYỀN THÔNG THƯỜNG TRỰC BAN BIÊN TẬP Trưởng Ban Nguyễn Linh Trung, Trường Đại học Công nghê, Đại học Quốc gia Hà Nội Các đồng Trưởng ban Nguyễn Hoàng Hà, Đại học Saskatchewan, Canada Đỗ Ngọc Minh, Đại học Illinois, Hoa Kỳ Các Phó trưởng ban Nguyễn Văn Đức, Trường Đại học Bách khoa Hà Nội Lê Vũ Hà, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Nguyễn Nam Hồng, Trường Đại học Cơng nghệ, Đại học Quốc gia Hà Nội Lê Hồng Sơn, Viện Cơng nghệ Thông tin, Đại học Quốc gia Hà Nội Trần Xuân Tú, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Nguyễn Khánh Văn, Đại học Bách khoa Hà Nội Thư ký khoa học: Trương Minh Chính, Trường Đại học Sư phạm, Đại học Huế Thư ký hành chính: Nguyễn Lan Phương, Tạp chí Thơng tin Truyền thơng BIÊN TẬP VIÊN LĨNH VỰC Trịnh Quốc Anh, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Võ Đình Bảy, Trường Đại học Cơng nghệ TP Hồ Chí Minh Ejder Bastug, NOKIA Bell Labs, Pháp Huỳnh Thị Thanh Bình, Trường Đại học Bách khoa Hà Nội Nguyễn Việt Dũng, Trường Công nghệ Tiên tiến quốc gia Bretagne, Pháp Lê Đức Hậu, Vingroup Phan Dương Hiệu, Trường Đại học Limoges, Pháp Đậu Sơn Hoàng, Trường Đại học RMIT, Úc Bùi Quang Hưng, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Nguyễn Tấn Hưng, Đại học Đà Nẵng Phan Quốc Huy, Trường Đại học Kent, Anh Trương Trung Kiên, Học viện cơng nghệ Bưu Viễn thông Raghvendra Kumar, LNCT Group of Colleges, Ấn Độ Nguyễn Lê Minh, Viện Khoa học Công nghệ Tiên tiến Nhật Bản Trần Minh Quang, Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Nguyễn Thái Sơn, Trường Đại học Trà Vinh Lê Nhật Thăng, Học viện cơng nghệ Bưu Viễn thơng Quản Thành Thơ, Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh ĐỊA CHỈ LIÊN HỆ: 115 Trần Duy Hưng, Hà Nội Tel: (84)-24-37737136 Fax: (84)-24-37737130, Website http://ictmag.vn Email: ict.research@mic.gov.vn (biên tập) chuyensanbcvt@mic.gov.vn (hành chính) Chi nhánh TP Hồ Chí Minh 27 Nguyễn Bỉnh Khiêm, Quận 1, TP Hồ Chí Minh Tel/Fax: (84)-28-38992898 LIÊN HỆ QUẢNG CÁO PHÁT HÀNH Phạm Thị Lâm Email: ptlam@mic.gov.vn, Tel: 84-948503999 Giấy phép xuất số 365/GP-BTTTT, ngày 19/12/2014; sửa đổi số 233/GP-BTTTT ngày 23/5/2017 In Công ty CP In Hà Nội In xong nộp lưu chiểu tháng 12/2019 Giá: 40.000 đồng Các cơng trình nghiên cứu phát triển Cơng nghệ Thông tin Truyền thông http://www.ictmag.vn/cntt-tt Tập 2019, Số Tháng 12 MỤC LỤC FGenHUSM: Một thuật toán hiệu khai thác chuỗi sinh phổ biến lợi ích cao 57 Trương Chí Tín, Trần Ngọc Anh, Dương Văn Hải, Lê Hoài Bắc Tăng tốc độ phát dị thường ảnh đa phổ siêu phổ ứng dụng tìm kiếm cứu nạn 70 Nguyễn Văn Phương, Đào Khánh Hồi, Tống Minh Đức Song song hóa thuật toán Lamport loại trừ tương hỗ phân tán 83 Đặng Hùng Vĩ, Lê Văn Sơn, Nguyễn Xuân Huy Toán tử lân cận cho thuật toán Tabu Search PSO giải toán lập lịch luồng công việc 93 môi trường điện toán đám mây Phan Thanh Toàn, Đặng Quốc Hữu, Nguyễn Thế Lộc Một phương pháp sinh luật mờ dựa định đại số gia tử xây dựng hệ luật mờ giải toán hồi quy Nguyễn Đức Dư, Hoàng Văn Thông 102 Research and Development on Information and Communication Technology http://www.ictmag.vn/cntt-tt Vietnamese Edition Volume 2019, Number December TABLE OF CONTENTS FGenHUSM: An Efficient Algorithm For Mining Frequent Generator High Utility Sequences 57 Truong Chi Tin, Tran Ngoc Anh, Duong Van Hai, Le Hoai Bac Acceleration of Anomaly Detection in Multispectral and Hyperspectral Images for Search and 70 Rescue Situations Nguyen Van Phuong, Dao Khanh Hoai, Tong Minh Duc A Parallelization of the Lamport Algorithm for Distributed Mutual Exclusion 83 Dang Hung Vi, Le Van Son, Nguyen Xuan Huy New Effective Neighborhoods for Tabu Search and Particle Swarm Optimization to Schedule 93 Workflow in Cloud Computing Phan Thanh Toan, Dang Quoc Huu, Nguyen The Loc A Method to Generate Fuzzy Rules based on Decision Tree and Hedge Algebras for Building Fuzzy Rule-based Systems for Regression Nguyen Duc Du, Hoang Van Thong 102 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông FGenHUSM: Một thuật toán hiệu khai thác chuỗi sinh phổ biến lợi ích cao Trương Chí Tín1 , Trần Ngọc Anh1 , Dương Văn Hải1,2 , Lê Hoài Bắc2 Khoa Toán – Tin học, Trường Đại học Đà Lạt Khoa Công nghệ Thông tin, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Tp Hồ Chí Minh Tác giả liên hệ: Trần Ngọc Anh, anhtn@dlu.edu.vn Ngày nhận bài: 15/07/2019, ngày sửa chữa: 09/10/2019, ngày duyệt đăng: 28/10/2019 Định danh DOI: 10.32913/mic-ict-research-vn.v2019.n2.872 Biên tập lĩnh vực điều phối phản biện định nhận đăng: PGS.TS Lê Hồng Sơn Tóm tắt: Khai thác chuỗi phổ biến chuỗi lợi ích cao có mức độ quan trọng khác ứng dụng thực tế Gần đây, nghiên cứu tập trung giải toán tổng quát hơn, khai thác tập FHUS chuỗi phổ biến lợi ích cao Tuy nhiên, thời gian nhớ dùng để khai thác FHUS lớn Bài báo đề xuất khái niệm tập FGHUS chuỗi sinh phổ biến lợi ích cao, biểu diễn súc tích FHUS, thuật tốn hiệu để khai thác Dựa vào hai chặn độ đo lợi ích, hai chiến lược tỉa theo chiều rộng sâu thiết kế để loại bỏ nhanh chuỗi phổ biến lợi ích thấp Sử dụng chặn lợi ích, chiến lược tỉa địa phương đề xuất để loại bỏ sớm chuỗi không chuỗi sinh phổ biến lợi ích cao Dựa vào chiến lược này, thuật toán 𝐹𝐺𝑒𝑛𝐻𝑈𝑆𝑀 thiết kế để khai thác FGHUS mà tính hiệu thể qua thử nghiệm sở liệu lớn Từ khóa: Chuỗi lợi ích cao, khai thác chuỗi sinh phổ biến lợi ích cao, chặn chặn độ đo lợi ích Title: Abstract: Keywords: FGenHUSM: An Efficient Algorithm For Mining Frequent Generator High Utility Sequences Mining the set of all frequent high utility sequences (FHUS) in quantitative sequential databases (QSDBs) plays an important role in many real-life applications However, for huge QSDBs and low minimum support and utility thresholds, algorithms for discovering FHUS often exhibit poor performance in terms of runtime and memory consumption due to the enormous cardinality of the FHUS set To address this issue, this paper introduces a novel set of all frequent generator high utility sequences (FGHUS) This set is a concise representation of FHUS having a cardinality that is often much less than that of FHUS Thus, it is more convenient for users to analyze the information provided by the FGHUS set This paper proposes a novel algorithm named 𝐹𝐺𝑒𝑛𝐻𝑈𝑆𝑀 to efficiently mine FGHUS The algorithm adopts the depth and width pruning strategies to quickly eliminate infrequent or low utility sequences In addition, it also uses a novel local pruning strategy to prune non-frequent generator high utility sequences early, which is based on a new lower bound on the utility measure Experimental results on large QSDBs show that the proposed algorithm is efficient in terms of runtime for mining FGHUS, and that the pruning strategies can greatly reduce the search space High utility sequence, frequent generator high utility sequence, upper and lower bounds on utility measure I GIỚI THIỆU HUSM tổng quát FSM có nhiều ứng dụng phân tích hành vi duyệt web [1], liệu thương mại di động [2], hiệu chỉnh gen [3], v.v Ta xét ứng dụng điển hình HUSM phân tích liệu mua hàng Xét sở liệu chuỗi biểu diễn đơn mua hàng khách hàng cửa hàng bán lẻ Khi chuỗi chứa mặt hàng mua khách hàng thời điểm khác Chi tiết hơn, danh sách có thứ tự tập mặt hàng, tập mặt hàng chứa mặt hàng mua Lấy ví dụ, ta có chuỗi {kem đánh răng, bàn chải đánh răng}, {bánh Kinh đơ, phơ mai}, {nhang} Chuỗi mặt hàng mua phụ nữ Người Khi khai thác tập chuỗi phổ biến (FSM: Frequent Sequence Mining) sở liệu chuỗi (SDB: Sequential Datadase), ta đánh nhiều chuỗi lợi ích cao (HU: High Utility) quan trọng nhiều ứng dụng thực tế chúng phổ biến Chẳng hạn, lợi ích mặt hàng bán thơng tin hữu ích định kinh doanh Vì vậy, tốn khai thác chuỗi HU (HUSM: High Utility Sequence Mining) SDB lượng hóa (QSDB: Quantitative SDB) đời sau nhu cầu thiết 57 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông mua kem đánh bàn chải đánh nhau, sau mua bánh Kinh với phơ mai, cuối mua nhang Mỗi mặt hàng có giá bán Khi đó, ta xác định giá trị tập mặt hàng mua giá trị danh sách tập mặt hàng chuỗi mua hàng khách hàng Khi khai thác tập lớn đơn mua hàng, ta biết thông tin như: (i) mặt hàng thường mua nhau, (ii) lợi ích đem lại chuỗi tập mặt hàng đó, v.v Các thơng tin có ích cho việc định kinh doanh cửa hàng hơn, FHUSM: Khai thác tập FHUS chuỗi phổ biến lợi ích cao (FHU: Frequent High Utility), độ đo lợi ích 𝑢 Theo cách tiếp cận trên, nhóm tác giả [13] đề xuất thuật toán hiệu nhằm khai thác hai biểu diễn súc tích FHUS, bao gồm chuỗi phổ biến tối đại lợi ích cao (FMaxHU) tập FCHUS chuỗi phổ biến đóng lợi ích cao (FCHU) Tuy nhiên, chiều dài chuỗi FMaxHU FCHU thường lớn Vì vậy, báo đề xuất biểu diễn súc tích khác FGHUS FHUS Trước đây, xuất nhiều cơng trình nhằm khai thác tập (tập thuộc tính) sinh phổ biến có/khơng có lợi ích cao [14–16] Các chuỗi (danh sách có thứ tự tập thuộc tính) đóng/tối đại/sinh phổ biến đối tượng nhiều nghiên cứu gần [12, 17, 18] Tập chứa chuỗi sinh phổ biến lợi ích cao (FGHUS) mở rộng tự nhiên chuỗi sinh phổ biến truyền thống Một chuỗi FHU gọi chuỗi sinh phổ biến lợi ích cao (FGHU) khơng tồn chuỗi FHU có độ hỗ trợ Cho Ψ QSDB chứa chuỗi đầu vào, chuỗi có kiện, kiện có thuộc tính, thuộc tính gắn với số lượng giá trị lợi ích Do chuỗi 𝛼 xuất vị trí khác (với lợi ích khác nhau) Ψ , nên lợi ích 𝛼 Ψ tính dạng tổng [4], giá trị lớn 𝑢 max (𝛼) [5, 6] giá trị nhỏ 𝑢 (𝛼) [7, 8] (theo nghĩa an toàn rủi ro cho việc phát triển chiến lược kinh doanh hay định) Khi đó, lợi ích 𝛼 tổng lợi ích tất chuỗi Ψ chứa 𝛼 Nếu lợi ích 𝛼 lớn ngưỡng lợi ích tối thiểu 𝑚𝑢, gọi chuỗi HU, ngược lại 𝛼 gọi chuỗi lợi ích thấp (LU: Low Utility) Mục đích HUSM khai thác tập chuỗi lợi ích cao (HUS) chứa chuỗi HU QSDB Vì chuỗi FGHU có chiều dài thường bé nhiều so với chuỗi FMaxHU FCHU, nên chúng có ưu điểm sau Thứ nhất, ta xem biểu diễn nén FHUS Điều phù hợp với nguyên lý chiều dài mô tả bé (MDL: Minimum Description Length) [19] Thứ hai, cho độ xác cao nhiệm vụ chọn mơ hình (so với FHUS hay tập FCHUS) Ngồi ra, khai thác mẫu sinh (với chiều dài tối thiểu) cịn bước quan trọng việc tìm luật quan trọng, chẳng hạn, luật với giả thiết (vế trái) dẫn nhiều kết luận (vế phải), luật không dư thừa [20] Khi đó, mẫu sinh vế trái, vế phải mẫu đóng khơng Do đó, mẫu sinh FGHUS thường ưa thích người dùng cần phân tích tập kết quả, số lượng chiều dài chúng bé so với FHUS Tập FHUS thường sử dụng lực lượng chúng bé, chẳng hạn ngưỡng hỗ trợ (𝑚𝑠) ngưỡng lợi ích tối thiểu (𝑚𝑢) cao Ngược lại, ngưỡng thấp đặc biệt tập liệu lớn, để vượt qua khó khăn việc sử dụng phân tích tập kết FHUS với kích thước lớn, tập FGHUS lựa chọn phù hợp với người dùng Thuận lợi giải FSM tính ‘a priori’, cịn gọi tính đơn điệu giảm (anti-monotonic) hay DCP (DownwardClosure Property), độ đo hỗ trợ: Mọi chuỗi cha chuỗi phổ biến (LF: Low Frequent) LF [5, 9] Đặc tính cho phép rút gọn đáng kể khơng gian tìm kiếm tiến hành khai thác chuỗi lớn dần tiền tố Đáng tiếc HUSM, độ đo lợi ích khơng có tính DCP Để khắc phục, chặn (UB: Upper Bound) lợi ích thiết kế để thu hẹp phạm vi tìm kiếm Chặn SWU [5] (thỏa DCP giá trị lớn) chặn khác chặt (có giá trị nhỏ gần với lợi ích hơn) thiết kế sử dụng (mặc dù thỏa mãn tính chất tựa DCP) Với 𝑢 max (𝛼), kể SPU SRU (2013), PEU RSU (2016), gần MEU [6] SEU [10] Với 𝑢 (𝛼), tác giả [7] đề xuất hai chặn trên, RBU LRU, thiết kế hai chiến lược tỉa theo chiều sâu (DPS: Depth Pruning Strategy) rộng (WPS: Width Pruning Strategy), tích hợp chúng vào thuật toán EHUSM để khai thác hiệu HUS Mặc dù EHUSM khai thác nhanh HUS, lực lượng tập kết thường lớn, việc quản lý phân tích chúng gây khó khăn người sử dụng Một tiếp cận thường dùng FSM khai thác biểu diễn súc tích chúng, chẳng hạn chuỗi tối đại, đóng sinh [11, 12] Chú ý rằng, việc tích hợp FSM HUSM, ta xét toán tổng quát Mục tiêu báo khai thác tập FGHUS Để khai thác hiệu nó, FGHUS ⊆ FHUS, nên chuỗi LU LF không FGHU Do đó, tính chất DCP độ hỗ trợ hai chiến lược WPS DPS dựa vào RBU LRU [7, 8] sử dụng để tỉa hiệu chuỗi LF LU từ FHUS mà FGHUS Tuy nhiên, FGHUS khơng tập tập tất chuỗi sinh phổ biến (FGS), nên ta áp dụng trực tiếp điều kiện tỉa 3E [12] để loại bỏ chuỗi khơng chuỗi sinh lợi ích cao (GHU) 58 Tập 2019, Số 2, Tháng 12 Kích thước 𝑞-chuỗi 𝛼 , ký hiệu size (𝛼 ), số 𝑞-sự kiện (𝑝) Bài báo có số đóng góp sau đây: (i) đề xuất chặn SF 𝑢 ; (ii) dựa vào điều kiện tỉa sớm tổng quát 𝐺𝐸 𝑃 [13] SF, chiến lược tỉa địa phương (LPG) thiết kế để loại bỏ sớm ứng viên (và mở rộng chúng) khơng GHU; (iii) tích hợp ba chiến lược DPS, WPS LPG vào thuật toán 𝐹𝐺𝑒𝑛𝐻𝑈𝑆𝑀 để khai thác chuỗi sinh phổ biến lợi ích cao (FGHU); (iv) thử nghiệm hai sở liệu lớn, thực tế tổng hợp, tính hiệu 𝐹𝐺𝑒𝑛𝐻𝑈𝑆𝑀 (so với thuật toán sở không áp dụng chiến lược tỉa) mặt thời gian chạy lực lượng FGHUS thường bé so với FHUS Đây thuật toán khai thác biểu diễn súc tích FGHUS FHUS với độ đo lợi ích 𝑢 Từ sau, ta xét hai 𝑞-chuỗi 𝛼 = 𝐴1 → 𝐴2 → · · · → 𝐴 𝑝 𝛽 = 𝐵1 → 𝐵2 → · · · → 𝐵𝑞 hai chuỗi tương ứng 𝛼 = 𝐴1 → 𝐴2 → · · · → 𝐴 𝑝 𝛽 = 𝐵1 → 𝐵2 → · · · → 𝐵 𝑞 Định nghĩa ([7]): Xét hai 𝑞-sự kiện 𝐴 𝐵 sau: 𝐴 = 𝑎 𝑖1 , 𝑞 𝑖1 ), (𝑎 𝑖2 , 𝑞 𝑖2 ), , (𝑎 𝑖𝑚 , 𝑞 𝑖𝑚 ) , 𝐵 = (𝑎 𝑗1 , 𝑞 𝑗1 ), (𝑎 𝑗2 ), 𝑞 𝑗2 ), , (𝑎 𝑗𝑛 , 𝑞 𝑗𝑛 ) , với 𝑚 ≤ 𝑛 𝐴 gọi chứa 𝐵 , ký hiệu 𝐴 𝐵, tồn số tự nhiên ≤ 𝑘 < · · · < 𝑘 𝑚 ≤ 𝑛 cho 𝑎 𝑖𝑙 = 𝑎 𝑗𝑘𝑙 𝑞 𝑖𝑙 = 𝑞 𝑗𝑘𝑙 , với 𝑙 = 1, 2, , 𝑚 Phần lại báo tổ chức sau Phần II trình bày khái niệm kết Phần xây dựng chiến lược tỉa địa phương LPG Phần IV đưa thuật toán 𝐹𝐺𝑒𝑛𝐻𝑈𝑆𝑀 kết thử nghiệm Phần V đưa kết luận báo Ngồi ra, ta nói 𝛼 chứa 𝛽 , ký hiệu 𝛼 𝛽 , 𝑝 ≤ 𝑞 tồn 𝑝 số nguyên dương, ≤ 𝑗1 < · · · < 𝑗 𝑝 ≤ 𝑞 cho 𝐴 𝑘 𝐵 𝑗𝑘 , với 𝑘 = 1, 2, , 𝑝 Đồng thời, 𝛼 𝛽 tương đương với ((𝛼 𝛽 ) ∧ (𝛼 ≠ 𝛽 )) Tương tự, ta dùng ký hiệu để định nghĩa quan hệ chứa tập tất chuỗi Ta nói 𝛼 𝛽 𝛽 𝛼 (𝛽 gọi chuỗi cha 𝛼) tồn 𝑝 số nguyên dương, ≤ 𝑗 < · · · < 𝑗 𝑝 ≤ 𝑞 cho 𝐴 𝑘 ⊆ 𝐵 𝑗𝑘 , với 𝑘 = 1, 2, , 𝑝 Đồng thời, 𝛼 𝛽 tương đương với ((𝛼 𝛽) ∧ (𝛼 ≠ 𝛽)) II CÁC KHÁI NIỆM VÀ KẾT QUẢ CƠ BẢN Định nghĩa toán Mục giới thiệu vài khái niệm sở liên quan đến toán HUSM với 𝑢 [7] Ta nói 𝛽 chứa 𝛼, ký hiệu 𝛼 𝛽 (hay 𝛽 gọi 𝑞-chuỗi cha 𝛼) proj(𝛽 ) 𝛼 def Định nghĩa ([7]): Gọi A = {𝑎 , 𝑎 , , 𝑎 𝑀 } tập thuộc tính phân biệt Mỗi thuộc tính 𝑎 gắn liền với số dương P(𝑎) thể giá trị lợi ích đơn vị Khi đó, def ta có véctơ P( 𝐴) = P(𝑎 ), P(𝑎 ), , P(𝑎 𝑀 ) Một thuộc tính số lượng/định lượng (𝑞-thuộc tính) cặp (𝑎, 𝑞), với 𝑎 ∈ A 𝑞 ∈ 𝑅+ số lượng dương Tập 𝐴 A, 𝐴 ⊆ A, gọi kiện Không tổng quát, giả sử thuộc tính kiện tăng theo thứ tự từ điển ≺ Một kiện số lượng (𝑞-sự kiện) ứng với 𝐴 định nghĩa Gọi 𝛼} tập tất 𝑞-chuỗi đầu vào chứa 𝛼 Độ hỗ trợ 𝛼 định nghĩa số 𝑞-chuỗi đầu vào chứa 𝛼, def supp(𝛼) = |𝜌(𝛼)| Định nghĩa ([7]): Các lợi ích 𝑞-thuộc tính (𝑎, 𝑞), 𝑞-sự kiện 𝐴 = (𝑎 𝑖1 , 𝑞 𝑖1 ), (𝑎 𝑖2 , 𝑞 𝑖2 ), , (𝑎 𝑖𝑚 , 𝑞 𝑖𝑚 ), 𝑞-chuỗi 𝛼 QSDB D định nghĩa def 𝐴 = {(𝑎 𝑖 , 𝑞 𝑖 ) | 𝑎 𝑖 ∈ 𝐴, 𝑞 𝑖 ∈ 𝑅+ } def 𝐴 gọi kiện chiếu 𝐴 , ký hiệu 𝐴 = proj( 𝐴 ) Danh sách 𝑞-sự kiện 𝐴 𝑘 , 𝑘 = 1, 2, , 𝑝 ký hiệu 𝛼 = 𝐴1 → 𝐴2 · · · → 𝐴 𝑝 , gọi 𝑞-chuỗi Chuỗi chiếu 𝛼 𝑞-chuỗi 𝛼 định nghĩa 𝑢((𝑎, 𝑞)) = 𝑃(𝑎) ∗ 𝑞, def 𝑢( 𝐴 ) = def def 𝛼 = proj(𝛼 ) = proj( 𝐴1 ) → proj( 𝐴2 ) → · · · → proj( 𝐴 𝑝 ) def def 𝜌(𝛼) = {Ψ ∈ D | Ψ 𝛼, 𝛽 𝑢(𝛼 ) = def Để thuận tiện, ta ký hiệu 𝛼 [𝑘] = 𝐴 𝑘 𝛼[𝑘] = proj( 𝐴 𝑘 ) Một 𝑞-chuỗi rỗng () tất kiện rỗng Một sở liệu chuỗi lượng hóa (QSDB) D chứa hữu hạn 𝑞-chuỗi đầu vào, D = Ψ𝑖 , 𝑖 = 1, 2, , 𝑁 𝑃( 𝐴) Mỗi 𝑞-chuỗi Ψ𝑖 gắn với định danh (SID) 𝑖 Cơ sở liệu chuỗi (khơng lượng hóa SDB) D ứng với D định nghĩa 𝑚 𝑗=1 𝑝 𝑖=1 𝑢((𝑎 𝑖 𝑗 , 𝑞 𝑖 𝑗 )), 𝑢( 𝐴𝑖 ), def 𝑢(D ) = Ψ ∈D 𝑢(Ψ ) Để tránh tính tốn lặp lại lợi ích 𝑢 𝑞-thuộc tính (𝑎, 𝑞) 𝑞-chuỗi Ψ D , ta tính chúng lần thay 𝑞 𝑢((𝑎, 𝑞)) = P(𝑎) ∗ 𝑞 sở liệu Biểu diễn tương đương QSDB D gọi QSDB tích hợp D , ký hiệu vắn tắt D Từ sau ta xét QSDB tích hợp def D = proj(D ) = proj(Ψ𝑖 ), 𝑖 = 1, 2, , 𝑁 59 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông Bảng I D − MỘT QSDB MINH SID độ hỗ trợ với Tập tất chuỗi GHU định nghĩa ký hiệu HỌA def Chuỗi GHUS = 𝛾 ∈ HUS | 𝛾 ∗ ∈ HUS : Ψ1 = (𝑎, 9) → (𝑐, 2) (𝑒, 20) → (𝑐, 1) (𝑔, 50) (𝛾 ∗ → (𝑐, 8) (𝑑, 16) → (𝑐, 8) (𝑑, 16) (𝑒, 35) (𝑔, 60) Ψ2 = (𝑐, 9) ( 𝑓 , 28) → (𝑎, 15) (𝑐, 10) Ψ3 = (𝑔, 20) → (𝑒, 40) ( 𝑓 , 12) → (𝑏, 45) (𝑐, 1) → (𝑑, 56) Tập chuỗi sinh phổ biến lợi ích cao, FGHU, định nghĩa ký hiệu → (𝑎, 3) (𝑐, 5) (𝑒, 2) → (𝑑, 16) (𝑔, 40) (𝑎, 15) (𝑒, 20) → (𝑐, 6) (𝑑, 24) (𝑒, 25) def FGHUS = 𝛾 ∈ FHUS | 𝛾 ∗ ∈ FHUS : (𝛾 ∗ Ψ4 = (𝑒, 40) → (𝑐, 2) ( 𝑓 , 20) → (𝑐, 3) D = {Ψ1 = 𝑎 → 𝑐𝑒 → 𝑐𝑔 → 𝑐𝑑𝑒𝑔 → 𝑎𝑐𝑒, Định nghĩa ([7]): Ta định nghĩa 𝑠-mở rộng 𝑖-mở rộng 𝛼 𝛽 Ψ2 = 𝑐 𝑓 → 𝑎𝑐 → 𝑑𝑔 → 𝑎𝑒 → 𝑐𝑑𝑒, Ψ3 = 𝑔 → 𝑒 𝑓 → 𝑏𝑐 → 𝑑, Ψ4 = 𝑒 → 𝑐 𝑓 → 𝑐} def O (𝛼, 𝛽 ) = {𝛼 | (𝛼 tập tất lần xuất 𝛼 𝛼 𝛽 Lợi ích bé (gọi tắt lợi ích) 𝛼 𝛽 định nghĩa def 𝑢 (𝛼, 𝛽 ) = min{𝑢(𝛼 ) | 𝛼 ∈ O (𝛼, 𝛽 )} Lợi ích 𝛼 D định nghĩa 𝑢 (𝛼) = Ψ ∈𝜌( 𝛼) def 𝛼 𝑠 𝛽 = 𝐴1 → 𝐴2 → · · · → 𝐴 𝑝 → 𝐵 → 𝐵 → · · · → 𝐵 𝑞 , 𝛼 𝑖 𝛽 = 𝐴1 → 𝐴2 → · · · → ( 𝐴 𝑝 ∪ 𝐵 ) → 𝐵 → · · · → 𝐵 𝑞 , def 𝑎 ≺ 𝑏 với 𝑎 ∈ 𝐴 𝑝 𝑏 ∈ 𝐵1 Một mở rộng tiến (hay mở rộng) 𝛼 với 𝛽, ký hiệu 𝛾 = 𝛼 𝛽, 𝑖-mở rộng 𝑠-mở rộng, tức 𝛼 𝑖 𝛽 hay 𝛼 𝑠 𝛽 Khi đó, 𝛼 gọi tiền tố 𝛾 𝛽 hậu tố (đối với 𝛼) 𝛾 Ngoài ra, 𝛿 tiền tố bé (của 𝛾 với ) chứa 𝛼, ta ký hiệu 𝛿 pref(𝛾, 𝛼) Hậu tố 𝛽 𝛾 (đối với 𝛿, tức 𝛾 = 𝛿 𝛽) ký hiệu suf (𝛾, 𝛼) Cơ sở liệu chiếu (PDB) 𝛼 định nghĩa 𝛽 Gọi 𝛽 ) ∧ (proj(𝛼 ) = 𝛼} def 𝛾) ∧ (supp(𝛾) = supp(𝛾 ∗ )) Khai thác tập FGHUS mục tiêu báo Ví dụ, xét 𝑚𝑢 = 226 𝑚𝑠 = Với chuỗi 𝛾 = 𝑎 → 𝑔 → 𝑐𝑑𝑒, ta có 𝛾2228 ∈ FHUS Hơn nữa, 𝛾 chuỗi FGHU, khơng tồn 𝛾 ∗ ∈ FHUS cho 𝛾 ∗ 𝛾 supp(𝛾 ∗ ) = supp(𝛾) Đây chuỗi FGHU nhất, tức FGHUS = {𝛾} Để ý rằng, lực lượng FGHUS thường bé nhiều so với FHUS, đặc biệt 𝑚𝑢 𝑚𝑠 bé Chẳng hạn, với 𝑚𝑢 = 𝑚𝑠 = 1, |FHUS| = 5235, |FGHUS| = 105 (khoảng 2% |FHUS|) Xét QSDB minh họa Bảng I, dùng cho ví dụ suốt báo Chuỗi 𝛼 = 𝑒 → 𝑐𝑒 chứa Ψ1 , 𝛼 Ψ1 , xuất Ψ𝑖 Lần xuất 𝛼 Ψ1 𝑞-chuỗi 𝛼 = (𝑒, 20) → (𝑐, 8)(𝑒, 35) Ψ1 Vậy proj(𝛼 ) = 𝛼 𝑢(𝛼 ) = 20+8+35 = 63 Ngoài ra, 𝛼 Ψ2 , nên 𝜌(𝛼) = {Ψ1 , Ψ2 } supp(𝛼) = SDB D ứng với D Định nghĩa ([7]): Giả sử 𝛼 𝛾) ∧ (supp(𝛾) = supp(𝛾 ∗ )) def D 𝛼 = {suf(Ψ, 𝛼)|(Ψ ∈ D) ∧ (Ψ 𝑢 (𝛼, Ψ )) 𝛼)} Ta nói D𝛽 chứa D 𝛼 , ký hiệu D𝛽 𝐷 𝛼 , 𝜌(𝛽) ⊆ 𝜌(𝛼) với Ψ ∈ 𝜌(𝛽) ta có suf (Ψ, 𝛽) suf(Ψ, 𝛼) Khi D𝛽 D 𝛼 D 𝛼 D𝛽 , ta nói D𝛽 D 𝛼 ký hiệu D𝛽 = D 𝛼 Dễ thấy supp(𝛼) = |D 𝛼 | Lúc đó, 𝛼 gọi chuỗi lợi ích cao (HU) 𝑢 (𝛼) ≥ 𝑚𝑢 Từ nay, ta viết gọn 𝛼𝑠𝑢 để diễn tả 𝑢 (𝛼) = 𝑢 supp(𝛼) = 𝑠 Lý việc sử dụng 𝑢 tham khảo thêm [7, 8, 13] Lấy ví dụ, xét 𝛼 = 𝑒 → 𝑐𝑒 với 𝜌(𝛼) = {Ψ1 , Ψ2 } supp(𝛼) = Dễ thấy rằng, Ví dụ, với 𝛼 = 𝑒 → 𝑒 𝛽 = 𝑒 → 𝑐𝑒, ta có 𝜌(𝛼) = 𝜌(𝛽) = {Ψ1 , Ψ2 }, suf (Ψ1 , 𝛼) = _𝑔 → 𝑎𝑐𝑒 suf(Ψ2 , 𝛼) = Do đó, PDB 𝛼 D 𝛼 = {_𝑔 → 𝑎𝑐𝑒, } Tương tự, ta có D𝛽 = D 𝛼 O (𝛼, Ψ4 ) = {(𝑒, 20) → (𝑐, 8) (𝑒, 35), (𝑒, 20) → Khơng gian tìm kiếm chuỗi lời giải biểu diễn tiền tố với gốc chuỗi rỗng, nút biểu diễn chuỗi ứng viên, nút biểu diễn chuỗi mở rộng Ta ký hiệu branch(𝛼) nhánh có gốc nút biểu diễn 𝛼, chứa 𝛼 mở rộng Với tiền tố khác rỗng 𝛼, 𝛽 = 𝛼 𝑦, chuỗi 𝛾 = 𝛼 𝜀 𝑦 mà 𝛾 𝛽 gọi mở rộng lùi (BE) 𝛽 𝜀, với 𝑦 thuộc (𝑐, 5) (𝑒, 20), (𝑒, 35) → (𝑐, 5) (𝑒, 20)} Do đó, 𝑢 (𝛼, Ψ1 ) = min{63, 45, 60} = 45 tương tự, 𝑢 (𝛼, Ψ1 ) = 51 Vì vậy, ta có 𝛼296 Định nghĩa 5: Một chuỗi HU 𝛾 gọi chuỗi sinh lợi ích cao, GHU, khơng tồn chuỗi HU có 60 Tập 2019, Số 2, Tháng 12 tính cuối 𝛽, ký hiệu lastItem(𝛽) Chẳng hạn, với 𝛼 = 𝑐𝑑 branch(𝛼) chứa chuỗi: 𝑐𝑑 → 𝜀, 𝑐𝑑𝑒 → 𝜀 𝑐𝑑𝑒𝑔 → 𝜀, với 𝜀, kể Cho 𝛽 = 𝑐𝑒, chuỗi 𝑐𝑑𝑒 𝑐 → 𝑐𝑔 → 𝑐𝑑𝑒 BE 𝛽 Tuy nhiên, 𝑐𝑒 → 𝑐𝑔 → 𝑒 BE 𝑐 → 𝑒, không BE 𝛽 Vì Một độ đo 𝑢𝑏 gọi chặn 𝑢 𝑢 (𝛼) ≤ 𝑢𝑏(𝛼), với 𝛼 Ngoài chặn truyền thống def SWU(𝛼) = Ψ ∈𝜌( 𝛼) 𝑢(Ψ ) [5], ta có chặn chặt sau Thách thức HUSM 𝑢 khơng đơn điệu tăng không đơn điệu giảm, tức ∃𝛽, 𝛼, 𝛾, 𝛿 : (𝛽 𝛼) ∧ (𝛾 𝑢𝑏 rem (𝛽, Ψ1 ) = 17 + 123 = 140 Định nghĩa ([7]): Xét 𝑦 ∈ A 𝛼 khác rỗng Ta định nghĩa chặn sau đây: 𝛿) (𝑢 (𝛽) > 𝑢 (𝛼)) ∧ (𝑢 (𝛾) > 𝑢 (𝛿)) def RBU(𝛼) = Nói cách khác, 𝑢 khơng thỏa mãn DCP (tính chất supp sử dụng FSM) Thật vậy, với 𝛼 = 𝑐𝑑, 𝛽 = 𝑐𝑑𝑔, 𝛿 = 𝑐 → 𝑐 → 𝑐𝑑, dễ thấy 𝛿 𝛼 𝛽 𝑢 (𝛽) = 84 > 𝑢 (𝛼) = 54 > 𝑢 (𝛿) = 27 Để khắc phục, chặn 𝑢 thỏa mãn tính chất tựa đơn điệu giảm (có thể yếu DCP) đề xuất mục def def 𝑢 𝑢 (𝛽, Ψ1 ) = 25, FEnd(𝛽, Ψ1 ) = 4, LRU SWU 𝑢 (𝛽, Ψ2 ) = 39, 𝑢(𝛽, Ψ1 , 4) = 25, 𝑢(rem(𝛽, Ψ1 , 4)) = 123 Vì 𝑢 (𝛽) = 𝑢 (𝛽, Ψ1 ) + 𝑢 (𝛽, Ψ2 ) = 64, 𝑢𝑏 rem (𝛽, Ψ1 ) = 150, 𝑢𝑏 rem (𝛽, Ψ2 ) = 64, RBU(𝛽) = 𝑢𝑏 rem (𝛽, Ψ1 ) + 𝑢𝑏 rem (𝛽, Ψ2 ) = 212 Ngoài ra, với 𝛼 = 𝑐 → 𝑐, ta dễ thấy 𝛽 = 𝛼 𝑖 𝑑 LRU(𝛽) = 𝑈𝐵rem (𝛼, Ψ1 ) + 𝑢𝑏 rem (𝛼, Ψ2 ) def = 200 + 165 = 365, SWU(𝛽) = 𝑢(Ψ1 ) + 𝑢(Ψ2 ) = 229 + 208 = 437 𝑢(𝛼, Ψ , 𝑖 𝑝 ) = min{𝑢(𝛼 ) | 𝛼 ∈ O (𝛼, Ψ ) ∧ end(𝛼 , Ψ ) = 𝑖 𝑝 } Vì ta có Chặn dựa vào lợi ích cịn lại 𝑢 (𝛼, Ψ ) định nghĩa ký hiệu: 𝑢(Ψ ), RBU Ví dụ, xét chuỗi 𝛽 = 𝑐 → 𝑐𝑑, 𝜌(𝛽) = {Ψ1 , Ψ2 } Khi def 𝑢𝑏 rem (𝛼, Ψ ) = 𝑢𝑏 rem (𝛼, Ψ ), Với hai chặn 𝑢𝑏 𝑢𝑏 , 𝑢𝑏 gọi chặt 𝑢𝑏 , ký hiệu 𝑢𝑏 𝑢𝑏 , 𝑢𝑏 (𝛼) ≤ 𝑢𝑏 (𝛼) với 𝛼 Theo [7, Định lý 1], ta có FEnd(, Ψ ) = 0, D = D rem(, Ψ , 𝑖 ∗𝑝 ) = Ψ Với điểm cuối 𝑖 𝑝 = end(𝛼, Ψ ), ta định nghĩa 𝑢(𝛼, Ψ , 𝑖 ∗𝑝 ) + 𝑢(rem(𝛼, Ψ , 𝑖 ∗𝑝 )), Ψ ∈𝜌( 𝛼 𝑦) LRU(𝑦) = SWU(𝑦) Giả sử 𝛼 Ψ , 𝛼 = proj(𝛼 ) Ψ , với Ψ = 𝐵1 → 𝐵2 → · · · → 𝐵𝑞 ∈ D , tức tồn 𝑝 số nguyên, ≤ 𝑖1 < 𝑖 < · · · < 𝑖 𝑝 ≤ 𝑞 cho 𝐴 𝑘 𝐵𝑖𝑘 𝐴 𝑘 = proj( 𝐴 𝑘 ) ⊆ proj(𝐵𝑖𝑘 ), với 𝑘 = 1, 2, , 𝑝 Chỉ số cuối 𝑖 𝑝 gọi điểm cuối 𝛼 (hay 𝛼 ) Ψ , ký hiệu end(𝛼, Ψ ) (hay end(𝛼 , Ψ )) Thuộc tính cuối 𝛼 𝐵𝑖 𝑝 gọi thuộc tính cuối ứng với 𝑖 𝑝 , ký hiệu 𝑒 𝑖 𝑝 Khi đó, 𝑞-chuỗi lại 𝛼 Ψ (đối với 𝑖 𝑝 ) phần lại Ψ def sau 𝑒 𝑖 𝑝 , ký hiệu rem(𝛼, Ψ , 𝑖 𝑝 ) Gọi 𝑖 ∗𝑝 = FEnd(𝛼, Ψ ) điểm cuối 𝛼 Ψ Cơ sở liệu chiếu lượng hóa (PQDB) D 𝛼 𝛼 chứa tất chuỗi lại def rem(𝛼, Ψ , 𝑖 ∗𝑝 ), với Ψ ∈ D Nếu 𝛼 =, ta quy ước 𝑖 ∗𝑝 = def 𝑢𝑏 rem (𝛼, Ψ ), LRU(𝛼 𝑦) = Hai chiến lược tỉa chuỗi LU LF theo chiều sâu chiều rộng def Ψ ∈𝜌( 𝛼) 𝑢 (𝛽) < RBU(𝛽) < LRU(𝛽) < SWU(𝛽) Để loại nhanh chuỗi có lợi ích thấp phổ biến, dựa vào [7, Định lý 2], ta thiết kế hai chiến lược DPS WPS nhằm thu hẹp hiệu khơng gian tìm kiếm Trước hết, ta có chiến lược tỉa theo chiều sâu dựa vào RBU, viết DPS(RBU), sau: “Nếu RBU(𝛼) < 𝑚𝑢 branch(𝛼) tỉa” 𝛼 ≠, 𝛼 = Ví dụ, xét 𝛽 = 𝑐 → 𝑑 Do lần xuất 𝛽 Ψ1 𝑞-chuỗi 𝛽 = (𝑐, 2) → (𝑑, 16) Ψ1 , nên def 𝑖 ∗𝑝 = FEnd(𝛽, Ψ1 ) = 4, Gọi hai tập thuộc tính ứng viên cho 𝑖− 𝑠-mở rộng là: 𝑢(rem(𝛽, Ψ1 , 𝑖 ∗𝑝 )) = 123, 𝐼LRU (𝛼) = {𝑧 | (LRU(𝛼 𝑖 𝑧) ≥ 𝑚𝑢) ∧ (supp(𝛼 𝑖 𝑧) ≥ 𝑚𝑠)}, 𝑆LRU (𝛼) = {𝑧 | (LRU(𝛼 𝑠 𝑧) ≥ 𝑚𝑢) ∧ (supp(𝛼 𝑠 𝑧) ≥ 𝑚𝑠)} rem(𝛽, Ψ1 , 𝑖 ∗𝑝 ) = (𝑒, 35) (𝑔, 60) → (𝑎, 3) (𝑐, 5) (𝑒, 20), 𝑢(𝛽, Ψ1 , 𝑖 ∗𝑝 ) def def = min{𝑢(𝛽 ), 𝑢((𝑐, 1) → (𝑑, 16))} = 17 61 Các cơng trình nghiên cứu phát triển Cơng nghệ Thông tin Truyền thông Nếu 𝑢 (𝛼 𝑖 𝑧) ≥ 𝑚𝑢 supp(𝛼 𝑖 𝑧) ≥ 𝑚𝑠, 𝑧) ≥ 𝑢 (𝛼 𝑖 𝑧) ≥ 𝑚𝑢, 𝑦 𝑖 𝑧) ≤ LRU(𝛼 𝑧, 𝛼 𝑠 𝑦 LRU(𝛼 𝑖 tức 𝑧 ∈ 𝐼LRU (𝛼) Vì LRU(𝛼 max{LRU(𝛾) | 𝛾 ∈ {𝛼 𝑖 ≤ LRU(𝛼 𝑦 𝑠 𝑠 𝑧), 𝑖 supp(𝛼 𝑦 𝑧) ≤ supp(𝛼 𝑧), 𝑖 𝑧, 𝛼 𝑠 III CHIẾN LƯỢC LPG TỈA SỚM CÁC CHUỖI KHÔNG LÀ SINH LỢI ÍCH CAO 𝑖 𝑦 với 𝛼 𝑦 𝑧 Điều kiện tỉa sớm tổng quát 𝑧), 𝑠 Trước hết, nhắc lại hai độ đo SE, SLIP điều kiện tỉa sớm tổng quát dùng để tỉa chuỗi phổ biến đóng chuỗi phổ biến đóng có lợi ích cao [13], chuỗi sinh phổ biến [12] 𝑧}} 𝛼 𝑧 Định nghĩa ([12]): Tổng kiện lại PDB D 𝛼 định nghĩa ký hiệu là: Cho nên ta có (𝑆LRU (𝛼 𝐼LRU (𝛼 𝑖 𝑖 𝑦) ⊆ 𝐼LRU (𝛼), 𝑦) ∪ 𝑆LRU (𝛼 𝑖 def SE(𝛼) = 𝑦)) ⊆ 𝑆LRU (𝛼) Ψ∈D: suf (Ψ, 𝛼) ∈D 𝛼 Từ đó, ta có chiến lược tỉa theo chiều rộng dựa vào LRU, viết WPS(LRU), sau: “Nếu LRU(𝛼 𝑦) < 𝑚𝑢, ta không cần xét tất mở rộng tiến 𝛼 𝑦, tức branch(𝛼 𝑦), mở rộng lùi Lấy ví dụ, với 𝑚𝑢 = 230 𝑚𝑠 = 2, ta có supp(𝑏) < 𝑚𝑠 LRU(𝑏) = 174 < 𝑚𝑢 Các giá trị LRU thuộc tính cịn lại, tập chứa thuộc tính ứng viên cho mở rộng, 𝐼LRU () = 𝑆LRU () = {𝑎, 𝑐, 𝑑, 𝑒, 𝑓 , 𝑔}, lớn hay mu (chẳng hạn LRU(𝑎) = 447) Khi đó, WPS(LRU), ta loại thuộc tính 𝑏 khỏi D Để minh họa tác dụng tỉa theo chiều sâu RBU, xét hai giá trị RBU(𝑎𝑐) = 199 RBU(𝑎 → 𝑐) = 229 bé 𝑚𝑢 Sử dụng DPS(RBU), toàn nhánh branch(𝑎𝑐) branch(𝑎 → 𝑐) bị tỉa Dễ thấy rằng, sử dụng supp, 𝐼LRU (𝑎) = {𝑐, 𝑒} 𝑆LRU (𝑎) = {𝑎, 𝑐, 𝑑, 𝑒, 𝑔}(⊆ 𝑆LRU ( )) Vì 𝑆LRU (𝑎 → 𝑐) ⊆ 𝑆LRU (𝑎) với 𝑥 ∈ 𝑆LRU (𝑎), RBU(𝑎 → 𝑐 → 𝑥) < LRU(𝑎 → 𝑐 → 𝑥) = 229 < 𝑚𝑢 hay supp(𝑎 → 𝑐 → 𝑥) = < 𝑚𝑠, 𝑆LRU (𝑎 → 𝑐) = ∅ Do đó, DPS(RBU), ta tỉa nhánh branch(𝑎 → 𝑐 → 𝑥), với 𝑥 ∈ {𝑎, 𝑐, 𝑑, 𝑒, 𝑔} Tuy nhiên, sử dụng WPS(LRU), ta loại bỏ tất nhánh mở rộng lùi branch(𝑎 → 𝑐 → 𝑥), ví dụ branch(𝑎 → 𝑐 → 𝑔 → 𝑑), branch(𝑎 → 𝑐𝑒 → 𝑐𝑔 → 𝑐𝑑) (của branch(𝑎 → 𝑐 → 𝑑)), v.v Thật vậy, lý 𝐼LRU (𝑎 → 𝑐𝑒 → 𝑐𝑔 → 𝑐) ⊆ 𝑆LRU (𝑎 → 𝑐𝑒) ⊆ 𝑆LRU (𝑎 → 𝑐) = ∅ Ngồi ra, chặt LRU, RBU khơng có tác dụng tỉa theo chiều rộng Nếu dùng RBU để tỉa theo chiều rộng, ta tỉa nhầm số lời giải Thật vậy, với 𝑚𝑢 = 225 𝑚𝑠 = 2, 𝐼RBU (𝑎 → 𝑔 → 𝑒 → 𝑐) (⊆ 𝑆RBU (𝑎 → 𝑔 → 𝑒) = {𝑐}), nên 𝐼RBU (𝑎 → 𝑔 → 𝑒 → 𝑐) = ∅ Tuy nhiên, 𝑎 → 𝑔 → 𝑒 → 𝑐𝑒 225 ∈ FHUS Có thể kết luận rằng, LRU lỏng RBU, tác dụng tỉa WPS thật mạnh DPS Vì vậy, DPS WPS dùng để tỉa nhánh LU (và LF) tìm kiếm tiền tố, có hiệu với giá trị 𝑚𝑢 cao [7] Tuy nhiên, nhiều chuỗi HU khơng chuỗi sinh HU (non-GHU) Do đó, phần tiếp theo, chiến lược LPG tỉa ứng viên non-GHU đề xuất Để ý rằng, LPG hiệu với giá trị 𝑚𝑢 thấp size(Ψ) − size(pref(Ψ, 𝛼)) + Với chuỗi 𝛼, gọi 𝛿 tiền tố bé Ψ chứa 𝛼, Ψ ∈ 𝜌(𝛼) Đặt 𝑓 𝑖(𝛼, Ψ) số (trong Ψ) kiện cuối 𝛿 lastEvent(𝛼) kiện cuối 𝛼 Gọi LP(𝛼, Ψ) danh sách vị trí thứ 𝑖 khác Ψ mà lastEvent(𝛼) ⊆ Ψ[𝑖] 𝑓 𝑖(𝛼, Ψ) ≤ 𝑖 ≤ size(Ψ) Không tổng quát, giả sử số LP(𝛼, Ψ) tăng Khi đó, def slip(𝛼, Ψ) = | LP(𝛼, Ψ)| số vị trí xuất kiện cuối 𝛿 Ψ Định nghĩa ([13]): Số đo SLIP PDB D 𝛼 định nghĩa ký hiệu def SLIP(𝛼) = slip(𝛼, Ψ) Ψ∈𝜌( 𝛼) Ví dụ, xét 𝛼 = 𝑒 → 𝑒 Vì D 𝛼 = {_𝑔 → 𝑎𝑐𝑒, }, nên SE(𝛼) = Ta có 𝜌(𝛼) = {Ψ1 , Ψ2 } Vì kiện cuối 𝑒 xuất hai lần Ψ1 vị trí thứ thứ 5, nên LP(𝛼, Ψ1 ) = {4, 5} Tương tự, LP(𝛼, Ψ2 ) = {5} Vì vậy, SLIP(𝛼) = Từ SE SLIP, ta có điều kiện tỉa sớm tổng quát (GEP) Định lý sau Định lý (Điều kiện tỉa sớm tổng quát [13]): Xét hai chuỗi 𝛼 𝛽 thỏa mãn 𝛼 𝛽 Khi đó: a) Nếu SE(𝛼) = SE(𝛽), supp(𝛼) = supp(𝛽) D𝛾 = D𝜆 với 𝑠-mở rộng 𝛾 𝛼 𝜆 𝛽 với chuỗi khác rỗng; b) Nếu SE(𝛼) = SE(𝛽) SLIP(𝛼) = SLIP(𝛽), supp(𝛼) = supp(𝛽) D𝛾 = D𝜆 với tất mở rộng 𝛾 𝛼 𝜆 𝛽 với chuỗi khác rỗng Chiến lược LPG Dựa vào GEP chặn SF sau 𝑢 , chiến lược LPG tỉa sớm chuỗi non-GHU đề xuất Định nghĩa 10: Cho chuỗi phổ biến 𝛼, tức supp(𝛼) ≥ def 𝑘, với 𝑘 = 𝑚𝑠 Sau xếp tăng dần dãy def U (𝛼) = {𝑢 (𝛼, Ψ ) | Ψ ∈ 𝜌(𝛼)}, 62 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thơng Thuật tốn 4: Thuật tốn TSPSO cá thể di cư quần thể tới vùng khơng gian mới, q trình tìm kiếm tái khởi động Tiếp theo ta tìm hiểu độ phức tạp thuật tốn TSPSO Trước thực thuật tốn TSPSO ta cần phải xếp máy chủ thực thi theo thứ tự tăng dần tốc độ thực hiện, giải thuật xếp có độ phức tập thời gian O(𝑛 log(𝑛)) Thủ tục tính ma trận thời gian thực thi tác vụ máy chủ có độ phức tạp thời gian tính tốn O(𝑀 × 𝑁), 𝑀 số tác vụ, 𝑁 số máy chủ Thủ tục tính ma trận thời gian truyền liệu máy chủ có độ phức tạp tính tốn O(𝑁 ) Trong thuật tốn TSPSO thủ tục khởi tạo khởi tạo cá thể quần thể cách ngẫu nhiên, cá thể mã hóa véc tơ độ dài 𝑀, độ phức tạp thủ tục khởi tạo O(𝑀 × SCT), SCT số cá thể quần thể; thực nghiệm sử dụng SCT = 100 Hàm tính thời gian thực (makespan) phương án xếp lịch O(𝑀 ) Thuật tốn Tabu_Search có độ phức tạp O(𝑀 ) Trong tốn lập lịch luồng cơng việc, thường số tác vụ lớn số máy chủ (𝑀 > 𝑁), độ phức tạp thuật tốn TSPSO (Số hệ) × O(𝑀 ) 10 11 12 13 14 15 16 17 18 19 20 21 V KẾT QUẢ THỰC NGHIỆM 22 23 Phân nhóm liệu thực nghiệm Dữ liệu tốc độ tính tốn máy chủ băng thơng máy chủ lấy từ công ty cung cấp dịch vụ cloud [16] địa website http://aws.amazon com/ec2/pricing [10; 100] (Mb/s); hệ số quán tính 𝜔 = 0, 729; hệ số gia tốc 𝑐 = 𝑐 = 1, 49445; số 𝐾 = 30; số cá thể SCT = 25; độ lệch 𝜖 = 0, 21; hệ số 𝛼 ∈ [0, 2; 0, 7] Dữ liệu luồng công việc lấy từ liệu thử nghiệm xây dựng theo độ trù mật khác luồng công việc từ ứng dụng thực tế ứng dụng Montage [17] Quá trình tiến hành thực nghiệm Để kiểm chứng thuật tốn đề xuất TSPSO sử dụng công cụ mô Cloudsim [6] để tạo lập môi trường đám mây kết hợp với liệu luồng công việc ứng dụng Montage [17] Các hàm gói thư viện Jswarm [6] sử dụng để thực phương thức tối ưu bày đàn Đối tượng so sánh thuật toán PSO_H [12], EGA [18] Round Robin [19] Những liệu tổng hợp lại chia thành hai nhóm sau Nhóm luồng công việc ngẫu nhiên với khác hệ số 𝛼 nhóm luồng cơng việc từ ứng dụng Montage Hệ số 𝛼 xác định sau: 𝛼= Dữ liệu vào: Tập T, tập S, mảng 𝑊 [1 × 𝑀], mảng 𝑃[1 × 𝑁], mảng 𝐵[𝑁 × 𝑁], mảng 𝐷 [𝑀 × 𝑀], số 𝐾, độ lệch 𝜔, số cá thể SCT Dữ liệu ra: Lời giải tốt gbest Khởi tạo ngẫu nhiên vector vị trí vector dịch chuyển cá thể 𝑖; Khởi tạo bước lặp 𝑡 ← 0; while điều kiện lặp for 𝑖 = to SCT Tính vector vị trí x𝑖 theo (3); 𝑀𝑖 = Makespan cá thể x𝑖 ; end for 𝑖 = to SCT if pbest𝑖 < 𝑀𝑖 then pbest𝑖 = 𝑀𝑖 ; end end gbest = min{𝑀𝑖 }; for 𝑖 = to SCT Cập nhật vector v𝑖𝑘 theo (1) (3); Tính x𝑖 theo (2); end 𝑡 ← 𝑡 + 1; if sau 𝐾 hệ mà độ lệch gbest không vượt 𝜔 then gbest = Tabu_Search(gbest); end end return gbest; |𝐸 | 𝑀 × (𝑀 − 1)/2 Các chương trình mơ viết ngôn ngữ Java chạy máy tính cá nhân với vi xử lý Intel Core i5, 2, GHz, RAM GB, hệ điều hành Windows Ultimate Thực nghiệm tiến hành cách độc lập 30 lần liệu thực nghiệm Tham số 𝛼 cho biết đồ thị G phân thành cấp, cấp có nhiều hay tác vụ, nói cách khác 𝛼 phản ánh độ trù mật đồ thị G Khi làm thực nghiệm với nhóm, số máy chủ số tác vụ giữ cố định tỷ lệ 𝛼 thay đổi hình 4 Kết thực nghiệm Tham số cấu hình hệ thống Hình cho thấy chênh lệch thời gian xử lý (makespan) lời giải tốt mà thuật toán đề xuất TSPSO thuật toán đối chứng (PSO_H, EGA, Round Robin) tìm chạy liệu khác thuộc nhóm luồng công việc ngẫu nhiên luồng Các tham số cấu hình đám mây thiết lập miền giá trị sau: tốc độ tính tốn máy chủ 𝑃𝑖 ∈ [1; 250] (MI/s); khối lượng liệu tác vụ 𝐷 𝑖 𝑗 ∈ [1; 10.000] (Mb); băng thông máy chủ 𝐵(𝑆𝑖 , 𝑆 𝑗 ) ∈ 98 Tập 2019, Số 2, Tháng 12 KẾT QUẢ THỰC HIỆN Ký hiệu Bảng II THUẬT TOÁN VỚI CÁC BỘ DỮ LIỆU NGẪU NHIÊN RRTSM PSO_H TSPSO EGA STD Mean Best STD Mean Best STD Mean Best STD Mean T532 - 18,7 18,7 4,7 9,9 7,1 1,0 7,2 7,0 3,4 9,8 7,0 T1031 - 33,1 33,1 2,4 20,4 17,4 1,1 18,3 16,5 1,2 20,4 16,8 T1032 - 16 16 2,0 8,2 3,5 1,2 5,1 3,5 1,8 8,1 3,5 T1035 - 18,9 18,9 2,5 9,7 5,2 1,8 6,8 3,9 2,3 9,7 4,9 T1051 - 23,7 23,7 1,5 21,5 16,4 1,1 17,6 14,8 1,4 19,1 16,1 T1054 - 25,2 25,2 2,0 20,7 18,9 0,9 19,0 17,3 1,3 20,5 17,6 T2081 - 72,7 72,7 5,2 44,2 34,1 2,7 37,8 32,4 3,7 41,9 35,1 T2083 - 20,3 20,3 2,2 21,2 19,8 0,5 19,4 18,2 1,4 20,3 19,6 T2084 - 72,0 72,0 6,1 44,7 37,4 2,7 39,3 34,1 3,2 42,5 36,5 T2086 - 32,5 32,5 1,5 26,2 22,8 1,2 21,4 17,4 1,4 25,4 22,6 KẾT QUẢ THỰC HIỆN Ký hiệu Bảng III THUẬT TOÁN VỚI CÁC BỘ DỮ LIỆU TỪ ỨNG DỤNG RRTSM PSO_H Best MONTAGE TSPSO EGA STD Mean Best STD Mean Best STD Mean Best STD Mean Best M2032 - 162,7 162,7 4,9 142,7 131,6 3,6 123,4 129,0 5,3 135,5 130,1 M2051 - 146,6 146,6 5,4 132 121,8 3,3 123,4 115,7 4,5 131,7 123,3 M2531 - 465,0 465,0 18,7 373,4 345,5 13,0 346,4 336,1 7,0 352,7 339,4 M2532 - 183,8 183,8 3,9 110,7 101,5 1,5 104,7 101,2 1,4 112,1 104,5 M2533 - 322,9 322,9 4,0 311,4 311,7 0,5 312,5 311,6 0,5 315,2 311,8 M2581 - 300,6 300,6 15 261,3 232,1 6,1 236,1 223,4 6,5 246,2 231,9 M2582 - 133,9 133,9 5,1 84,8 77,9 4,7 81,4 72,3 2,9 85,1 77,6 M2583 - 236,5 236,5 8,3 239 224 5,3 221,3 215,7 4,7 233,5 221,4 M5081 - 155,8 155,8 6,3 108,0 95,0 5,5 101,7 91,5 3,2 107,8 96,6 M5082 - 82,1 82,1 0,9 14,0 18,1 0,8 12,6 13,1 0,5 14,0 14,8 M5083 - 101,7 101,7 4,3 98,3 89,8 4,3 90,0 80,2 1,8 95,3 88,5 công việc từ ứng dụng Montage Kết thực nghiệm trình bày chi tiết bảng II III hình Kết so sánh giá trị trung bình tính thuật tốn TSPSO với thuật toán đối sánh, hầu hết trường hợp thuật toán TSPSO cho kết tốt thuật tốn đối sánh, giá trị trung bình tìm TSPSO nhỏ giá trị trung bình tìm PSO_H từ 4%– 11% nhỏ giá trị trung bình tìm thuật tốn EGA từ 2%–7% EGA, điều chứng tỏ thuật tốn TSPSO có chất lượng lời giải tốt thuật tốn đối sánh độ ổn định lần chạy tốt VI KẾT LUẬN Bài báo trình bày kiến trúc lân cận cho thuật toán Tabu Search thuật toán Tối ưu bày đàn để tìm lời giải gần cho tốn lập lịch thực thi luồng công việc môi trường điện tốn đám mây Những kết gồm có: Các hình so sánh giá trị tốt tìm thuật tốn TSPSO với thuật tốn đối sánh, qua ta thấy giá trị tốt tìm TSPSO nhỏ giá trị tốt tìm PSO_H từ 2%–9%, nhỏ giá trị tốt tìm random từ 20%–40%; giá trị tốt tìm thuật tốn TSPSO nhỏ giá trị tốt tìm thuật tốn EGA từ 1%–8% Kết so sánh độ lệch chuẩn tìm thuật tốn TSPSO với thuật toán đối sánh, giá trị độ lệch chuẩn TSPSO nhỏ độ lệch chuẩn thuật toán RRTSM, PSO_H • • • 99 Đề xuất phương thức để cập nhật vị trí cá thể cách ánh xạ giá trị thực tới máy chủ có tốc độ tính tốn băng thơng gần với giá trị Đề xuất cơng thức tính vector dịch chuyển cá thể thứ 𝑖 theo giá trị gbest pbest𝑖 Đề xuất hai toán tử lân cận cho thuật tốn tìm kiếm lân cận Tabu Search để chương trình khỏi cực trị địa phương cách dịch chuyển cá thể tới miền khơng gian tìm kiếm Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thông TÀI LIỆU THAM KHẢO [1] J D Ullman, “NP-complete scheduling problems,” Journal of Computer and System sciences, vol 10, no 3, pp 384– 393, 1975 [2] G B Berriman, E Deelman, J C Good, J C Jacob, D S Katz, C Kesselman et al., “Montage: a grid-enabled engine for delivering custom science-grade mosaics on demand,” in Optimizing Scientific Return for Astronomy through Information Technologies, vol 5493, 2004, pp 221–232 [3] P Maechling, E Deelman, L Zhao, R Graves, G Mehta, N Gupta et al., “SCEC CyberShake workflows—automating probabilistic seismic hazard analysis calculations,” in Workflows for e-Science Springer, 2007, pp 143–163 [4] USC Epigenome Center [Online] Available: http: //epigenome.usc.edu [5] LIGO - Laser Interferometer Gravitational Wave Observatory [Online] Available: http://www.ligo.caltech.edu [6] R Buyya, R Ranjan, and R N Calheiros, “Modeling and simulation of scalable cloud computing environments and the CloudSim toolkit: Challenges and opportunities,” in IEEE International Conference on High Performance Computing & Simulation, 2009, pp 1–11 [7] K Dubey, M Kumar, and S Sharma, “Modified HEFT algorithm for task scheduling in cloud environment,” Procedia Computer Science, vol 125, pp 725–732, 2018 [8] A M Manasrah and H Ba Ali, “Workflow scheduling using hybrid GA-PSO algorithm in cloud computing,” Wireless Communications and Mobile Computing, vol 2018, no 1934784, pp 1–16, 2018 [9] N Grigoreva, “Branch and bound method for scheduling precedence constrained tasks on parallel identical processors,” in Proceedings of The World Congress on Engineering, 2014, pp 832–836 [10] R Rajavel and T Mala, “Achieving service level agreement in cloud environment using job prioritization in hierarchical scheduling,” in International Conf on Information Systems Design and Intelligent Applications, 2012, pp 547–554 [11] S Singh and M Kalra, “Task scheduling optimization of independent tasks in cloud computing using enhanced genetic algorithm,” Int’l J Application or Innovation in Engineering & Management, vol 3, no 7, pp 2319–4847, 2014 [12] S Pandey, L Wu, S M Guru, and R Buyya, “A particle swarm optimization-based heuristic for scheduling workflow applications in cloud computing environments,” in IEEE International Conference on Advanced Information Networking and Applications, 2010, pp 400–407 [13] Q Cao, Z.-B Wei, and W.-M Gong, “An optimized algorithm for task scheduling based on activity based costing in cloud computing,” in IEEE International Conference on Bioinformatics and Biomedical Engineering, 2009, pp 1–3 [14] F Glover, “Tabu search– part I,” ORSA Journal on Computing, vol 1, no 3, pp 190–206, 1989 [15] D de Werra and A Hertz, “Tabu search techniques: A tutorial and an application to neural networks,” Operations Research Spektrum, vol 11, no 3, pp 131–141, 1989 [16] J Vliet and F Paganelli, Programming Amazon EC2 O’Reilly Media, Inc, 2011 [17] Q Jiang, Y C Lee, M Arenaz, L M Leslie, and A Y Zomaya, “Optimizing scientific workflows in the cloud: A Montage example,” in IEEE International Conference on Utility and Cloud Computing, 2014, pp 517–522 [18] R Kaur and S Kinger, “Enhanced genetic algorithm based task scheduling in cloud computing,” International Journal of Computer Applications, vol 101, no 14, pp 1–6, 2014 [19] E Upfal, Probability and computing: Randomized algorithms and probabilistic analysis Cambridge University Press, 2005 (a) T532 (b) T1051 (c) M2032 Hình So sánh thuật tốn với liệu khác nhau: T532, T1051 M2032 • Đề xuất thuật toán TSPSO sử dụng phương thức cập nhật vị trí cá thể thủ tục Tabu Search để tìm kiếm lời giải cho tốn lập lịch thực thi luồng công việc môi trường đám mây Những kết thực nghiệm tiến hành với nhiều liệu thực nghiệm khác chứng tỏ chất lượng lời giải tìm thuật tốn đề xuất tốt so với thuật toán đối chứng thuật toán PSO_H, thuật toán EGA thuật toán Round Robin Về hướng công việc dự định đề xuất kiến trúc lân cận phù hợp với toán nhằm nâng cao khả tìm kiếm tổng thể qua nhằm đạt lời giải có chất lượng tốt 100 Tập 2019, Số 2, Tháng 12 Phan Thanh Toàn sinh năm 1974 Thái Nguyên, tốt nghiệp Đại học Thạc sĩ Trường Đại học Bách khoa Hà Nội nhận Tiến sĩ năm 2018 Học viện Khoa học Công nghệ Quân Tác giả công tác trường Đại học Sư phạm Hà Nội Lĩnh vực nghiên cứu bao gồm phương pháp tiến hóa, tối ưu, xử lý song song phân tán Đặng Quốc Hữu tốt nghiệp Đại học Thạc sĩ Khoa Công nghệ Thông tin, Đại học Quốc gia Hà Nội năm 2006 2015 Tác giả công tác Trường Đại học Thương mại, đồng thời nghiên cứu sinh Viện Khoa học Công nghệ Quân từ năm 2017 Lĩnh vực nghiên cứu bao gồm mạng máy tính truyền thơng, xử lý song song phân tán Nguyễn Thế Lộc tốt nghiệp Đại học Khoa Toán–Tin, Trường Đại học Sư phạm Hà Nội năm 1993, Thạc sĩ Công nghệ Thông tin Trường Đại học Bách khoa Hà Nội, nhận Tiến sĩ Viện Nghiên cứu Khoa học Công nghệ Nhật Bản (JAIST) năm 2007 Tác giả công tác Trường Đại học Sư phạm Hà Nội Lĩnh vực nghiên cứu bao gồm mạng máy tính truyền thơng, xử lý song song phân tán 101 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông Một phương pháp sinh luật mờ dựa định đại số gia tử xây dựng hệ luật mờ giải tốn hồi quy Nguyễn Đức Dư, Hồng Văn Thông Khoa Công nghệ Thông tin, Trường Đại học Giao thông Vận tải, Hà Nội Tác giả liên hệ: Nguyễn Đức Dư, nducdu@utc.edu.vn Ngày nhận bài: 12/11/2019, ngày sửa chữa: 24/12/2019, ngày duyệt đăng: 25/12/2019 Định danh DOI: 10.32913/mic-ict-research-vn.v2019.n2.901 Biên tập lĩnh vực điều phối phản biện định nhận đăng: PGS.TS Võ Đình Bảy Tóm tắt: Bài báo đề xuất phương pháp sinh luật mờ dựa định đại số gia tử để xây dựng hệ luật mờ giải toán hồi quy Thuật toán thử nghiệm toán mẫu đối sánh với phương pháp có PAES_KB HA-MG-PAES-Kmax mục tiêu độ xác độ phức tạp hệ luật Kết đối sánh cho thấy thuật toán đề xuất cho kết tốt Từ khóa: Hệ luật mờ, đại số gia tử, định, toán hồi quy Title: Abstract: Keywords: A Method to Generate Fuzzy Rules based on Decision Tree and Hedge Algebras for Building Fuzzy Rule based Systems for Regression This paper proposes a method to generate fuzzy rules based on decision tree and hedge algebras for building fuzzy rulebased systems for regression problems The proposed method was experimented on nine regression problems and was compared to two existing methods PAES_KB and HA-MG-PAES-Kmax on two objectives including the accuracy and complexity of rule-based systems Comparative results show that our proposed method outperforms the existing ones Fuzzy rule-based system, hedge algebra, decision tree, regression I MỞ ĐẦU Một số đề xuất sinh luật từ định (decision tree) cho toán phân lớp [5, 12–14] Phương pháp làm giảm đáng kể số luật phải xem xét nhờ vào kỹ thuật hạn chế chiều cao cắt tỉa cây, nhiên lại gặp khó khăn trình tối ưu tham số tập mờ Cách giải toán phân lớp hồi quy hệ luật mờ (FRBS: Fuzzy Rule based System) nhận nhiều quan tâm nhóm nghiên cứu, như: Acalá cộng [1], Antonelli cộng [2], Ishibuchi Nojima [3, 4], Pulkkinen Koivisto [5], Cordón cộng [6], Nguyễn Cát Hồ cộng [7–9], Aghaeipoor Javidi [10] Các nghiên cứu đề xuất chủ yếu tập trung tìm kiếm phương pháp xây dựng FRBS cho tốn phân lớp, cịn tốn hồi quy chưa có nhiều nghiên cứu đề cập tới [1] Khi xây dựng FRBS giải toán chủ yếu giải ba vấn đề chính: thiết kế phân hoạch mờ (ngữ nghĩa tính toán từ), sinh tập luật mờ ứng cử, tìm kiếm hệ luật mờ tối ưu Với hướng tiếp cận theo lý thuyết đại số gia tử (ĐSGT), [7–9] Nguyễn Cát Hồ cộng đề xuất phương pháp sinh luật từ mẫu liệu Theo đó, mẫu liệu sinh luật có độ dài 𝑛 số thuộc tính tập mẫu liệu, từ luật sinh luật có độ dài lmax nhỏ cho trước (lmax < 𝑛) Với phương pháp sinh luật ứng cử số luật tối đa phải xem xét giảm đáng kể so với phương pháp sinh luật tổ hợp Tuy nhiên theo hướng tiếp cận phải xem xét số lượng luật lớn Về vấn đề sinh luật ứng cử, phương pháp tiếp cận dựa lý thuyết tập mờ thường sinh luật cách tổ hợp tất giá trị ngôn ngữ sử dụng cho biến [1–4, 11] Nhược điểm hướng tiếp cận tập liệu có nhiều thuộc tính khơng gian tìm kiếm luật lớn Trong báo đề xuất phương pháp xây dựng FRBS giải toán hồi quy với luật sinh định ĐSGT Thuật toán giải hai vấn đề sinh luật tối ưu tham số tập mờ 102 Tập 2019, Số 2, Tháng 12 Si(2) T3(0) T2(Vc-) T3(c-) Vc- T2(Lc-) T2(w) Lc- T2(Lc+) T3(c+) T2(Vc+) Lc+ T3(1) Vc+ X(2) c- c+ W Hình Hệ khoảng tương tự từ có độ dài khơng q ĐSGT có gia tử Hình Hệ khoảng tương tự từ có độ dài khơng q 1 Giải tốn hồi quy hệ luật mờ Mamdani dựa ĐSGT Thuật toán đề xuất gồm hai pha Pha thứ tối ưu tham số ĐSGT sử dụng cho biến tốn Ở pha chúng tơi sử dụng thuật giải di truyền để tìm kiếm1 tham số tối ưu Pha thứ hai, với tham số tối ưu 1ĐSGT tìm pha thứ nhất, xây dựng ĐSGT sử dụng chúng để chuyển đổi tập liệu giá trị số tốn thành tập liệu giá trị ngơn ngữ tương ứng Từ tập liệu ngôn ngữ định xây dựng, từ định sinh tập luật ứng cử sử dụng thuật toán cải tiến (2+2)M-PAES sử dụng để tìm FRBS tối ưu X( ) Giải toán hồi quy hệ luật mờ Mamdani xây dựng hệ luật mờ Mamdani có dạng 𝑅𝑚 : if 𝑋1 is 𝐴1, 𝑗𝑚 , , 𝑋𝑛 is 𝐴𝑛, 𝑗𝑚 then 𝑌 is 𝐴𝑛+1, 𝑗𝑚 , (1) để dự đoán giá trị đầu 𝑦ˆ ứng với giá trị đầu vào 𝑥 có 𝑛 chiều Trong (1), 𝐴𝑖, 𝑗𝑚 ∈ 𝐿 𝑖 = { 𝐴𝑖,0 } ∪ 𝑋 (𝑘𝑖 ) = { 𝐴𝑖,1 , 𝐴𝑖,2 , , 𝐴𝑖, |𝑋(𝑘𝑖 ) | } , Thuật toán đề xuất thử nghiệm toán hồi quy đối sánh kết thu số độ phức tạp hệ luật giá trị sai số trung bình phương với thuật tốn hướng tiếp cận PAESKB [1] HA-MGPAES-Kmax [8] Kết đối sánh cho thấy thuật tốn đề xuất cho kết có độ xác tốt với 𝑖 = 1, 2, , 𝑛 + 1, 𝑋 (𝑘𝑖 ) tập từ ngơn ngữ có độ dài không 𝑘 𝑖 sinh ĐSGT A 𝑋 𝑖 tương ứng, sử dụng để xây dựng phân hoạch thuộc tính thứ 𝑖, 𝐴 𝑓 ,0 có giá trị Don’t care với hàm thuộc đồng Chú ý, 𝐿 𝑛+1 không chứa giá trị Don’t care 𝑚 = 1, 2, , 𝑀, với 𝑀 số luật hệ Phần lại báo bố cục sau Phần II trình bày tốn hồi quy phương pháp giải toán hồi quy hệ mờ dựa đại số gia tử Phần III trình bày phương pháp sinh luật mờ dựa định ĐSGT Phần IV trình bày thuật tốn xây dựng hệ luật Phần V trình bày kết thử nghiệm Cuối cùng, Phần VI rút số kết luận Tương tự đề xuất [1, 2, 8, 9], chúng tơi sử dụng phương pháp trung bình trọng số để suy diễn giá trị 𝑦ˆ từ hệ luật biết véc-tơ đầu vào 𝑥 𝑖 theo công thức sau: 𝑦ˆ 𝑖 = 𝑀 𝑚=1 𝜇 𝑚 (𝑥𝑖 ) 𝐴¯ 𝑛+1, 𝑗𝑚 𝑀 𝑚=1 với 𝑖 = 1, 2, , 𝑁, 𝜇 𝑚 (𝑥𝑖 ) , (2) 𝑛 II BÀI TOÁN HỒI QUY VÀ HỆ LUẬT MỜ MAMDANI DỰA TRÊN ĐSGT 𝜇 𝑚 (𝑥𝑖 ) = 𝑓 =1 𝜇 𝐴 𝑓 , 𝑗𝑚 (𝑥 𝑖 𝑓 ) độ đốt cháy luật thứ 𝑚 mẫu liệu 𝑥𝑖 , 𝐴¯ 𝑛+1, 𝑗𝑚 giá trị định lượng hạng từ ngôn ngữ 𝐴𝑛+1, 𝑗𝑚 𝜇 𝐴 𝑓 , 𝑗𝑚 (·) hàm thuộc từ ngôn ngữ 𝐴 𝑓 , 𝑗𝑚 Trong (2), 𝑀 𝑚=1 𝜇 𝑚 (𝑥𝑖 ) = 0, có nghĩa hệ luật khơng phủ mẫu liệu 𝑥 𝑖 , 𝑦ˆ suy diễn theo phương pháp đề xuất [1] Bài toán hồi quy Cho tập mẫu liệu D = {(𝑥𝑖 , 𝑦 𝑖 ), 𝑖 = 1, 2, , 𝑁 }, 𝑥𝑖 véc-tơ 𝑛 chiều có dạng (𝑥𝑖1 , 𝑥𝑖2 , , 𝑥 𝑖𝑛 ) với 𝑥 𝑖 𝑗 ∈ 𝑈 𝑗 ⊂ R, 𝑈 𝑗 miền xác định biến độc lập 𝑋 𝑗 (thuộc tính đầu vào) tốn ( 𝑗 = 1, 2, , 𝑛), 𝑦 𝑖 ∈ 𝑈𝑛+1 ⊂ R, 𝑈𝑛+1 miền xác định biến phụ thuộc 𝑌 (thuộc tính đầu ra), 𝑁 số mẫu liệu Để đánh giá độ xác hệ luật xây dựng, dựa vào giá trị sai số trung bình phương (MSE: Mean Squared Error): Từ tập liệu mẫu D xây dựng hệ mờ dựa luật cho phép tính giá trị 𝑦ˆ ứng với giá trị đầu vào 𝑥 ∈ 𝑈 = 𝑈1 × × 𝑈 𝑛 MSE = 103 2𝑁 𝑁 𝑖=1 ( 𝑦ˆ 𝑖 − 𝑦 𝑖 ) (3) Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông Thuật toán 2: GenFRBS(T) 𝑛+1 , 𝑘, lmax) Thuật toán 1: BuildDecisionTree(D, {𝜋𝑖 }𝑖=1 10 11 Dữ liệu vào: Cơ sở liệu toán D; tham số 𝑛+1 ; chiều dài tối đa hạng ĐSGT {𝜋𝑖 }𝑖=1 từ sinh từ ĐSGT 𝑘; chiều cao tối đa lmax Dữ liệu ra: Cây định T for 𝑖 = to 𝑛 + Xây dựng ĐSGT A 𝑋 𝑖 tương ứng với tham số 𝜋𝑖 ; Sinh tập từ 𝑋 (𝑘𝑖 ) ; Sinh hệ khoảng tính mờ tương tự 𝑆 (𝑘𝑖 ) ; end 𝐷 = Chuẩn hóa D đoạn [0, 1]; 𝐷 = Chuyển đổi 𝐷 thành sở liệu ngôn ngữ dựa 𝑛+1 hệ khoảng tính mờ 𝑆 (𝑘𝑖 ) 𝑖=1 ; Xây dựng định T có chiều cao tối đa lmax từ sở liệu 𝐷 thuật toán C4.5; return T; 10 11 12 13 14 Trong (3), 𝑦ˆ 𝑖 𝑦 𝑖 giá trị suy diễn từ hệ luật giá trị quan sát tương ứng với giá trị đầu vào 𝑥 𝑖 Giá trị MSE nhỏ hệ luật mờ xác Dữ liệu vào: Cây định T Dữ liệu ra: Hệ luật mờ S S = ∅; Leafs = Tập nút T; foreach lf ∈ Leafs Với lf xây dựng danh sách lsNode Node từ lf đến gốc cây; Tạo luật 𝑟 có 𝑛 điều kiện tiền đề, tất tiền đề có giá trị Don’t care; for 𝑗 = lsNode.Count − down to Thay giá trị Don’t care luật 𝑟 ứng với thuộc tính nút lsNode[ 𝑗] giá trị phân chia nút lsNode[ 𝑗 − 1] (nút cha nút lsNode[ 𝑗]); end Gán kết luận luật 𝑟 giá trị nút lsNode[0]; S = S ∪ {𝑟 }; end return S; tập liệu D đoạn [0, 1] chuyển đổi tuyến tính ta tập 𝐷 III ĐỀ XUẤT PHƯƠNG PHÁP SINH HỆ LUẬT MỜ DỰA TRÊN CÂY QUYẾT ĐỊNH VÀ ĐSGT Bước thứ hai, với thuộc tính đầu vào, ta xác định tham số ĐSGT tương ứng, giả sử 𝜋𝑖 (𝑖 = 1, 2, , 𝑛 + 1) Với tham số 𝜋𝑖 ta xây dựng ĐSGT A 𝑋 𝑖 sinh tập từ có độ dài không 𝑘 𝑖 ký hiệu 𝑋 (𝑘𝑖 ) , tính giá trị định lượng ngữ nghĩa từ 𝑋 (𝑘𝑖 ) xây dựng hệ khoảng tương tự 𝑆 (𝑘𝑖 ) tương ứng theo thuật toán [7] Hệ khoảng tính mờ tương tự từ ngôn ngữ ĐSGT Nguyễn Cát Hồ cộng đề xuất lần [15], xây dựng phương pháp hình thức sinh từ ngơn ngữ ánh xạ từ ngôn ngữ tới giá trị định lượng tương ứng đoạn [0; 1] ĐSGT giúp sinh dạng ngữ nghĩa khác từ ngôn ngữ từ ngữ nghĩa vốn có từ bao gồm: giá trị định lượng 𝑣 𝑥 (𝑥), khoảng tính mờ 𝑓 𝑚(𝑥), khoảng tương tự [7] Gọi 𝑋 (𝑘𝑖 ) tập từ có độ dài không 𝑘 𝑖 biến 𝑋𝑖 Tập 𝑆 (𝑘𝑖 ) khoảng tương tự từ 𝑋 (𝑘𝑖 ) hình thành phân hoạch 𝑈 giá trị định lượng ngữ nghĩa từ 𝑥 ∈ 𝑋 (𝑘𝑖 ) 𝑣 𝑥 (𝑥) ∈ 𝑇 (𝑥), 𝑇 (𝑥) khoảng tương tự từ 𝑥 Các giá trị khoảng tương tự 𝑇 (𝑥) coi tương tự với giá trị định lượng ngữ nghĩa 𝑣 𝑥 (𝑥) 𝑥 với cấp độ 𝑘 𝑖 , 𝑘 𝑖 lớn mức độ tương tự giá trị khoảng tương tự cao Hệ khoảng tượng tự công cụ hữu dụng để phân hoạch miền tham chiếu biến, sử dụng thuật toán sinh luật phương pháp tiếp cận dựa ĐSGT Bước thứ ba chuyển đổi sở liệu 𝐷 thành sở liệu từ ngôn ngữ 𝐷 theo nguyên tắc sau: với véctơ 𝑥 𝑖 = (𝑥 𝑖1 , 𝑥𝑖2 , , 𝑥 𝑖𝑛 ) chuyển đổi thành véc-tơ từ ngôn ngữ 𝑥𝑖 = ( 𝐴𝑖1 , 𝐴𝑖2 , , 𝐴𝑖𝑛 ), 𝑥𝑖 𝑗 ∈ 𝑇 ( 𝐴𝑖 𝑗 ) với 𝑗 = 1, 2, , 𝑛; giá trị đầu 𝑌 chuyển đổi tương tự Từ sở liệu ngôn ngữ 𝐷 áp dụng thuật toán C4.5 [16] xây dựng định có chiều cao tối đa lmax, việc thiết lập chiều cao tối đa nhằm hạn chế chiều dài luật sinh Mỗi nút định chứa hai giá trị nhãn thuộc tính giá trị phân chia nút cha Thuật toán sinh luật từ định Thuật toán sinh luật từ định trình bày thuật toán Đầu vào thuật toán định T xây dựng thuật toán Gọi S tập luật sinh ra, khởi đầu S = ∅, Leafs tập nút T Với nút sinh luật có phần kết luận nhãn nút phần tiền đề luật nhãn nút nằm đường từ gốc đến Để xác định đường đi, xuất phát từ nút ngược nút gốc Giả sử để sinh luật 𝑟 từ nút lf, từ nút ta dễ dàng xác định danh sách (lsNode) Thuật toán xây dựng định Thuật toán xây dựng định trình bày thuật toán Để xây dựng định từ tập liệu D toán hồi quy gồm véc-tơ đầu vào 𝑥𝑖 = (𝑥𝑖1 , 𝑥𝑖2 , , 𝑥 𝑖𝑛 ), với 𝑥 𝑖 𝑗 ∈ 𝑈 𝑗 ⊂ R giá trị đầu 𝑦 𝑖 ∈ 𝑈𝑛+1 ⊂ R Bước cần chuẩn hóa 104 Tập 2019, Số 2, Tháng 12 nút mô tả đường từ nút lf đến nút gốc Tiếp theo ta tạo luật 𝑟 có độ dài số chiều tốn có tất tiền điều kiện Don’t care Với nút lsNode[ 𝑗] ( 𝑗 = lsNode.Count − 1, , 1) thay giá trị Don’t care tiền điều kiện tương ứng với thuộc tính nhãn nút lsNode[ 𝑗] giá trị phân chia nút lsNode[ 𝑗 −1] (nút cha nút lsNode[ 𝑗]), gán kết luận 𝑟 giá trị nút lsNode[0] Thêm luật 𝑟 vào tập luật S Hình Mã hóa cá thể tối ưu tham số ĐSGT IV PHƯƠNG PHÁP XÂY DỰNG FRBS GIẢI BÀI TOÁN HỒI QUY Trong phần áp dụng phương pháp sinh luật đề xuất phần III để xây dựng hệ mờ giải toán hồi quy Phương pháp xây dựng FRBS thực với hai pha Pha thứ phát triển thuật toán OptHAParams sử dụng thuật giải di truyền để tìm tham số mờ ĐSGT thuộc tính tốn Pha thứ hai sử dụng tham số mờ ĐSGT tìm pha thứ xây dựng định toán, từ định sinh tập luật ứng cử, sau áp dụng thuật tốn HA-De-PAES để tìm kiếm hệ luật tối ưu Ở HA-De-PAES phát triển dựa thuật toán (2+2)MPAES [17] Thuật toán (2+2)M-PAES tối ưu đồng thời hệ luật tham số mờ thuật toán HA-De-PAES tối ưu hệ luật luật chọn từ tập luật ứng cử sinh từ định, với hai mục tiêu MSE Comp (tổng chiều dài luật) Hình Cấu trúc mã hóa cá thể biểu diễn hệ luật a) Các toán tử di truyền Toán tử lai ghép: Với hai cá thể bố mẹ 𝑝 𝑝 sử dụng phương pháp lai ghép điểm (one-point crossover), điểm lai ghép chọn ngẫu nhiên đoạn [1, 𝜌min − 1], 𝜌min số luật nhỏ 𝑝 𝑝 Lưu ý toán tử lai ghép khơng thực đột biến ln xảy (có nghĩa khơng xảy lai ghép xác suất đột biến 1) Tốn tử đột biến: Nếu đột biến xảy chọn ngẫu nhiên thực hai toán tử đột biến sau Toán tử đột biến thêm luật: Thêm 𝛾 luật vào với 𝛾 chọn ngẫu nhiên đoạn [1, 𝛾max ], 𝛾 + 𝑀 > 𝑀max 𝛾 = 𝑀max − 𝑀, luật chọn từ tập S Toán tử đột biến thay đổi luật: Thay đổi ngẫu nhiên 𝛿 giá trị ngôn ngữ số luật hệ luật, với 𝛿 chọn ngẫu nhiên đoạn [1, 𝛿max ] Thực 𝛿 lần trình sau: chọn ngẫu nhiên luật 𝑅, chọn ngẫu nhiên gen 𝑗 ∈ [1, 𝑛 + 1] 𝑅; 𝑗 ≤ 𝑛 chọn ngẫu nhiên từ {𝐷𝑜𝑛 𝑡𝑐𝑎𝑟𝑒} ∪ 𝑋 (𝑘 𝑗 ) ; 𝑗 = 𝑛 + chọn ngẫu nhiên từ 𝑋 (𝑘𝑛+1 ) ; thay từ gen thứ 𝑗 𝑅 từ vừa chọn; luật 𝑅 sau đột biến có độ dài lớn lmax đột biến bị bỏ qua Thuật tốn tìm tham số tối ưu ĐSGT thuật tốn GA Để tìm kiếm tham số mờ ĐSGT, báo thực thiết kế thuật giải di truyền dựa sơ đồ mã hóa nhị phân với hàm thích nghi giá trị sai số trung bình phương MSE Bài tốn có 𝑛 thuộc tính, với thuộc tính ta cần xác định hai tham số 𝜇 𝑓 𝑚𝐶 − 𝜇 𝐿 (ở sử dụng ĐSGT có hai gia tử 𝑉 𝐿) 𝑛+1 Như số tham số cần xác định cho toán {𝜋𝑖 }𝑖=1 2(𝑛 + 1) Chi tiết trình bày thuật tốn Hình mơ tả sơ đồ mã hóa cá thể, biến mục tiêu mã hóa chuỗi bít có 𝑙 bít Lưu ý sau lai ghép, đột biến có nhiều luật trùng giữ lại một, loại bỏ luật có độ dài b) Thuật tốn tiến hóa HA-De-PAES Thuật toán HA-De-PAES xây dựng hệ mờ tối ưu Phần trình bày bước thuật tốn HA-De-PAES phát triển dựa lược đồ tiến hóa (2+2)M-PAES đề xuất [17] Tại thời điểm thuật toán lưu trữ quần thể mà cá thể khơng bị trội cá thể lại theo mục tiêu MSE Comp Một quần thể xác định mặt Pareto Thuật tốn thực tìm kiếm mặt Pareto xấp xỉ tối ưu theo hai mục tiêu MSE Comp Mỗi cá thể quần thể mã hóa gồm 𝑀 luật (𝑀 khác cá thể), với luật 𝑅𝑖 lấy từ tập luật ứng cử S Nhằm đạt cân tính dễ hiểu độ xác hệ luật, giới hạn số luật FRBS nằm đoạn [𝑀min , 𝑀max ] Với cá thể cần tối thiểu hai mục tiêu MSE Comp, MSE xác định theo (3) Comp tổng độ dài luật sở luật, biểu thị độ phức tạp FRBS Xét toán tối ưu 𝑛 mục tiêu, cực tiểu hàm F(𝑥) = 𝑓1 (𝑥), 𝑓2 (𝑥), , 𝑓𝑛 (𝑥) với 𝑥 ∈ 𝑋 ⊆ R𝑚 , F(𝑥) 105 Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông Thuật toán 3: OptHAParams(D, 𝑘, lmax, 𝐺 𝐴𝑝𝑎𝑟 𝑠) 10 11 12 13 14 Dữ liệu vào: Cơ sở liệu toán D; Chiều dài tối đa hạng từ sinh từ ĐSGT 𝑘; Chiều cao tối đa lmax; Bộ tham số thuật giải di truyền 𝐺 𝐴𝑝𝑎𝑟 𝑠 gồm có chiều dài nhiễm sắc thể 𝑙𝑐ℎ𝑟𝑜𝑚, kích thước quần thể Pop𝑠𝑖𝑧𝑒, số hệ 𝐺, xác suất lai ghép 𝑃𝑐𝑟𝑜𝑠𝑠, xác suất đột biến 𝑃𝑚𝑢 Dữ liệu ra: Bộ tham số tối ưu 𝜋𝑜 𝑝𝑡 Bước 1: Khởi tạo Gán 𝑗 ← 0; Khởi tạo quần thể ban đầu: Initial(Pop 𝑗 ); foreach 𝑝 ∈ Pop 𝑗 𝑛+1 ĐSGT; Giải mã 𝑝 để tham số {𝜋𝑖 }𝑖=1 𝑛+1 T ← BuildDecisionTree(D, {𝜋𝑖 }𝑖=1 , 𝑘, lmax); S ← GenFRBS(T); Suy diễn tập liệu D hệ luật S tính giá trị hàm mục tiêu MSE 𝑝; end 𝑋𝑏𝑒𝑠𝑡 ← GetIndividualHasBestObj(Pop 𝑗 ); //Chọn cá thể có giá trị mục tiêu tốt Bước 2: Tiến hóa ComputeFitnessMeasure(Pop 𝑗 ); //Tính độ đo thích nghi cá thể Thuật toán 4: HA-De-PAES (D, 𝑘, lmax, 𝜋opt , paespars) Dữ liệu ra: 𝑃 𝐴 (mặt xấp xỉ tối ưu Pareto với hai mục tiêu MSE Comp hệ luật) Bước 1: Tạo tập luật ứng cử T = BuildDecisionTree(D, 𝜋𝑜 𝑝𝑡 , 𝑘, lmax); S = GenFRBS(T); Bước 2: Sinh ngẫu nhiên cá thể 𝑐 , 𝑐 Mỗi cá thể gồm 𝑀 luật chọn từ tập luật ứng cử S 𝑀 chọn ngẫu nhiên đoạn [𝑀min , 𝑀max ] Bước 3: Bổ sung 𝑐 , 𝑐 vào 𝑃 𝐴 Bước 4: Lặp 𝑖 = 1, , 𝑀𝑎𝑥𝐺𝑒𝑛 (số hệ tối đa) Chọn ngẫu nhiên hai cá thể bố mẹ 𝑝 , 𝑝 𝑃 𝐴 (𝑝 , 𝑝 trùng nhau); Thực lai ghép hai cá thể 𝑝 , 𝑝 để sinh hai cá thể 𝑜1 , 𝑜2 ; Thực đột biến 𝑜1 , 𝑜2 ; Tính giá trị mục tiêu (MSE, Comp) 𝑜1 , 𝑜 ; Lần lượt bổ sung 𝑜1 , 𝑜2 vào 𝑃 𝐴 có thể; Lặp lại bước với hệ kế tiếp; return 𝑃 𝐴; 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 Popparent ← Select(Pop 𝑗 ); //Chọn cá thể cha mẹ Popchild ← Mute(Crossover(Popparent )); //Lai ghép đột biến tạo quần thể 𝑗 ← 𝑗 + 1; Pop 𝑗 ← Popchild ; //Thay quần thể quần thể vừa tạo sinh foreach 𝑝 ∈ Pop 𝑗 𝑛+1 ĐSGT; Giải mã 𝑝 để tham số {𝜋𝑖 }𝑖=1 𝑛+1 T ← BuildDecisionTree(D, {𝜋𝑖 }𝑖=1 , 𝑘, 𝑙); S ← GenFRBS(T); Suy diễn tập liệu D hệ luật S tính giá trị hàm mục tiêu MSE 𝑝; end 𝑋 ← GetIndividualHasBestObj(Pop 𝑗 ); if 𝑜𝑏 𝑗 (𝑋) > 𝑜𝑏 𝑗 (𝑋𝑏𝑒𝑠𝑡 ) then 𝑋𝑏𝑒𝑠𝑡 ← 𝑋; //𝑜𝑏 𝑗 (𝑋) giá trị mục tiêu cá thể 𝑋 end Bước 3: Lặp lại Bước 𝑗 > 𝐺 Bước 4: Trả lại tham số tối ưu 𝑛+1 ĐSGT; Giải mã 𝑋𝑏𝑒𝑠𝑡 để tham số {𝜋𝑖 }𝑖=1 𝑛+1 ; 𝜋𝑜 𝑝𝑡 ← {𝜋𝑖 }𝑖=1 return 𝜋𝑜 𝑝𝑡 ; 𝑖 ∈ {1, , 𝑚} tồn 𝑗 thỏa mãn 𝑓 𝑗 (𝑥) < 𝑓 𝑗 (𝑦) Kí hiệu 𝑃 𝐴 quần thể tại, thuật toán gồm bước trình bày thuật tốn Một cá thể 𝑜 không bị trội cá thể 𝑃 𝐴 𝑜 bổ sung vào 𝑃 𝐴, đồng thời loại bỏ tất cá thể 𝑃 𝐴 bị trội 𝑜 Nếu số cá thể 𝑃 𝐴 lớn số lượng tối đa (𝑀𝑎𝑥 𝐴𝑟𝑐ℎ𝑖𝑣𝑒) phép lưu trữ 𝑃 𝐴 loại bỏ ngẫu nhiên cá thể vùng có mật độ cao khỏi 𝑃 𝐴 Xác định vùng có mật độ cao theo thuật toán [17] Dữ liệu vào: Cơ sở liệu toán D, chiều dài tối đa hạng từ sinh từ ĐSGT 𝑘, chiều cao tối đa lmax, tham số mờ ĐSGT tối ưu, tham số thuật toán PAES 𝑝𝑎𝑒𝑠𝑝𝑎𝑟 𝑠 15 V NGHIÊN CỨU THỬ NGHIỆM Chúng tiến hành thử nghiệm thuật toán xây dựng FRBS đề xuất báo đối sánh kết với thuật toán PAESKB [1] HA-PAES-MG-Kmax [8] PAESKB tiếp cận dựa lý tuyết tập mờ, tập mờ biểu diễn (two-tuples), luật mờ sinh tổ hợp ngẫu nhiên từ ngôn ngữ sử dụng biến, q trình tối ưu hóa tham số tập mờ hệ luật thuật toán (2+2)M-PAES [17] HA-PAES-MG-Kmax tiếp cận dựa lý thuyết ĐSGT, tham số tập mờ xác định dựa tham số mờ ĐSGT, luật mờ sinh dựa mẫu liệu, trình tối ưu hóa tham số tập mờ hệ luật thuật tốn (2+2)M-PAES [17] Chúng tơi chọn hai thuật toán để đối sánh chúng sử dụng thuật tốn tiến hóa (2+2)M-PAES nhằm chứng tỏ tính hiệu phương pháp sinh luật dựa định véc-tơ mục tiêu, 𝑓𝑖 (𝑥) mục tiêu thứ 𝑖 cần cực tiểu, 𝑥 véc-tơ lời giải không gian 𝑚 chiều, 𝑋 khơng gian lời giải tốn Một mặt 𝑃 ⊆ 𝑋 gọi mặt Pareto điểm khơng bị trội điểm lại 𝑃 Một lời giải 𝑥 ∈ 𝑃 gọi trội lời giải 𝑦 ∈ 𝑃, ký hiệu 𝑥 𝑦, 𝑓𝑖 (𝑥) ≤ 𝑓𝑖 (𝑦) với 106 Tập 2019, Số 2, Tháng 12 tra chéo 5-fold, với fold học fold kiểm tra Mỗi fold thử nghiệm lần (6 × = 30 lần) Mỗi lần thử nghiệm pha thứ gọi thuật tốn OptHAParams để tìm tham số mờ ĐSGT cho tất thuộc tính, tham số tìm đầu vào thuật toán HA-De-PAES Để giảm thời gian xây dựng định pha thứ nhất, giới hạn chiều cao tối đa sinh lmax = 2, để giới hạn chiều dài luật sinh pha thứ hai thiết lập lmax giá trị nhỏ #𝑁𝑜 𝐴 Bảng I CÁC BÀI TOÁN SỬ DỤNG THỬ NGHIỆM [1, 8] TT #𝑁 𝑜𝑃 Bài toán #𝑁 𝑜 𝐴 Electrical Length (ELE1) 495 2 Electrical Maintainance (ELE2) 1056 Weather Ankara (WA) 1609 Weather Izmir (WI) 1461 Treasury (TR) 1049 15 Abalone (AB) 4177 Mortgage (MTG) 1049 15 Computer Activity (CA) 8192 21 Pole Telecommunication (PT) 15000 26 Mỗi lần thử nghiệm, kết thu mặt Pareto theo hai mục tiêu MSE Comp Chúng tơi tính tốn mặt Pareto trung bình 30 lần thử nghiệm, tương tự [1, 2, 8] Thực đối sánh kết thu thuật toán đề xuất với thuật toán HA-PAES-MG-Kmax PAESKB điểm FIRST mặt Pareto Điểm FIRST điểm tương ứng với hệ luật có MSETr nhỏ Ký hiệu MSETr MSETs giá trị MSE trung bình tập liệu huấn luyện (Tr) tập liệu kiểm tra (Ts), 𝜎Ts phương sai trung bình tập kiểm tra, cịn Comp #𝑅 độ phức tạp trung bình số luật trung bình hệ luật Bảng II CÁC THAM SỐ THỬ NGHIỆM PHA THỨ NHẤT, TÌM THAM SỐ TỐI ƯU 𝜇min = 0,3 𝑓 𝑚𝐶min = 0,3 𝑓 𝑚𝐶max = 0,7 𝜇max = 0,7 𝑘𝑚𝑎𝑥 = lmax = 𝐿𝑐ℎ𝑟 𝑜𝑚 = Pop𝑠𝑖𝑧𝑒 = 100 𝐺 = 100 𝑃𝑐𝑟 𝑜𝑠𝑠 = 0,7 Xác suất lai ghép 𝑃𝑚𝑢 = 0,1 Xác suất đột biến Chúng tơi tiến hành phân tích sử dụng phương pháp thống kê phi tham số Wilcoxon theo hai mục tiêu độ phức tạp Comp độ xác (dựa MSE), với mức ý nghĩa 𝛼 = 0,05 Kết thống kê trình bày bảng V, VI, VII Từ bảng V ta thấy giá trị Exact P-value lớn 𝛼 = 0,05, giả thiết H0 “độ phức tạp hệ luật tạo hai thuật toán nhau” chấp nhận Như độ phức tạp hệ luật xây dựng thuật toán đề xuất báo khơng có khác biệt với thuật toán so sánh Bảng III CÁC THAM SỐ THỬ NGHIỆM PHA THỨ HAI , TÌM KIẾM HỆ LUẬT TỐI ƯU 𝑀 𝑎𝑥 𝐴𝑟 𝑐ℎ𝑖𝑣𝑒 = 64 𝑀 𝑎𝑥𝐺𝑒𝑛 = 300.000 𝛾max = 𝛿max = 𝑀min = 𝑀max = 30 lmax = min(#𝑁 𝑜 𝐴, 5) 𝑃𝑐𝑅𝐵 = 0,3 Xác suất lai ghép 𝐶RB 𝑃𝑚𝑅𝐵 = 0,1 Xác suất đột biến 𝐶RB 𝑃𝐴𝑑𝑑 = 0,75 Xác suất đột biến thêm luật 𝐶RB Kết phân tích bảng VI cho thấy giá trị Exact P-value nhỏ 𝛼 = 0,05, giả thiết H0 “độ xác hệ luật tập huấn luyện thuật toán nhau” bị loại bỏ Như có khác biệt giá trị MSE hệ luật sinh từ thuật toán đề xuất báo với giá trị MSE hệ luật sinh từ thuật toán đối sánh Từ bảng IV ta thấy giá trị MSE hệ luật sinh từ thuật toán HA-De-PAES tốt hầu hết tốn trừ tốn AB Kết phân tích bảng VII cho thấy giá trị Exact P-value lớn 𝛼 = 0,05, giả thiết H0 “độ xác hệ luật tập kiểm tra thuật toán nhau” chấp nhận Mặc dù khơng có khác biệt độ xác tập kiểm tra hệ luật sinh thuật toán đề xuất báo từ bảng IV thấy độ xác thuật toán đề xuất thuật toán đối sánh toán, tốt tốn Chúng ta kết luận thuật toán đề xuất tốt thuật toán đối sánh mục tiêu độ xác Để cơng so sánh hiệu phương pháp, sử dụng dạng phân hoạch mờ tham số thử nghiệm tương tự phương pháp so sánh Phân hoạch mờ sử dụng có dạng đa thể hạt, tập mờ có dạng tam giác, độ dài tối đa hạng từ sinh ĐSGT 𝑘 = cho tất thuộc tính đầu vào đầu Chúng tơi tiến hành thử nghiệm 09 tốn, 08 toán thử nghiệm lấy từ http://archive.ics.uci edu/ml/datasets.php, riêng toán Abalone lấy từ https:// sci2s.ugr.es/keel/dataset.php?Cod=96, với #𝑁𝑜𝑃 số mẫu #𝑁𝑜 𝐴 số thuộc tính Các tham số thử nghiệm cho pha thứ trình bày bảng II pha thứ hai trình bày bảng III Phương pháp thử nghiệm kiểm 107 Các cơng trình nghiên cứu phát triển Cơng nghệ Thơng tin Truyền thông Bảng IV SO SÁNH KẾT QUẢ THỬ NGHIỆM THUẬT TOÁN HA-D E -PAES (HAD E ) VỚI CÁC THUẬT TOÁN HA-PAES-MG-K MAX (HATG ), PAESKB TẠI ĐIỂM FIRST #𝑅 Comp MSETr MSETs 𝜎Ts 145.995 141.666 141.321 194.028 202.591 201.836 24.745 35.321 30.0234 65,1 11,043 8.813 8.504 12.606 10.686 10.372 3.105 3.114 1.771 WA 28 25,0 25,0 103 60,0 71,6 1,64 1,03 1,01 3,92 1,25 1,22 9,27 0,17 0,17 WI 25 24,9 25,0 91,0 61,3 64,2 1,30 0,79 0,77 1,49 0,96 0,95 0,26 0,13 0,14 TR 11 15,0 15,0 40,0 29,4 33,9 0,080 0,031 0,026 0,140 0,045 0,039 0,15 0,02 0,01 AB 29 19,8 22,6 107 59,6 49,1 2,32 2,31 2,43 2,48 2,41 2,68 0,18 0,17 0,20 MTG 12 15,0 13,0 49,0 28,1 28,3 0,050 0,016 0,014 0,090 0,022 0,019 0,10 0,01 0,01 CA 10 13,8 14,5 30,0 44,7 45,6 11,99 4,58 4,09 13,43 4,86 4,81 4,66 0,63 0,55 PT 14 13,3 14,4 53,0 38,3 36,3 87,00 71,89 65,07 89,00 73,47 68,97 25,00 17,02 10,44 WILCOXON TEST VỚI MỨC 𝛼 = 0,05 SO SÁNH ĐỘ PHỨC TẠP CỦA HỆ LUẬT SỬ DỤNG So sánh với R+ R- Exact P-value Confidence-interval Giả thuyết PAES-KB 37 0,09766 [-28,9; -0,55] Loại bỏ giả thuyết H0 HA-Tg 15 30 ≥ 0,2 [-1,95; 4,85] Chấp nhận giả thuyết H0 MSE TRÊN Bảng VI TẬP HUẤN LUYỆN SỬ DỤNG WILCOXON TEST VỚI MỨC 𝛼 = 0,05 So sánh với R+ R- Exact P-value Confidence-interval PAES-KB 42 0,019532 [-2.337,315; -0,054] Loại bỏ giả thuyết H0 HA-Tg 40 0,03906 [-172,51; -0,002] Chấp nhận giả thuyết H0 SO SÁNH SAI SỐ MSE TRÊN Bảng VII TẬP KIỂM TRA SỬ DỤNG Giả thuyết WILCOXON-TEST VỚI MỨC 𝛼 = 0,05 So sánh với R+ R- Exact P-value Confidence-interval Giả thuyết PAES-KB 33 12 [-1.117,0505; 3.902,65] Loại bỏ giả thuyết H0 HA-Tg 39 ≥ 0,2 [-377,505; 0,11] Loại bỏ giả thuyết H0 0,05468 VI KẾT LUẬN HADe 52,7 67,0 SÁNH SAI SỐ HATg PAESKB HADe HATg 46,1 29,9 30,0 65,0 Bảng V PAESKB PAESKB HADe HADe HATg HATg PAESKB 27,3 27,4 46,0 ELE2 30 SO HADe HATg PAESKB Bài toán ELE1 27 gồm hai pha, kết thử nghiệm thuật toán cho thấy mục tiêu độ phức tạp độ xác hệ luật so sánh với thuật tốn đề xuất Bài báo đề xuất hướng tiếp cận sinh luật giải toán hồi quy hệ luật mờ Các phương pháp truyền thống dựa lý thuyết tập mờ thường dụng phương pháp sinh luật cách tổ hợp từ ngôn ngữ sử dụng cho thuộc tính Với cách tiếp cận số luật phải xem xét lớn Tiếp cận dựa lý thuyết ĐSGT sử dụng phương pháp sinh luật dựa mẫu liệu, phương pháp tiếp cận làm giảm không gian luật cần phải xem xét, nhiên lại khơng tận dụng thơng tin quan hệ liệu Bài báo đề xuất phương pháp sinh luật tiếp cận theo lý thuyết ĐSGT định Chúng phát triển thuật toán xây dựng FRBS LỜI CẢM ƠN Nghiên cứu nằm khuôn khổ đề tài “Nghiên cứu phát triển phương pháp thao tác trực tiếp từ ngôn ngữ dựa đại số gia tử để giải số vấn đề lĩnh vực trích rút tri thức, tăng cường chất lượng ảnh sở liệu mờ”, mã số 102.01-2017.06, tài trợ Quỹ phát triển khoa học công nghệ quốc gia (NAFOSTED) 108 Tập 2019, Số 2, Tháng 12 TÀI LIỆU THAM KHẢO Nguyễn Đức Dư nhận Cử nhân Toán tin ứng dụng Thạc sĩ Toán ứng dụng Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội năm 2001 2005 Tác giả hiên nghiên cứu sinh Viện Khoa học Công nghệ Quân từ năm 2015, đồng thời giảng viên Khoa Công nghệ Thông tin, Trường Đại học Giao thông Vận tải Các lĩnh vực nghiên cứu bao gồm khai phá liệu, lơ-gic mờ, hệ mờ, tính tốn mềm, tính tốn với từ, học máy [1] R Alcalá, P Ducange, F Herrera, B Lazzerini, and F Marcelloni, “A multiobjective evolutionary approach to concurrently learn rule and data bases of linguistic fuzzy-rule-based systems,” IEEE Transactions on Fuzzy Systems, vol 17, no 5, pp 1106–1122, Oct 2009 [2] M Antonelli, P Ducange, B Lazzerini, and F Marcelloni, “Learning concurrently data and rule bases of Mamdani fuzzy rule-based systems by exploiting a novel interpretability index,” Soft Computing, vol 15, pp 1981–1998, 2011 [3] H Ishibuchi and Y Nojima, “Analysis of interpretabilityaccuracy tradeoff of fuzzy systems by multiobjective fuzzy genetics-based machine learning,” International Journal of Approximate Reasoning, vol 44, no 1, pp 4–31, 2007 [4] ——, “Repeated double cross-validation for choosing a single solution in evolutionary multi-objective fuzzy classifier design,” Knowledge-Based Systems, vol 54, pp 22–31, 2013 [5] P Pulkkinen and H Koivisto, “Fuzzy classifier identification using decision tree and multiobjective evolutionary algorithms,” International Journal of Approximate Reasoning, vol 48, no 2, pp 526–543, 2008 [6] O Cordón, M J Del Jesus, and F Herrera, “A proposal on reasoning methods in fuzzy rule-based classification systems,” International Journal of Approximate Reasoning, vol 20, no 1, pp 21–45, 1999 [7] C H Nguyen, W Pedrycz, T L Duong, and T S Tran, “A genetic design of linguistic terms for fuzzy rule based classifiers,” International Journal of Approximate Reasoning, vol 54, no 1, pp 1–21, 2013 [8] C H Nguyen, V T Hoang, and V L Nguyen, “A discussion on interpretability of linguistic rule based systems and its application to solve regression problems,” Knowledge-Based Systems, vol 88, pp 107–133, 2015 [9] C H Nguyen, V Hoang, T Tran, and V Nguyen, “LFoCInterpretability of linguistic rule based systems and its applications to solve regression problems,” International Journal of Computer Technology & Applications, vol 8, no 2, pp 94–117, 2017 [10] F Aghaeipoor and M M Javidi, “On the influence of using fuzzy extensions in linguistic fuzzy rule-based regression systems,” Applied Soft Computing, vol 79, pp 283–299, 2019 [11] C Mencar and A M Fanelli, “Interpretability constraints for fuzzy information granulation,” Information Sciences, vol 178, no 24, pp 4585–4618, 2008 [12] L A Zadeh, “Fuzzy sets,” Information and Control, vol 8, no 3, pp 338–353, 1965 [13] N M Han, N C Hao et al., “An algorithm to building a fuzzy decision tree for data classification problem based on the fuzziness intervals matching,” Journal of Computer Science and Cybernetics, vol 32, no 4, pp 367–380, 2016 [14] X Liu, X Feng, and W Pedrycz, “Extraction of fuzzy rules from fuzzy decision trees: An axiomatic fuzzy sets (AFS) approach,” Data & Knowledge Engineering, vol 84, pp 1– 25, 2013 [15] N C Ho and W Wechler, “Hedge algebras: An algebraic approach to structure of sets of linguistic truth values,” Fuzzy Sets and Systems, vol 35, no 3, pp 281–293, 1990 [16] J Han, J Pei, and M Kamber, Data Mining: Concepts and Techniques Elsevier, 2011 [17] J D Knowles and D W Corne, “Approximating the nondominated front using the Pareto archived evolution strategy,” Evolutionary Computation, vol 8, pp 149–172, 2000 Hồng Văn Thơng nhận Cử nhân Tốn tin ứng dụng Thạc sĩ Cơng nghệ Thông tin Trường Đại học Khoa học Tự nhiên Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội năm 2001 2005 Năm 2016, tác giả nhận Tiến sĩ Học viện Khoa học Công nghệ, Viện Hàn lâm Khoa học Việt Nam Tác giả giảng viên Khoa Công nghệ Thông tin, Trường Đại học Giao thông Vận tải Các lĩnh vực nghiên cứu bao gồm khai phá liệu, lơ-gic mờ, hệ mờ, tính tốn mềm, tính tốn với từ, học máy, trí tuệ nhân tạo 109 DANH SÁCH PHẢN BIỆN NĂM 2019 Trần Hải Anh Trịnh Quốc Anh Võ Đình Bảy Huỳnh Thị Thanh Bình Lâm Sinh Công Nguyễn Việt Dũng Nguyễn Long Giang Lê Vũ Quỳnh Giang Nguyễn Trung Hiếu Ngơ Khắc Hồng Nguyễn Nam Hoàng Nguyễn Quang Hùng Phan Quốc Huy Trần Thiện Khải Đinh Quốc Khánh Trương Trung Kiên Nguyễn Lê Duy Lai Nguyễn Phi Lê Nguyễn Thị Thúy Loan Nguyễn Bình Minh Trần Thị Ngân Nguyễn Hữu Phát Nguyễn Khánh Phương Trần Minh Quang Lê Hoàng Sơn Lê Lam Sơn Đinh Duy Tài Trần Đức Tân Trần Minh Thái Tạ Minh Thanh Nguyễn Thành Nguyễn Trí Thành Lê Trung Thành Lê Thị Ngọc Thơ Quản Thành Thơ Nguyễn Đình Thuận Nguyễn Đức Thuận Nguyễn Cảnh Thưởng Lê Hồng Trang Nguyễn Linh Trung Lê Cung Tưởng Trường Đại học Bách khoa Hà Nội Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Trường Đại học Công nghệ TP Hồ Chí Minh Trường Đại học Bách khoa Hà Nội Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Trường Công nghệ Tiên tiến Quốc gia Bretagne, Pháp Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam Học viện Quản lý Giáo dục Học viện Cơng nghệ Bưu Viễn thơng Trường CentraleSupelec, Pháp Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Kent, Anh Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Sungkyunkwan, Hàn Quốc Học viện Cơng nghệ Bưu Viễn thơng Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Bách khoa Hà Nội Trường Đại học Quốc tế, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Bách khoa Hà Nội Trường Đại học Thủy lợi Trường Đại học Bách khoa Hà Nội Trường Đại học Bách khoa Hà Nội Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Viện Cơng nghệ Thông tin, Đại học Quốc gia Hà Nội Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Viện tiên tiến Khoa học Cơng nghệ, Nhật Bản Trường Đại học Phenikaa Trường Đại học Ngoại ngữ - Tin học TP Hồ Chí Minh Học viện Kỹ thuật Quân Viện Khoa học Công nghệ Quốc gia Ulsan, Hàn Quốc Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Trường Đại học Cơng nghệ TP Hồ Chí Minh Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Công nghệ Thông tin, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Nha Trang Trường Đại học Osaka, Nhật Bản Trường Đại học Bách khoa, Đại học Quốc gia TP Hồ Chí Minh Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Trường Đại học Tơn Đức Thắng THƠNG TIN DÀNH CHO TÁC GIẢ Chun san Các cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông – gọi tắt Chuyên san CNTT-TT, hay tiếng Anh ICT Research – ấn phẩm khoa học Tạp chí Thơng tin Truyền thơng, Bộ Thơng tin Truyền thông xuất từ năm 1999 ICT Research có phản biện, mở trực tuyến (open access) phát hành số năm, Ấn phẩm tiếng Việt (ISSN: 1859-3526) có số Ấn phẩm tiếng Anh (ISSN: 1859-3534) – Research and Development on Information and Communication Technology – có số ICT Research diễn đàn dành cho nhà nghiên cứu chuyên gia phổ biến ý tưởng sáng tạo lĩnh vực Công nghệ Thông tin, Truyền thông Điện tử Việt Nam toàn giới Ban biên tập ICT Research bao gồm nhà khoa học uy tín đến từ đơn vị nghiên cứu Việt Nam quốc gia khác HƯỚNG DẪN DÀNH CHO CÁC TÁC GIẢ QUÁ TRÌNH PHẢN BIỆN VÀ XUẤT BẢN Các tác giả nên tìm hiểu cách viết báo kỹ thuật, chẳng hạn hướng dẫn tài liệu “How to write for technical periodicals & conferences” Viện Kỹ sư Điện, Điện tử Hoa Kỳ (IEEE) ICT Research nhận thảo nộp trực tuyến trang web ICT Research http://ictmag.vn Tác giả cần chế bản thảo theo mẫu mà ICT Research hướng dẫn Các tác giả phải chịu trách nhiệm việc đảm bảo thảo chưa công bố trước đó, khơng q trình phản biện chuẩn bị xuất nơi khác Tác giả liên hệ phải chịu trách nhiệm đảm bảo đồng ý tất đồng tác giả nộp cho ICT Research Bản thảo cần nộp dạng PDF Để hỗ trợ phản biện kín hai chiều, tác giả cần nộp hai phiên thảo, phiên có đầy đủ thơng tin tất tác giả, khơng có thơng tin Các thảo nộp lại sau chỉnh sửa cần tuân theo dẫn thảo nộp lần đầu, cần kèm theo văn giải trình ý kiến phản biện, giải thích nội dung chỉnh sửa và/hoặc trả lời ý kiến phản biện Sau thảo thức chấp nhận xuất bản, tác giả cần phải chuẩn bị thảo cuối LATEX theo mẫu trình bày cho IEEE Transactions Một Biên tập viên lĩnh vực Trưởng Ban biên tập giao phụ trách điều phối phản biện thảo Biên tập viên thực đánh giá nhanh thảo định liệu thảo có phù hợp độc giả ICT Research hay không Nếu phù hợp, Biên tập viên khởi động trình phản biện Mỗi thảo phản biện hai phản biện Q trình phản biện kín hai chiều, theo danh tính tác giả phản biện khơng tiết lộ cho Các kết luận phản biện gồm có: (A) Chấp nhận, (B1) Chấp nhận với yêu cầu chỉnh sửa nhỏ, (B2) Chỉnh sửa nộp lại (bản thảo cần phải viết lại với thay đổi lớn sau cần qua vịng phản biện lần thứ hai), (C) Từ chối Mỗi vòng phản biện cần khoảng hai tháng Trong trường hợp tác giả Biên tập viên yêu cầu chỉnh sửa thảo, phiên chỉnh sửa cần nộp vòng hai tháng yêu cầu chỉnh sửa lớn tháng với yêu cầu chỉnh sửa nhỏ Tác giả cần nhiều thời gian xin vui lòng liên hệ với Biên tập viên Mỗi báo chấp nhận xuất trực tuyến sau đó, với số DOI, sau biên tập chế theo quy tắc biên tập ICT Research Đồng thời, có đủ số lượng phù hợp, ICT Research tập hợp lại xuất số in, kèm với mục lục báo ĐẠO ĐỨC TRONG XUẤT BẢN Khi báo chấp nhận, quyền báo tự động chuyển giao cho Tạp chí Cơng nghệ Thơng tin Truyền thông, tổ chức chịu trách nhiệm xuất ICT Research, với đảm bảo nội dung báo chấp nhận xuất cơng bố miễn phí trang web ICT Research Việc chuyển giao cho phép bên xuất có tồn quyền giải khiếu nại việc sử dụng trái phép Các tác giả có quyền đăng tải lại hay sử dụng lại báo xuất hình thức cho mục đích nào, miễn có trích dẫn đầy đủ tới báo gốc xuất ICT Research Việc nộp báo xem tác giả đọc đồng ý với sách quyền ICT Research am kết tuân thủ quy định, tiêu chuẩn hướng dẫn thiết lập COPE (Committee on Publication Ethics) việc đảm bảo tính liêm tạp chí xử lý trường hợp vi phạm Tất bên tham gia (Biên tập viên, Tác giả, Phản biện Nhà xuất bản) cần phải hiểu tuân thủ quy định, tiêu chuẩn hướng dẫn công bố trang web COPE Ban biên tập ICT Research sàng lọc tất thảo trước công bố Tất thảo kiểm tra mức độ tương tự với cơng trình khác sử dụng cơng cụ trực tuyến có Mọi hình thức đạo văn khơng chấp nhận thảo bị từ chối THÔNG TIN VỀ BẢN QUYỀN ... chế truyền multicast Trong chế này, gói tin vào máy chủ không tuân thủ nguyên tắc lưu lượng truyền unicast Truyền multicast kết hợp đặc biệt từ máy chủ kết nối với máy chủ phát thông tin truyền. .. cơng trình nghiên cứu phát triển Công nghệ Thông tin Truyền thông D4C7T5N5S6I4 (ms = 0.25%) D4C7T5N5S6I4 (ms = 0.25%) Số lời giải số chuỗi FHU 1E+6 Số ứng viên 1E+6 1E+5 1E+5 1E+4 1E+3 1E+2 1E+1...ISSN: 1859-3526 Tập 2019, Số 2, Tháng 12 TỔNG BIÊN TẬP: VŨ CHÍ KIÊN CÁC CƠNG TRÌNH NGHIÊN CỨU PHÁT TRIỂN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG THƯỜNG TRỰC BAN BIÊN TẬP Trưởng Ban

Ngày đăng: 04/11/2020, 07:19

TỪ KHÓA LIÊN QUAN