Bài viết đã đánh giá tính phức tạp của tập mẫu huấn luyện khi trích chọn từ dữ liệu nghiệp vụ thông qua việc phân tích tính đa dạng của miền trị thuộc tính. Bài viết cũng đã chỉ ra tính phức tạp khi định lượng giá trị ngôn ngữ đặc biệt là các giá trị ngôn ngữ ngoại lai trong tập mẫu huấn luyện.
Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 14 (34), tháng 12/2015 Một phƣơng pháp xử lý giá trị ngoại lai tập mẫu huấn luyện định sử dụng đại số gia tử A method for handling outliers in training data set to build a decision tree based on hedge algebra Lê Văn Tƣờng Lân, Nguyễn Mậu Hân, Nguyễn Công Hào Abstract: In this paper we propose a method to handle the outliers of the fuzzy fileds in the sample training dataset that based on hedge algebra Due to the value of the attribute domain may be value or linguistic so we need a method of approximate data in a simple way and effective to handle outliers of it Keyword: Hedge algebra, decision tree, fuzzy decision tree, training data set I ĐẶT VẤN ĐỀ Trong tốn khai phá liệu việc chọn tập mẫu huấn luyện giai đoạn quan trọng, định kết cơng việc khai phá Bài tốn xây dựng định toán khai phá liệu nên vấn đề chọn tập mẫu huấn luyện vấn đề cần phải giải Nhƣ biết, định đƣợc xây dựng dựa tập liệu huấn luyện bao gồm đối tƣợng mẫu, tất mẫu tập có chung cấu trúc, gồm cặp Mỗi đối tƣợng đƣợc mơ tả tập giá trị thuộc tính nhãn lớp Để xây dựng định, nút cần xác định thuộc tính thích hợp để kiểm tra, phân chia liệu thành tập Trên tập mẫu huấn luyện M, bản, thuật toán phân lớp phải thực bƣớc sau: Bước 1: Chọn thuộc tính Ai có giá trị ai1, ai2,…, ain Bước 2: Với thuộc tính Ai đƣợc chọn, ta tạo nút sau chia mẫu ứng với nút thành tập mẫu tƣơng ứng M1, M2, …, Mk sau lại tiếp tục Đây bƣớc phân chia với kết nhận đƣợc từ Bước 1, điều có nghĩa chất lƣợng kết phụ thuộc phần lớn vào cách chọn thuộc tính cách phân chia mẫu nút Chính điều này, thuật tốn phải tính lƣợng thơng tin nhận đƣợc thuộc tính chọn thuộc tính tƣơng ứng có lƣợng thông tin tốt để làm nút phân tách cây, nhằm để đạt đƣợc có nút nhƣng có khả dự đốn cao [2,17] Trong giới thực, liệu nghiệp vụ đa dạng chúng đƣợc lƣu trữ để phục vụ nhiều công việc khác nhau, nhiều thuộc tính đƣợc miền giá trị trƣớc lƣu trữ nhƣng tồn nhiều thuộc tính có miền trị chƣa [5,7,20] Khi thuộc tính chƣa xuất tập mẫu huấn luyện, thuật toán học để xây dựng chƣa thể tiến hành Do đó, cần phải tiền xử lý liệu để có đƣợc tập mẫu huấn luyện Vấn đề đặt ta phải xử lý nhƣ để có đƣợc kết khả quan Ví dụ: Cho bảng liệu DIEUTRA lƣu trữ tình hình mua máy tính xách tay khách hàng công ty nhƣ Bảng 1, ta cần xây dựng định cho việc dự đoán khách hàng mua hàng Lúc này, tập mẫu huấn luyện có thuộc tính LươngTháng chứa liệu khơng qn Để huấn luyện tập mẫu này, phải làm liệu cho thuộc tính [8] - 55 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 14 (34), tháng 12/2015 Bảng 1: Bảng liệu điều tra Phiếu ĐT Họ Tên Số CMND Chuyên Ngành Lƣơng Tháng Máy Tính M01045 Nguyễn An 193567450 Luật 48 Khơng M01087 Lê Văn Bình 191568422 Luật Thấp Khơng M02043 Hồng Hà 196986568 CNTT 53 Có M02081 Võ Văn Bình 191003117 LịchSử 20 Có M02046 Trần Hƣơng 196001278 LịchSử Cao Có M03087 Nguyễn Lài 198235457 LịchSử Cao Không M03025 Vũ Văn Hoa 198875584 CNTT Rất cao Có M03017 Lê Bá Linh 191098234 Luật 35 Khơng M04036 Võ Bạch Ân 196224003 Luật 100 Có M04037 Lê Văn Bách 196678578 LịchSử 50 Có M04042 Lê Vũ Bình 197543457 Luật Q cao Có M04083 Nguyễn Hố 192267457 CNTT Ít thấp Có M05041 Lê Thị Hoa 198234309 CNTT 55 Có M05080 Trần Chung 196679345 LịchSử 50 Khơng M05086 Trần Xn Bi 196679995 Luật QThấp Khơng Trong q trình liệu, việc định lƣợng cho giá trị ngôn ngữ thông thƣờng đƣợc dựa vào miền giá trị rõ thuộc tính tức ta tìm thấy miền trị [min, max] từ miền giá trị rõ sau định lƣợng cho giá trị ngôn ngữ từ miền trị [6,8] Tuy vậy, việc tìm miền trị [min, max] khơng phải lúc thuận lợi xuất giá trị ngôn ngữ mà giá trị thật nằm ngồi miền liệu rõ có thuộc tính xét Các giá trị ta gọi giá trị ngoại lai Ví dụ nhƣ Bảng 1, với thuộc tính LươngTháng, ta có miền trị rõ [min, max] = [20, 100] đủ để định lƣợng cho giá trị ngôn ngữ thơng thƣờng nhƣ: {Thấp, Ít thấp, Cao, Rất cao} Các giá trị ngôn ngữ “Quá cao“ hay “Quá thấp” thuộc tính LươngTháng khơng nằm miền trị nên giá trị ngoại lai thuộc tính xét Việc sử dụng miền trị [min, max] = [20 100] để định lƣợng cho giá trị ngôn ngữ ta thu đƣợc giá trị rõ, nhƣng khơng phản ánh giá trị ngơn ngữ cần thể Các phƣơng pháp tiền xử lý liệu truyền thống nhƣ sử dụng giá trị tồn cục hay sử dụng giá trị trung bình thuộc tính, phƣơng pháp Binning, hồi quy, [9,15,24] khơng thể sử dụng để xác định giá trị ngoại lai Ta bỏ qua trƣờng hợp ngoại lai xem chúng lớp tƣơng đƣơng với giá trị ngôn ngữ khác, chẳng hạn mẫu ta đồng ngữ nghĩa “Quá cao” với “Rất cao”, nhƣng việc làm làm thông tin Sử dụng ý kiến chuyên gia cho việc xác định giá trị rõ cho giá trị ngoại lai lúc cho kết nhƣ mong muốn cịn phụ thuộc vào trình độ chuyên gia Trong thời gian qua, đại số gia tử đƣợc nhiều tác giả nghiên cứu ngồi nƣớc nghiên cứu có kết đáng kể, đặc biệt lập luận xấp xỉ số toán điều khiển [1,6,12-19, 23] Việc sử dụng đại số gia tử để xử lý giá trị ngơn ngữ - 56 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT miền liệu chƣa cho kết tích cực [6, 8] Trong báo này, chúng tơi trình bày cách để giải giá trị ngoại lai thuộc tính có liệu chƣa theo tiếp cận đại số gia tử, nhằm giúp ta xác định giá trị rõ cho giá trị ngôn ngữ mà giá trị rõ thật nằm ngồi khoảng rõ có miền liệu tập mẫu huấn luyện II THUẦN NHẤT GIÁ TRỊ CHO CÁC THUỘC TÍNH DỰA TRÊN ĐẠI SỐ GIA TỬ Với tập mẫu huấn luyện M có thuộc tính chƣa Ai, ta gọi Dom(Ai) miền trị tƣơng ứng với thuộc tính mờ Ai xem nhƣ đại số gia tử Dom(Ai) = DAi LDAi, với DAi tập giá trị kinh điển Ai LDAi tập giá trị ngôn ngữ Ai Trƣớc tiên, phải xử lý để chuyển đổi thuộc tính chƣa Ai nhằm đạt đƣợc tập giá trị kinh điển DAi tập giá trị ngôn ngữ LDAi [8] II.1 Chuyển giá trị ngôn ngữ giá trị số Để chuyển đổi giá trị ĐSGT (giá trị ngôn ngữ) thành số [0,1] ta sử dụng hàm định lƣợng ngữ nghĩa X đƣợc xây dựng nhƣ sau với x = him hi2hi1c: (1) x phần tử sinh tức x = c+ x = c-, lúc này: (c) = W-.fm(c-) (c+) = W + .fm(c+) (2) x phần tử sinh: - Với 1 j p: (hjx) = (x) + Sign(hjx) p i j fm( hi x) (1 Sign( h j x) Sign( h1h j x)( )) fm(h j x) - Với j > p: (hjx) = (x) + Sign(hjx) j i p1 fm(hi x) (1 Sign(h j x) Sign(h1h j x)( )) fm(h j x) Tập V-2, Số 14 (34), tháng 12/2015 Nếu LDAi = DAi Dom(Ai) ta có: max 1 max IC() = , với Dom(Ai) = [min, max] miền trị kinh điển Ai Nếu DAi , LDAi Dom(Ai) ta có IC() = { × (maxLV)}/max, với LDAi = [minLV, maxLV] miền trị ngôn ngữ Ai Nếu chọn tham số W độ đo tính mờ cho gia tử cho (maxLV) 1.0 { × 1 (maxLV)}/max max max Ví dụ: Cho miền trị sở U(T) = {0…100, … rất trẻ, … , rất già} DT = {20, 25, 27, 30, 45, 60, 75, 66, 80} LDT = {trẻ, trẻ, già, trẻ, già, già, già, rất trẻ} Dom(T) = DT LDT Nếu LDT = Dom(T) = DT = {20, 25, 27, 30, 45, 60, 75, 66, 80} Do DT, chuyển đổi giá trị số [0, 1] nhờ hàm IC() Ta có DT = {0.2, 0.25, 0.27, 0.3, 0.45, 0.6, 0.75, 0.66, 0.8} Nếu DT LDT ta có: Dom(T) = DT LDT = {trẻ, trẻ, già, trẻ, già, giá, già, rất trẻ, 20, 25, 27, 30, 45, 60, 75, 66, 80} Giả sử tính đƣợc (maxLV) = (rất già) = 0.98 Khi DT IC() = { × (maxLV)}/max = ( × 0.98)/100, hay DT chuyển đổi giá trị số [0, 1] nhờ hàm IC() Nên ta có: DT = {0.196, 0.245, 0.264, 0.294, 0.441, 0.588, 0.735, 0.646, 0.784} II.2 Chuyển giá trị số giá trị ngôn ngữ Tiếp đến, hàm k đƣợc sử dụng để chuyển giá trị [0, 1] thành giá trị ngôn ngữ x tƣơng ứng đại số gia tử X Trƣớc tiên, sử dụng hàm IC để chuyển giá trị số giá trị thuộc [0,1], hàm IC: Dom(Ai) [0,1] đƣợc xác định nhƣ sau: k: [0, 1] X gọi hàm ngƣợc hàm theo mức k đƣợc xác định: a [0, 1], k(a) = xk a I(xk), với xk Xk - 57 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT II.3 Định lý Cho đại số gia tử X = (X, G, H, ), hàm định lƣợng ngữ nghĩa X, k hàm ngƣợc , ta có: (1) xk Xk, k((xk)) = xk (2) a I(xk), b I(yk), xk k yk, a < b k(a) >khả WLươngTháng = 0.4, fm(thấp) = 0.4, fm(cao) = 0.6, Vì vậy, thuật tốn xác định đƣợc giá trị rõ nằm ngồi miền giá trị có cho giá trị ngơn ngữ ngoại lai tập mẫu (rất) = 0.35, (hơn) = 0.25, (khả năng) = 0.20, (ít) = 0.20 Lúc ta có : IV ỨNG DỤNG XỬ LÝ GIÁ TRỊ NGOẠI LAI CHO DỮ LIỆU BÁN HÀNG Cho tập mẫu huấn luyện nhƣ Bảng 1, xây dựng định hỗ trợ dự đoán việc mua máy Do tập mẫu huấn luyện có thuộc tính LươngTháng chƣa nên ta phải giá trị cho LươngTháng Ta có: fm(rất thấp) = 0.35 0.4 = 0.14, fm(hơn thấp) = 0.25 0.4 = 0.10, fm(ít thấp) = 0.2 0.4 = 0.08, fm(khả thấp) = 0.2 0.4 = 0.08 Vì thấp < thấp < thấp < khả thấp < thấp nên: - 59 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 14 (34), tháng 12/2015 Chọn 1 = 100 XLươngTháng Num(LươngTháng), I(rất thấp) = [0, 0.14], I(hơn thấp) = [0.14, 0.24], I(khả thấp) = [0.24, 0.32], IC() = {0.35, 0.24, 0.41, 0, 0.64, 0.64, 1, 0.19, 1, 0.38, 0.4, 0.44, 0.38} I(ít thấp) = [0.32, 0.4] Ta lại có: fm(rất cao) = 0.35 0.6 = 0.21, Tiếp theo, ta phải tính cho giá trị ngoại lai xác định Ta chọn phân hoạch thích hợp khoảng mờ để chèn giá trị ngoại lai vào khoảng fm(hơn cao) = 0.25 0.6 = 0.15, fm(ít cao) = 0.2 0.6 = 0.12, fm(khả cao) = 0.2 0.6 = 0.12 Vì cao < khả cao < cao < cao < cao nên : Do giá trị ngoại lai cao > cao nên ta phân hoạch đoạn [0.79, 1] tƣơng ứng |I(lớn)| Nhƣ ta có: I(ít cao) = [0.4, 0.52], I(khả cao) = [0.52, 0.64], fm(quá cao) ~ fm(rất cao) I(rất cao) = 0.21 0.79 = 0.17 I(hơn cao) = [0.64, 0.79], Nên I(rất cao) = [0.79, 0.96], I(rất cao) = [0.79, 1] Ta có hình ảnh phân bố tính mờ thuộc tính LươngTháng đƣợc mơ tả tóm tắt nhƣ Hình I(quá cao) = [0.96, 1] Quá thấp < thấp nên ta phân hoạch đoạn [0, 0.14] tƣơng ứng |I(thấp)| Nhƣ vậy: fm(quá thấp) ~ fm(rất thấp) I(rất thấp) = 0.14 0.14 = 0.02 Nên I(rất thấp) = [0.02, 0.14], I(quá cao) = [0, 0.02] Nhƣ vậy, thuộc tính LươngTháng nhận đƣợc nhƣ sau: ALươngTháng= {48, Thấp, 53, 20, Cao, Cao, Rất cao, 35, 100, 50, Quá cao, Ít thấp, 55, 50, Quá thấp}, IC() = {0.35, 0.24, 0.41, 0.02, 0.64, 0.64, 0.79, 0.19, 0.79, 0.38, 1, 0.4, 0.44, 0.38, 0} Do đó, 2(0.35) = thấp 0.35 I(ít thấp) Tƣơng tự cho giá trị cịn lại, ta có thuộc tính LươngTháng theo ngữ nghĩa nhƣ sau: Hình Tính mờ LươngTháng Nhƣ vậy, với thuộc tính khơng LươngTháng xét, ta có ALươngTháng= {48, Thấp, 53, 20, Cao, Cao, Rất cao, 35,100, 50, Ít thấp, 55, 50}, {Ít thấp, Thấp, Ít cao, Rất thấp, Cao, Cao, Rất cao, Hơn thấp, Rất cao, Ít thấp, Quá cao, Ít thấp, Ít cao, Ít thấp, Quá thấp} Lúc này, thuộc tính LươngTháng đƣợc làm theo giá trị là: {48, 24, 53, 20, 64, 64, 100, 35, 100, 50, 130, 50, 40, 55, 50, 12} - 60 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT V NHẬN XÉT VÀ ĐÁNH GIÁ Với tập mẫu huấn luyện DIEUTRA cho Bảng 1, chứa thuộc tính chƣa LươngTháng, ta có: Tập V-2, Số 14 (34), tháng 12/2015 64, 100, 35, 100, 50, 130, 50, 40, 55, 50, 12} Tiến hành xây dựng cây, thu đƣợc kết Hình Không làm liệu mà loại bỏ giá trị ngôn ngữ, xem giá trị ngôn ngữ giá trị “lỗi”, ta thu đƣợc nhƣ Hình Nhƣ vậy, trình loại mẫu “lỗi” làm cho thuộc tính LươngTháng mẫu khơng đủ hữu hiệu để xất kết quả, điều không phản ánh hết thông tin thực tế Không xét giá trị ngoại lai nhƣ đề cập mục mà thực việc liệu giá trị lại Kết sau giá trị, ta có tập giá trị thuộc tính LƣơngTháng là: {45, 24, 52, 34, 64, 79, 35, 100, 50, 79, 40, 55, 50} Tiến hành xây dựng cây, thu đƣợc kết Hình Hình Cây định tạo ta có xử lý giá trị ngoại lai Đối sánh thu đƣợc Hình 4, Hình giá trị rõ tập mẫu ban đầu, ta thấy bỏ qua giá trị ngoại lai dẫn đến sai khác vị trí biên kết Nhƣ vậy, việc xử lý giá trị ngoại lai thực cần thiết VI KẾT LUẬN Hình Cây định tạo bỏ qua giá trị ngôn ngữ tập mẫu huấn luyện Bài báo đánh giá tính phức tạp tập mẫu huấn luyện trích chọn từ liệu nghiệp vụ thơng qua việc phân tích tính đa dạng miền trị thuộc tính Bài báo tính phức tạp định lƣợng giá trị ngôn ngữ đặc biệt giá trị ngôn ngữ ngoại lai tập mẫu huấn luyện Trên sở đại số gia tử, việc xem xét tính hiệu làm giá trị cho thuộc tính chƣa mẫu theo giá trị ngôn ngữ hay theo giá trị kinh điển Bài báo cách thức để xác định đƣợc giá trị rõ cho giá trị ngôn ngữ ngoại lai tập huấn luyện, để từ ta huấn luyện đƣợc định phù hợp với thực tế TÀI LIỆU THAM KHẢO [1] DƢƠNG THĂNG LONG: Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa đại số gia tử ứng dụng toán phân lớp, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ Thơng tin, 2010 Hình Cây định tạo bỏ qua giá trị ngoại lai tập mẫu huấn luyện [2] ĐOÀN VĂN BAN, LÊ MẠNH THẠNH, LÊ VĂN Xét riêng giá trị ngoại lai nhƣ đề cập mục IV, kết sau giá trị, ta có tập giá trị thuộc tính LƣơngTháng là: {48, 24, 53, 20, 64, - 61 - TƢỞNG LÂN: Một cách chọn mẫu huấn luyện thuật toán học để xây dựng định khai phá liệu, Tạp chí Tin học Điều khiển học, T23, S4, 2007 Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 14 (34), tháng 12/2015 [3] NGUYỄN CÁT HỒ: Lý thuyết tập mờ Công nghệ [16] FERNANDEZ A., CALDERON M, BARRENECHEA tính tốn mềm, Tuyển tập giảng Trƣờng thu hệ mờ ứng dụng, 2006 đại số gia tử, Bài giảng trƣờng Thu - Hệ mờ ứng dụng, Viện Toán học Việt Nam, 2008 E., Enhancing Fuzzy Rule Based Systems in MultiClassication Using Pairwise Coupling with Preference Relations, EUROFUSE Workshop Preference Modelling and Decision Analysis, Public University of Navarra, Pamplona, Spain, 2009 [5] NGUYỄN CÔNG HÀO, NGUYỄN CÁT HỒ: Một [17] FA CHAO LI, JUAN SUN, XI-ZHAO WANG, cách tiếp cận xấp xỉ liệu sở liệu mờ, Tạp chí Tin học Điều khiển học, 2006 Analysis on the fuzzy filter in fuzzy decision trees, Proceedings of the Second International Conference on Machine Learxung and Cybernetics, 2003 [4] NGUYỄN CÁT HỒ: Cơ sở liệu mờ với ngữ nghĩa [6] NGUYỄN CÔNG HÀO: Cơ sở liệu mờ với thao tác liệu dựa đại số gia tử, Luận án Tiến sĩ Tốn học, Viện Cơng nghệ Thơng tin, 2008 [18] KAVITA SACHDEVA, MADASU HANMANDLU, AMIOY KUMAR, Real Life Applications of Fuzzy Decision Tree, International Journal of Computer Applications, 2012 [7] LÊ VĂN TƢỜNG LÂN: Phụ thuộc liệu tác động tốn phân lớp khai phá liệu, Tạp chí khoa học Đại học Huế, Tập:19, Số:53, 2009 [19] HESHAM A HEFNY, AHMED S GHIDUK, ASHRAF ABDEL WAHAB, Effective Method for Extracting Rules from Fuzzy Decision Trees based on Ambiguity and Classifiability, Universal Journal of Computer Science and Engineering Technology, Cairo University, Egypt, 2010 [8] LÊ VĂN TƢỜNG LÂN: Một cách tiếp cận chọn tập mẫu huấn luyện định dựa đại số gia tử, Hội nghị Quốc gia lần thứ VI nghiên cứu ứng dụng Công nghệ Thông tin (FAIR), XNB Khoa học tự nhiên công nghệ, 2013 [9] PHẠM HẠ THỦY: Xác định phần tử ngoại lai [20] HO TU BAO, Introduction to knowledge discovery and data mining, Institute of Information Technology National Center for Natural Science, 2000 sở liệu quan hệ, Tạp chí Tin học Điều khiển học, T21, S4, 2005 HO N C AND NAM H V, An algebraic approach to linguistic hedges in Zadeh's fuzzy logic, Fuzzy Sets and Systems, vol.129, pp.229-254, 2002 [10] A.K BIKAS, E M VOUMVOULAKIS AND N D HATZIARGYRIOU, Neuro-Fuzzy Decision Trees for Dynamic Security Control of Power Systems, Department of Electrical and Computer Engineering, Greece, 2008 [21] MOUSTAKIDIS, S MALLINIS, G KOUTSIAS, N THEOCHARIS, J.B., PETRIDIS, V, SVM-Based Fuzzy Decision Trees for Classification of High Spatial Resolution Remote Sensing Images, Geoscience and Remote Sensing, IEEE, 2012 [11] CHIDA A, Enhanced Encoding with Improved Fuzzy Decision Tree Testing Using CASP Templates, Computational Intelligence Magazine, IEEE, 2012 [12] CHANG, ROBIN L P PAVLIDIS, Fuzzy Decision Tree Algorithms, Man and Cybernetics, IEEE, 2007 [22] OLEKSANDR DOROKHOV, VLADIMIR CHERNOV, Application of the fuzzy decision trees for the tasks of alternative choices, Transport and Telecommunication Institute, Lomonosova, Latvia, Vol.12, No 2, 2011 [13] DORIAN P, Data Preparation for Data Mining, Morgan Kaufmann, 1999 [14] DAVEEDU R A., JAYA SUMA G, LAVANYA DEVI G Construction of Fuzzy Decision Tree using Expectation Maximization Algorithm, International Journal of Computer Science and Management Research, 2012 [15] E M KNORR, Outliers and data mining: finding [23] V BARNETT, T LEWIS, Outliers in Statistical Data, John Wiley, 3rd edition, 1994 Ngày nhận bài: 08/04/2015 exceptions in data, Doctor’ thesis, Dept of Computer science, University of British Columbia, 2002 - 62 - Các cơng trình nghiên cứu, phát triển ứng dụng CNTT-TT Tập V-2, Số 14 (34), tháng 12/2015 SƠ LƢỢC VỀ TÁC GIẢ LÊ VĂN TƢỜNG LÂN NGUYỄN CÔNG HÀO Sinh năm 1976 Thừa thiên Huế Sinh năm 1974 TP Huế Nhận thạc sỹ Tin học, chuyên ngành CNTT Trƣờng ĐH Bách khoa Hà Nội, năm 2002 Đang NCS trƣờng ĐH Khoa học – ĐH Huế, chuyên ngành Khoa học Máy tính Nhận tiến sĩ Viện CNTT năm 2008 Hiện Giám đốc Trung tâm CNTT, ĐH Huế Lĩnh vực nghiên cứu: Cơ sở liệu mờ, phƣơng pháp tính tốn mềm, phƣơng pháp lập luận xấp xỉ Hiện công tác khoa CNTT, Trƣờng ĐH Khoa học, ĐH Huế Địa email: nchao@hueuni.edu.vn Lĩnh vực nghiên cứu: Khai phá liệu, công nghệ phần mềm Điện thoại liên hệ: 0905151357 Địa email: nmhan2009@gmail.com NGUYỄN MẬU HÂN Sinh năm 1957 Thừa thiên Huế Nhận tiến sĩ Viện CNTT Đƣợc phong hàm Phó Giáo sƣ năm 2013 Hiện giảng viên khoa CNTT, Trƣờng ĐH Khoa học, ĐH Huế Lĩnh vực nghiên cứu: Xử lý song song phân tán, tính tốn lƣới điện tốn đám mây Email: nchao@hueuni.edu.vn - 63 - ... Chuyển giá trị số giá trị ngôn ngữ Tiếp đến, hàm k đƣợc sử dụng để chuyển giá trị [0, 1] thành giá trị ngôn ngữ x tƣơng ứng đại số gia tử X Trƣớc tiên, sử dụng hàm IC để chuyển giá trị số giá trị. .. fm(hMinLV) - fm(hGiáTrịNgoạiLai) Nếu GiáTrịNgoạiLai > MaxLV thì: - Phân hoạch đoạn [(MaxLV), 1] thành [(MaxLV), (GiáTrịNgoạiLai)] [(GiáTrịNgoạiLai), 1] - fm(hGiáTrịNgoạiLai) ~ fm(hMaxLV)... phƣơng pháp tiền xử lý liệu truyền thống nhƣ sử dụng giá trị toàn cục hay sử dụng giá trị trung bình thuộc tính, phƣơng pháp Binning, hồi quy, [9,15,24] sử dụng để xác định giá trị ngoại lai Ta