Phát triển thuật toán dự đoán vị trí của thuê bao di động theo tiếp cận khai phá dữ liệu

CHƯƠNG TỔNG QUAN Ngày nay, với phát triển nhanh chóng mạng truyền thơng tế bào, nhiều người sử dụng thiết bị di động cá nhân để tìm kiếm thơng tin mạng internet Hầu người có thiết bị di động mobile phone, máy tính bảng (tablet mobile), notebook, … Vào khoảng tỷ mobile phones sử dụng toàn giới vào năm 2015 với tỷ lệ 95,56% dân số tồn giới Do đó, mục tiêu vấn đề làm để đảm bảo chất lượng dịch vụ di động 1.1 Tổng quan dự báo trước đường Hiện với phát triển nhanh chóng cơng nghệ truyền thơng khơng dây (wireless communications) thiết bị di động đầu cuối đại tạo nên môi trường trao đổi liệu mới, mơi trường làm việc di động (Mobile Work Environment) Việc quản lý đường th bao di động mơi trường tính tốn di động (Mobile Computing Environments) bao gồm phương pháp lưu trữ cập nhật thơng tin vị trí phục vụ hệ thống Một vấn đề quan trọng lĩnh vực nghiên cứu quản lý đường dự báo trước đường thuê bao di động 1.2 Các đóng góp nghiên cứu Trong luận án có đóng góp tóm tắt sau: Đóng góp thứ nhất: Chúng tơi thực giảm thời gian thực thuật toán UMPMining cách thực tự kết thuật toán tạo ứng viên (cải tiến 1) Tiếp tục giảm thời gian thực thuật toán cách giảm độ phức tạp thuật toán Để giảm độ phức tạp thuật toán, biến đổi ma trận kề thành ma trận đường (cải tiến 2) B Sanou (2015, May) www.itu.int/ict [Online] https://www.itu.int/en/ITUD/Statistics/Documents/facts/ICTFactsFigures2015.pdf Nội dung liên quan đến đóng góp cơng bố Cơng trình [2], [3], [4] [5] [6] Đóng góp thứ hai: Ở đóng góp thứ hai này, chúng tơi thực thu nhỏ giao tác thuật toán tạo mẫu ứng viên Bằng cách áp dụng lý thuyết tập hợp, rút ngắn số giao tác lần lặp thứ ba trở Nội dung liên quan đến đóng góp cơng bố Cơng trình [2], [3] Đóng góp thứ ba: Chúng tơi đưa thuật tốn UMP_Online để tránh qt lại tồn sở liệu (CSDL) Thuật tốn thực khai phá tập liệu (các giao tác thêm vào CSDL) Do đó, nhà cung cấp dịch vụ cung cấp ứng dụng hiệu (nâng cao QoS) Nội dung liên quan đến đóng góp cơng bố Cơng trình [1],[2] Đóng góp thứ tư: Chúng tơi dề xuất phương pháp để nâng cao độ xác việc dự báo trước di chuyển thuê bao di động (phân lớp liệu theo thời gian) Nội dung liên quan đến đóng góp cơng bố Cơng trình [1] CHƯƠNG MƠ HÌNH DỰ BÁO TRƯỚC VỊ TRÍ CỦA THUÊ BAO DI ĐỘNG THEO TIẾP CẬN KHAI PHÁ DỮ LIỆU Trong chương chúng tơi đưa mơ hình dự báo trước vị trí thuê bao di động theo tiếp cận khai phá liệu Mơ hình bao gồm giai đoạn: giai đoạn đầu lấy liệu từ “logfile” ghi HLR Giai đoạn 2: chuẩn hóa liệu đầu vào theo bước Giai đoạn 3: khai phá liệu UAPs (User Actual Paths) để UMPs (User Mobility Patterns) Giai đoạn 4: tìm luật di chuyển (Mobility Rules) từ mẫu di chuyển thuê bao di động (UMPs) Cuối giai đoạn dự báo trước đường thuê bao di động Khai thác UAPs để UMPs UMPs Mobility Rules Hình 2.1: Lưu đồ phương pháp dự báo trước đường thuê bao di động 2.1 Giai đoạn 1: Lấy liệu từ file log HLR Dữ liệu thực tế từ Mobile Switching Center (MSC) có dạng text dạng khơng có cấu trúc với nhiều thơng tin Để khai thác liệu ta phải thực qua nhiều cơng đoạn 2.2 Giai đoạn 2: Chuẩn hóa liệu đầu vào Ở giai đoạn này, để thực chuẩn hóa liệu chúng tơi thực bước: chuyển liệu từ file text sang file có cấu trúc, ghép mã “cell”, rút trích số trường cần thiết để khai phá liệu lọc bỏ thuê bao di động không di chuyển 2.3 Giai đoạn 3: Khai thác UAPs để UMPs Giả sử UAPs có dạng: U= {c1,c2,…,cn} Mỗi ck biểu thị số ID “cell” thứ k vùng phủ sóng Ví dụ: đồ phủ sóng mơ C1 C7 C2 C6 C0 C8 C3 C5 C4 Hình 2.9: Mơ hình mạng tế bào ánh xạ sang đồ thị G Và bảng liệu thử sau: UAP ID UAP {5,6,0,4} {3,4,5,0} {1,2,3,4,0,5} {3,2,0} Bảng 2.2: Tập liệu thử Gọi mẫu di chuyển users là: UMPs (User Mobility Patterns) Khai thác UMPs cho ta rút luật di chuyển (Mobility Rules) UMPs chuỗi “cell” lân cận vùng phủ sóng Để khai thác UMPs từ UAPs thực sau: Gọi G đồ thị có hướng tương ứng với “cell” vùng phủ sóng Mỗi “cell” đỉnh G hình 2.9 Nếu có “cell” gọi A B lân cận (có chung biên) vùng phủ sóng có đường trực tiếp khơng có trọng số từ A đến B ngược lại Định nghĩa: Giả sử có UAPs, A={a1, a2, …,an} B={b1,b2,…,bm} B chuỗi A, tồn : ≤ i1 Tất luật di chuyển bắt nguồn từ mẫu sau: {c1} -> {c2,…, ck} {c1, c2} -> {c3,…, ck} … { c1, c2,…, ck-1} -> { ck } Cho luật di chuyển R: (c1, c2,…, ci-1) (ci, ci+1,…, ck), hệ số confidence tính sau: Confidence( R) = (c1 , c , , ck ) count 100 (c1 , c , ,ci ).count Bằng cách sử dụng UMPs, tất luật di chuyển tạo giá trị confidence phải tính tốn Các luật có độ confidence minconf chọn 2.5 Giai đoạn 5: Dự báo trước đường thuê bao di động Đây giai đoạn dự báo trước thuê bao di động di chuyển đến “cell” vùng phủ sóng Thuật toán 2.8: Dự báo trước đường thuê bao di động Input: Đường user: P = (c1, c2, …, ci) Tập luật di chuyển: R Số luật dự báo tối đa: m Output: Tập cell dự báo trước: Pre_Cells 10 Pre_Cells = Ø // Khởi tạo tập cell Pre_Cells = Ø k=1 // Gán số đếm mảng luật for each r: (a1, a2, …, aj) (aj+1, …, ai) ϵ R if (a1, a2, …, aj) P and aj = ci then Luat_dubao = Luat_dubao r Tìm hệ số confidence (lấy kết từ giai đoạn 4) Mang_Luat ← Lưu confidence endif endfor Sort (Mang_Luat) // theo thứ tự giảm dần theo hệ số confidence 11 Pre_Cells ← Right_cell //Lấy cell bên vế phải luật 12 Return Pre_Cells - Trong phần đường thuê bao di động dự báo trước Thuật toán tóm tắt sau: giả sử thuê bao di động có đường cho Như vậy, đường o2 biểu diễn lại là: o2 = (4, 0, 0, 1, 2, 3, 0, 0) Nếu S = {i4, i5} vector biểu diễn v(S) = (0, 1, 1, 0), tức có đường theo thứ tự hai UAP o2 o3 Với đường o1, ta có í4 = 4, i5 = chứng tỏ có đường từ “cell” tới “cell” khơng có đường theo hướng ngược lại Sau thuật tốn để tìm mẫu UMPs theo ma trận đường Mdd: Thuật toán Find_UMP_ Reduce_Complexity Input: (O, I, R), minsupp Ma trận đường Mdd Đồ thị vùng phủ sóng G Output: L L = // khởi tạo tập mẫu phổ biến rỗng L1 ← Find_L1 //Tạo L1 từ (O, I, R) cách xét cột ma trận Mdd For (k=2; Lk-1 ; k++) Lk ← Find_Lk(Lk-1) //Tạo Lk từ Lk-1 L = L Lk endfor Return L So sánh với thuật toán trước: Thuật toán UMPMining Cn Thuật toán cải tiến Thuật toán cải tiến Ln số lượng Cn Th gian chạy (s) số lượng Cn Th gian chạy (s) số lượng Cn Th gian chạy (s) C1 351 33 351 32 351 348 L1 C2 1492 176 1488 167 1488 129 1033 L2 C3 5191 511 3340 341 3340 274 124 L3 C4 651 63 79 79 L4 Tổng 7685 783 5258 548 5258 410 Bảng 3.10: So sánh thời gian chạy thuật toán Thời gian chạy (giây) 1000 800 600 400 200 0 Thời gian chạy (TT gốc) Thời gian chạy (cải tiến 1) Thời gian chạy (cải tiến Cn Hình 3.9: Biểu đồ so sánh thời gian chạy thuật toán  Tỷ lệ giảm thời gian so với cải tiến 1: 36.53%  Tỷ lệ giảm thời gian so với thuật toán UMPMining: 47.63% Giải thích: Đối với Thuật tốn UMPMining, từ dòng đến dòng 11 (tìm support Cn) cụ thể hóa sau: Tim_support_Goc(Sk): Tính support Sk UMPMining Input: sở liệu D Output: Support Sk For each (UAP a D) //quét toàn sở liệu D For (i = 1; i |a|; i++) //|a|: chiều dài chuỗi a Tìm vị trí (s1,s2,…,sk) Sk chuỗi a // Sk = {s1, s2, …, sk} Tính totDist Tính Sk.count Endfor Endfor Return SP(Sk) - Đối với Thuật toán Find_UMP_Reduce_Complexity (phần tìm SP(S)) chi tiết hóa sau: Thuật toán Tim_support_Caitien2(Sk): Tính support Sk -Input: Ma trận đường Mdd Output: Support Sk For each (o Mdd) //quét toàn ma trận đường Tìm vị trí (s1,s2,…,sk) Sk o Tính totDist Tính Sk.count Endfor Return SP(Sk) -Độ phức tạp Thuật tốn Tim_support_Goc: o Đối với vòng lặp dòng 1: độ phức tạp O(m), với m = |D| o Đối với vòng lặp thứ hai (dòng 2): độ phức tạp O(n), với n = |a|: chiều dài trung bình chuỗi a D o Như vậy, độ phức tạp thuật toán là: O(m n) Độ phức tạp Thuật toán Tim_support_Caitien2: o Đối với vòng lặp dòng 1: độ phức tạp O(m), với m = |O|: số dòng Mdd (= số dòng CSDL D) o Như vậy, độ phức tạp thuật toán là: O(m) Ta thấy độ phức tạp thuật toán cải tiến giảm n lần (giảm vòng lặp) so với thuật toán gốc UMPMining 3.3 Cải tiến (Thuật toán Find_UMP_ Reduce_Transaction4): Thuật toán Find_UMP_ Reduce_Transaction giống thuật toán Find_UMP_ Reduce_Complexity, nhiên chúng khác hàm tìm support, cụ thể sau: Cho T FS(O, I, R, minsupp), T S S FS(O, I, R, minsupp) -Thuật toán 3.7 (Find_Lk()): Tạo Lk từ Lk-1 -Input: Lk-1, Minsupp, Mdd Output: Lk Lk = For each (X Lk-1) For each (Y Lk-1 and X Y) S=X Y // Tự kết S = {s1,s2,…,sk-1,sk} //sk: cell liên thông sk-1 G SP(Sk) ← Find_Supp(Sk) //Thuật toán 3.12 If (|Sk| = k and SP(Sk) ≥ minsupp) then Lk = Lk {Sk} Endif 10 Endfor 11 Endfor 12 Return Lk Thuật tốn Find_Supp(Sk): Tìm support Sk Input: Ma trận đường (Mdd) Sk, minsupp Output: SP(Sk) Dem_dong = If Sk = then For (i=1;i ≤ O ; i++) //qt tồn dòng Mdd (on Mdd) If (Sk O thành phần Sk có thứ tự O) then dong = {i | i on } sodong = Dem_dong //Đếm số dòng thỏa Dem_dong = Dem_dong + Endif Thuật toán đặt tên Find_UMP_2 cơng trình [2] [3] Endfor 10 Else // Sk > 11 Sk-1 ← Sk // Lọc trái lấy k-1 phần tử 12 STT ← Lay_stt(Sk-1) // Lấy số thứ tự Sk-1 Mang_luu 13 |OR| ← mang_luu(STT).sodong //|OR|: Số dòng có chứa Sk-1 14 For (i=1; i ≤|OR| ; i++) //|OR| < O : Giảm số vòng lặp 15 If (Sk OR thành phần Sk có thứ tự OR) then 16 dong = {i | i oRn } // oRn OR 17 sodong = Dem_dong //Đếm số dòng thỏa 18 Dem_dong = Dem_dong + 19 Endif 20 Endfor 21 Endif 22 SP(Sk) ← Tinh_totDist 23 If SP(Sk) > minsupp then 24 Mang_luu ← dong, Dem_dong // Lưu dòng số dòng thỏa ĐK 25 Endif 26 Return SP(Sk) -Thuật toán UMPMining Cn Thuật toán cải tiến Thuật toán cải tiến Thuật toán cải tiến số lượng Cn Th.gian chạy(s) số lượng Cn Th.gian chạy(s) số lượng Cn Th.gian chạy(s) số lượng Cn Th.gian chạy(s) C1 351 33 351 32 351 351 C2 1492 176 1488 167 1488 129 1488 129 C3 5191 511 3340 341 3340 274 3340 C4 651 63 79 79 79 Tổng 7685 783 5258 548 5258 410 5258 136 Bảng 3.12: So sánh thời gian chạy thuật toán Thời gian thực (giâ Thời gian900 chạy (UMPMining) Thời gian chạy (cải tiến 1) Thời gian chạy (cải tiến 2) Thời gian800 chạy (cải tiến 3) 700 600 500 400 300 200 100 0 Cn Hình 3.11: Biểu đồ so sánh thời gian chạy thuật toán Nhận xét:  Tổng số lượng Cn chạy thuật toán cải tiến so với cải tiến cải tiến nhau, lý do: thuật tốn tìm Ck+1 từ Lk  Tổng thời gian chạy thuật toán cải tiến giảm so với thuật toán là: 410 giây – 136 giây = 274 giây (tỷ lệ giảm: 66,82%) Và giảm thời gian so với thuật toán cải tiến là: 548 giây – 136 giây = 412 giây (tỷ lệ giảm: 75,18%) Và giảm thời gian so với thuật toán gốc là: 783 giây – 136 giây = 647 giây (tỷ lệ giảm: 82,63%) 3.4 Cải tiến (Thuật toán UMP_Online) Sau thuật toán cải tiến (Thuật toán UMP_Online), áp dụng cho ma trân đường Mdd thuê bao di động Thuật toán 3.9: Thuật toán UMP_Online Input: Các tập ứng viên có chiều dài i: Cinew Các tập ứng viên có chiều dài i: Ci Các tập phổ biến có chiều dài i: Li; minsupp Output: Tập phổ biến mới: L For each (c Cinew) if c Ci then supptotal = s.supp + c.supp // s Ci s = c s.supp=supptotal If supptotal >= minsupp then If c Li then l.supp = supptotal // l Li l = c = s Else // c Li Li = Li c 10 endif 11 endif 12 Else // c Ci 13 Ci = Ci c 14 If (c.supp >= minsupp) then 15 Li = Li c 16 Endif 17 Endif 18 Endfor 19 Return L -Bảng kết cũ tập ứng viên Cn mẫu phổ biến Ln tìm thuật toán cải tiến Trong Thuật toán tận dụng kết chạy thuật tốn để tìm mẫu phổ biến CSDL mới, sau “insert” vào kết có để kết chung Đó tư tưởng thuật tốn nhằm giảm thời gian tìm luật di chuyển thuê bao di động Để so sánh kết phương pháp trên, chúng tơi có kết chạy thực tế sau: - CSDL (cũ): số record 56198 - CSDL (mới): số record 68787 - CSDL (tổng): số record 56198 + 68787 = 124985 - Thời gian chạy 214 giây Khi chạy thuật toán UMP_Online, thời gian chạy là: 90 giây (giảm 57,94%) Thời gian chạy (giây) 300 Find_UMP_Reduce_Transaction UMP_Online 250 200 150 100 50 CSDL1+CSDL2 CSDL1+CSDL2+CSDL3 Hình 3.13: Biểu đồ so sánh thời gian chạy thuật tốn 3.5 Độ xác việc dự báo So sánh độ xác thuật tốn Độ xác thuật tốn UMPMining, Find_UMP_Reduce_Complexity Find_UMP_Reduce_Transaction Ta có: UAPs => UMPs (Ln) => Mobility Rules Độ xác thuật toán cho kết tập Ln Kết thực nghiệm sau: UMPMining Cn Find_UMP_ Reduce_Complexity Find_UMP_ Reduce_Transaction Ln Số lượng Cn Th.gian chạy(s) Số lượng Cn Th.gian chạy(s) Số lượng Cn Th.gian chạy(s) C1 351 32 351 351 348 L1 C2 1488 167 1488 129 1488 129 1033 L2 C3 3340 341 3340 274 3340 124 L3 C4 79 79 79 L4 Tổng 5258 548 5258 410 5258 136 Bảng 3.15: So sánh kết tìm Ln thuật tốn Theo kết trên, ta thấy: L1 = 348, L2 = 1033, L3 = 124, L4 = (cho tất thuật toán: UMPMining, Find_UMP_ Reduce_Complexity Find_UMP_ Reduce_Transaction) CHƯƠNG ĐỘ CHÍNH XÁC DỰ BÁO Chúng tơi sử dụng tập liệu huấn luyện (Training Data Sets) có số đường thực tế 56198 records, tập thứ có 68787 records, tập thứ có 34895 records Tập liệu thử (Testing Data Sets) có số đơờng thực tế 7207 records, dùng để đánh giá xác (precision) việc dự báo trước vị trí 4.1 Độ xác thuật tốn Định nghĩa:  Recall: số “cell” dự báo / tổng yêu cầu  Precision: số “cell” dự báo / tổng dự báo thực Sự thay đổi hệ số Recall thay đổi giá trị min_supp: Tập huấn luyện thứ có 56198 records Tập huấn luyện thứ hai có 56198 + 68787 = 124985 records Tập huấn luyện thứ ba có 56198 + 68787 + 34895 = 159880 records Tập liệu thử có 7207 records Hình 4.4: so sánh “recall” luật dự báo theo ba tập liệu huấn luyện khác tăng minsupp “recall” giảm theo Lý tăng minsupp kéo theo số luật dự báo khai phá giảm đi, Do đó, số dự báo giảm theo Khi kích thước tập huấn luyện tăng lên “recall” luật dự báo tăng theo Recall 0.5 0.4 0.3 0.2 0.1 Data set (1) Data set (1+2) Data set (1+2+3) 0.5 1.522.5 3.5 minsupp Hình 4.4: So sánh thay đổi recall theo minsupp tập liệu Độ xác (precision) việc dự báo thay đổi giá trị min_conf Hình 4.8: so sánh độ xác luật dự báo theo ba tập liệu huấn luyện khác Chúng ta thấy tằng số record tập liệu huấn luyện (56198 + precision 68787 + 34895 records) precision chúng thay đổi không đáng kể 0.8 0.6 0.4 0.2 data set data set (1+2) data set (1+2+3) minconf 10 Hình 4.8: So sánh độ xác dự báo tập liệu thay đổi minconf 3.6 Nâng cao độ xác dự báo Để nâng cao độ xác dự báo, thực phân lớp theo thời gian ngày tập liệu đầu vào Việc phân lớp xác tùy thuộc vào vùng, miền, quốc gia theo văn hóa xã hội công việc họ Dữ liệu từ ghi HLR đưa vào phân lớp theo thời gian Dữ liệu chia làm ba lớp sau: - Lớp sáng: từ 0:00 - Lớp chiều: từ 12:00 - Lớp tối: từ 18:00 12:00 18:00 24:00 Dữ liệu không phân Dữ liệu phân lớp Dữ liệu phân lớp lớp sáng chiều Dữ liệu phân lớp tối Training Testing Training Testing Training Testing Training Testing Data Set Data Data Set Data Data Set Data Data Set Data Set Set Set Set 18662 237 18662 237 - - - - 14347 1846 - - 14347 1846 - - 5581 2024 - - - - 5581 2024 Bảng 4.1: Tập liệu phân lớp theo thời gian 4.2.1 Sự thay đổi recall theo minsupp Khi thay đổi giá trị min_supp giá trị “recall” thay đổi sau: Đối với tập liệu phận lớp sáng: Recall - 0.25 0.2 0.15 0.1 Không phân lớp phân lớp sáng 0.05 0.5 1.5 Min_supp 2.5 3.5 Hình 4.10: So sánh hệ số recall sau phân lớp sáng Đối với phân lớp sáng, hệ số recall có cải thiện giá trị đầu min_supp từ khoảng 0,5 1,3 Tỷ lệ nâng cao hệ số recall từ 5% 6% Tương tự, phân lớp chiều tối cải thiện 4.2.2 Sự thay đổi precision theo min_conf - Đối với liệu phân lớp sáng: Khi thay đổi giá trị hệ số min_conf giá trị hệ số precision thay đổi sau: precision 0.8 0.6 0.4 không phân lớp phân lớp sáng 0.2 minconf Hình 4.13: So sánh hệ số precision sau phân lớp sáng Đối với phân lớp sáng, hệ số precision cải thiện Tỷ lệ tăng hệ số precision từ 0,1% 13% Tương tự, phân lớp chiều, tỷ lệ tăng hệ số precision từ 0,15% 17% phân lớp tối, tỷ lệ tăng hệ số precision từ 0,6% 4,9% KẾT LUẬN Trong luận án này, từ chương đến chương 4, đưa phân tích lý thuyết thực nghiệm phương pháp thực dự báo trước đường thuê bao di động Các nghiên cứu ứng dụng kỹ thuật “data mining” (thuật toán UMPMining truyền thống) phương pháp khác có mục tiêu giải vấn đề mạng truyền thơng tế bào như: tính di chuyển, việc ngắt kết nối, thời gian trì hỗn dài, chuyển giao tế bào (handover), thay đổi băng thông liên tục, … Tuy nhiên, phương pháp có thời gian thực dài, xử lý “offline” Do đó, để nâng cao chất lượng dịch vụ mạng di động, Luận văn đưa số đóng góp đạt kết sau: Đóng góp thứ nhất: Chúng tơi tiến hành giảm thời gian chạy thuật tốn UMPMining cách thực tự kết thuật toán tạo ứng viên (cải tiến 1) Kết thực nghiệm cho thấy thời gian chạy cải tiến giảm so với thuật toán UMPMining 235 giây (tỷ lệ giảm 30%) Tiếp tục giảm thời gian thực thuật toán cách giảm độ phức tạp thuật toán Độ phức tạp thuật toán cải tiến (Thuật toán Find_UMP_Reduce_Complexity) giảm n lần (giảm vòng lặp) so với thuật tốn gốc UMPMining Kết thực nghiệm cho thấy rằng, thời gian chạy thuật toán Find_UMP_Reduce_Complexity với liệu thực tế 410 giây (Thuật toán UMPMining 783 giây), giảm 47,63% Nội dung đóng góp cơng bố Cơng trình [2],[3], [4].[5] [6] Đóng góp thứ hai: Ở đóng góp thứ hai này, chúng tơi thực thu nhỏ giao tác thuật toán tạo mẫu ứng viên Bằng cách áp dụng lý thuyết tập hợp, rút ngắn số giao tác lần lặp thứ hai trở Kết thực nghiệm cho thấy thời gian thực thuật toán cải tiến (Thuật toán Find_UMP_Reduce_Transaction) 136 giây Giảm so với Thuật toán UMPMining là: 783 giây – 136 giây = 647 giây (tỷ lệ giảm: 82,63%) Nội dung đóng góp cơng bố Cơng trình [2] [3] Đóng góp thứ ba: Đối với đóng góp thứ ba này, chúng tơi đưa thuật toán UMP_Online (cải tiến 4) nhằm tăng tốc độ chạy thuật tốn có thêm liệu cập nhật Thuật toán UMP_Online thực khai thác giao tác thuê bao di động, sau “insert” Cn, Ln vào Cn, Ln cũ khai phá từ sở liệu trước nhằm tránh qt lại tồn CSDL Thời gian chạy Thuật toán UMP_Online 90 giây (Thuật toán Find_UMP_Reduce_Transaction 214 giây) (giảm 57,94%) Nội dung liên quan đến đóng góp cơng bố Cơng trình [1],[2] Đóng góp thứ tư: Để nâng cao độ xác dự báo, đóng góp thứ tư này, đưa phương pháp phân lớp theo thời gian ngày tập liệu đầu vào (phân lớp) Kết thực nghiệm cho thấy phân lớp liệu theo thời gian độ xác dự báo tăng lên đáng kể Cụ thể theo kết thực nghiệm, tỷ lệ tăng giá trị hệ số “recall” theo giá trị “min_supp” (so với chưa phân lớp) từ 0,1 37% tỷ lệ tăng giá trị hệ số “precision” theo giá trị “min_coff” (so với chưa phân lớp) từ 0,1 17% Nội dung liên quan đến đóng góp cơng bố Cơng trình [1] Những vấn đề cần tiếp tục nghiên cứu hướng phát triển tương lai - minsupp m luật theo hai hệ số kết hợp với lưu lượng mạng di động - Vấn đề ứng dụng kết dự báo để nâng cao chất lượng dịch vụ: tương lai đề xuất Đơn vị cung cấp dịch vụ cho thử nghiệm thực tế, có đánh giá kết để ứng dụng vào thực tế - Vấn đề phân lớp liệu theo thới gian: thời gian tới thực phân lớp theo nhiều thời gian khác so sánh độ xác việc dự báo, từ chọn cách phân lớp tối ưu cho mạng - Trong tương lai, nghiên cứu để phát triển công nghệ di động dựa tảng điện toán đám mây Đây xu hướng công nghệ di động tương lai kết hợp lợi tính tốn di động điện tốn đám mây, cung cấp dịch vụ tối ưu cho thuê bao di động ... TRÍ CỦA THUÊ BAO DI ĐỘNG THEO TIẾP CẬN KHAI PHÁ DỮ LIỆU Trong chương đưa mơ hình dự báo trước vị trí th bao di động theo tiếp cận khai phá liệu Mô hình bao gồm giai đoạn: giai đoạn đầu lấy liệu. .. đoạn dự báo trước đường thuê bao di động Khai thác UAPs để UMPs UMPs Mobility Rules Hình 2.1: Lưu đồ phương pháp dự báo trước đường thuê bao di động 2.1 Giai đoạn 1: Lấy liệu từ file log HLR Dữ liệu. .. đoạn 5: Dự báo trước đường thuê bao di động Đây giai đoạn dự báo trước thuê bao di động di chuyển đến “cell” vùng phủ sóng Thuật toán 2.8: Dự báo

Định dạng
Số trang	29
Dung lượng	219,55 KB