Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)Dự Đoán Tính Di Động Sử Dụng Dữ Liệu Gps (LV thạc sĩ)
HỌC VIỆN CƠNG NGHỆ BƢU CHÍNH VIỄN THƠNG TRẦN HỒNG NAM DỰ ĐỐN TÍNH DI ĐỘNG SỬ DỤNG DỮ LIỆU GPS LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) TP HỒ CHÍ MINH – 2017 HỌC VIỆN CƠNG NGHỆ BƢU CHÍNH VIỄN THƠNG TRẦN HOÀNG NAM DỰ ĐỐN TÍNH DI ĐỘNG SỬ DỤNG DỮ LIỆU GPS Chuyên ngành: HỆ THỐNG THÔNG TIN Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƢỜI HƢỚNG DẪN KHOA HỌC: T.S BÙI XUÂN LỘC TP HỒ CHÍ MINH – 2017 i LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu riêng Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố cơng trình khác Tp Hồ Chí Minh, ngày 13 tháng 08 năm 2017 Học viên thực luận văn Trần Hoàng Nam ii LỜI CẢM ƠN Tơi xin bày tỏ lòng biết ơn sâu sắc đến T.S Bùi Xuân Lộc hướng dẫn nhiệt tình, tận tâm suốt q trình giúp tơi thực luận văn Thầy giúp cho định hướng mục tiêu, phương pháp nghiên cứu tiếp cận, tài liệu bổ ích đặt biệt kinh nghiệm quý giá Tôi xin chân thành cảm ơn Học Viện Công Nghệ Bưu Chính Viễn Thơng tạo điều kiện đặc biệt gửi lời cám ơn sâu sắc tới Thầy, Cô tận tụy hướng dẫn, giúp đỡ truyền dạy kiến thức quý báu, bổ ích cho suốt khóa học, để tơi áp dụng vào công việc lĩnh vực công nghệ thông tin, hoàn thành luận văn Cảm ơn bạn học viên lớp Cao học “Hệ Thống Thông Tin 2014-2” gắn bó, đồn kết chia sẻ kinh nghiệm, giúp đỡ tơi q trình học tập suốt trình thực luận văn Tp Hồ Chí Minh, ngày 20 tháng 05 năm 2017 Học viên thực luận văn Trần Hoàng Nam iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT iv DANH MỤC CÁC BẢNG v DANH SÁCH HÌNH VẼ vi MỞ ĐẦU Chƣơng 1- TỔNG QUAN 1.1 Giới thiệu công nghệ GPS 1.1.1 Lịch sử phát triển 1.1.2 Phần không gian (space segment) 1.1.3 Phần điều khiển (control segment) 1.1.4 Phần ngƣời sử dụng (user segment) 1.1.5 Mạng lƣới vệ tinh GPS 1.1.6 Cấu trúc tín hiệu GPS 1.2 Giới thiệu số phƣơng pháp dự đoán 10 1.2.1 Phƣơng pháp Bayesian 10 1.2.2 Thuật toán phân cụm K-Means 11 1.2.3 Khai phá liệu GPS 12 Chƣơng - CÁC THUẬT TOÁN DỰ ĐOÁN TÍNH DI ĐỘNG 14 2.1 Thuật toán TBHG (Tree Based Hierachical Graph) 14 2.2 Thuật toán CAMP (Cluster-Aided Mobility Predictions) 20 2.3 Thuật toán đề xuất: K-Means Based Cluster Aided Mobility Prediction (KM-CAMP) 23 2.3.1 Chuyển đổi liệu ngƣời dùng dạng phù hợp để áp dụng thuật toán K-means 25 2.3.2 Dự đốn vị trí di chuyển ngƣời dùng dựa kết gom nhóm thuật toán K-means 28 Chƣơng - KẾT QUẢ THỰC NGHIỆM 31 3.1 Giới thiệu ngôn ngữ Julia - ngôn ngữ dùng để thể thuật toán 31 3.2 Giới thiệu liệu GPS sử dụng thuật toán 35 3.3 Các kịch thử nghiệm 36 3.4 Một số kết thử nghiệm 38 Chƣơng - KẾT LUẬN 41 DANH MỤC TÀI LIỆU THAM KHẢO 42 iv DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT Viết tắt Tiếng Anh GPS Global Positioning System TBHG Tree-Based Hierarchical Graph DPMM Dirichlet Process (DP) mixture model HITS Hypertext Induced Topic Search CAMP Cluster-Aided Mobility Predictor KM-CAMP K-mean Cluster-Aided Mobility Predictors v DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 1.1 Các thành phần tín hiệu tần số tƣơng ứng 10 3.1 Dữ liệu thống kê sau chạy thử nghiệm 38 thuật tốn dự đốn vi DANH SÁCH HÌNH VẼ Số hiệu Tên hình vẽ Trang hình vẽ 1.1 Sơ đồ liên quan ba phần GNSS (GPS) 1.2 Chuyển động vệ tinh nhân tạo xung quanh trái đất 1.3 Vị trí trạm điều khiển giám sát hệ thống GPS 2.1 Xây dựng biểu đồ phân cấp 15 2.2 Kiến trúc hệ thống 17 2.3 Ý tƣởng mơ hình HITS 18 2.4 Mơ hình suy luận dựa HITS 19 2.5 Một số trƣờng hợp minh họa cho chiến lƣợc chọn liệu 20 2.6 Hệ tọa độ GPS đƣợc chia theo cách 25 2.7 Minh họa cách tạo quỹ đạo di chuyển theo hệ tọa độ 26 2.8 Cách chuyển liệu di chuyển sang hệ tọa độ thói quen di chuyển 27 3.1 Màn hình làm việc ngôn ngữ Julia 31 3.2 Một đoạn code đƣợc viết Julia Language 33 3.3 Một số mẫu ví dụ Gadfly kết hợp với Julia 35 3.4 Phƣơng pháp Random Walk, khả di chuyển ngƣời dung 36 từ vị trí A đến vị trí 3.5 Biểu đồ thể tỷ lệ dự đoán thuật toán 40 MỞ ĐẦU Trong thời gian gần đây, ý tƣởng dự đoán di động ngƣời dùng nhận đƣợc nhiều quan tâm ý, điều có tác dụng thúc đẩy mạnh mẽ phát triển ứng dụng liên quan phạm vi rộng Đơn cử vài ứng dụng nhƣ: cung cấp dịch vụ dựa vị trí đến ngƣời dùng cách dự đốn xu hƣớng chuyển động họ (ví dụ: hệ thống quảng cáo di động, dịch vụ đề nghị, hệ thống cảnh báo…), hệ thống dự báo giao thông đô thị, thiết kế hệ thống điều tiết lƣu lƣợng hiệu mạng không dây Tuy nhiên, việc cải thiện ứng dụng cách dự đốn phụ thuộc nhiều vào độ xác dự đoán đƣa Giả sử, ngƣời đứng vị trí A, dự đốn vị trí mà ngƣời có khả di chuyển đến Nếu có liệu di chuyển khứ A, tìm xem q khứ ngƣời vị trí A chƣa, vị trí A rồi, vị trí ngƣời di chuyển đến vị trí Các phán đốn dựa vào hƣớng di chuyển q khứ đƣa dự đốn ngƣời có khả lặp lại hƣớng di chuyển khứ thời điểm xét Tuy nhiên, khó để đƣa phán đốn hƣớng di chuyển lần ngƣời đến vị trí A, liệu có khơng tồn vị trí A lịch sử di chuyển (có thể liệu thu thập khơng đầy đủ) Mục đích toán đƣa dự đoán điểm đến ngƣời kể trƣờng hợp không đủ liệu di chuyển khứ lần ngƣời đến điểm A Các quỹ đạo ngƣời dùng mạng có số mẫu điển hình lặp lặp lại, mẫu đƣợc khai thác để dự đốn di động tƣơng lai Những mẫu liệu di động tƣơng ứng với hành vi thơng thƣờng ngƣời sử dụng, ví dụ nhƣ từ nhà đến quan để làm việc hàng ngày di động đến quán café yêu thích dịp cuối tuần Xác định đƣợc mẫu di động lịch sử di động ngƣời dùng chìa khóa để đƣa dự đốn xác di động họ tƣơng lai Tuy nhiên, có nhiều thách thức liên quan đến việc thu nhập liệu GPS ngƣời dùng Ví dụ, ngƣời dùng cảm thấy lo ngại tiết lộ thói quen di động ảnh hƣởng đến số vấn đề riêng tƣ họ, trình thu thập GPS bị gián đoạn số nguyên nhân nhƣ máy hỏng, ngƣời dùng đổi máy khác… Những cố vừa nêu làm nhiễu liệu dẫn đến ảnh hƣởng đến trình lấy mẫu, làm giảm xác việc đƣa dự đốn Do vậy, trƣờng hợp khơng đủ sở để đƣa dự đoán hƣớng di chuyển ngƣời thiếu liệu, liệu khơng có, dựa vào di chuyển ngƣời khác có thói quen di chuyển giống gần giống với đối tƣợng xét Những ngƣời có thói quen di chuyển giống nhau, gom lại thành nhóm để tạo thành sở đƣa kết phán đoán Hiện nay, vấn đề dự đoán khả di động ngƣời dùng vấn đề mẻ Việt Nam Có lẽ vậy, sau thời gian tìm hiểu thơng tin đề tài có liên quan đến dự đoán khả di động ngƣời dùng, luận văn chƣa tìm thấy thơng tin có liên quan đến vấn đề này, dự án trình nghiên cứu phát triển nên chƣa đƣợc công bố tiết lộ thông tin đến ngƣời Các nguồn thông tin nƣớc đƣợc sử dụng để tìm hiểu thơng tin có liên quan đến đề tài bao gồm: Tìm hiểu internet, cách tìm kiếm cơng cụ tìm kiếm nhƣ Google, Bing với từ khóa nhƣ “Dự đốn tính di động ngƣời dùng dựa GPS”, “Dự đoán khả di động ngƣời dùng”, ”Ứng dụng liệu GPS”… Tìm hiểu thơng qua sách báo tạp chí khoa học nhƣ: tạp chí Khoa Học Cơng Nghệ Việt Nam, Tạp chí khoa học, Echip… 29 liệu lại thành data, từ data áp dụng thuật toán K-means để phân nhóm ngƣời dùng Nhƣ vậy, muốn dự đốn di chuyển user đó, sử dụng kết K-means mà chạy sẵn Giả sử, ngƣời dùng A, vị trí x, muốn dự đốn vị trí di chuyển A, ta xét thói quen di chuyển tất ngƣời dùng nhóm với A đồng thời kết hợp với liệu di chuyển khứ A Chúng ta có đƣợc danh sách tất điểm mà A ngƣời dùng nhóm với A có khả di chuyển đến Thuật toán dự đoán quy định lần di chuyển từ x đến điểm ngƣời dùng chung nhóm với A điểm, lần di chuyển từ điểm x đến điểm A 1+ n điểm Nhƣ vậy, quỹ đạo khứ A, di chuyển từ điểm x đến điểm x1, khả A lặp lại di chuyển khứ cao di chuyển theo ngƣời khác Cuối cùng, có danh sách điểm x1 mà A ngƣời dùng chung nhóm với A di chuyển tới Kèm theo điểm đƣợc dự đốn trọng số Xét khả di chuyển từ điểm x đến điểm x1 có trọng số cao xuất kết dự đốn điểm Ví dụ, từ điểm x, sau xét thói quen di chuyển ngƣời nhóm với A (nhóm có 100 ngƣời), ta có tập điểm j có khả A di chuyển đến {j1, j2, j3, j4} với trọng số đến j1 = 20, j2 = 15,j3 = 40, j4 =25 Ta đƣa kết dự đoán điểm A có khả di chuyển đến j3 với số điểm cao 40 30 Mã giả thể ý tƣởng thuật toán dự đoán: Algorithm 2: Dự đoán điểm di chuyển Input: listUserSameGroup, currentUser; currentIndex; Haskey ; for i=0; i< listUserSameGroup.length; i++ trajectory = QuyDaoCuaUser(listUserSameGroup[i]); flag = 0; foreach index in trajectory if index == currentIndex flag = 1; else if flag == flag = 0; Haskey(index,Haskey[index]+1); end end trajectory = QuyDaoCuaUser(currentUser); foreach index in trajectory if index == currentIndex flag = 1; else if flag == flag = 0; Haskey(index,Haskey[index]+2); end end end Output: index có giá trị cao Haskey 31 Chƣơng - KẾT QUẢ THỰC NGHIỆM 3.1 Giới thiệu ngôn ngữ Julia - ngôn ngữ dùng để thể thuật tốn Trong q trình thực đề tài, ngơn ngữ lập trình Julia Language đƣợc đề xuất để thể thuật toán luận văn, ngơn ngữ lập trình cấp cao, động với hiệu suất cao cho máy tính kỹ thuật, với cú pháp quen thuộc cho ngƣời sử dụng môi trƣờng điện tốn kỹ thuật Nó cung cấp trình biên dịch phức tạp, phân phối thực song song, thƣ viện tính tốn học rộng lớn Thƣ viện phần lớn đƣợc viết Julia, số đƣợc lấy bên C Fortran nhƣ thƣ viện đại số tuyến tính, hệ số ngẫu nhiên, xử lý tín hiệu xử lý chuỗi Ngoài ra, cộng đồng phát triển Julia đóng góp số gói bên ngồi thơng qua trình quản lý gói đƣợc tích hợp sẵn Julia, với tốc độ nhanh chóng IJulia, hợp tác cộng đồng IPython Julia, cung cấp giao diện đồ họa dựa trình duyệt mạnh mẽ cho Julia Hình 3.1 dƣới minh họa hình làm việc ngơn ngữ Julia Hình 3.1: Màn hình làm việc ngơn ngữ Julia 32 Tóm tắt tính Julia Language Nhiều dispatch: cung cấp khả định nghĩa hành vi chức thông qua kết hợp nhiều loại đối số Hệ thống soạn thảo động: tạo tài liệu, tối ƣu hóa dispatch Trình biên dịch có hiệu cách tiếp cận tốt giống nhƣ ngôn ngữ lập trình C Tích hợp quản lý gói Các hàm giống nhƣ Lisp ngôn ngữ khác Gọi chức Python: sử dụng gói PyCall Gọi chức C trực tiếp mà không cần wrapper hay API đặc biệt Đƣợc thiết kế cho xử lý song song (parallelism) điện toán đám mây Các hàm ngƣời dùng định nghĩa nhanh nhƣ hàm đƣợc tích hợp sẵn Hỗ trợ hiệu cho Unicode, bao gồm UTF-8 Đƣợc cấp phép MIT, hoàn toàn miễn phí ngơn ngữ lập trình mã nguồn mở Ứng dụng có trình biên dịch đáng tin cậy, phân phối thực song song, độ xác cao thƣ viện hàm toán học lớn Nó hỗ trợ định cho thƣ viện C Fortran Trong chạy dòng lệnh, Julia Language cung cấp cho ngƣời dùng không gian làm việc tồn diện để tạo biên dịch script Julia Cú pháp tƣơng tự nhƣ ngơn ngữ lập trình khác, nhƣng dễ sử dụng cho nhà phát triển ngƣời sử dụng Julia 33 Hình 3.2: Một đoạn code đƣợc viết Julia Language Julia Language bao gồm số thƣ viện chức năng, với độ xác cao hiệu hơn, đƣợc viết Julia, C Fortran Đại số tuyến tính, hệ số, xử lý tín hiệu xử lý chuỗi đƣợc cải thiện cách sử dụng thƣ viện Julia Language hỗ trợ nhiều dispatch, cho phép xác định hành vi chức số kết hợp loại đối số Hơn nữa, có hệ thống tính năng động giúp cho việc tạo tài liệu, cơng cụ tối ƣu hóa gửi dễ dàng Trình biên dịch ngơn ngữ lập trình nhanh chóng, thuận tiện đƣợc trang bị tính thời gian điểm chuẩn gần với trình biên dịch C Trình biên dịch đƣợc tích hợp gói quản lý cho phép xử lý phần mở rộng plugin, đó, hỗ trợ Python, C chức Lisp Hơn nữa, nhà phát triển dễ dàng kết hợp cú pháp Julia với yếu tố từ thƣ viện C Fortran, nhƣ chức gọi hàm từ bên ngồi Ngƣời dùng dễ dàng định nghĩa hàm C, Python, Fortran mà không cần viết mã wrapper biên dịch lại dòng có 34 LLVM Julia Language dựa trình biên dịch just-in-time (JIT) đƣợc thiết kế để xử lý song song tính tốn phân tán, với hệ số tự động cấu hình tốt Nó cung cấp loạt khối xây dựng quan trọng việc tính tốn phân tán, cho phép giữ lại số style chủ đề song song Nó xử lý số loại đối số cho phép xác định yếu tố phù hợp với nhiều đối số Julia khơng áp đặt phong cách đặc biệt parallelism cho ngƣời sử dụng Thay vào đó, cung cấp số lƣợng khối xây dựng việc tính tốn phân tán, làm cho trở nên linh hoạt để hỗ trợ số phong cách parallelism, cho phép ngƣời dùng thêm phong cách khác vào Ví dụ đơn giản sau chứng minh làm để đếm số lƣợng đầu ngƣời mặt đồng xu, tung số lƣợng lớn đồng xu song song Tính tốn đƣợc tự động phân phối tất nút tính tốn có sẵn, kết quả, làm giảm tổng (+), đƣợc trả lại vào nút gọi Điều mở đƣờng cho hoạt động dựa hoàn toàn đám mây, bao gồm quản lý liệu, chỉnh sửa code, chia sẻ, thực hiện, gỡ lỗi (debug), phối hợp, phân tích khai thác liệu Mục tiêu cuối ngƣời ngừng lo lắng điều hành máy tính, quản lý liệu tập trung vào vấn đề thực Gadfly Julia Language sản xuất lơ khác với phần phụ trợ trình duyệt (SVG, PDF, PNG phần phụ trợ khác đƣợc hỗ trợ) Tính tƣơng tác thêm đồ thị lơ với gói Interact.jl Một mẫu nhỏ khả Gadfly đƣợc trình bày hình 3.3 dƣới đây: 35 Hình 3.3: Một số mẫu ví dụ Gadfly kết hợp với Julia Ngồi ra, có tính hỗ trợ Unicode, tùy chọn mặc định phƣơng pháp mã hóa UTF-8 Ngơn ngữ lập trình Julia Language đƣợc thiết kế cho trình độ cao, hiệu suất cao tính động, tính dễ dàng sử dụng với cú pháp linh hoạt Vì khả tùy biến việc sử dụng thƣ viện Julia tốt nên ngƣời lập trình dễ dàng chuyển đổi từ ngơn ngữ lập trình Python sang Julia 3.2 Giới thiệu liệu GPS sử dụng thuật toán Dữ liệu đƣợc sử dụng thuật toán [13] đề xuất liệu quỹ đạo GPS đƣợc thu thập dự án Geolife trung tâm nghiên cứu Microsoft Châu Á tiến hành Dữ liệu đƣợc thu thập 182 ngƣời tham gia nghiên cứu khoảng thời gian năm (từ tháng 4/2007 đến tháng 8/2012) Quỹ đạo GPS liệu thể biện vị trí đƣợc đánh dấu theo thời gian, thông tin vị trí bao gồm vĩ độ, kinh độ độ cao Bộ liệu chứa 17,621 quỹ đạo với tổng khoảng cách khoảng 1,2 triệu km tổng thời gian 48,000 Các quỹ đạo đƣợc ghi thiết bị GPS khác điện thoại smartphone, có loạt tỷ lệ lấy mẫu 91% quỹ đạo đƣợc ghi lại liên tục, ví dụ 1~5 giây 5~10 mét điểm Bộ liệu mã hóa 36 phạm vi rộng di chuyển trời ngƣời dùng bao gồm thói quen di chuyển hàng ngày nhƣ nhà, làm, vui chơi, giải trí, hoạt động thể thao, mua sắm, tham quan, ăn uống, đƣờng dài xe đạp Bộ liệu quỹ đạo đƣợc sử dụng nhiều lĩnh vực nghiên cứu chẳng hạn nhƣ khai thác mơ hình di động, sử dụng nhận dạng hoạt động ngƣời dùng, mạng xã hội dựa địa điểm, vị trí riêng tƣ giới thiệu địa điểm 3.3 Các kịch thử nghiệm Vì vấn đề thời gian hạn chế kinh nghiệm, luận văn khơng thể tái lại thuật tốn Khai phá liệu Bayesian phi tham số kết hợp với DPMM để so sánh với ý tƣởng đề xuất Do vậy, phƣơng pháp dự đoán khác đƣợc đề xuất thể ngơn ngữ Julia đƣợc trình bày nhƣ sau: - Phƣơng pháp Random Walk: Phƣơng pháp dựa theo cách chọn ngẫu nhiên vị trí số vị trí mà ngƣời dùng có khả di chuyển đến Cụ thể từ điểm xét A hệ toạ độ di chuyển, ngƣời dùng có khả di chuyển đến điểm xung quanh điểm A (hình 3.4) Xác xuất dự đoán 1/8 = 12.5% Hình 3.4: Phƣơng pháp Random Walk, khả di chuyển ngƣời dùng từ vị trí A đến vị trí 37 # Hàm dự đốn vị trí di chuyển người dùng dựa ý tưởng Random Walk function RandomWalkPredict(current_index) random_index = rand([1,2,3,4,5,6,7,8]); return GetIndexOfPredictPosition(current_index,random_index); end # Hàm GetIndexOfPredictPosition dựa vào giá trị random_index để trả vị trí điểm dự đốn Đoạn mã giả sau mơ tả cách chọn vị trí di chuyển ngƣời dùng dựa ý tƣởng Random Walk - Phƣơng pháp Follow The Ground (Phƣơng pháp dự đoán dựa số đông): điểm A quỹ đạo user, để dự đoán điểm đến tiếp theo, xem xét quỹ đạo tất user có sở liệu, thống kê tỷ lệ di chuyển từ điểm A đến điểm lân cận Điểm lân cận có tỷ lệ di chuyển cao từ điểm A đƣợc lựa chọn điểm đến # Hàm dự đốn vị trí di chuyển người dùng dựa theo thói quen di chuyển số đông người dùng function FollowTheGroundPredict(current_index) predictNextIndexList = Dict(); for u in userListAll var predict_index = GetNextPositionOfUser(u,current_index); if(haskey(predictNextIndexList,predict_index)) count = predictNextIndexList[predict_index]; predictNextIndexList[predict_index] = count + 1; else predictNextIndexList[predict_index] = 1; end end predict_index_result = GetMaximumIndex(predictNextIndexList); return predict_index_result; end # Hàm GetIndexOfPredictPosition dựa vào giá trị random_index để trả vị trí điểm dự đốn 38 Trong q trình chạy thử nghiệm, lý hạn chế nhớ xử lý, nên số ngƣời dùng có liệu di chuyển lớn, thuật toán feature hashing đƣợc áp dụng để giảm kích thƣớc vector thể thói quen di chuyển ngƣời dùng Việc sử dụng feature hashing giúp thể liệu ma trận lớn thành ma trận nhỏ nhƣng đảm bảo đƣợc tính chất thể đầy đủ mặt liệu ma trận sau chuyển đổi 3.4 Một số kết thử nghiệm Thực nghiệm so sánh kết phƣơng pháp dự đoán phƣơng pháp dự đoán mà luận văn đề xuất, với số lần dự đoán thuật toán 20 lần, kết thử nghiệm đƣợc thể bảng kết 3.1 biểu đồ hình 3.5 nhƣ sau 39 Bảng 3.1: Dữ liệu thống kê sau chạy thử nghiệm thuật toán dự đoán n Random Follow The Walking Ground KM-CAMP 12.85 32.96 68.68 10.61 34.63 64.28 9.49 35.75 61.54 10.61 36.87 66.48 17.31 36.87 68.13 10.05 28.49 68.68 11.73 39.1 63.18 15.08 37.98 61.53 19.55 36.21 59.34 10 10.61 34.07 59.89 11 8.93 32.96 62.08 12 14.52 33.79 60.43 13 11.79 32.83 60.43 14 10.73 35.34 58.24 15 14.68 35.16 65.38 16 8.52 35.64 61.53 17 9.65 35.26 64.83 18 10.79 25.26 58.24 19 11.36 34.5 57.14 20 10.79 34.12 60.99 40 80 70 60 50 Random Walking 40 Fllow The Ground 30 KM-CAMP 20 10 10 11 12 13 14 15 16 17 18 19 20 Hình 3.5: Biểu đồ thể tỷ lệ dự đốn thuật tốn Phân tích biểu đồ hình 3.5 ta thấy: so với thuật toán bản, phƣơng pháp mà luận văn đề xuất có tỷ lệ dự đốn trung bình tốt hẳn, nhờ vào việc dựa theo quỹ đạo ngƣời dùng nhóm để bổ sung thêm liệu hỗ trợ đƣa kết dự đoán 41 Chƣơng - KẾT LUẬN Dự đốn tính di động ngƣời dùng tƣơng lai đƣợc xem xu hƣớng nhận đƣợc nhiều quan tâm ủng hộ Việc tạo cơng cụ dự đốn tốt, có hiệu xuất cao góp phần thúc đẩy phát triển nhiều lĩnh vực khác sống Dựa ý tƣởng gom nhóm ngƣời dùng có quỹ đạo di chuyển giống nhau, dự đốn đƣợc vị trí di chuyển ngƣời dùng dựa suy đoán di chuyển ngƣời dùng khác nhóm Với kết hợp thuật toán K-means thuật toán Bayesian phi tham số, luận văn tạo công cụ dự đốn mạnh mẽ thích nghi tốt lƣợng liệu quỹ đạo di chuyển ngƣời dùng phát triển mạnh Tuy thuật toán đƣợc đề xuất luận văn có hiệu suất chƣa phải tối ƣu nhất, nhƣng cách thực việc dự đoán tiền đề để tiếp tục nghiên cứu tìm phƣơng pháp khác tốt dựa ý tƣởng đề xuất Trong thời gian tới, có thời gian điều kiện, luận văn mong muốn tìm đƣợc phƣơng pháp khác với khả phân tích liệu ngƣời dùng tốt hơn, với xác xuất gom nhóm liệu ngƣời dùng dựa giống quỹ đạo tốt hơn, từ nâng cao hiệu suất cơng cụ dự đốn tính di động mà luận văn đề xuất Ngồi ra, hệ thống dự đốn phát triển lên bƣớc mới, không dự đoán khả di chuyển ngƣời dùng, mà lúc dự đốn đƣợc khả di chuyển nhiều ngƣời dùng khu vực, với thời gian địa điểm xác định Từ đó, ứng dụng cho việc cảnh báo dòng di chuyển nhiều ngƣời dùng 42 DANH MỤC TÀI LIỆU THAM KHẢO [1] Yu Zheng, Quannan Li, Yukun Chen, Xing Xie, Wei-Ying Ma (2008), “Understanding Mobility Based on GPS Data”, in Proceeding of ACM UbiComp 2008, pages 312-321, New York, NY, USA [2] Jaeseong Jeong, Mathieu Leconte and Alexandre Proutiere (2016), “ClusterAided Mobility Predictions”,IEEE INFOCOM 2016 [3] Yu Zheng, Lizhu Zhang, Xing Xie, Wei-Ying Ma (2009), “Mining Interesting Locations and Travel Sequences from GPS Trajectories”, in Proceeding of WWW 2009, pages 791-800, New York, NY, USA [4] Jaeseong Jeong, Mathieu Leconte and Alexandre Proutiere (2016), “ClusterAided Mobility Predictions”, arXiv preprint, http://arxiv.org/abs/1507.03292 [6] P Jacquet, W Szpankowski, and I Apostol, “A universal predictor based on pattern matching,” Information Theory, IEEE Transactions on, vol 48, no 6, pp 1462–1472, 2002 [7] T S Ferguson, “A bayesian analysis of some nonparametric problems,” The annals of statistics, pp 209–230, 1973 [9] N Merhav, M Feder, and M Gutman (1993), “Some properties of sequential predictors sfor binary markov sources,” Information Theory, IEEE Transactions on, vol 39, no 3, pp 887–892 [10] P Smyth et al (1997), “Clustering sequences with hidden markov models,” Advances in neural information processing systems, pp 648–654 [11] T Jebara, Y Song, and K Thadani (2007), “Spectral clustering and embedding with hidden markov models,” in Machine Learning: ECML 2007 Springer, pp 164–175 [12] J McInerney, J Zheng, A Rogers, and N R Jennings (2013), “Modelling heterogeneous location hasbits in human populations for location prediction under data sparsity,” in Proceedings of the 2013 ACM international joint conference on Pervasive and ubiquitous computing ACM, 2013, pp 469–478 43 Các trang web: [13] http://research.microsoft.com/en-us/downloads/b16d359d-d164-469e-9fd4daa38f2b2e13/, truy cập ngày 10/06/2016 [14] https://www.kaggle.com/c/facebook-v-predicting-check-ins truy cập ngày 10/03/2017 ... TRẦN HOÀNG NAM DỰ ĐỐN TÍNH DI ĐỘNG SỬ DỤNG DỮ LIỆU GPS Chuyên ngành: HỆ THỐNG THÔNG TIN Mã số: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƢỜI HƢỚNG DẪN KHOA... mẫu đƣợc khai thác để dự đoán di động tƣơng lai Những mẫu liệu di động tƣơng ứng với hành vi thơng thƣờng ngƣời sử dụng, ví dụ nhƣ từ nhà đến quan để làm việc hàng ngày di động đến quán café yêu... [2], luận văn đƣa ý tƣởng tiến hành nghiên cứu dự đốn tính di động dựa vào liệu GPS, thay áp dụng liệu nhà mạng để tận dụng đƣợc đặc điểm liên tục di chuyển ngẫu nhiên ngƣời dùng Với mục tiêu cuối