Giá trị IFV của MIPFGWC trong các trƣờng hợp

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân cụm mờ trọng số địa lý (Trang 68 - 73)

1 2 3 4 5 6 7 2 11.7049486 20.0232695 10.154074 8.23072177 9.23821881 10.469763 11.08623174 3 17.952302 25.4080269 15.7233928 16.3287406 15.9462509 16.925419 17.21644388 4 35.0811333 39.7138951 30.3731482 29.1589639 30.7202974 31.094041 31.49313673 5 51.5420933 56.8320851 47.8757178 48.7488984 48.8075054 46.929211 48.83228616 6 50.4247525 59.0267489 47.9636901 46.4649544 47.6160686 46.198731 49.05443814 7 60.0568722 59.6234998 57.9032289 57.1424389 58.716324 56.465733 59.18063651

Bảng 3.4: Giá trị IFV trong KMIPFGWC bởi tham số  trong hàm Gaussian.

C  1.0 1.5 2.0 2.5 3.0 3.5 4.0 2 10.5376415 9.49204753 11.086232 11.6871611 13.7415223 14.4181472 14.1752734 3 15.6419977 15.3284579 17.216444 17.6213803 18.4386497 19.8629179 18.1979602 4 30.6946426 29.9651581 31.493137 32.9895376 33.1232309 33.8038296 35.4039242 5 45.5546969 48.0114717 48.832286 49.0008308 49.6652911 50.1130267 50.8740823 6 46.6748687 47.5883726 49.054438 50.8181554 51.3159319 50.0033107 52.6601364 7 56.5632083 58.2222294 59.180637 61.0639689 60.6795872 60.5061439 64.1375236

Bây giờ, chúng ta tiếp tục khảo sát sự thay đổi các giá trị IFV trong KMIPFGWC bởi tham số  trong hàm Gaussian. Kết quả cho thấy rằng, giá trị IFV trong KMIPFGWC tỷ lệ thuật trực tiếp với các giá trị của tham số, điều này có nghĩa là giá trị tham số là cao thì giá trị IFV trong KMIPFGWC cũng sẽ lớn, ví dụ, khi C=4, giá trị IFV trong KMIPFGWC từ  =1.0 đến 4.0 tƣơng ứng là 30.6946426, 29.9651581, 31.493137, 32.9895376, 33.1232309, 33.8038296 và 35.4039242. Vì vậy, chúng ta nên đặt giá trị của tham số  cao để giá trị IFV trong KMIPFGWC đạt đƣợc giá trị tốt nhất. Kết luận cuối cùng trong phần 3.3:

 Để có đƣợc chất lƣợng phân cụm tốt nhất trong KMIPFGWC thì các tham số phải đƣợc thiết lập là u h t hoặc giá trị của tham số  phải cao.

 Sự thay đổi giá trị IFV trong KMIPFGWC bởi các trƣờng hợp và tham số khác nhau có thể xem trong bảng 3.3 và bảng 3.4.

3.4. Kết luận chƣơng

Trong chƣơng này, phần đầu chúng tôi đánh giá chất lƣợng phân cụm của thuật toán KMIPFGWC so với thuật toán MIPFGWC và FGWC thông qua chỉ số IFV. Đồng thời đánh giá thời gian tính toán. Kết quả thu đƣợc cho thấy, chất lƣợng phân cụm của thuật toán KMIPFGWC tốt hơn so với các thuật toán MIPFGWC và FGWC. Giá trị của các tham số nên đƣợc chọn sao cho giá trị của tham số  là lớn, giá trị tham số  là trung bình, giá trị tham số  là thấp để thu đƣợc giá trị IFV của KMIPFGWC tốt hơn. Ngoài ra kết quả còn cho thấy thời gian tính toán của thuật toán KMIPFGWC tuy có cao hơn thuật toán MIPFGWC và FGWC nhƣng vẫn có thể chấp nhận đƣợc.

Phần cuối trong chƣơng này, chúng tôi khảo sát một số đặc trƣng của thuật toán KMIPFGWC bởi các trƣờng hợp khác nhau của hàm Gaussian. Kết quả cho thấy để có đƣợc chất lƣợng phân cụm tốt thì các tham số phải đƣợc thiết lập là u h t hoặc giá trị của tham số  phải cao.

KẾT LUẬN

Luận văn đã trình bày:

 Các kiến thức cơ bản về phân cụm dữ liệu địa lý, bao gồm các định nghĩa, độ đo và ứng dụng của nó trong các lĩnh vực ý tế, an ninh, xã hội v.v. đồng thời trình bày sơ lƣợc về các thuật toán phân cụm dữ liệu địa lý nhƣ FCM, NE, FGWC, CFGWC, CFGWC2, IPFGWC, MIPFGWC cùng các ƣu nhƣợc điểm của chúng, từ đó đề xuất thuật toán KMIPFGWC.

 Thuật toán phân cụm mờ trọng số địa lý KMIPFGWC, với hàm mục tiêu sử dụng độ đo khoảng cách là hàm nhân Gaussian thay vì sử dụng hàm Euclidean truyền thống và sử dụng mô hình SIM2 để nâng cao chất lƣợng phân cụm cho bài toán.

 Cài đặt thử nghiệm thuật toán KMIPFGWC trên bộ dữ liệu thực tế là bộ dữ liệu địa lý về kinh tế - xã hội từ tổ chức Liên Hợp Quốc – UNO và so sánh nó với các thuật toán MIPFGWC, FGWC để đánh giá hiệu quả của thuật toán đề xuất.

Các kết quả cho thấy thuật toán KMIPFGWC cho thấy chất lƣợng phân cụm tốt hơn so với các thuật toán phân cụm dữ liệu địa lý đƣợc sử dụng phổ biến nhất hiện nay và thời gian thực hiện thuật toán là có thể chấp nhận đƣợc.

Hƣớng phát triển trong tƣơng lai của luận văn tập trung vào ứng dụng của thuật toán KMIPFGWC vào các bài toán thực tế về kinh tế - xã hội và dữ liệu có kích thƣớc lớn hơn.

TÀI LIỆU THAM KHẢO

Tiếng Anh:

[1]. Ahmed, M. N., Yamany, S. M., Mohamed, N., Farag, A. A., Moriarty, T., 2002. A modified fuzzy c-means algorithm for bias field estimation and segmentation of MRI data. IEEE Trans. Med. Imaging 21,193–199.

[2]. Atanassov, K. T. (1986). Intuitionistic fuzzy sets. Fuzzy sets and Systems,20(1), 87-96.

[3]. Bezdek, J.C., R. Ehrlich, et al. (1984), "FCM: the fuzzy c-means clustering algorithm", Computers and Geosciences, 10, pp.191-203.

[4]. Chen, S. C., Zhang, D. Q., 2004. Robust image segmentation using FCM with spatial constrains based on new kernel-induced distance measure. IEEE Trans. Systems Man Cybernet. Part B 34, 1907–1916.

[5]. Feng, Z. and Flowerdew, R. (1998), Fuzzy Geodemographics: a contribution from fuzzy clustering methods, In: Carver, S. (Ed.) Innovations in GIS 5, Taylor & Francis, London, pp.119-127.

[6]. Harrison, N., Hatt, S. (2010), “„Disadvantaged Learners‟: Who Are We Targeting? Understanding the Targeting of Widening Participation Activity in the United Kingdom Using Geo-Demographic Data From Southwest England”, Higher Education Quarterly, Vol. 64, No. 1, pp. 65-88.

[7]. Keogh, E., Ratanamahatana, C. A., 2005. Exact indexing of dynamic time warping. Knowledge and information systems 7(3), 358-386.

[8]. Le Hoang Son, Bui Cong Cuong, Pier Luca Lanzi, Nguyen Tho Thong (2012), “A Novel Intuitionistic Fuzzy Clustering Method for Geo-Demographic Analysis”, Expert Systems with Applications, Vol. 39, No. 10, pp. 9848–9859. [9]. Le Hoang Son, Bui Cong Cuong, Pier Luca Lanzi, Hoang Anh Hung (2012), "Data Mining in GIS: A Novel Context-Based Fuzzy Geographically Weighted Clustering Algorithm", International Journal of Machine Learning and Computing, 2(3), 235-238.

[10]. Le Hoang Son, Bui Cong Cuong, Hoang Viet Long (2013), “Spatial interaction – modification model and applications to geo-demographic analysis”, Knowledge-Based Systems, Vol. 49, pp. 152–170.

[11]. Le Hoang Son (2014), “Enhancing Clustering Quality of Geo- Demographic Analysis Using Context Fuzzy Clustering Type-2 and Particle Swarm Optimization”, Applied Soft Computing, Vol. 22, pp. 566 - 584.

[12]. Mason, G. A. and Jacobson, R. D., 2007. Fuzzy Geographically Weighted Clustering. Proceedings of the 9th International Conference on GeoComputation, Maynooth, Eire, Ireland, (electronic proceedings on CD-ROM).

[13]. Masoud, N., Zadeh, L. A., and Aminzadeh, F. (2003), Soft computing and intelligent data analysis in oil exploration, Vol. 51, Elsevier Science, Amsterdam. [14]. Mendel, J. M. (2007). Type-2 fuzzy sets and systems: an overview.Computational Intelligence Magazine, IEEE, 2(1), 20-29.

[15]. Morris, P., Thrall, G. (2010), “Using Geospatial Techniques to Address Institutional Objectives: St. Petersburg College Geo-Demographic Analysis”, IR Applications, Vol. 27, Association for Institutional Research.

[16]. Páez, A., M. Trépanier, C. Morency (2011), “Geodemographic analysis and the identification of potential business partnerships enabled by transit smart and the identification of potential business partnerships enabled by transit smart cards”, Transportation Research Part A, Vol. 45, pp. 640–652.

[17]. Pedrycz, W. (1996), "Conditional fuzzy C-mean", Pattern Recognition Letter, 17, pp.625-632.

[18]. Shelton, N., Birkin, M. and Dorling, D. (2006), “Where not to live: a geo- demographic classification of mortality for England and Wales, 1981- 2000”, Health and Place, Vol. 12, No. 4, pp. 557-569.

[19]. Sleight, P. (1993), Targeting Customers: How to use geodemographics and lifestyle data in your business, NTC Publication, Henley-on-Thames.

[20]. Thakur, P., Lingam, C., 2013. Generalized Spatial Kernel based Fuzzy C- Means Clustering Algorithm for Image Segmentation. International Journal of Science and Research 2(5), 165 -169.

[21]. UNSD Statistical Databases, 2011. Demographic Yearbook. http://unstats.un.org/unsd/databases.htm, [accessed 14 July 2012].

[22]. Wu Z., Xie, W. X., Yu J. P., 2003. Fuzzy C-means Clustering Algorithm Based on Kernel Method. Proceedings of Fifth International Conference on Computational Intelligence and Multimedia Applications, pp. 49-56.

[23]. Yang, M. S., Tsai, H. S. (2008), “A Gaussian kernel-based fuzzy c-means algorithm with a spatial bias correction”, Pattern Recognition Letters, Vol. 29, No. 12, pp. 1713-1725..

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân cụm mờ trọng số địa lý (Trang 68 - 73)

Tải bản đầy đủ (PDF)

(73 trang)