Hiện nay, internet đang phát triển một cách nhanh chóng và được sử dụng rộng rãi trong mọi lĩnh vực đặc biệt là trong lĩnh vực thương mại toàn cầu. Hoạt động marketing cũng không nằm ngoài sự ảnh hưởng đó. Trong giới hạn bài viết này, tác giả tập trung nghiên cứu việc ứng dụng dữ liệu web được khai phá vào hoạt động phân phối trên internet nhằm tối ưu hóa hoạt động này.
Kỷ yếu Hội thảo quốc tế “Thương mại phân phối” lần năm 2018 KHAI PHÁ DỮ LIỆU WEB NHẰM TỐI ƯU HÓA KÊNH PHÂN PHỐI TRÊN INTERNET WEB DATA MINING TO OPTIMIZE CHANNEL DISTRIBUTORS ON THE INTERNET Nguyễn Thị Khánh Hà Trường CĐ CNTT hữu nghị Việt – Hàn Email: khanha055@gmail.com Tóm tắt Hiện nay, internet phát triển cách nhanh chóng sử dụng rộng rãi lĩnh vực đặc biệt lĩnh vực thương mại tồn cầu Hoạt động marketing khơng nằm ngồi ảnh hưởng Với mục tiêu tối thượng thỏa mãn nhu cầu khách hàng, tất sách mà doanh nghiệp đưa nhằm mục đích đưa sản phẩm đến người, qua kênh, vào thời điểm Như vậy, doanh nghiệp cần thu thập thơng tin từ khách hàng sẵn có, thông qua quy tắc định để đưa khuynh hướng mua sắm khách hàng Để làm điều cần thiết phải có kỹ thuật để tìm thơng tin, kiến thức từ liệu có, phải vận dụng kĩ thuật khai phá liệu Trong giới hạn viết này, tác giả tập trung nghiên cứu việc ứng dụng liệu web khai phá vào hoạt động phân phối internet nhằm tối ưu hóa hoạt động Từ khóa: Kênh phân phối, khai phá liệu, Internet Abstract Today, the in internet is growing rapidly and it is used extensively in all areas especially in the field of global trade Marketing is not out of touch With the ultimate goal of satisfying customer needs, all the policies that businesses offer are aimed at bringing the product to the right people, right channel, at the right time Thus, businesses need to collect information from existing customers, and and through certain rules to make the shopping trends of new customers To this, it is necessary to have techniques to find information and knowledge from existing data, to use data mining techniques In this article, the author focuses on the application of web data mining to internet distribution in order to optimize this activity Keywords: Distribution channel, data mining, Internet Đặt vấn đề Là số chức quan trọng marketing, phân phối giữ vai trò đưa sản phẩm đến thị trường mục tiêu, kênh phân phối làm cho sản phẩm sẵn có thời gian, địa điểm phương thức mà khách hàng mong muốn Với hỗ trợ internet, hoạt động phân phối ngày thể tầm quan trọng trình tạo nên lợi cạnh tranh dài hạn cho doanh nghiệp Nhằm mục đích cuối nâng cao lợi ích so với số vốn đầu tư bỏ ra, doanh nghiệp không ngừng nghiên cứu cho hoạt động kênh phân phối nói chung kênh phân phối internet nói riêng ngày tối ưu Đây việc nắm bắt xem khách hàng thường ghé thăm website thơng qua đâu, họ tìm kiếm thơng tin với động nào, từ khóa khách hàng tìm kiếm nhiều nhất… Vậy làm để doanh nghiệp có thơng tin này? Bài viết sau phần lý giải câu hỏi Tổng quan nghiên cứu, sở lý thuyết phương pháp nghiên cứu 2.1 Khai phá liệu web Hiện nay, với phát triển vượt bật cơng nghệ thơng tin, hệ thống thơng tin lưu trữ khối lượng liệu lớn Trong kho liệu lớn khơng phải thơng tin có ích Vì để khai thác tri thức có ích phương pháp Khai phá liệu đời Chúng cho phép trích xuất thơng tin hữu ích mà chưa biết Các tri thức vừa tìm thấy vận dụng để cải thiện hiệu hoạt động hệ thống thông tin ban đầu 351 Kỷ yếu Hội thảo quốc tế “Thương mại phân phối” lần năm 2018 Khai phá liệu định nghĩa việc khám phá tri thức sở liệu, q trình trích xuất thơng tin ẩn, trước chưa biết có khả hữu ích sở liệu [3]; Là q trình tính tốn để tìm mẫu liệu lớn liên quan đến phương pháp giao điểm máy học, thống kê hệ thống sở liệu [1] Quá trình Khai phá liệu bao gồm giai đoạn sau [1]: − Xác định vấn đề không gian liệu để giải vấn đề (Problem understanding and data understanding) − Chuẩn bị liệu (Data preparation), bao gồm q trình làm liệu (data cleaning), tích hợp liệu (data integration), chọn liệu (data selection), biến đổi liệu (data transformation) − Khai phá liệu (Data mining): xác định nhiệm vụ khai phá liệu lựa chọn kĩ thuật khai phá liệu Kết cho ta nguồn tri thức thông minh − Đánh giá (Evaluation): dựa số tiêu chí tiến hành kiểm tra lọc nguồn tri thức thu − Triển khai (Deployment) 2.2 Một số kỹ thuật khai phá liệu marketing [2] 2.2.1 Phân tích cụm để xác định nhóm mục tiêu Phân tích cụm cho phép xác định nhóm người dùng cụ thể theo tính phổ biến sở liệu Các tính bao gồm độ tuổi, vị trí địa lý, trình độ học vấn, Đó kỹ thuật khai phá liệu hữu ích marketing để phân đoạn sở liệu Sự kết hợp biến vô tận phân tích cụm nhiều hay chọn lọc theo yêu cầu tìm kiếm 2.2.2 Phân tích hồi qui để dự báo marketing Kỹ thuật cho phép nghiên cứu thay đổi, thói quen, mức độ hài lịng khách hàng yếu tố khác liên quan đến tiêu chí Khi số tiêu chí thay đổi, doanh nghiệp có ý tưởng rõ ràng xảy với người dùng 2.2.3 Phân tích phân hạng để xác định spam khía cạnh khác Làm doanh nghiệp phân loại email trả lời từ khách hàng? Và làm cách để doanh nghiệp nhận liên kết khách hàng tiềm cho sản phẩm trước sau chạy chiến dịch quảng cáo? Chỉ có câu trả lời: phân tích phân hạng, kỹ thuật khai phá liệu cho phép nhận mẫu (các lược đồ định kỳ) bên sở liệu Một giải pháp hiệu để cải thiện hiệu suất chiến lược marketing doanh nghiệp 2.2.4 Phát bất thường Kỹ thuật phát bất thường sử dụng để loại bỏ sở liệu không quán bất thường nguồn Phần mềm xử lý việc tìm kiếm lập trình để thực thao tác phức tạp sở liệu chứa tới hàng nghìn ghi (địa chỉ, tên, ) 2.2.5 Phát xâm nhập để bảo mật hệ thống tốt Để tránh sử dụng sở liệu bị xâm nhập (các giá trị cá nhân thêm vào tin tặc, chí virus chép liệu), kỹ thuật khai phá liệu sử dụng để khử nhiễm sở liệu đảm bảo an toàn cho toàn hệ thống 2.2.6 Nghiên cứu quy tắc kết hợp để khám phá liên kết liệu Việc nghiên cứu qui tắc kết hợp sử dụng cho tất hoạt động bán sản phẩm Các liệu khách hàng lưu lại tham gia giao dịch trực tuyến cửa hàng trung tâm mua sắm tạo mối liên hệ với 352 Kỷ yếu Hội thảo quốc tế “Thương mại phân phối” lần năm 2018 2.2.7 Cây định để tối ưu hóa quản lý rủi ro dự án Doanh nghiệp đứng trước nhiều lựa chọn trước đưa định, đường giao lựa chọn trở thành định Ban đầu gây nhầm lẫn phải xử lý định, có cơng cụ máy tính phù hợp để tổ chức đưa lựa chọn hoàn chỉnh cuối với chi phí / lợi ích câu chuyện khác trở thành công cụ có giá trị cho việc quản lý rủi ro dự án Mức độ phân tích chủ yếu phụ thuộc vào cơng nghệ có sẵn: phần mềm tiên tiến cho thấy đường tốt để theo đuổi 2.2.8 Mạng thần kinh để nghiên cứu tự động hóa Đây ứng dụng khai phá liệu nhất, theo doanh nghiệp sử dụng phép tính marketing nghĩa máy tính quản lý sở liệu, nghiên cứu để xác định mẫu có chứa phần tử có mối quan hệ với Kết việc nghiên cứu cơng nhận lưu trữ mẫu có ích khơng cho mà cho tương lai 2.2.9 Quy tắc qui nạp cho dự báo liệu sở phân tích Với kỹ thuật khai phá liệu này, doanh nghiệp phân tích dự đốn phức tạp bên sở liệu với hàng ngàn ghi 2.2.10 Lưu kho liệu cho trình xử lý liệu lớn Khi phải dịch chuyển chương trình hệ thống, doanh nghiệp tính tốn phần mềm kho liệu, khơng riêng cho hoạt động marketing mà cho phát triển doanh nghiệp Kết thảo luận Tối ưu hóa kênh phân phối việc nắm bắt xem khách hàng thường ghé thăm website thông qua đâu, họ tìm kiếm thơng tin với động nào, từ khóa khách hàng tìm kiếm nhiều Những việc làm nhằm tập trung vào kênh marketing hiệu mục đích cuối nâng cao lợi ích so với số vốn đầu tư bỏ Hiện nay, doanh nghiệp có hệ thống giao dịch điện tử khơng nắm bắt lượng mua qua website họ bao nhiêu, họ quan tâm đến lượng khách viếng thăm website nên việc tìm hiểu xem số lượng khách viếng thăm có người mua hàng, mua chưa để ý đến Những doanh nghiệp nắm bắt việc khách hàng viếng thăm website họ với mục đích gì, xem website, làm hành động trang chính, khỏi website từ đâu Chính vậy, cho dù có nhiều khách hàng viếng thăm website với động tìm kiếm thơng tin nữa, doanh số bán tăng lên Để tăng doanh số bán việc tăng số lượng khách hàng quan trọng, nhiên việc nắm bắt khách hàng làm website việc quan trọng Nghĩa là, doanh nghiệp phải phân tích đường dẫn khách hàng viếng thăm website liên kết việc ghé thăm với doanh số bán hàng Không dừng lại chỗ đếm lượng khách ghé thăm website mức độ “nhiều, ít” số, doanh nghiệp không nắm nguyên nhân chủng loại, đường khiến khách hàng ghé thăm website lượng thăm có tăng đến đâu nữa, không đạt kết đáng kể Khi không nắm lượng mua hàng website, người thực hành động website, họ vào vào thời điểm nào, cách thật khó để mong chờ vào kết tốt đẹp Đặc biệt doanh nghiệp dùng phép phân tích web log file (phân tích log) để tìm hiểu giao thơng website Web log file file liệu tập hợp dấu tích người sử dụng web để lại web server, file chứa liệu hữu ích liên quan đến việc tiếp cận người sử dụng web Web log file chia thành hai hình thái standard log extend log [4] 353 Kỷ yếu Hội thảo quốc tế “Thương mại phân phối” lần năm 2018 - Standard log chia làm hình thái: Access log file file tập hợp ghi chép việc ghé thăm site, thời gian ghé thăm, thơng tin đường ghé thăm Ngồi ra, người sử dụng kiểm chứng file cịn chứa thơng tin ID người đăng nhập xác nhận việc mà người tiến hành web Error log file nội dung thời gian ghi chép lỗi xảy web server thất bại tiếp cận web Khi error log lớn ảnh hưởng đến mức độ tin cậy web, phải để ý đến số để bảo trì web theo chu kỳ Referr log file file ghi chép động tìm kiếm từ khóa tìm kiếm sử dụng web, cịn bao gồm thông tin trang trước web Có thể sử dụng thơng tin thu thập qua Referr log file để chọn phương tiện quảng cáo internet Agent log file cung cấp thơng tin chủng loại trình duyệt, phiên trình duyệt, hệ điều hành mà người sử dụng dùng để tiếp cận web, sử dụng để tối ưu hóa web pages - Extend log cung cấp thêm thông tin mà standard log chưa cung cấp Để thực việc khai phá liệu web phải lấy web log file từ web server, tiến hành tiền xử lý sau áp dụng kĩ thuật khai phá liệu để phân tích Đặc biệt khai thác sử dụng web web log file có ghi chép lại tất dấu tích ghé thăm người sử dụng có nhiều thơng tin khơng cần thiết cho việc phân tích ghi chép lại Vì vậy, để tìm hiểu người sử dụng tính số lần ghé thăm người sử dụng việc nắm rõ session quy trình tiền xử lý việc hoàn thành đường ghé thăm người sử dụng mà không ghi chép lại web log file quan trọng so với khai phá liệu thơng thường Phép phân tích cho thấy khách hàng thông qua đường để ghé thăm web, trang đầu họ ghé thăm trang nào, sau ghé thăm website họ kích chọn vào link họ thoát khỏi web lúc nào, thoát từ đâu Bằng việc phân tích giao thơng web, doanh nghiệp nắm bắt khách hàng thực quan tâm đến website, khách hàng có ý định muốn giao dịch với doanh nghiệp.Và phát triển nữa, doanh nghiệp biết trang có ấn tượng khách hàng, yếu tố khiến khách hàng giao dịch mua, yếu tố ngăn cản giao dịch mua khách hàng.Với biện pháp trên, doanh nghiệp đạt lượng khách cố định ghé thăm website với mục đích tìm kiếm thơng tin mua dịch vụ Đặc biệt, dịch vụ làm tăng doanh số bán, doanh nghiệp phải cung cấp cho khách hàng thông tin hàng tháng phải phân tích số khách hàng ghé thăm thay đổi họ theo nội dung sau: - Vào web doanh nghiệp từ link hay thông qua website nhiều - Con đường khách ghé thăm dùng để vào nhiều - Trang khách hàng vào nhiều hay gọi trang entry - Trang khách hàng nhiều hay cịn gọi trang exit - Khách hàng dùng trình duyệt nhiều nhất, độ phân giải hình, màu sắc hệ điều hành - Từ khóa tìm kiếm nhiều website - Trang có ấn tượng trang khơng có ấn tượng - Phần website có lỗi nhiều - Khách hàng tìm đến web nhiều Bằng việc có thơng tin để nâng cao doanh số bán doanh nghiệp phải tiến hành cung cấp dịch vụ sau để nâng cao doanh số bán thực tế: - Phân tích khách ghé thăm: quan tâm đến thay đổi số lượng khách ghé thăm theo chu kỳ định kỳ, phân tích thơng tin chi tiết liên quan tới khách ghé thăm vào từ đâu, đâu 354 Kỷ yếu Hội thảo quốc tế “Thương mại phân phối” lần năm 2018 cách nào, ghé thăm website thường xuyên hay không Những phân tích mang lại thơng tin hữu ích, báo cáo định kỳ khách hàng cho doanh nghiệp - Phân tích nguyên nhân chủng loại giao thơng web: phân tích khác biệt đường tìm kiếm thơng qua động tìm kiếm Bằng phân tích log, doanh nghiệp nắm bắt tảng khách ghé thăm Thông qua thông tin doanh nghiệp tối ưu hóa website, điều chỉnh hình thức kinh doanh nhằm nâng cao lượng bán Vai trò kênh phân phối điểm để khách hàng trực tiếp mua hàng, nhiên thơng qua doanh nghiệp tiếp xúc với khách hàng Hơn nữa, vị trí doanh nghiệp, để vận hành kênh phân phối, doanh nghiệp phải đầu tư, nguyên tắc doanh nghiệp đầu tư phải thu lại lợi nhuận cao Vì đặc điểm này, nên internet trở thành kênh phân phối có sức hấp dẫn Bởi internet nơi doanh nghiệp gặp gỡ khách hàng, tương tác với khách hàng thông qua kênh phân phối Tuy nhiên mặt hàng yêu cầu phải có di chuyển thực tế, việc thực đơn hàng mà dẫn đến việc gây lỗ vốn cho doanh nghiệp thực hình thức Bởi vậy, phân hóa kênh phân phối, doanh nghiệp phải kiểm tra liệu có gây tổn hại đến hình ảnh tổng hợp sản phẩm theo kênh phân phối thương hiệu hay không, khác biệt sản phẩm giá cả, khác biệt cách tiếp cận kênh phân phối khách hàng cá nhân Kết luận Thỏa mãn nhu cầu nhằm đạt hài lòng khách hàng đích đến quan trọng doanh nghiệp Để làm điều này, doanh nghiệp cần phải hiểu khách hàng thân họ hiểu Việc khai phá liệu giúp tìm “bảo vật” chơn dấu vơ vàn liệu có sẵn, bảo vật (thông tin) giúp doanh nghiệp đưa định đắn Kênh phân phối internet tối ưu hóa nhờ việc khai phá liệu web có lợi cho khách hàng lẫn doanh nghiệp, đường mà hai bên để gặp đường nhanh, thuận tiện hiệu TÀI LIỆU THAM KHẢO Website http://www.wikipedia.org/ https://www.egon.com, “The secrects of data mining for your marketing strategy” K A Taipale Data Mining and Domestic Security: Connecting the Dots to Make Sense of Data, Columbia Science and Technology Law Review, 5(2), December 2003 Kang (2016), “Customer relationship management”, Soongsil University 355 ... định đắn Kênh phân phối internet tối ưu hóa nhờ việc khai phá liệu web có lợi cho khách hàng lẫn doanh nghiệp, đường mà hai bên để gặp đường nhanh, thuận tiện hiệu TÀI LIỆU THAM KHẢO Website http://www.wikipedia.org/... dùng để tiếp cận web, sử dụng để tối ưu hóa web pages - Extend log cung cấp thêm thông tin mà standard log chưa cung cấp Để thực việc khai phá liệu web phải lấy web log file từ web server, tiến... mại phân phối? ?? lần năm 2018 Khai phá liệu định nghĩa việc khám phá tri thức sở liệu, q trình trích xuất thơng tin ẩn, trước chưa biết có khả hữu ích sở liệu [3]; Là q trình tính tốn để tìm mẫu liệu