Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá

85 5 0
Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá Áp dụng các kỹ thuật suy luận nhân quả trong chiến lược định giá

MỤC MỤC Trang tựa TRANG Quyết định giao đề tài Biên chấm luận văn tốt nghiệp thạc sĩ Phiếu nhận xét Lý lịch khoa học i Lời cảm ơn ii Lời cam đoan iii Abstract iv Tóm tắt vi Mục mục viii Danh sách chữ viết tắt x Danh sách bảng xi Danh sách hình xii Chương TỔNG QUAN 1.1 Tính cấp thiết đề tài 1.2 Mục tiêu đối tượng nghiên cứu 1.3 Nhiệm vụ nghiên cứu giới hạn 1.4 Phương pháp nghiên cứu 1.5 Ý nghĩa thực tiễn đề tài 10 1.6 Kết cấu luận văn 10 Chương CƠ SỞ LÝ THUYẾT 11 2.1 Suy luận nhân 11 2.1.1 Hồi quy tuyến tính 11 2.1.2 Hiệu ứng liệu pháp dựa nhân 12 2.2 Phương pháp suy luận 16 2.2.1 Cơ sở xây dựng phương pháp 16 2.2.2 Chiến lược định giá 28 Chương TÌNH HÌNH NGHIÊN CỨU 32 3.1 Suy luận nhân 32 3.2 Ước lượng nghiệm phương trình 34 3.3 Tối ưu chiến lược định giá 35 Chương CẢI TIẾN RỪNG NGẪU NHIÊN TRỰC GIAO BẰNG PHƯƠNG PHÁP KẾT HỢP ƯỚC LƯỢNG NGHIỆM 37 viii 4.1 Giải pháp xây dựng Rừng Ngẫu Nhiên Trực Giao 37 4.2 Phương pháp kết hợp giải nghiệm Newton phương trình bậc 39 4.3 Phương pháp đề xuất 39 4.3.1 Phương pháp Ước lượng Chebyshev – Halley 41 4.3.2 Phương pháp Ước lượng Newton cải tiến 44 CHƯƠNG KẾT QUẢ THỰC NGHIỆM 46 5.1 Giả lập 46 5.2 Dữ liệu thật 57 Chương KẾT LUẬN 72 6.1 Kết luận 72 6.2 Hạn chế 72 6.3 Hướng phát triển đề tài 73 TÀI LIỆU THAM KHẢO 74 BÀI BÁO 79 ix DANH SÁCH CHỮ VIẾT TẮT Nguyên nghĩa STT Ký hiệu UTE Hiệu ứng liệu pháp đơn vị ATE Hiệu ứng liệu pháp trung bình ATET Hiệu ứng liệu pháp trung bình xét đối tượng áp dụng liệu pháp ATEC Hiệu ứng liệu pháp trung bình xét nhóm chứng CATE Hiệu ứng liệu pháp trung bình có điều kiện DML Mơ hình Double Machine Learning ORF Mơ hình Rừng Ngẫu Nhiên Trực Giao FE “Fan Edition” Tên dòng điện thoại Samsung Galaxy Note MAE Sai số tuyệt đối trung bình 10 MSE Sai số tồn phương trung bình x DANH SÁCH CÁC BẢNG BẢNG TRANG Bảng 5.1: Cấu hình cho mơ hình tham gia thử nghiệm 47 Bảng 5.2: Môi trường thực thử nghiệm, thời gian chạy giả lập 48 Bảng 5.3: Kết thử nghiệm giả lập sơ với n = 25, support = .49 Bảng 5.4: Kết thử nghiệm giả lập sơ với n = 25, support = 15 .50 Bảng 5.5: Kết thử nghiệm giả lập sơ với n = 25, support = 20 .50 Bảng 5.6: Phần trăm tăng hay giảm hệ số lỗi MAE so với Newton chuẩn .53 Bảng 5.7: Phần trăm tăng hay giảm hệ số lỗi MSE so với Newton chuẩn 53 Bảng 5.8: Phần trăm tăng hay giảm hệ số lỗi tuyệt đối ATE so với Newton chuẩn 53 Bảng 5.9: Phần trăm tăng hay giảm hệ số lỗi MAE so với Newton chuẩn .55 Bảng 5.10: Phần trăm tăng hay giảm hệ số lỗi MSE so với Newton chuẩn 55 Bảng 5.11: Phần trăm tăng hay giảm hệ số lỗi tuyệt đối ATE so với Newton chuẩn 56 Bảng 5.12: Bảng thuộc tính liệu thực nghiệm 58 Bảng 5.13: Mơ tả kiểu trình bày đồ thị quan hệ thuộc tính - hiệu ứng .59 Bảng 5.14: Kết luận dựa ước lượng UTE với định giá tâm lý liệu pháp 62 Bảng 5.15: Kết luận dựa ước lượng UTE với định giá giảm liệu pháp 66 Bảng 5.16: Kết luận dựa ước lượng UTE với giá liệu pháp 70 xi DANH SÁCH CÁC HÌNH HÌNH TRANG Hình 2.1: Mơ hình quan hệ biến nhiễu W 18 Hình 2.2: Mơ hình quan hệ biến điều khiển Z 19 Hình 4.1: Mơ hình sơ đồ mẫu Rừng Ngẫu Nhiên Trực Giao 38 Hình 4.2: Đồ thị 𝜌𝑔 𝜌𝑓 41 Hình 4.3: Đường phân cách thẳng dọc 𝑥 = 1, vng góc với trục Ox 42 Hình 5.1: Biểu đồ MAE theo giá trị support bốn giải pháp, với 𝑛 = 25 51 Hình 5.2: Biểu đồ MSE theo giá trị support bốn giải pháp, với 𝑛 = 25 52 Hình 5.3: Biểu đồ hệ số lỗi tuyệt đối ATE theo giá trị support bốn giải pháp, với 𝑛 = 25 .52 Hình 5.4: Biểu đồ MAE theo giá trị support bốn giải pháp, với 𝑛 = 50 54 Hình 5.5: Biểu đồ MSE theo giá trị support bốn giải pháp, với 𝑛 = 50 54 Hình 5.6: Biểu đồ hệ số lỗi tuyệt đối ATE theo giá trị support bốn giải pháp, với 𝑛 = 50 .55 Hình 5.7: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá tâm lý từ liệu thật phương pháp Newton .60 Hình 5.8: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá tâm lý từ liệu thật phương pháp Chebyshev – Halley (2) 60 Hình 5.9: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá tâm lý từ liệu thật phương pháp Chebyshev – Halley (3) 61 Hình 5.10: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá tâm lý từ liệu thật phương pháp Newton cải tiến 62 Hình 5.11: Kết từ mơ hình Newton cải tiến Các mơ hình dự đốn tỉ lệ nữ giới có việc làm tồn thời gian 35% giúp hiệu ứng ổn định 63 xii Hình 5.12: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá giảm từ liệu thật phương pháp Newton .64 Hình 5.13: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá giảm từ liệu thật phương pháp Chebyshev – Halley (2) 64 Hình 5.14: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá giảm từ liệu thật phương pháp Chebyshev – Halley (3) 65 Hình 5.15: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá giảm từ liệu thật phương pháp Newton cải tiến 66 Hình 5.16: Đồ thị dự đoán hiệu ứng định giá giảm theo income Newton cải tiến Vùng xám miền có hệ số thu nhập 10.4 10.95 67 Hình 5.17: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá từ liệu thật phương pháp Newton 68 Hình 5.18: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá từ liệu thật phương pháp Chebyshev – Halley (2) 69 Hình 5.19: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá từ liệu thật phương pháp Chebyshev – Halley (3) 69 Hình 5.20: Đồ thị điểm liệu theo giá trị đặc trưng - UTE, dự đoán hiệu ứng chiến lược định giá từ liệu thật phương pháp Newton cải tiến 70 xiii Chương TỔNG QUAN Chương tổng qt hóa cơng trình nghiên cứu trình bày kết cấu luận văn 1.1 Tính cấp thiết đề tài Thế kỉ XXI đánh dấu bước tiến mạnh mẽ nhiều ngành khoa học Cuộc cách mạng công nghiệp 4.0 đánh dấu vực dậy trí tuệ nhân tạo, internet vạn vật, liệu lớn nhiều Với tiến dân trí điều kiện sống, người chắn không ngừng đặt mục tiêu cao Điển hình mơ hình máy học khắc phục hạn chế nhiều năm trước Từ toán phân loại đơn giản, đến nay, xây dựng thành công hệ thống phức tạp xử lý hình ảnh, video theo thời gian thực, hay ứng dụng an ninh mạng, thương mại điện tử, Y học với tốc độ độ xác vượt trội Nhưng đề cập, chưa phải giới hạn Vài năm trở lại đây, ý tưởng cỗ máy có khả đưa kết dựa đặc tính nhân đề cập nhiều báo nghiên cứu nước Sự vượt trội giúp máy học khỏi biên giới tương quan đơn biến độc lập – phụ thuộc truyền thống Không phải lĩnh vực quen thuộc, suy luận nhân lại chứa đựng quan điểm mang tính thực tế Bắt đầu từ câu hỏi phức tạp kết thay đổi tác nhân thay đổi, máy học truyền thống khó đảm bảo cho kết thuyết phục chúng khơng thiết kế cho mục đích cụ thể Tính tương quan từ lâu sở cho máy học truyền thống Dự đoán dựa tính tương quan đơn Tuy vậy, sở thiếu yếu tố nhân khiến dự đốn khó trở thành gợi ý định hay định Quyết định nói đến có tính quan trọng chiến lược kinh doanh, sách vĩ mô, thử nghiệm thuốc Giải pháp suy luận nhân quả, với mục tiêu ước lượng hiệu ứng liệu pháp, xây đựng để giải vấn đề Với thử nghiệm lâm sàng Y học, ước lượng hiệu liệu pháp điều trị công việc thiết yếu để hiểu rõ thuốc Còn lĩnh vực kinh tế, mơ hình suy luận nhân cho hiệu ứng sách bán hàng, thường gọi độ co giãn cầu theo giá Ngoài chiến lược định giá bàn mục sau, mơ hình vừa đề cập vận dụng thương mại điện tử qua tác vụ học tỉ lệ nhấp chuột vào đường dẫn, hình ảnh trang web, gợi ý định giá tối ưu Dễ dàng thấy phạm vi áp dụng phương pháp suy luận nhân dù mang tính đặc thù rộng thực tế 1.2 Mục tiêu đối tượng nghiên cứu Nghiên cứu ứng dụng mơ hình suy luận nhân Rừng Ngẫu Nhiên Trực Giao, cải tiến đề xuất cho mơ hình đánh giá cải tiến Đối tượng nghiên cứu mơ hình máy học suy luận nhân bật năm vừa qua cơng trình ước lượng nghiệm liên quan đến cải tiến 1.3 Nhiệm vụ nghiên cứu giới hạn - Nhiệm vụ nghiên cứu giới thiệu lý thuyết thuật toán tiêu biểu chiến lược định giá, đưa nhìn tổng quan khía cạnh vận dụng thực tế mục đích cụ thể - Lập luận, phân tích, chứng minh thử nghiệm phương pháp gốc giải pháp cải tiến ước lượng nghiệm với Rừng Ngẫu Nhiên Trực Giao 1.4 Phương pháp nghiên cứu Phương pháp nghiên cứu tài liệu: Các tài liệu tham khảo phù hợp với nhiệm vụ, giới hạn mục đích nghiên cứu Những yếu tố cần tiếp thu gồm lý thuyết, kết thử nghiệm trước đây, phương pháp xây dựng mơ hình giả lập - Phương pháp thống kê, đối chiếu: Các thử nghiệm chạy nhiều lần hệ số lỗi sở để so sánh, đánh giá khách quan - Phương pháp thử nghiệm: Thực nghiệm liệu thật khó để đánh giá hiệu mơ hình Ngược lại, thử nghiệm mơ hình giả lập khắc phục vấn đề - Phương pháp phân tích đồ thị: Khi áp dụng thực tiễn, suy luận thể khơng qua số, mà cịn dựa sở đồ thị 1.5 Ý nghĩa thực tiễn đề tài Suy luận nhân lựa chọn bên cạnh máy học truyền thống Với cách khoa học kết hợp tính nhân với mơ hình có sẵn, khơng q khó để hình dung việc áp dụng ý tưởng mẻ thực tiễn Qua loạt giới thiệu, dễ dàng nhận thấy suy luận nhân cho phép vận dụng tri thức người Câu hỏi “nếu làm sao”, “liệu chiến lược tác động nào” cần hiểu biết có sẵn Chúng vấn đề mà từ chất mang quan hệ nhân Ứng dụng cho chiến lược định giá hoàn toàn khả thi thực tiễn Dù doanh nghiệp hay nhỏ hộ kinh doanh nhỏ lẻ, định giá nghiệp vụ thiết yếu Định giá có nhiều phương pháp Khi áp dụng với mơ hình, phương pháp cho suy luận, định chiến lược khác Trong giai đoạn mà thương mại điện tử lên ngôi, cạnh tranh ngày khốc liệt Những yếu tố khoảng cách địa lý, mặt cửa hàng khơng cịn tác động q lớn đến định khách hàng Thị trường trở nên màu mỡ, hội trôi qua nhanh Một hệ thống gợi ý chiến lược kỳ vọng đóng vai trị thiết thực tương lai mang lại lợi lớn cho doanh nghiệp 1.6 Kết cấu luận văn Chương hai gồm nội dung lý thuyết thuật toán phương pháp chiến lược định giá Chương ba hệ thống hóa nhằm bao quát tình hình nghiên cứu năm gần Chương bốn tập trung trình bày cải tiến mơ hình Rừng Ngẫu Nhiên Trực Giao Sau đó, kết thử nghiệm thực nghiệm trình bày chương năm 10 Chương CƠ SỞ LÝ THUYẾT Chương trình bày sở lý thuyết liên quan đến suy luận nhân chiến lược định giá thương mại 2.1 Suy luận nhân 2.1.1 Hồi quy tuyến tính Phương pháp hồi quy tuyến tính áp dụng từ năm 1805 nhà nghiên cứu thống kê người Pháp Legendre Đáng ý, đến năm 1941, máy tính lập trình xuất Xét khía cạnh chất, hồi quy không lĩnh vực máy học Các đề xuất phương pháp hồi quy kinh điển đến từ thống kê kinh tế lượng Dù có hạn chế mặt công nghệ, nghiên cứu đương thời trở thành tảng cho phát triển mô hình sau rừng ngẫu nhiên, hồi quy ứng dụng mạng nơ-ron Mục tiêu hồi quy kiểm tra quan hệ biến cách cách tối thiểu giá trị lỗi (thường kí hiệu 𝜀) Mơ hình hồi quy tuyến tính thể phương trình bậc nhất: 𝑦 = 𝑎𝑥 + 𝜀 (1) Trong đó, 𝑥 ma trận cho biến độc lập, 𝑦 biến phụ thuộc/hệ quả, 𝜀 hệ số lỗi 𝑎 hệ số 𝑥 Hàm thực chất giả định mang tính tốn học, nhà phân tích biết 𝑦 biến đổi theo 𝑥 [1] Hồi quy tuyến tính giả định chúng có mối quan hệ đẳng thức đơn giản Nếu giá trị lỗi lớn, giải pháp hồi quy khác, với giả định hàm phức tạp cải thiện hiệu Đó lý hồi quy xem phương pháp kiểm tra bên cạnh mục đích dự đoán giá trị thường thấy bên máy học Đáng ý, hồi quy tuyến tính cịn sử dụng nhiều giảm thiểu tượng over-fitting 11 Chương KẾT LUẬN Phần trình bày kết luận khía cạnh đánh giá kết tổng qt, trình bày hạn chế cải tiến, hướng phát triển cải tiến nói riêng suy luận nhân chiến lược định giá nói chung 6.1 Kết luận Luận văn tập trung tổng qt hóa tình hình ứng dụng cơng trình nghiên cứu bật từ khoảng mười bốn năm trở lại đây, vốn giai đoạn nhiều mơ hình tiêu biểu xuất Để hiểu rõ lý thuyết, nhiều kiến thức đại số, thống kê, kinh tế lượng đề cập Dù chúng không phổ biến phạm vi khoa học máy tính nói chung mơ hình máy học suy luận nhân xem chúng sở lý luận Chúng không ràng buộc người dùng phải lựa chọn mơ hình máy học cụ thể Việc tự việc kết hợp với thành máy học kinh điển giúp trình tối ưu mơ hình linh hoạt Áp dụng vào chiến lược định giá đánh giá hợp lý, vốn nghiệp vụ phổ biến với doanh nghiệp dù quy mô lớn hay nhỏ Công trình đưa so sánh cải tiến thử nghiệm giả lập liệu liên tục thực tiễn Kết thử nghiệm giả lập cho thấy cải tiến đạt hiệu rõ rệt Ứng dụng giải pháp với liệu kinh doanh cho kết thuận lợi suy luận Việc thay đổi tham số bổ sung từ cải tiến 𝛽 giúp cải thiện mơ hình rõ rệt Tuy nhiên, thực tế có khó khăn khơng tồn thước đo xác, rõ ràng để đánh giá độ hiệu Dù vậy, thay đổi tham số giải pháp không tệ vừa tác động đến độ xác rõ rệt, vừa khơng ảnh hưởng đến thời gian học mơ hình 6.2 Hạn chế Bên cạnh lợi không ảnh hưởng tốc độ học, thuận tiện tinh chỉnh tìm tham số tối ưu, hạn chế cải tiến việc phụ thuộc nhiều vào hệ số tốc độ hội tụ giải pháp ước lượng từ đầu giá trị tương đối hiệu Giải pháp khắc 72 phục đánh giá dự đốn mơ hình dựa kinh nghiệm phương pháp kiểm tra mối quan hệ nhân phương pháp Granger 6.3 Hướng phát triển đề tài Suy luận nhân lĩnh vực tiềm Kế thừa trí tuệ nhân tạo đồng nghĩa mơ hình tổng qt hóa mơ hình máy học có sẵn, làm giảm bước định nghĩa mơ hình ban đầu thủ cơng Thay thực lý thuyết trị chơi, máy tính dựa liệu lịch sử để đưa dự đoán Lĩnh vực máy học nhân giải toán tối ưu định giá thuận lợi Mặt khác, rõ ràng cần thời gian để chứng minh khả Trong tương lai, áp dụng lý thuyết trò chơi hướng phát triển phù hợp Được biết vài cơng trình [39, 40] nghiên cứu năm gần kết hợp lý thuyết trị chơi với số mơ hình thịnh hành Generative Adversarial Network (GAN) Riêng với mơ hình ORF, cải tiến tương lai nhắm đến cải thiện phương pháp ước lượng hệ số điểm nhánh xây dựng ràng buộc sát với thực tế Cải tiến ước lượng nghiệm giúp tối ưu mơ hình với hay khơng có hệ số cần xác định ban đầu Sẽ tốt tồn phương pháp hay mơ hình ước tính hệ số tương đối từ ban đầu hiệu quả, rõ ràng thách thức thực với toán kiểu Như đề cập, chiến lược định giá mang tính tổng qt, áp dụng phạm vi cụ thể Ở tình hình nghiên cứu nay, suy luận nhân hỗ trợ củng cố có giả định nhân đặt Nhu cầu định giá tự động trở nên thiết thực, tình cảnh ngành thương mại điện tử, với chiến lược mua bán trao đổi [33], giao hàng hai phía [34] ngày phổ biến Đó kỳ vọng phát triển suy luận nhân với chiến lược định giá nói chung tương lai 73 TÀI LIỆU THAM KHẢO [1] Judea Pearl, “Causal inference in statistics: An overview”, Statistics Surveys, Vol 3, 2009, pp 96-146 [2] Tim James Smith, Pricing strategy: setting price levels, managing price discounts, & establishing price structures, 2012, Chapter 1, page [3] Tim James Smith, Pricing strategy: setting price levels, managing price discounts, & establishing price structures, 2012, Chapter 1, page 91 – 97 [4] Alan L Montgomery, “Creating Micro-Marketing Pricing Strategies Using Supermarket Scanner Data”, Marketing Science, Vol 16, No 4, 1997, pp 315337 [5] Aviv Nevo and Konstantinos Hatzitaskos, “Why Does the Average Price Paid Fall During High Demand Periods?”, 2006 [6] Xavier de Luna and Per Johansson, “Testing for the Unconfoundedness Assumption Using an Instrumental Assumption”, Journal of Causal Inference, Vol 2, No 2, 2014, pp 187-199 [7] Victor Chernozhukov, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian and Hansen, and Whitney Newey, “Double Machine Learning for Treatment and Causal Parameters”, CeMMAP working papers, 2016 [8] Susan Athey, Julie Tibshirani and Stefan Wager, “Generalized Random Forests”, The Annals of Statistics, Vol 47, No 2, 2019, pp 1148-1178 [9] Sören R Künzel, Jasjeet S Sekhon, Peter J Bickel, and Bin Yu, “Meta-learners for Estimating Heterogeneous Treatment Effects using Machine Learning”, Proceedings of the National Academy of Sciences, Vol 116, No 10, 2019, pp 4156-4165 [10] Xinkun Nie and Stefan Wager, “Quasi-Oracle Estimation of Heterogeneous Treatment Effects”, Oxford University Press’s Biometrika, 2020 [11] Miruna Oprescu, Vasilis Syrgkanis and Zhiwei Steven Wu, “Orthogonal Random Forest for Causal Inference”, Proceedings of the 36th International Conference on Machine Learning, 2019 74 [12] Jason Hartford, Greg Lewis, Kevin Leyton-Brown and Matt Taddy, “Deep IV: A Flexible Approach for Counterfactual Prediction”, Proceedings of the 34th International Conference on Machine Learning, 2017 [13] Lester Mackey, Vasilis Syrgkanis and Ilias Zadik, “Orthogonal Machine Learning: Power and Limitations”, Proceedings of the 35th International Conference on Machine Learning, 2018 [14] P M Robinson, “Semiparametric Econometrics: A Survey”, Wiley’s Journal of Applied Econometrics, Vol 3, No 1, 1988, pp 35-51 [15] Natalie Mizik and Dominique M Hanssens, Elgar’s Handbook of Marketing Analytics, 2018, Part II, section 6, pp 144 [16] Whitney K Newey, “Efficient Estimation of Models with Conditional Moment Restrictions”, Elsevier’s Handbook of Statistics, Vol 11 – Econometrics, 1993, pp 419-425 [17] Judea Pearl, Causal Inference in Statistics: A Primer, 2016, pp 16 [18] Whitney K Newey and James L Powell, “Instrumental Variable Estimation of Nonparametric Models”, The Econometric Society’s Econometrica, Vol 71, No 5, 2003, pp 1565–1578 [19] Guido W Imbens, “Instrumental Variables: An Econometrician’s Perspective”, Institute of Mathematical Statistics’s Statistical Science, Vol 29, No 3, 2014, pp 323-358 [20] Hal R Varian, “Causal Inference in Economics and Marketing”, Proceedings of the National Academy of Sciences, Vol 113, No 27, 2016, pp 7310-7315 [21] Supak Apitanawit, “Influence of the Samsung Galaxy Note 7’s battery problem On consumer perception and intention to purchase Samsung smartphone in the future”, Thammasat University, 2016 [22] Kaihua Tang, Yulei Niu, Jianqiang Huang, Jiaxin Shi and Hanwang Zhang, “Unbiased Scene Graph Generation from Biased Training”, Conference on Computer Vision and Pattern Recognition (CVPR), 2020 75 [23] Trevor J McDougall, and Simon J Wotherspoon, “A simple modification of Newton’s method to achieve convergence of order 1+√2”, Elsevier's Applied Mathematics Letters, Vol 29, 2014, pp 20-25 [24] Zhongyong Hu, Xiaoyan Ma, and Jing Li, “A Note on Chebyshev-Halley Method with Data Analysis” CSEE 2011: Springer’s Advances in Computer Science, Environment, Ecoinformatics, and Education, 2011, pp 481-484 [25] M A Hernández and M A Salanova, “A family of Chebyshev-Halley type methods”, International Journal of Computer Mathematics, Vol 47, 1993, pp 5963 [26] Lecture Notes on Advanced Econometrics Accessed on: Jul 20, 2020 [Online] Available: http://www3.grips.ac.jp/~yamanota/Lecture%20Note%208%20to%2010%202SL S%20&%20others.pdf [27] Jisheng Kou, Yitian Li and Xiuhua Wang, “A variant of super-Halley method with accelerated fourth-order convergence”, Elsevier's Applied Mathematics and Computation, Vol 186, 2007, pp 535-539 [28] Jisheng Kou, Yitian Li, “The improvements of Chebyshev–Halley methods with fifth-order convergence”, Elsevier's Applied Mathematics and Computation, Vol 188, 2007, pp 143-147 [29] MonaNaranga, SaurabhBhatiab, V.Kanwar, “New two-parameter ChebyshevHalley-like family of fourth and sixth-order methods for systems of nonlinear equations”, Elsevier's Applied Mathematics and Computation, Vol 275, 2016, pp 394-403 [30] M Rostami and H Esmaeili, "A modication of Chebyshev-Halley method free from second derivatives for nonlinear equations", Elsevier's Applied Mathematics and Computation, Vol 235, 2014, pp 221-225 [31] Janak Raj Sharma, "Improved Chebyshev–Halley methods with sixth and eighth order convergence", Elsevier's Applied Mathematics and Computation, Vol 256, 2015, pp 119-124 76 [32] Jisheng Kou, Yitian Li, "Modified Chebyshev–Halley methods with sixth-order convergence", Elsevier’s Applied Mathematics and Computation, Vol 188, 2007, pp 681–685 [33] Jingchen Liu, Xin Zhai, Lihua Chen, “Optimal Pricing Strategy under Trade-in Program in the Presence of Strategic Consumers”, Omega, Vol 84, pp 1-17, 2019 [34] Ling-Chieh Kung, Guan-Yu Zhong, "The optimal pricing strategy for two-sided platform delivery in the sharing economy", Elsevier’s Transportation Research, Vol 101, pp 1-12, 2017 [35] Elif Dogu, Y Esra Albayrak, "Criteria evaluation for pricing decisions in strategic marketing management using an intuitionistic cognitive map approach", Springer's Soft Computing, Vol 22, 2018, pp 4989–5005 [36] Liping Deng, Jin Che, Huan Chen, and Liang-Jie Zhang, "Research on the Pricing Strategy of the CryptoCurrency Miner’s Market", Springer's International Conference on Blockchain, 2018, pp 228-240 [37] James M Hunt and Howard Forman, "The role of perceived risk in pricing strategy for industrial products: a point-of-view perspective", Journal of Product & Brand Management, Vol 15, No 6, 2006, pp 386-393 [38] U.S Bureau of Labor Statistics, “Average Annual Pay by State and Industry, 1994”, 1995 [39] Barbara Franci and Sergio Grammatico, "A game–theoretic approach for Generative Adversarial Networks", 2020 59th IEEE Conference on Decision and Control (CDC), 2020, pp 1646-1651 [40] Akshat Kishorea, Anupam Kumarb, and Nobel Dang, "Enhanced Image Restoration by GANs using Game Theory", Elsevier's Procedia Computer Science, Vol 173, 2020, pp 225-233 [41] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, 2019, Chapter 1, page 10 [42] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, 2019, Chapter 3, page 147 77 [43] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, 2019, Chapter 1, page 11 [44] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, 2019, Chapter 1, page 35 [45] Weisstein, Eric W "Statistical Correlation." From MathWorld A Wolfram Web Resource https://mathworld.wolfram.com/StatisticalCorrelation.html [46] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, 2019, Chapter 4, page 218 [47] Deborah M Todd, "Galaxy Note recall did not damage Samsung brand in U.S.: Reuters/Ipsos poll", Reuters, 2016 https://www.reuters.com/article/us-samsungelec-recall-brand-idUSKBN13F146 [48] Dominick's Dataset - Kilts Center, Chicago Booth Accessed on: May 30, 2020 [Online] Available: https://www.chicagobooth.edu/research/kilts/datasets/dominicks 78 BÀI BÁO ÁP DỤNG CÁC KỸ THUẬT SUY LUẬN NHÂN QUẢ TRONG CHIẾN LƯỢC ĐỊNH GIÁ Applying Causal Inference Techniques to Pricing Strategies Le Minh Tan1, Le Van Vinh2 Học viên trường đại học Sư phạm Kỹ thuật TP.HCM Trường đại học Sư phạm Kỹ thuật TP.HCM TÓM TẮT Ứng dụng máy học vào lĩnh vực suy luận nhân dần trở nên phổ biến Trong năm vừa qua, có nhiều phương pháp đề xuất ý Chúng có mục tiêu chung ước lượng hiệu ứng liệu pháp để giải toán mà mơ hình máy học truyền thống xem không phù hợp Bài báo đặt mục tiêu cải tiến phương pháp Rừng Ngẫu Nhiên Trực Giao hiệu trình bày vào năm 2019 ứng dụng vào toán chiến lược định giá Một cách ngắn gọn, thay thực tính tốn điểm số dựa giả thiết hàm mơ-men xác, mơ hình ước lượng sử dụng Giải pháp xuất phát từ ý tưởng hệ số lỗi tập mẫu tuyệt đối liên quan đến mơ-men gia tăng q trình phân chia tập liệu Vì vậy, việc tính tốn điểm xác bỏ qua trường hợp Đề xuất giúp cải thiện mơ hình theo hướng tốn so sánh với việc tăng số nhiều giải pháp khác vốn thường ảnh hưởng tốc độ học Các thử nghiệm với liệu giả lập liệu thực thực nghiệm để đánh giá hiệu mơ hình việc giải tốn gợi ý chiến lược định giá vốn đề cao việc tối ưu hóa lợi ích doanh nghiệp Từ khóa: Suy luận nhân quả, Rừng Ngẫu Nhiên Trực Giao, ước lượng nghiệm, máy học, kinh tế lượng, chiến lược định giá ABSTRACT Machine Learning usage in causal Inference is being popular lately In the last years, some proposed methods have been highly noticed Those have the same purpose of estimating treatment effect to deal with problems that traditional models are concerned unsuitable This paper aimed to improve the highly effective Orthogonal Random Forest which was introduced in 2019 and apply to pricing strategy problems In short, instead of calculating scores based on moment function assumption precisely, we would like to use estimation This comes from the idea that absolute sampling errors related to the moment may increase while splitting data Therefore, exact score finding can accidentally skip those Moreover, the solution supports in tuning the model with low cost comparing with tree increments or some other solutions, which usually harm the training speed Simulated data as well as real data were tested to see how effective the model was in solving pricing strategies problems Keywords: Causal inference, Orthogonal Random Forest, Root estimation, Machine learning, Econometrics, Pricing strategies GIỚI THIỆU Chiến lược định giá gồm phương pháp thiết lập giá sản phẩm/dịch vụ cho tối ưu hóa lợi nhuận Định giá chìa khóa mang đến thành cơng, hồn tồn khơng dễ để thực phụ thuộc vào yếu tố chi phí sản xuất, chất sản phẩm,… Một ví dụ tiêu biểu kiện liên quan đến điện thoại Samsung Galaxy Note năm 2016 Vì lỗi kỹ thuật pin, báo cáo cho thấy điện thoại có khả phát nổ, gây nguy hiểm đến người dùng Một năm sau, Samsung mắt Galaxy Note Fan Edition (FE) với cấu hình giá tương đương với tiền 79 nhiệm Đây hời với khách hàng Tuy nhiên, xét mẫu điện thoại đời sau Note 8, giá trị chúng giảm đến 44% sau năm mắt FE sản phẩm đánh vào khách hàng trung thành không đơn điện thoại tân trang Dữ liệu cho thấy có đến 91% người dùng Samsung Mỹ có khuynh hướng mua điện thoại hãng [1] Có sở để nói cơng ty xét đến trung thành, thương hiệu nhiều yếu tố khác trước định giá Về mặt lý thuyết, có nhiều chiến lược định giá Bài tập trung chiến lược định giá tâm lý sử dụng số giá trị khơng làm trịn định giá giảm phổ biến Bằng câu từ, hàm hiểu hệ có liệu pháp trừ cho hệ khơng có liệu pháp hiệu ứng đơn vị Trong thực tế, người ta quan tâm đến hệ số hiệu ứng liệu pháp trung bình, vốn phản ánh hiệu ứng mang tính tổng quát [3]: Suy luận nhân nhiều phương pháp hiệu ứng dụng chiến lược định giá Mục đích để ước lượng hiệu ứng hệ tác nhân thay đổi cách khai thác mối quan hệ nhân Những mối quan hệ mức cao tương quan thường thể thông qua sơ đồ quan hệ Ở thời kỳ đầu, mơ hình hồi quy mong đợi giải tốn Chúng thường hiệu với liệu chiều, dẫn đến kết luận khơng biến có mối tương quan thay quan hệ nhân Một thời gian sau, nghiên cứu sâu vào việc khai thác tính nhân Có thể kể đến đề xuất liên quan đến Khoa Học Máy Tính thuộc nhóm unconfoundedness Double Machine Learning (DML) [4], mơ hình dựa rừng, nhóm meta-learners,… phương pháp ước lượng biến điều khiển: Hồi quy Two-Stage Least Squares [5] [6], Deep IV (2017) [7] Nhóm unconfoundedness, sử dụng mơ hình nhân hình 1, phát triển so với ước lượng biến điều khiển Nhóm đặt giả định biến nhiễu W đầy đủ quan sát liệu Khác với biến nhiễu, việc thu thập phân loại biến điều khiển thực khó khăn chúng thường khơng ổn định Các biến trở thành biến điều khiển thuyết phục, có lúc tính chất trở nên mơ hồ, khiến mối liên kết biến điều khiển phần cịn lại khơng rõ ràng Vậy nên, mơ hình thuộc nhóm ước lượng IV đặt giả định tồn biến điều khiển vững Từ vấn đề vừa đề cập, nhìn chung, phương pháp sử dụng biến điều khiển đánh giá nhiều triển vọng ứng dụng lĩnh vực kinh tế [8] 𝐴𝑇𝐸 = 𝐸[𝑌|𝐷 = 1] − 𝐸[𝑌|𝐷 = 0] Kỳ vọng 𝐸 dự đốn mơ hình máy học, trường hợp này, giá trị trung bình ATE xác định tham số thống kê, tức phản ánh ATE toàn tập hợp Các thuật toán suy luận nhân dự đoán tham số hiệu ứng nêu đóng vai trị góp ý cho người đưa định mang tính chiến lược, liệu pháp Hình 21.Sơ đồ nhân có tham gia biến nhiễu W Trong sơ đồ trên, W biến nhiễu, D biến liệu pháp/chiến lược, X biến giải thích/độc lập Y hệ quả/biến phụ thuộc Với hiệu ứng đối tượng, hiệu ứng liệu pháp đơn vị tính [2]: 𝑈𝑇𝐸(𝑌) = 𝑌(𝐷 = 1) − 𝑌(𝐷 = 0) (2) Nhóm dựa rừng bao gồm mơ hình dựa phương pháp rừng Khởi đầu Rừng (1) 80 Điểm số nhánh tính tính nghiệm Newton: Ngẫu Nhiên Tổng Quát - Generalized Random Forests [9] vốn lấy rừng ngẫu nhiên Breiman (2001) làm sở khái niệm Rừng Nhân Quả đời Điểm yếu bật giải pháp hiệu thực biến nhiễu nhiều chiều Rừng Ngẫu Nhiên Trực Giao – Orthogonal Random Forest (ORF) [10] đề xuất vào năm 2019 dựa Rừng Ngẫu Nhiên DML Thử nghiệm giả lập báo chứng minh thuật toán hiệu Một điểm mạnh ORF tính linh hoạt: Bản chất DML hàm tham chiếu với hàm bên phi tham chiếu nên DML xếp vào nhóm mơ hình bán tham chiếu Mơ hình rừng ORF dạng phi tham chiếu mà việc chia nhánh thực DML Tính linh hoạt giúp ORF giải tập liệu phức tạp, nhiều chiều 𝜌= CẢI TIẾN 2.1 Bổ sung hệ số lỗi dựa hàm phi tuyến tính Nhiều mơ hình ước lượng nghiệm phi tuyến tính đề xuất Nhiều giải pháp yêu cầu phương trình bậc cao để đổi lại tốc độ hội tụ, số lại không đặt yêu cầu Điều kiện mô-men nâng lên bậc hai Vì vậy, nhóm khơng yêu cầu bậc cao có tốc độ lớn bậc hai (tốc độ Newton) chọn Ước lượng nghiệm áp dụng vào ORF có dạng: Điều kiện mơ-men ORF có dạng [9]: (3) Ở đây, mơ-men có giá trị kỳ vọng 𝑇̃, 𝑌̃ phần dư liệu pháp hệ Từ định nghĩa có 𝑇̃ = 𝑇 − 𝐸[𝑇|𝑋, 𝑊] 𝑌̃ = 𝑌 − 𝐸[𝑌|𝑋, 𝑊] Gọi Hàm tính điểm 𝜓(𝜃), 𝜓(𝜃) xét theo mô-men trở thành: 𝜓(𝜃) = 𝑌̃𝑇̃ − 𝜃𝑇̃ 𝜃𝐶 = 𝜃𝑃 − 𝜌(𝜃𝑃 ) 𝜓 ̅̅̅̅̅ 𝛻𝜃 𝜓 (8) Ta nâng bậc mơ-men ban đầu thành hàm bình phương để tồn đạo hàm bậc hai: (4) Mục đích tìm 𝜃 phù hợp để giảm 𝜓 So với 𝜓(𝜃0 ), với 𝜃0 nút cha, 𝜃 phù hợp cho 𝜓(𝜃) cho |𝜓(𝜃0 ) − 𝜓(𝜃)| lớn Trong ORF, với nút chuẩn bị chia, thuật toán đề xuất ngẫu nhiên 𝑛 cách chia, gồm thuộc tính ngưỡng Tính nghiệm Newton ORF dùng có dạng: 𝜃 = 𝜃0 − (6) Điểm đề xuất trung bình cộng điểm hai nhánh 𝜌𝑖1 + 𝜌𝑖2 (7) 𝜌𝑖 = Tính nghiệm tác động tích cực đến độ xác hiệu năng, việc tính 𝜃 DML không cần thiết Tuy nhiên, chia nhỏ liệu liên tục, hệ số lỗi xây dựng tập mẫu phát sinh có xu hướng tăng nhanh đáng kể Lúc này, 𝜃 khơng cịn phản ánh tham số tập mẫu ban đầu hay quần thể Ý tưởng kết hợp ORF với giải pháp ước lượng nghiệm Từ đó, giá trị lỗi phụ thuộc vào mơ hình ước lượng thêm vào khơng phủ định phương trình mơ-men ban đầu Trong q trình học, ORF xây dựng rừng bao gồm nhiều nhị phân Việc chia tách nút vấn đề chia tập liệu thành tập ứng với nút cần phải đạt hiệu Mơ hình tính tốn điểm cách ước lượng chênh lệch hiệu ứng liệu pháp trung bình nút cha nút Đề xuất cải tiến dựa ý tưởng việc ước lượng điểm ước lượng nghiệm hiệu tính tốn nghiệm xác 𝐸[𝑌̃𝑇̃ − 𝜃𝑇̃ ] = 𝜓 𝜓 = ′ ̅̅̅̅̅ ̅̅̅ 𝛻 𝜓 𝜃𝜓 𝑓(𝜃) = 𝜃𝜓(𝜃) = 𝑌̃𝑇̃𝜃 − 𝜃 𝑇̃ (9) 𝑓 ′ (𝜃) = 𝑌̃𝑇̃ − 2𝜃𝑇̃ 𝑓 ′′ (𝜃) = −2𝑇̃ (10) (11) Bước tạo thêm nghiệm 𝜃 = Giải pháp với lần ước lượng, thuật tốn cần phải tìm thêm đường phân chia có dạng 𝑥 = 𝑛 kiểm tra 𝜃 nằm phía hội tụ hay nghiệm xác Phần đề cập kỹ phần sau (5) 81 Hầu hết phương pháp ước lượng nghiệm hội tụ nhanh Newton gốc Với phương trình bậc hai đơn giản, tốc độ nhanh không đảm bảo hiệu cải thiện theo Trong báo này, hai phương pháp chọn Chebyshev-Halley với tốc độ hội tụ mũ Newton Cải Tiến hội tụ mức + √2 Ước lượng nghiệm khơng đưa kết xác Gọi giá trị lỗi phát sinh 𝜀 Với đề xuất ước lượng nghiệm, |𝜀| lớn theo chênh lệch 𝜃𝑃 𝜃 màu xanh thể hàm trung gian nâng bậc hai từ điều kiện mô-men, với điểm A B có 𝑥 𝜃 nút cha Khoảng cách hai điểm sai số phương pháp ước lượng nghiệm gây Bước xác định điểm hội tụ quan trọng, nhằm tránh trường hợp nghiệm không với hàm bậc ban đầu 2.2 Ước lượng nghiệm Chebyshev – Halley Cùng với Newton, Chebyshev – Halley [11] [12] phương pháp ước lượng nghiệm kinh điển Hàm tính điểm có dạng: 𝜌 = (1 + 0.5 𝑔(𝜃0 ) 𝑓(𝜃0 ) ) ′ − 𝛽𝑔(𝜃0 ) 𝑓 (𝜃0 ) (12) Với 𝑔(𝑥0 ) định nghĩa: 𝑔(𝑥0 ) = 𝑓(𝑥0 ) 𝑓′′(𝑥0 ) 𝑓′(𝑥0 ) Hình 22.Đồ thị 𝜌𝑔 𝜌𝑓 (13) Để tránh trường hợp hội tụ 0, cần xác định hàm có dạng 𝑥 = 𝑥𝑑𝑖𝑣 tạo nên đường thẳng phân chia song song trục 𝑂𝑦 Sau đó, dựa vị trí 𝑥 = 𝜃, xác định điểm 𝑓(𝜃 ) hội tụ 𝜃 Xét 𝑥 = 𝑛 = (𝑓′(𝜃0 ) → ∞) Từ 𝛽 hệ số xác định ban đầu thường số tự nhiên: Chebyshev – Halley kinh điển 𝛽 = 0, phương pháp Halley với 𝛽 = 0.5 siêu Halley 𝛽 = Tuy nhiên, hệ số tùy chỉnh mà khơng ảnh hưởng đến việc tính tốn Thử nghiệm tiến hành với 𝛽 = 𝛽 = lần chạy thử trước cho thấy mơ hình khơng hiệu với 𝛽 < 𝜀 định nghĩa: 𝜀(𝜃0 ) = 0.5 𝑔(𝜃0 ) 𝑓(𝜃0 ) − 𝛽𝑔(𝜃0 ) 𝑓 ′ (𝜃0 ) đó, tính được: 𝑌̃𝑇̃ (15) 2𝑇̃ Nếu 𝑥𝑑𝑖𝑣 > 𝜃0 ≤ 𝑥𝑑𝑖𝑣 , 𝑥𝑑𝑖𝑣 < 𝜃0 ≥ 𝑥𝑑𝑖𝑣 , 𝑥𝑑𝑖𝑣 = sử dụng tính nghiệm Newton Cơng thức dùng cho phương pháp Chebyshev – Halley Newton Cải Tiến đề cập mục sau Ở ví dụ phía dưới, đường màu xanh dương thể hàm điểm 𝜌 Chebyshev – Halley Trong đó, đường màu xanh hàm tính điểm 𝜌 Newton Cải Tiến Cả hai phương pháp áp dụng cơng thức 𝑥𝑑𝑖𝑣 vẽ đường thẳng 𝑥 = 𝑥𝑑𝑖𝑣 = (14) 𝛽 tăng, tốc độ tiệm cận cải thiện Từ hàm trên, nhận thấy 𝛽 tăng 𝜀 giảm Ngồi ra, 𝜀 = 0, trở lại mơ hình Newton hàm bậc 𝛽 → ∞ Vì vậy, 𝛽 vừa đủ lớn giúp cải thiện hiệu hiệu quả, đặc biệt so sánh với phương pháp truyền thống tăng cây, số lượng rừng, giảm ngưỡng vốn làm chậm tốc độ học hay dự đốn Dù áp dụng mơ hình ước lượng nghiệm 𝜃 ≠ có ý nghĩa với tốn Ảnh ví dụ bên vẽ đường màu cam ứng với điều kiện mơ-men ban đầu đường 82 𝑋 có kích thước 𝑛 × 3, 𝜃(𝑥) bằng: 𝑥1 + 3𝑥2 𝑘ℎ𝑖 𝑥1 ≤ 0.3 [2𝑥1 + 𝜎(𝑥2 + 0.5) 𝑘ℎ𝑖 0.3 < 𝑥1 ≤ 0.6 (24) 2𝑥1 + 𝑥3 𝑘ℎ𝑖 𝑥1 > 0.6 (25) + 𝑒 −𝑥 Dữ liệu gồm 5000 ghi Trong đó, có 3500 hàng dành cho việc học Thử nghiệm với số đặc trưng nhiễu 𝑛 25 50 Kích thước support, hay lượng thuộc tính nhiễu thực tham gia tính 𝑇, tăng dần 1, 15 20 với 𝑛 = 25 mức 1, 15, 20, 25, 35, 45 với 𝑛 = 50 Mỗi thử nghiệm với tham số khởi tạo liệu chạy 100 lần 𝜎(𝑥) = Hình 23.Trong ví dụ này, Đường phân cách thẳng dọc 𝑥 = 1, vng góc với trục Ox tách thành hai miền có điểm hội tụ khác 2.3 Newton Cải Tiến Dữ liệu Dominick’s Finer Foods scanner [14] dùng báo Thử nghiệm áp dụng chiến lược định giá tâm lý định giá giảm Dữ liệu cho định giá tâm lý thực theo quy tắc sau: Nếu giá có dạng *.99, *.9, *.5, hệ 𝑇 = 𝑇 = ngược lại Với định giá giảm, xét thuộc tính deal làm sở Thử nghiệm xét sản phẩm nước cam Tropicana 64 oz làm mục tiêu Xác định biến nhiễu dựa ý nghĩa thuộc tính, gồm: age60, educ, ethnic, income, hhlarge, workwom, hval150, sstrdist, cpdist5 Sản lượng (sales) hệ Hệ số lỗi đánh giá mơ hình gồm Mean Average Error (MAE), Mean Squared Error (MSE) Average Treatment Effect Error (ATEE) tức lỗi tính tốn hiệu ứng trung bình ATE Nhiều phương pháp khơng cần nâng bậc cải thiện tốc độ Newton Cải Tiến [13] số Dựa Newton gốc kết hợp với phương pháp hai bước dự đốn – chỉnh sửa, 𝑓′′(𝜃) trở nên khơng cần thiết Tuy vậy, việc nâng bậc đề cập ban đầu cần phải thực 𝜌=− 𝑓(𝜃0 ) 𝑓(𝜃1 ) 𝑓(𝜃0 ) − 𝑓(𝜃1 ) (16) − ′ = ′ 𝑓 (𝜃0 ) 𝑓 (𝜃0 ) 𝑓 ′ (𝜃0 ) 𝜃1 xác định là: 𝜃1 = 𝜃0 − 𝑓(𝜃0 ) 𝑓 ′ (𝜃0 ) (17) Newton Cải Tiến chứng minh có tốc độ hội tụ + √2 ≈ 2.414, tức nhanh Newton, chậm Chebyshev-Halley Giá trị lỗi 𝜀 phương pháp là: 𝜀(𝜃0 ) = − 𝑓(𝜃1 ) 𝑓 ′ (𝜃0 ) Về cấu hình, mơ hình sử dụng 200 cây, độ cao/sâu tạo 20, số lượng đề xuất chia nhánh 1000, ngưỡng chia tối đa 50, số tối thiểu 100 Ngồi mơ hình ORF gốc dùng Newton bậc một, ba mơ hình ước lượng nghiệm gồm Chebyshev – Halley (𝛽 = 2), Chebyshev – Halley (𝛽 = 3) Newton Cải Tiến (18) THỰC NGHIỆM Hai thử nghiệm tiến hành cho liệu giả lập liệu thật Mơ hình khởi tạo liệu giả lập theo mơ hình tham khảo: 𝑌 = 𝜃0 (𝑥)𝑇 + ⟨𝑊, 𝛾⟩ + 𝜀 (19) 𝑇 = ⟨𝑊, 𝛽⟩ + 𝜂 (20) 𝑋, 𝛽, 𝛾~𝑈[0,1] (21) 𝑊~𝑁[0, 𝐼𝑝 ] (22) 𝜀, 𝜂~𝑈[−1,1] (23) Thử nghiệm giả lập cho thấy với 𝑛 = 25, số MAE ATEE cho thấy có phương pháp ước lượng nghiệm giảm hệ số lỗi so với giải pháp gốc Xét đến MSE, giá trị lỗi có tăng khơng hiệu Newton không, đặc biệt với support = 15 support = 20 Tuy nhiên, hệ số hiệu ứng ATE 83 tính bậc một, việc ATE giảm có lợi trường hợp Hệ số phần trăm tỉ lệ tăng hay giảm hệ số lỗi so với phương pháp Newton ban đầu Dấu dương tức hệ số lỗi tăng âm ngược lại Các giá trị in đậm hệ số lỗi giảm Dựa vào kết trên, Chebyshev – Halley (𝛽 = 3) phù hợp với liệu so với phương pháp ước lượng nghiệm khác Kết với giả lập 𝑛 = 50 tương đồng, MAE ATEE đề xuất trội Nhưng lúc này, Newton cải tiến đánh giá ổn hơn, giảm lỗi ATE giá trị support Mức giảm tốt 16.04%, thấp 0.07% Như vậy, mơ hình ước lượng nghiệm chọn hiệu hay khơng cịn tùy thuộc vào liệu học Bảng 17.Phần trăm tăng hay giảm hệ số lỗi MAE so với Newton gốc Chebyshev – Halley Newton Cải Tiến 𝛽 Sup.1 -7.41% -10.92% +1.19% Sup.15 +0.38% -0.20% -0.21% Sup.20 +3.37% -0.65% +2.78% Thực nghiệm với liệu thật cho thấy kết không khác biệt nhiều suy luận tổng quan dựa dự đoán Newton cải tiến cho nhìn rõ ràng nhất, cho thấy liệu phù hợp với cải tiến Với liệu thật, khơng thể tính tốn hệ số đánh giá mơ hình, hiệu ứng nhân khơng có liệu ban đầu Bảng 18.Phần trăm tăng hay giảm hệ số lỗi MSE so với Newton gốc – Halley Newton Cải Tiến 𝛽 Sup.1 -5.38% -9.74% -16.19% Sup.15 +3.24% +0.98% +6.48% Sup.20 +9.60% +0.86% +12.97% Hiệu ứng Chebyshev Bảng 19.Phần trăm tăng hay giảm hệ số lỗi tuyệt đối ATE so với Newton gốc – Halley Hình 24.Hiệu ứng đơn vị chiến lược định giá tâm lý dự đoán Newton gốc Newton Cải Tiến 𝛽 Sup.1 -11.47% -13.91% -7.27% Sup.15 +0.19% -0.24% -0.80% Sup.20 +3.27% -0.69% +2.34% Hiệu ứng Chebyshev Workwom 84 Dự đoán cho chiến lược định giá giảm cho thấy hiệu ứng ổn định, có xu hướng giảm workwom tăng, giảm mạnh workwom mức từ 45% Trường hợp này, doanh nghiệp áp dụng chiến lược giảm giá trọng tâm khu vực có tỉ lệ phụ nữ có việc làm toàn thời gian 45% KẾT LUẬN Có thể nhận thấy việc đưa chiến lược có yếu tố chủ quan người Các mơ hình suy luận nhân đóng vai trị gợi ý định chiến lược tự đưa định thay người Ngoài chất liệu, chủ động từ người xác định trước chiến lược định giá giúp ích nhiều Workwom Hình 25.Hiệu ứng đơn vị chiến lược định giá tâm lý dự đốn Newton Cải Tiến Với tiêu chí đảm bảo hiệu ứng mức cao ổn định, chiến lược đưa lựa chọn khu vực có tỉ lệ nữ giới có việc làm tồn thời gian (workwom) 35% Hiệu ứng Rừng Ngẫu Nhiên Trực Giao mơ hình cịn hiệu Phương pháp đề xuất đạt mục tiêu cải thiện độ xác mà khơng đánh đổi tốc độ học mơ hình Kết từ thực nghiệm cho thấy tốc độ hội tụ định độ hiệu cải tiến Đối với liệu cụ thể, độ hiệu khác Vậy nên, việc lựa chọn Chebyshev – Halley, Newton cải tiến hay mơ hình khác cần phải xem xét, đánh giá dựa thử nghiệm Đây cơng việc khó khăn, tốn nhiều thời gian nên xem hạn chế phương pháp Với phát triển lĩnh vực kinh tế lên gần đây, chiến lược định giá trở thành công việc thiết yếu có yếu tố định với doanh nghiệp lớn, vừa nhỏ Các hình thức kinh doanh sau mua bán trao đổi [15], giao hàng hai phía [16] địi hỏi việc xác định giá nhanh xác Đó sở kỳ vọng cho phát triển suy luận nhân với chiến lược định giá nói chung tương lai Workwom Hiệu ứng Hình 26.Hiệu ứng đơn vị chiến lược định giá giảm dự đoán Newton gốc LỜI CẢM ƠN Xin cảm ơn Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh Ý kiến đóng góp, phản biện q Thầy Cơ nhà trường tiền đề để chúng tơi hồn thành cơng trình Workwom Hình 27.Hiệu ứng đơn vị chiến lược định giá giảm dự đoán Newton Cải Tiến 85 TÀI LIỆU THAM KHẢO [1] Deborah M Todd, Galaxy Note recall did not damage Samsung brand in U.S.: Reuters/Ipsos poll, Reuters, 2016 https://www.reuters.com/article/us-samsung-elecrecall-brand-idUSKBN13F146 [2] Whitney K Newey, Efficient Estimation of Models with Conditional Moment Restrictions, Elsevier’s Handbook of Statistics 11, pp 419-425, 1993 [3] Fröhlich, Markus, Sperlich, and Stefan, Impact evaluation, treatment effects and causal analysis, Cambridge University Press, first published, pp 147, 2019 [4] Victor Chernozhukov, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian and Hansen, and Whitney Newey, Double Machine Learning for Treatment and Causal Parameters, CeMMAP working papers, 2016 [5] Guido W Imbens, Instrumental Variables: An Econometrician’s Perspective, Institute of Mathematical Statistics’s Statistical Science 29, No 3, pp 323-358, 2014 [6] Lecture Notes on Advanced Econometrics Accessed on: Jul 20, 2020 [Online] Available: http://www3.grips.ac.jp/~yamanota/Lecture%20Note%208%20to%2010%202SLS%20& %20others.pdf [7] Jason Hartford, Greg Lewis, Kevin Leyton-Brown and Matt Taddy, Deep IV: A Flexible Approach for Counterfactual Prediction, Proceedings of the 34th International Conference on Machine Learning, pp 1414-1423, 2017 [8] Natalie Mizik and Dominique M Hanssens, Elgar’s Handbook of Marketing Analytics, Edward Elgar Publishing Limited, first published, pp 144, 2018 [9] Susan Athey, Julie Tibshirani and Stefan Wager, Generalized Random Forests, The Annals of Statistics 47, No 2, pp 1148-1178, 2019 [10] Miruna Oprescu, Vasilis Syrgkanis and Zhiwei Steven Wu, Orthogonal Random Forest for Causal Inference, Proceedings of the 36th International Conference on Machine Learning, pp 4932-4941, 2019 [11] Zhongyong Hu, Xiaoyan Ma, and Jing Li, A Note on Chebyshev-Halley Method with Data Analysis CSEE 2011: Springer’s Advances in Computer Science, Environment, Ecoinformatics, and Education, pp 481-484, 2011 [12] M A Hernández and M A Salanova, A family of Chebyshev-Halley type methods, International Journal of Computer Mathematics 47, pp 59-63, 1993 [13] Trevor J McDougall, and Simon J Wotherspoon, A simple modification of Newton’s method to achieve convergence of order 1+√2, Elsevier's Applied Mathematics Letters 29, pp 20-25, 2014 [14] Dominick's Dataset - Kilts Center, Chicago Booth Accessed on: May 30, 2020 [Online] Available: https://www.chicagobooth.edu/research/kilts/datasets/dominicks [15] Jingchen Liu, Xin Zhai, Lihua Chen, Optimal Pricing Strategy under Trade-in Program in the Presence of Strategic Consumers, Omega 84, pp 1-17, 2019 [16] Ling-Chieh Kung, Guan-Yu Zhong, The optimal pricing strategy for two-sided platform delivery in the sharing economy, Elsevier’s Transportation Research 101, pp 1-12, 2017 Tác giả chịu trách nhiệm viết: Họ tên: Lê Minh Tân Đơn vị: Khơng có Điện thoại: 0932.751.620 86 ... liên quan đến suy luận nhân chiến lược định giá thương mại 2.1 Suy luận nhân 2.1.1 Hồi quy tuyến tính Phương pháp hồi quy tuyến tính áp dụng từ năm 1805 nhà nghiên cứu thống kê người Pháp Legendre... với giá thành chúng Nghiên cứu thực thực nghiệm chiến lược định giá phân biệt dựa liệu giảm giá định giá tâm lý Để đảm bảo hiệu quả, biến liệu pháp xét chiến thuật cụ thể để tránh trường hợp chiến. .. giá 2.2.2.1 Định giá đời sống Chiến lược định giá gồm phương pháp thiết lập giá sản phẩm/dịch vụ cho tối ưu hóa lợi nhuận Định giá trình thiết yếu định nhiều đến thành công phức tạp Trong lúc cân

Ngày đăng: 15/03/2022, 21:53

Tài liệu cùng người dùng

Tài liệu liên quan