Cửa hàng bán hàng trực tuyến kinh doanh thương mại điện tử
Data MiningFinal ReportClassification – Ebook Store Member of Group•Lê Hoàng Việt•Lê Anh Văn Outline•Tìm hiểu đề tài•Các giải thuật Data Mining•Giải thuật Classification•Thực hiện chương trình•Tổng kết •Reference Tìm hiểu đề tài•Requirement: Cho CSDL bán hàng của cửa hàng sách trực tuyến, phân loại khách hàng thành các dạng khách hàng tiềm năng khác nhau. Tìm hiểu đề tài•Cần lấy được cơ sở dữ liệu về khách hàng đã mua sách của cửa hàng và làm sạch dữ liệu.•Cần xác định phương pháp dùng để khai phá dữ liệu.•Xác định tiêu chí phân loại.•Xác định kết quả phân loại.•Kiểm tra kết quả training với dữ liệu mẫu. •Cửa hàng sách trực tuyến: là một website trình bày các loại sách cho phép người mua thông qua mạng Internet để xem, chọn mua, thanh toán qua mạng và được giao tận nơi. CSDL của cửa hàng bán sách như vậy sẽ lưu trữ lại các thông tin, dữ liệu chi tiết về các loại sách, những khách hàng đã đặt mua, đã chọn xem(có thể có hoặc không) và các thông tin liên quan…. •Lợi ích(kết quả) của cửa hàng(End User):•Giảm chi phí mua không hiệu quả(ví dụ sách ít người đọc, ít người mua, bán chậm hoặc tồn kho…).•Lợi nhuận tăng(nhiều người mua nhiều độ tuổi, nhiều thể loại, nhiều người vào website tham khảo…do đưa ra những gợi ý liên quan hiệu quả cho người dùng phù hợp).•Hiển thị kết quả(thống kê, dự báo), gợi ý trực quan góp phần vào quyết định hướng đi đúng đắn(chiến lược kinh doanh thời gian tới, nguồn hàng nào cần tăng, nguồn hàng nào cần giảm bớt…).•Quản lý dữ liệu một cách hiệu quả hơn. •Kết quả đạt được(dự định của sinh viên):•Nắm vững lý thuyết, giải thuật phân lớp(Classification).•Xây dựng phần mềm thực hiện được các chức năng:–Đọc dữ liệu đầu vào(kết nối CSDL hoặc đọc từ file)–Máy học(huấn luyện)–Chạy giải thuật đúng đắn.–Đưa ra kết quả + dự báo + gợi ý(nếu có thể).–Kết xuất trực quan kết quả.•Hoàn thành mục tiêu môn học với phần mềm thực hiện chức năng cụ thể. Outline•Tìm hiểu đề tài•Các giải thuật Data Mining•Giải thuật Classification•Thực hiện chương trình•Tổng kết •Reference Các giải thuật Data Mining [...]... buys(X; “computer”) => buys(X; “software”) [support = 1%; confidence = 50%] • X: biến biểu diễn khách hàng Độ chắc chắn(confidence) 50% là khách hàng X sẽ mua máy tính(computer) thì sẽ mua phần mềm(software)… 1% support thể hiện tỉ lệ mua máy tính và mua phần mềm cùng nhau trong tất cả quá trình mua hàng • Phân lớp: là quá trình tìm mẫu(model) thích hợp mà mô tả và phân biệt các lớp dữ liệu và các... khách hàng customer thuộc lớp C… • return calculate(customer.Cust_Sex, C) *calculate(customer.Cust_Major, C)*calculate(customer.Cust_Country, C)*calculate(age, C) – Calculate(Customer.xi, Class C): • Xác xuất khách hàng mang thuộc tính xi thuộc lớp C… • Return total(class C, xi) / total(class C) – Total(class C): tính số lượng thực thể thuộc lớp C • Total(class C, Customer.xi): số lượng khách hàng mang... giải thuật Data Mining • Giải thuật Classification • Thực hiện chương trình • Tổng kết • Reference Thực hiện chương trình – Core: • Class Customer: lớp khách hàng này lấy thông tin từ input(người dùng đưa vào) để khai phá dữ liệu…Thông tin khách hàng do mình nhập vào và dùng lớp nào để lưu trữ các thông tin đó để tiến hành phân loại… Thông tin đó chỉ cần lưu trữ các thuộc tính cần cho quá trình phân... thành phần trong enum TypeCustomerClass… • • • Lớp classification: tính xác xuất của khách hàng mang tuple X với từng class C rồi tiến hành phân loại: • CustomerClass: gồm tất cả class tham gia vào quá trình phân loại • Classification(Customer customer): – Tìm ra lớp thích hợp nhất(xác xuất cao nhất) để đặt khách hàng customer vào – Với mỗi lớp Ci trong list L tính giá trị: Pi = NaiveBayes.Calculate(class . •Reference Tìm hiểu đề tài•Requirement: Cho CSDL bán hàng của cửa hàng sách trực tuyến, phân loại khách hàng thành các dạng khách hàng tiềm năng khác nhau. Tìm hiểu. định kết quả phân loại.•Kiểm tra kết quả training với dữ liệu mẫu. Cửa hàng sách trực tuyến: là một website trình bày các loại sách cho phép người mua thông