Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
330,27 KB
Nội dung
Header Page of 126 -1BỘ GIÁO DỤC – ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG -2Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS Huỳnh Cơng Pháp TRẦN THỊ BÍCH ĐÀO Phản biện 1: TS Trương Ngọc Châu ỨNG DỤNG KHAI PHÁ DỮ LIỆU ĐỂ TÌM LUẬT KẾT HỢP ĐÁNG TIN CẬY TRONG HỆ THỐNG BÁN HÀNG TẠI CÔNG TY DƯỢC TW3 Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 Phản biện 2: TS Trương Cơng Tuấn Luận văn bảo vệ trước hội ñồng chấm Luận văn tốt nghiệp Thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 16 tháng 06 năm 2012 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Có thể tìm hiểu Luận văn tại: - Trung tâm Thông tin – Học liệu, Đại học Đà Nẵng - Trung tâm Học liệu, Đại học Đà Nẵng Đà Nẵng - Năm 2012 Footer Page of 126 Header Page of 126 -3MỞ ĐẦU Lý chọn đề tài Ngày nay, cơng nghệ thơng tin ñang dần phổ biến hầu hết lĩnh vực Tỷ lệ thuận với phát triển lượng liệu ñược lưu trữ lớn theo Chúng ta biết lượng liệu ñang ẩn chứa giá trị ñịnh Tuy nhiên theo thống kê, lượng nhỏ liệu (khoảng 5% - 10%) phân tích, số cịn lại khơng biết để làm ln phải lưu trữ sợ bỏ qua thơng tin quan trọng ngày dùng tới chúng Do đó, phương pháp quản trị khai thác sở liệu truyền thống ngày khơng thể đáp ứng thực tế ñã làm phát sinh khuynh hướng kỹ thuật mới: phát tri thức khai phá liệu KDD (Knowledge Discovery and Data Mining) Phát tri thức khai phá liệu trình phát tri thức tiềm ẩn, tiềm năng, trước có lợi từ kho liệu lớn KDD kế thừa phát triển thành tựu nhiều lĩnh vực nghiên cứu ứng dụng tin học trước như: Hệ chun gia, Trí tuệ nhân tạo, lý thuyết nhận dạng, … Thị trường dược phẩm, thiết bị y tế ngày phát triển mạnh mẽ, công ty kinh doanh lĩnh vực liên tục đưa sản phẩm, hình thức kinh doanh cạnh tranh với nhằm thu hút người tiêu dùng Để cơng ty tồn tại, phát triển bền vững cạnh tranh thị trường cần phải ñưa nhận ñịnh kịp thời, người quản lý phải có cách nhìn tổng thể cách thức ñầu tư mặt hàng nhằm ñáp ứng u cầu khách hàng để có hướng ñầu tư ñúng ñắn Hiện tại, công ty Dược ñang có nguồn liệu lớn thơng tin khách hàng, số lượng, doanh thu mặt hàng ñược bán ra,… Dựa vào lưu lượng liệu này, ñây hướng ñi tiềm năng, có nhiều khả phát triển tương lai, nên tơi chọn ñề tài : “Ứng dụng khai Footer Page of 126 -4phá liệu để tìm luật kết hợp tin cậy hệ thống bán hàng Công ty Dược TW3” Đề tài mô tả thực số chức hệ thống bán hàng nhằm phục vụ cho mục đích đề tài ứng dụng khai phá liệu, cụ thể ứng dụng thuật tốn phân lớp với định để tìm luật kết hợp hệ thống bán hàng Công ty Dược TW3, mang lại cho người quản lý có cách nhìn tổng qt nhu cầu mua bán để ñưa nhận ñịnh ñúng hợp lý, mang lại hiệu cho hoạt động bán hàng cơng ty Đối tượng phạm vi nghiên cứu a Đối tượng Lý thuyết - Kỹ thuật khai phá liệu - Nghiệp vụ quản lý bán hàng công ty dược TW3 Dữ liệu - Cơ sở liệu: khách hàng, loại hàng, mặt hàng… - Các văn bản, qui định có liên quan… b Phạm vi - Nghiên cứu kiến thức phương pháp luật kết hợp - Tìm hiểu qui trình tác nghiệp hệ thống Mục tiêu nhiệm vụ a Mục tiêu - Ứng dụng luật kết hợp vào công tác quản lý bán hàng - Đưa kết nhận định hay dự đốn mang tính chiến lược cho nhà quản lý b Nhiệm vụ Nghiên cứu sở lý thuyết - Nghiên cứu kỹ thuật khai phá liệu - Nghiên cứu phát triển thuật giải tìm luật kết hợp Header Page of 126 - a b -5- Ứng dụng thuật toán vào sở liệu quản lý bán hàng Triển khai xây dựng ứng dụng - Xây dựng sở liệu mẫu - Xây dựng ứng dụng Phương pháp nghiên cứu - Tham khảo tài liệu liên quan, báo khoa học… - Lập kế hoạch, lập qui trình, tiến độ thực - Nghiên cứu kỹ thuật khai phá liệu việc tìm luật kết hợp mặt hàng dựa loại hàng doanh thu loại hàng Kết dự kiến - Tổng hợp kiến thức phương pháp khai phá luật kết hợp - Xây dựng số ứng dụng ñơn giản, dễ sử dụng mang tính hiệu cao Ý nghĩa khoa học thực tiễn ñề tài Ý nghĩa khoa học - Đây phương pháp ñược nhiều nhà khoa học nghiên cứu có nhiều đóng góp vào thực tiễn - Ứng dụng tin học vào công tác quản lý Ý nghĩa thực tiễn - Giải ñược số tác nghiệp công tác quản lý - Đánh giá kết nhận ñịnh, hỗ trợ ñưa ñịnh hay dự đốn mang tính chiến lược dựa loại hàng doanh thu loại hàng - Giúp nhà quản lý nắm bắt kịp thời nhu cầu mua bán thị trường có cách nhìn tổng quan Cấu trúc luận văn Footer Page of 126 -6Luận văn gồm có chương: Chương 1: Tổng quan lý thuyết - Nghiên cứu, tìm hiểu lý thuyết khai phá liệu - Trình bày thuật tốn áp dụng luận văn: thuật tốn phân lớp với định Chương 2: Phân tích thiết kế hệ thống quản lý bán hàng công ty dược TW3 - Phát biểu tốn: định nghĩa tốn qui trình bán hàng - Phân tích thiết kế sở liệu xác ñịnh tác nhân liên quan ñến hệ thống bán hàng Chương 3: Xây dựng chương trình thực nghiệm - Trình bày ngơn ngữ lập trình - Đưa liệu thực tế thu thập ñược - Thiết kế giao diện bao gồm số chức chính: khai phá liệu theo mã loại hàng khai phá liệu loại hàng theo doanh thu Bên cạnh cịn có số chức hỗ trợ thêm: danh mục khách hàng, cập nhật thơng tin hóa đơn, quản lý doanh thu bán hàng… CHƯƠNG 1: TỔNG QUAN VỀ LÝ THUYẾT 1.1 LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Khai phá liệu 1.1.1.1 Định nghĩa khai phá liệu Định nghĩa Ferruzza: “Khai phá liệu tập hợp phương pháp dùng tiến trình khám phá tri thức ñể khác biệt mối quan hệ mẫu chưa biết bên liệu” Định nghĩa Parsaye: “Khai phá liệu q trình trợ giúp định, tìm kiếm mẫu thơng tin chưa biết bất ngờ CSDL lớn” Header Page of 126 -7- -8- Định nghĩa Fayyad: “Khai phá tri thức q trình khơng tầm thường nhận mẫu liệu có giá trị, mới, hữu ích, tiềm hiểu được” 1.1.1.2 Đặc điểm khai phá liệu Khai phá liệu giai đoạn chủ yếu q trình phát tri thức Khai phá liệu để tìm mẫu (pattern) có ý nghĩa tiến hành tập liệu mà ta hy vọng thích hợp với nhiệm vụ khai phá thời Mẫu tìm từ q trình khai phá liệu phải có tính mơ tả (description) dự đốn (prediction) Khai phá liệu q trình mà người trung tâm Khai phá liệu trình tìm kiếm tri thức từ liệu Khai phá liệu mang tính chất hướng nhiệm vụ 1.1.1.3 Ý nghĩa thực tiễn tình hình ứng dụng khai phá liệu a Ý nghĩa thực tiễn Cùng với tăng lên không ngừng khối lượng liệu , yêu cầu khai thác liệu ngày cao Ngoài địi hỏi tính linh hoạt, suất, chun mơn hóa vấn đề khai thác, CSDL cần phải mang lại tri thức liệu Các định cần phải hợp lý, nhanh chóng, xác có khả dự đốn việc tương lai Trước yêu cầu này, cách khai thác CSDL truyền thống cho thấy hạn chế Khai phá đời mở hướng cho khó khăn Có thể kể số ứng dụng khai phá liệu sau: công ty bảo hiểm muốn phát từ CSDL khách hàng bị nghi ngờ gian lận, đó, người ta thực khai phá liệu CSDL chứa thông tin liên quan đến giao dịch khách hàng cơng ty để tìm phân lớp, lớp “đáng tin” lớp “khơng đáng tin” khách hàng Từ cơng ty có biện pháp hạn chế gian lận xảy Hay cơng ty nhận đặt hàng từ khách hàng qua email giảm bớt chi phí gửi email cách dùng tri thức khám phá ñể gửi email liên lạc ñến khách hàng có khả mua thường xuyên Bệnh viện cần khám phá tri thức từ liệu nhằm phục vụ cho mục đích nghiên cứu, chẩn đốn ngành y… b Tình hình ứng dụng Ở Việt Nam, có nhiều ñề tài nghiên cứu khoa học khai phá liệu đạt nhiều kết đáng khích lệ Khai phá liệu lĩnh vực nghiên cứu dùng kỹ thuật thơng minh để khai phá tri thức tìm ẩn liệu Khả hỗ trợ công việc khai phá liệu làm cho việc ứng dụng kỹ thuật vào thực tế ngày rộng rãi Mặc dù, hệ thống khai phá liệu khai phá liệu giới nhiều cịn hạn chế hồn thiện thực trở thành công cụ quan trọng khơng thể thiếu hầu hết lĩnh vực xã hội 1.1.2 Các bước trình phát tri thức Nhìn chung, trình khai phá liệu gồm bước sau: Bước 1: Tìm hiểu lĩnh vực ứng dụng xác định mục ñích khai phá liệu Bước 2: Xác ñịnh liệu liên quan hình thức khai phá Bước 3: Tiền xử lý liệu Bước 4: Chọn thuật toán khai phá chuyển liệu dạng phù hợp Bước 5: Khai phá liệu Bước 6: Trích lọc mẫu thực có ý nghĩa Bước 7: Ứng dụng tri thức phát ñược 1.2 LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 1.2.1 Vài nét khai phá luật kết hợp Mục đích khai phá liệu trích rút tri thức cách tự ñộng, hiệu “thông minh” từ kho liệu Footer Page of 126 Header Page of 126 -9- Trong hoạt động sản xuất kinh doanh, ví dụ kinh doanh mặt hàng siêu thị, nhà quản lý thích có thơng tin mang tính thống kê như: “90% phụ nữ có xe máy màu đỏ đeo đồng hồ Thụy Sỹ dùng nước hoa hiệu Chanel” “70% khách hàng công nhân mua TV thường mua loại 21 inches” Những thơng tin hữu ích việc định hướng kinh doanh Vậy vấn ñề ñặt liệu có tìm luật cơng cụ khai phá liệu hay không? Câu trả lời hồn tồn Đó nhiệm vụ khai phá luật kết hợp 1.2.2 Luật kết hợp 1.2.2.1 Định nghĩa luật kết hợp Định nghĩa 1: Cho I={I1, I2, , Im} tập hợp m tính chất riêng biệt Giả sử D sở liệu, với ghi chứa tập T tính chất (có thể coi T ⊆ I), ghi có số riêng Một luật kết hợp mệnh đề kéo theo có dạng X→Y, X, Y ⊆ I, thỏa mãn điều kiện X∩Y=∅ Các tập hợp X Y ñược gọi tập hợp tính chất (itemset) Tập X gọi nguyên nhân, tập Y gọi hệ Có ñộ ño quan trọng ñối với luật kết hợp: Độ hỗ trợ (support) ñộ tin cậy (confidence), ñược ñịnh nghĩa phần ñây Định nghĩa 2: Độ hỗ trợ Độ hỗ trợ tập hợp X sở liệu D tỷ số ghi T⊆D có chứa tập X tổng số ghi D (hay phần trăm ghi D có chứa tập hợp X), ký hiệu Support(X ) hay Supp(X) Ký hiệu: Supp(X) Ta có: ≤ Supp(X) ≤ với tập hợp X Độ hỗ trợ Supp(X) cịn hiểu xác suất X ñược thỏa D Ký hiệu: P(X) Độ hỗ trợ luật kết hợp X→Y tỷ lệ số lượng ghi chứa tập hợp X ∪ Y, so với tổng số ghi D Footer Page of 126 - 10 Supp(X→Y) = Supp(X∪Y)= | {T ∈ D | X ∪ Y ⊆ T } | |D| Khi nói độ hỗ trợ luật 70%, có nghĩa có 70% tổng số ghi chứa X ∪ Y Như vậy, ñộ hỗ trợ mang ý nghĩa thống kê luật Độ hỗ trợ X là: Supp(X)= Số lượng giao dịch hỗ trợ (X) Tổng số giao dịch Định nghĩa 3: Độ tin cậy Độ tin cậy (Confidence) luật kết hợp có dạng R: X→Y tỷ lệ số lượng ghi D chứa X ∪ Y với số ghi D có chứa tập hợp X Ký hiệu độ tin cậy luật Conf(R) Conf (X→Y) = P( Y | X )= Supp( X ∪ Y ) Supp ( X ) Có thể định nghĩa độ tin cậy sau: Độ tin cậy luật kết hợp X→Y tỷ lệ số lượng ghi tập hợp chứa X ∪ Y, so với tổng số ghi chứa X Việc khai thác luật kết hợp từ sở liệu việc tìm tất cảc luật có độ hỗ trợ ñộ tin cậy người sử dụng xác ñịnh trước Các ngưỡng ñộ hỗ trợ ñộ tin cậy ñược ký hiệu minsup, minconf người dùng xác ñịnh Việc khai thác luật kết hợp phân tích thành hai vấn đề: Tìm tất tập mục thường xuyên xảy mà có độ hỗ trợ lớn minsup Tạo luật mong muốn sử dụng tập mục lớn mà có độ tin cậy lớn minconf Định nghĩa 4: Độ quan trọng Độ quan trọng (importance) luật X→Y, ký hiệu Imp(X→Y), ñược xác ñịnh tỷ số Conf(X→Y) Conf( X →Y) Header Page of 126 Imp(X →Y) = lg( - 11 - Conf (Y → X ) P( X | Y ) ) = lg( ) Conf (Y → X ) P( X ) | Y ) Trong tính tốn, ta thường đưa tỷ số vào lơgarit ñể ñộ quan trọng có giá trị xung quanh 1.2.2.2 Một số hướng tiếp cận khai phá luật kết hợp 1.2.2.3 Một số thuật toán phát luật kết hợp 1.3 THUẬT TOÁN PHÂN LỚP VỚI CÂY QUYẾT ĐỊNH 1.3.1 Đặt vấn ñề Giả sử doanh nghiệp ñã ñưa số tiêu chí ñể phân loại khách hàng VIP khơng VIP: có khối lượng giao dịch trung bình tháng đạt từ 3,000,000 VND trở lên, có tần suất giao dịch trung bình 10 lần tháng Vấn ñề ñặt doanh nghiệp cần xác định đặc trưng chung nhóm khách hàng VIP, để từ làm sở dự báo khách hàng (mới) có tiềm trở thành khách hàng VIP hay không Trong bảng trên, thuộc tính rời rạc hóa theo cách: Tuổi: Bằng tuổi nhỏ 25, tuổi từ 25 ñến 40, tuổi lớn 40 Giới tính: Bằng nữ, nam, Thu nhập: Bằng thu nhập 30 triệu VND/năm, từ 30 triệu VND ñến 50 triệu VND/năm, 50 triệu VND/năm, Tình trạng nhân: Bằng chưa lập gia đình, ngược lại 1.3.2 Một số ñịnh nghĩa Cho bảng liệu A gồm n dịng với thuộc tính: (X1, X2, , XN, Y), Y thuộc tính output (thuộc tính cần dự báo) X1, X2, , XN thuộc tính input Giả sử Y rời rạc hóa thành k giá trị y1, y2, , yk (nghĩa giá trị Y dòng A phải y1, y2, , yk) Gọi n y1 số dòng bảng A thỏa ñiều kiện Y = y1, ký hiệu tương tự cho n y , , n y k Đương nhiên ta có n y i phải lớn hay ( n y1 + n y + + n y k )= n Footer Page of 126 - 12 Định nghĩa 1: Độ phân tán thông tin bảng A giá trị khoảng từ đến 1, tính bởi: I( n y , − ny2 , , nyk ) n y1 n y1 + n y + + n y k − = log k n y2 n y1 + n y + + n y k n y1 n y1 + ny + + n y k log k n y2 n y1 + n y + + n y k − n yk n y1 + n y2 + + n yk log k n yk n y1 + n y2 + + n yk Trong đó, ta qui ước logk0=0 Nhận xét: - Hàm I khơng thay đổi giá trị ta hốn vị n y i - Hàm I ñạt giá trị lớn (bằng 1) n y1 = n y = = n y k , nghĩa dịng bảng A phân tán cho trường hợp (rời rạc) thuộc tính output Y - Hàm I ñạt giá trị nhỏ (bằng 0) có n y i n (tổng số dịng bảng A), đương nhiên n y i lại phải Khi đó, ta nói bảng A khơng phân tán thơng tin cả, có nghĩa A khơng có để dự báo Định nghĩa 2: Gọi n y m giá trị lớn n y1 , n y , , n y k , ta gọi ym giá trị trội thuộc tính output Y; độ tin cậy luật 1→(Y=ym) ñược gọi ñộ trội output bảng A Nhận xét: Conf(1→(Y=ym)) = n ym n Định nghĩa 3: Gọi X thuộc tính input bảng A, giả sử X ñã ñược rời rạc hóa thành m giá trị x1, x2, , xm Phép tách A dựa vào thuộc tính X, ký hiệu TX, tạo thành m bảng A: Header Page of 126 - 13 - TX = {A1, A2, , Am}, đó: - A1, A2, , Am tạomthành phân hoạch A, nghĩa Ai∩Aj = ∅, ∀i, j =1,2, ,m, i ≠ j Ai = A i =1 - Ai tập hợp dịng A có giá trị X xi, nghĩa Ai = {t∈A|t.X = xi}, ∀i = 1, 2, , m Định nghĩa 4: Gọi TX phép tách ñịnh nghĩa Với i từ A ñến m, gọi n y1i số dịng bảng Ai thỏa điều kiện Y = y1, ký hiệu U A A tượng tự cho n y 2i , , n y ki Độ phân tán thông tin phép tách TX , ký hiệu E(TX), giá trị từ ñến 1, ñược tính bởi: k Ai ∑ ny j m j =1 Ai Ai Ai E(TX) = × I (n y1 n y , , n y k ) ∑ k i =1 n ∑ yj j =1 Trong đó: - n yAij số dịng bảng Ai thỏa ñiều kiện Y=yj - k ∑ n số dòng bảng Ai j =1 - Ai yj k ∑ n số dòng bảng A j =1 yj A A A - I (n y1i n y2i , , n yki ) độ phân tán thơng tin bảng A Một phép tách TX ñược gọi “tốt” bảng Ai tạo thành có độ phân tán thơng tin thấp, hay nói theo nghĩa phương pháp gom cụm, bảng Ai cụm có đa số phần tử (dịng) có giá trị Y giống Từ đó, phép tách TX tốt E(TX) thấp, ngược lại 1.3.3 Thuật tốn Input: - Bảng liệu A gồm n dịng với thuộc tính (X1, X2, , XN, Y), Y thuộc tính Output (thuộc tính cần dự báo) X1, X2, , XN thuộc tính input Tất thuộc tính A có giá trị rời rạc Footer Page of 126 - 14 - w: ngưỡng ñộ tin cậy chấp nhận ñược Output: - Cây định CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG QUẢN LÝ BÁN HÀNG TẠI CÔNG TY DƯỢC TW3 2.1 PHÁT BIỂU BÀI TOÁN 2.1.1 Định nghĩa toán Thị trường cung cấp dược phẩm, thiết bị y tế ngày phát triển mạnh mẽ, công ty kinh doanh lĩnh vực liên tục ñưa sản phẩm, hình thức kinh doanh nhằm thu hút người tiêu dùng Để cơng ty tồn tại, phát triển cạnh tranh thị trường cần phải đưa nhận định kịp thời, người quản lý có cách nhìn tổng thể cách thức ñầu tư mặt hàng nhằm ñáp ứng ñúng yêu cầu khách hàng có hướng đầu tư đắn Với mục đích phát triển cơng ty thành nhà cung cấp dược phẩm có quy mơ lớn việc ứng dụng cơng nghệ thơng tin vào công tác quản lý lựa chọn hàng ñầu nhà quản lý Phạm vi ứng dụng vai trị cơng nghệ thơng tin cơng tác quản lý lớn, thờ gian điều kiện cịn hạn chế nên tơi chọn khía cạnh nhỏ cơng tác quản lý xây dựng hệ hỗ trợ khai phá liệu dựa thơng tin giao dịch hóa đơn, hỗ trợ cho người quản lý ñưa nhận ñịnh mang tính chất chiến lược kinh doanh Bên cạnh đó, luận văn cịn đáp ứng số chức giúp nhà quản lý xem ñánh giá thông qua danh mục khách hàng, hóa đơn bán lẻ hàng ngày, hàng hóa có kho, tính doanh thu, lợi nhuận qua tháng… Giải ñược số tác nghiệp ñiều quan trọng ứng dụng khai phá liệu luật kết hợp để đưa định, bao gồm nhiều bảng thống kê mang tính chất nhận định, giúp ta có cách nhìn tổng quan liệu, dự đốn quy luật để qua kiểm chứng lại nhận ñịnh Header Page of 126 Khai phá mối quan hệ lợi nhuận loại hàng có hóa đơn, dự đốn kết ảnh hưởng loại hàng nào? Khách hàng liệu có thói quen mua hàng hay khơng? Từ quy luật đó, ta đánh giá kiểm định lại độ tin cậy có xác khơng? Có nhận định dễ dàng giúp nhà kinh doanh tìm hướng đầu tư cho loại mặt hàng tốt Bài tốn cụ thể ñược nêu ñây là: ứng dụng khai phá liệu, cụ thể dựa vào thuật toán phân lớp với định để tìm luật kết hợp tin cậy dựa mã loại hàng dựa doanh thu loại hàng ñể ñưa ñánh giá, nhận ñịnh ảnh hưởng loại hàng ñến doanh thu lợi nhuận cơng ty 2.1.2 Qui trình bán hàng Hệ thống bán hàng thực theo qui trình sau: - Bộ phận trình dược viên giới thiệu danh mục hàng hóa đến cho khách hàng - Khách hàng chọn mặt hàng cần mua (hay gọi ñặt hàng) - Bộ phận trình dược viên gởi yêu cầu ñặt mua ñến cho phận quản lý bán hàng - Bộ phận quản lý bán hàng gửi yêu cầu ñặt mua ñến cho phận quản lý vật tư (kho) Bộ phận vật tư hồi ñáp cho biết danh mục mặt hàng khách hàng đặt mua có tồn kho hay khơng - Nếu kho vật tư cịn hàng, phận quản lý bán hàng yêu cầu phận quản lý kho xuất kho (lập phiếu xuất kho) yêu cầu phận tài lập phiếu thu tiền khách hàng - Nếu khách hàng yêu cầu mua hàng trả chậm phận quản lý bán hàng gửi u cầu cơng nợ đến phận quản lý cơng nợ, phận quản lý cơng nợ chấp nhận phận quản lý bán hàng tra sổ cơng nợ khách hàng, thêm mục nợ đồng thời yêu cầu phận quản lý vật tư ñánh dấu chưa toán vào phiếu xuất kho Footer Page of 126 - 16 - - 15 - 2.2 PHÂN TÍCH THIẾT KẾ 2.2.1 Cơ sở liệu Ký hiệu chữ viết : P: Primary key (khố chính) U: Unique key, candidate key (khố định) M : Mandatory (khơng rỗng) L : Locked (khơng cho phép sửa ñổi giá trị) - Loại thực thể Người dùng (NguoiDung) - - - Thuộc tính Kiểu Kích thước P U M L Tennguoidung nvarchar 50 x x x x Matkhau nvarchar 50 x Vaitro int x Loại thực thể Khách hàng (KhachHang) Thuộc tính Kiểu Kích thước P U M L Makh nvarchar 10 x x x x Tenkh nvarchar 50 x Diachi nvarchar 50 x DienThoai nvarchar 50 x Loại thực thể Hóa đơn (HoaDon) Thuộc tính Kiểu Kích thước P U M L Mahd nvarchar 10 x x x x Makh nvarchar 50 x Ngaylap datetime x Tonggiatri float 10 x Loại thực thể Hàng hóa (HangHoa) Thuộc tính Kiểu Kích thước P U M L Mahang nvarchar 10 x x x x Tenhang nvarchar 50 x Dongia float 10 x Soluong int 10 x Header Page of 126 Maloai - - - 17 nvarchar - 18 - 10 Loại thực thể Loại hàng (LoaiHang) Thuộc tính Kiểu Kích thước P U M L Maloai nvarchar 10 x x x x Tenloai nvarchar 50 x Loại thực thể Các tháng (CacThang) Thuộc tính Kiểu Kích thước Thang Int P U M L x Dữ liệu Các tháng bao gồm 12 tháng năm - Sự kết hợp Chi tiết hóa đơn (ChiTietHoaDon) Thuộc tính Kiểu Kích thước P U M L Mahd nvarchar 10 x x x x Mahang nvarchar 10 x x x x Soluong int 10 x Dongia float 10 x Sơ ñồ mối quan hệ thực thể Hình 2.1 Mơ hình sở liệu Footer Page of 126 Xác ñịnh tác nhân Dựa vào phần ñịnh nghĩa tốn, ta xác định tác nhân hệ thống sau: TRÌNH DƯỢC VIÊN: người giới thiệu mặt hàng, thực việc mua hàng gởi ñơn ñặt hàng cho người quản lý KHÁCH HÀNG: người giao dịch với hệ thống thơng qua đơn đặt hàng, khách hàng chọn lựa mặt hàng muốn thơng qua giới thiệu trình dược viên NGƯỜI QUẢN LÝ: người ñiều hành, quản lý theo dõi hoạt ñộng hệ thống NGƯỜI DÙNG: bao gồm người quản lý, trình dược viên khách hàng ñã ñược cập nhật thông qua ñơn ñặt hàng Ứng với thành viên có chức khác nhằm phục vụ cho công việc cụ thể cho ñối tượng 2.2.3 Xác ñịnh UC, gói UC xây dựng biểu đồ UC chi tiết 2.2.4 Đặc tả Use Case 2.2.5 Xác ñịnh lớp thực thể lớp biên 2.2.6 Biểu ñồ hoạt động Use Case 2.2.7 Mơ hình hóa tương tác Use Case: Biểu ñồ 2.2.2 x CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH VÀ THỰC NGHIỆM 3.1 NGƠN NGỮ LẬP TRÌNH Chọn lập trình Window Form C# để xây dựng chương trình (dùng cơng cụ Microsoft Visual Studio 2008) Cơ sở liệu chọn SQL – dùng phiên SQL Server 2005 Developer Edition để tiện cho cơng việc khai phá liệu 3.2 DỮ LIỆU THỰC TẾ THU THẬP ĐƯỢC - Dữ liệu thu thập thực tế cơng ty dược dựa vào thơng tin hóa đơn Thơng tin hóa đơn bao gồm thơng tin khách hàng, loại hàng, mặt hàng, số lượng, ñơn giá thuốc bán Bên Header Page 10 of 126 - 19 - cạnh đó, cịn thu thập thêm thơng tin số lượng có kho, đơn giá gốc, liệu giúp người quản lý nắm bắt doanh thu bán hàng, lợi nhuận thu ñược từ mặt hàng bán - Khách hàng: Dữ liệu thơng tin khách hàng bao gồm khoảng 2160 khách hàng thường xuyên giao dịch với công ty, bảng liệu khách hàng bao gồm mã khách hàng, tên khách hàng, ñịa số điện thoại khách hàng - Hóa đơn: Dữ liệu Hóa đơn bao gồm khoảng 3.000 hóa ñơn, liệu hóa ñơn bao gồm mã hóa ñơn, mã khách hàng, ngày lập hóa đơn tổng giá trị hóa đơn - Chi tiết hóa đơn: Dữ liệu Chi tiết hóa đơn bao gồm khoảng 12.000 bảng ghi, liệu bao gồm mã hóa ñơn, mã loại hàng, số lượng ñơn giá mặt hàngHàng hóa: Dữ liệu Hàng hóa bao gồm khoảng 189 mặt hàng, liệu bao gồm mã hàng, tên hàng, ñơn giá, số lượng mã loại hàng - Loại hàng: bao gồm khoảng 82 loại hàng, liệu bao gồm mã loại tên loại hàng ñược thể hình bên dưới: - 20 3.3 THIẾT KẾ GIAO DIỆN CHƯƠNG TRÌNH 3.3.1 Form Đăng nhập 3.3.2 Giao diện 3.3.3 Chức 3.3.3.1 Khai phá liệu theo mã loại hàng Hình 3.25 Giao diện Khai phá liệu dựa theo loại hàng hóa Hình 3.26 Kết sau khai phá liệu dựa theo loại hàng hóa Footer Page 10 of 126 Header Page 11 of 126 3.3.3.2 - 21 - Khai phá liệu loại hàng theo doanh thu Hình 3.27 KPDL dựa doanh thu bán loại hàng có doanh thu thấp Hình 3.28 Kết sau khai phá liệu mã loại hàng có doanh thu thấp 3.3.4 Chức hỗ trợ 3.3.4.1 Danh mục khách hàng Cho ta biết thơng tin khách hàng Mã khách hàng , Tên khách hàng, Địa , Điện Thoại 3.3.4.2 Danh mục hóa ñơn Dùng ñể quản lý hóa ñơn chi tiết hóa đơn tất Footer Page 11 of 126 - 22 khách hàng , ta thêm xóa sửa hóa đơn cho khách hàng chi tiết hóa đơn hóa ñơn 3.3.4.3 Danh mục sản phẩm Là mục ñể quản lý tất loại hàng hóa hàng hóa có loại hàng , có chức thêm xóa sửa loại hàng sản phẩm 3.3.4.4 Thống kê giao dịch 3.3.4.5 Quản lý doanh thu Mục Quản Lý Doanh Thu hiển thị cho ta thấy tất Hóa Đơn Danh sách Chi Tiết Hóa Đơn Hóa Đơn khoảng thời gian cụ thể Từ tính Doanh Thu & Lợi Nhuận khoảng thời gian tháng năm Từng mặt hàng , loại hàng ñã bán ñem lại lợi nhuận dannh thu khoảng thời gian năm 3.3.4.6 Tình hình biến động giá Mỗi loại hàng hóa đem lại cho ta doanh thu khác , thống kê ñược biến ñộng giá có nhìn tổng quan mặt hàng siêu thị cần ñược ñầu tư : Ta thống kê loại hàng có độ lệch chuẩn theo doanh thu năm 3.4 KẾT QUẢ THỬ NGHIỆM VÀ NHẬN XÉT Kết khai phá luật kết hợp kỹ thuật phân lớp với ñịnh bảng doanh thu gồm 352 giao dịch, giao dịch gồm có thuộc tính Kết đạt ứng với mã loại hàng 1, 2, 3, 4, sau : Ngưỡng tin cậy cho Số giao Số luật thu STT trước dịch ñược 0.6 352 12 0.7 352 47 0.8 352 59 0.9 352 67 Header Page 12 of 126 - 23 - - 24 - Rời rạc thuộc tính bảng theo phương thức sau : - Các loại hàng : loại hàng 1, loại hàng 2, loại hàng 3, rời rạc theo trung bình doanh thu - Nếu 0: doanh thu - Nếu 1: có doanh thu thấp mức trung bình doanh thu - Nếu 2: có doanh thu cao mức trung bình doanh thu - Lợi nhuận: - Nếu 1: lợi nhuận thấp mức trung bình lợi nhuận - Nếu 2: lợi nhuận cao mức trung bình lợi nhuận - Bảng kết sau rời rạc thuộc tính xuất file excel Sheet1 - Giả sử ta cho ngưỡng tin cậy cho trước 0.6, thử nghiệm với loại mặt hàng sau: 1, 2, 3, 4, với số giao dịch 340 ta có tập luật sau: - Nếu mã loại hàng có doanh thu mã loại hàng có doanh thu thấp mức trung bình doanh thu lợi nhuận thu cao mức trung bình lợi nhuận - Nếu mã loại hàng có doanh thu mã loại hàng có doanh thu cao mức trung bình doanh thu ñó lợi nhuận thu ñược thấp mức trung bình trung bình lợi nhuận - Nếu mã loại hàng 1, mã loại hàng 3, mã loại hàng có doanh thu đồng thời lợi nhuận thu cao mức trung bình lợi nhuận - Nếu mã loại hàng 1, mã loại hàng có doanh thu đồng thời mã loại hàng có doanh thu thấp mức trung bình doanh thu lợi nhuận thu thấp mức trung bình lợi nhuận - Nếu mã loại hàng có doanh thu thấp mức trung bình doanh thu lợi nhuận thu thấp mức trung bình lợi nhuận - Nếu mã loại hàng có doanh thu cao mức trung bình doanh thu mã loại hàng có doanh thu có doanh thu lợi nhuận thu cao mức trung bình lợi nhuận - Nếu mã loại hàng có doanh thu cao mức trung bình doanh thu mã loại hàng có doanh thu thấp mức trung bình doanh thu lợi nhuận thu thấp mức trung bình lợi nhuận - Nếu mã loại hàng mã loại hàng đồng thời có doanh thu cao mức trung bình doanh thu mã loại hàng có doanh thu lợi nhuận thu cao mức trung bình lợi nhuận - Nếu mã loại hàng 4, mã loại hàng đồng thời có doanh thu cao mức trung bình doanh thu mã loại hàng 1, mã loại hàng đồng thời có doanh thu thấp mức trung bình doanh thu lợi nhuận thu thấp mức trung bình lợi nhuận - Nếu mã loại hàng 2, mã loại hàng 4, mã loại hàng đồng thời có doanh thu cao mức trung bình doanh thu mã loại hàng có doanh thu thấp mức trung bình doanh thu lợi nhuận thu cao mức trung bình lợi nhuận - Nếu mã loại hàng 2, mã loại hàng 3, mã loại hàng 4, mã loại hàng đồng thời có doanh thu cao mức trung bình doanh thu mã loại hàng có mức doanh thu thấp mức trung bình doanh thu lợi nhuận thu thấp mức trung bình lợi nhuận - Nếu mã loại hàng 1, mã loại hàng 2, mã loại hàng 3, mã loại hàng 4, mã loại hàng đồng thời có doanh thu cao mức trung bình doanh thu lợi nhuận thu ñược cao mức trung bình lợi nhuận NHẬN XÉT - Qua lần chạy thử mơ hình, ta thấy Conf = giá trị, chứng tỏ ñộ tin cậy luật tốt Bên cạnh độ Footer Page 12 of 126 Header Page 13 of 126 - - 25 - phổ biến chênh lệch khoảng giá trị xác ñịnh cho thấy mức ñộ dao ñộng luật khơng cao, chấp nhận nhiều luật lúc Càng tăng số độ tin cậy số luật thay đổi khơng đáng kể nên chứng tỏ luật mang tính chất liên kết cao Ta thấy có số luật ln xuất mơ hình chạy thử mà ta tin tưởng Footer Page 13 of 126 - 26 KẾT LUẬN Đánh giá kết - Về mặt lý thuyết: Nghiên cứu kiến thức khai phá tri thức khai phá liệu, thuật tốn tìm luật kết hợp như: Apriori, AprioriTIP, Apriori-Hybrid, FP-Growth, phân lớp với định Cài đặt thuật tốn tìm luật kết hợp phương pháp phân lớp với ñịnh - Về mặt ứng dụng: Xây dựng ñược hệ thống hỗ trợ ñưa ñịnh phục vụ cho công tác quản lý thông qua việc khai phá liệu dựa loại hàng doanh thu loại hàng có cơng ty Hạn chế - Chỉ minh họa hệ thống sở liệu công ty TNHH MTV Dược TW3, chưa minh họa nhiều sở liệu khác - Hệ thống cịn đơn giản, chưa có nhiều chức thiết thực giúp phục vụ hiệu công tác quản lý công ty Hướng phát triển - Tiếp tục hồn thiện đề tài, xây dựng hệ thống nhiều chức hơn, dùng thuật toán phân lớp với ñịnh thử nghiệm ñánh giá kỹ sở liệu lớn sở liệu khác - Đưa thêm phương pháp khai phá liệu khác vào việc phân tích mơ hình, gom cụm để phân lớp liệu để từ phân tích liệu xác ñưa luật có ñộ tin cậy cao - Khai phá liệu kho liệu với luật kết hợp đa chiều, nhiều mức - Tìm hiểu công cụ hỗ trợ hiển thị kết thuật tốn dạng đồ họa đồ thị, biểu đồ, … ... dụng khai Footer Page of 126 -4phá liệu để tìm luật kết hợp tin cậy hệ thống bán hàng Công ty Dược TW3? ?? Đề tài mô tả thực số chức hệ thống bán hàng nhằm phục vụ cho mục đích đề tài ứng dụng khai. .. kỹ sở liệu lớn sở liệu khác - Đưa thêm phương pháp khai phá liệu khác vào việc phân tích mơ hình, gom cụm ñể phân lớp liệu ñể từ ñó phân tích liệu xác đưa luật có độ tin cậy cao - Khai phá liệu. .. hệ thống hỗ trợ ñưa ñịnh phục vụ cho công tác quản lý thông qua việc khai phá liệu dựa loại hàng doanh thu loại hàng có cơng ty Hạn chế - Chỉ minh họa hệ thống sở liệu công ty TNHH MTV Dược TW3,