Giải quyết vấn đề

Một phần của tài liệu LUẬN văn THẠC sĩ ỨNG DỤNG kỹ THUẬT KHAI PHÁ dữ LIỆU NHẰM hỗ TRỢ CÔNG tác tư vấn MUA HÀNG tại các DOANH NGHIỆP vừa và NHỎ ở TỈNH KIÊN GIANG (Trang 60 - 62)

Các vấn đề không thể thực hiện bằng chương trình quản lý hiện tại của đơn vị (hiện tại đang quản lý dựa trên phần mềm Microsoft Excel, dữ liệu rời rạc). Tác giả giải quyết vấn đề bằng nghiên cứu luận văn sử dụng phần mềm dựa trên kỹ thuật phân lớp Cây quyết định có áp dụng thuật toán C 4.5.

Bước 1 Thiết kế cơ sỡ dữ liệu mẫu phục vụ cho quá trình xây dựng cây quyết định

Dựa trên thực tế về sản phẩm của Kiên Giang, cơ sở dữ liệu mẫu bao gồm các bảng dữ liệu sau:

- Bảng dữ liệu chính SanPham

Khóa chính là maSP (mã sản phẩm), chứ các thuộc tính cơ bản là tên sản phầm, ngành, loại, đặc tính, doanh nghiệp, huyện, chứng nhận, trọng lượng và 7 khóa ngoại tham chiếu đến các bảng dữ liệu khác

- Bảng dữ liệu Nganh

Khóa chính là tenNganh để tham chiếu với khóa ngoại của bảng sản phẩm và chứa thông tin về ngành

- Bảng dữ liệu Loai

Khóa chính là tenLoai để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về loại

- Bảng dữ liệu Dactinh

Khóa chính là tenDacTinh để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về đặc tính

- Bảng dữ liệu TrongLuong

Sản Phẩm và chứa thông tin về trọng lượng - Bảng dữ liệu DoanhNghiep

Khóa chính là tenDoanhNghiep để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về doanh nghiệp.

- Bảng dữ liệu Huyen

Khóa chính là tenHuyen để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về huyện

- Bảng dữ liệu ChungNhan

Khóa chính là tenChungNhan để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về chứng nhận

Hình 3.2 Sơ đồ liên kết giữa các bảng

Bước 2: Xác định thuộc tính cần dự toán và thuộc tính đầu vào cho mô hình. Xây dựng cây quyết định để phân lớp

Xác định thuộc tính cần dự đoán và thuộc tính đầu vào cho mô hình. Dựa theo dữ liệu sản phẩm Kiên Giang đến cuối năm 2020: gồm các sản phẩm OCOP, sản phẩm công nghiệp nông thôn tiêu biểu, sản phẩm tiềm năng của địa phương:

- Thuộc tính đầu vào là 10 thuộc tính có trong bảng “SanPham” - Trong đó thuộc tính phân lớp là thuộc tính “XacNhan”

Xây dựng cây quyết định để phân lớp dữ liệu và rút ra các luật phân lớp cho mô hình

- Sử dụng phần mềm với dữ liệu đầu vào là bảng “SanPham” được thiết kế trong bước 1 để hình thành cây quyết định dựa trên thuật toán C4.5

- Phân tích cây quyết định để rút ra các luật phân lớp dựa trên thuật toán C.4.5

- Phân tích cây quyết định để rút ra các luật phân lớp phục vụ cho luận văn

Bước 3: Dùng kết quả ở bước 2 để xây dựng phần mềm ứng dụng đánh giá xác nhận kết quả sản phẩm Kiên Giang

- Sử dụng ngôn ngữ C# trên Microsoft Visual Stuidio 2015 để thiết kế phần mềm ứng dụng.

- Xây dựng chức năng kết nối với cơ sở dữ liệu SQL Server 2014 để lấy dữ liệu từ các bảng chính và các bảng tham chiếu.

- Đưa vào các luật phân lớp được rút ra từ “bước 2” vào trong phần mềm

- Thiết kế các chức năng ứng dụng cho chương trình

Một phần của tài liệu LUẬN văn THẠC sĩ ỨNG DỤNG kỹ THUẬT KHAI PHÁ dữ LIỆU NHẰM hỗ TRỢ CÔNG tác tư vấn MUA HÀNG tại các DOANH NGHIỆP vừa và NHỎ ở TỈNH KIÊN GIANG (Trang 60 - 62)