Các vấn đề không thể thực hiện bằng chương trình quản lý hiện tại của đơn vị (hiện tại đang quản lý dựa trên phần mềm Microsoft Excel, dữ liệu rời rạc). Tác giả giải quyết vấn đề bằng nghiên cứu luận văn sử dụng phần mềm dựa trên kỹ thuật phân lớp Cây quyết định có áp dụng thuật toán C 4.5.
Bước 1 Thiết kế cơ sỡ dữ liệu mẫu phục vụ cho quá trình xây dựng cây quyết định
Dựa trên thực tế về sản phẩm của Kiên Giang, cơ sở dữ liệu mẫu bao gồm các bảng dữ liệu sau:
- Bảng dữ liệu chính SanPham
Khóa chính là maSP (mã sản phẩm), chứ các thuộc tính cơ bản là tên sản phầm, ngành, loại, đặc tính, doanh nghiệp, huyện, chứng nhận, trọng lượng và 7 khóa ngoại tham chiếu đến các bảng dữ liệu khác
- Bảng dữ liệu Nganh
Khóa chính là tenNganh để tham chiếu với khóa ngoại của bảng sản phẩm và chứa thông tin về ngành
- Bảng dữ liệu Loai
Khóa chính là tenLoai để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về loại
- Bảng dữ liệu Dactinh
Khóa chính là tenDacTinh để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về đặc tính
- Bảng dữ liệu TrongLuong
Sản Phẩm và chứa thông tin về trọng lượng - Bảng dữ liệu DoanhNghiep
Khóa chính là tenDoanhNghiep để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về doanh nghiệp.
- Bảng dữ liệu Huyen
Khóa chính là tenHuyen để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về huyện
- Bảng dữ liệu ChungNhan
Khóa chính là tenChungNhan để tham chiếu với khóa ngoại của bảng Sản Phẩm và chứa thông tin về chứng nhận
Hình 3.2 Sơ đồ liên kết giữa các bảng
Bước 2: Xác định thuộc tính cần dự toán và thuộc tính đầu vào cho mô hình. Xây dựng cây quyết định để phân lớp
Xác định thuộc tính cần dự đoán và thuộc tính đầu vào cho mô hình. Dựa theo dữ liệu sản phẩm Kiên Giang đến cuối năm 2020: gồm các sản phẩm OCOP, sản phẩm công nghiệp nông thôn tiêu biểu, sản phẩm tiềm năng của địa phương:
- Thuộc tính đầu vào là 10 thuộc tính có trong bảng “SanPham” - Trong đó thuộc tính phân lớp là thuộc tính “XacNhan”
Xây dựng cây quyết định để phân lớp dữ liệu và rút ra các luật phân lớp cho mô hình
- Sử dụng phần mềm với dữ liệu đầu vào là bảng “SanPham” được thiết kế trong bước 1 để hình thành cây quyết định dựa trên thuật toán C4.5
- Phân tích cây quyết định để rút ra các luật phân lớp dựa trên thuật toán C.4.5
- Phân tích cây quyết định để rút ra các luật phân lớp phục vụ cho luận văn
Bước 3: Dùng kết quả ở bước 2 để xây dựng phần mềm ứng dụng đánh giá xác nhận kết quả sản phẩm Kiên Giang
- Sử dụng ngôn ngữ C# trên Microsoft Visual Stuidio 2015 để thiết kế phần mềm ứng dụng.
- Xây dựng chức năng kết nối với cơ sở dữ liệu SQL Server 2014 để lấy dữ liệu từ các bảng chính và các bảng tham chiếu.
- Đưa vào các luật phân lớp được rút ra từ “bước 2” vào trong phần mềm
- Thiết kế các chức năng ứng dụng cho chương trình