Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 16 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
16
Dung lượng
6,89 MB
File đính kèm
code.rar
(19 MB)
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC BÁO CÁO HỆ HỖ TRỢ QUYẾT ĐỊNH HỆ THỐNG HỖ TRỢ QUYẾT ĐỊNH ĐẦU TƯ VÀO DOANH NGHIỆP Giảng viên hướng dẫn: TS Lê Chí Ngọc Sinh viên thực hiện: Lớp: Toán tin 02 – K62 HÀ NỘI – 2020 MỤC LỤC 2 MỞ ĐẦU Ngày nay, thời đại cách mạng công nghiệp 4.0, phần mềm sử dụng trí tuệ nhân tạo trở thành phần thiếu phát triển kinh tế, xã hội Rất nhiều quan, doanh nghiệp có nhu cầu sử dụng phần mềm ứng dụng Trí tuệ nhân tạo học máy (tiếng Anh: machine learning) Học máy lĩnh vực trí tuệ nhân tạo liên quan đến việc nghiên cứu xây dựng kĩ thuật cho phép hệ thống "học" tự động từ liệu để giải vấn đề cụ thể Có thể kể đến nhiều lĩnh vực mà áp dụng Machine Learning, kể đến hỗ trợ định đầu tư vào doanh nghiệp Việc lựa chọn doanh nghiếp để đầu tư khó khăn Nếu đưa định không đắn dẫn đến nhứng thương vụ thất bại hay chí khoảng nợ khổng lồ Nếu dự đoán doanh số doanh nghiệp thời gian tới việc đưa định đầu tư có lợi ích lớn cho cơng ty Với liệu doanh số bán hàng năm, tổng khối tài sản, liệu phụ khác, mục tiêu đặt làm để dự đốn doanh số tới doanh nghiệp gọi vốn để giúp cho nhà quản lý có nhìn tổng qt dễ dàng đưa định đắn, qua giúp đạt lợi nhuận tốt khơng thừa thãi phung phí tài ngun Dựa nhu cầu đó, ta cần xây dựng chương trình nhằm hỗ trợ phân tích liệu doanh nghiệp dự đốn dành cho người sử dụng nhà quản lý 3 I Khảo sát hệ thống 1.1 Tổng quan liệu Hàng năm trang Forbes.com đưa danh sách top 2000 doanh nghiệp giới Các công ty xếp hạng dựa nhiều tiêu chí khác kể đến quy mô doanh nghiệp, giá trị thị trường, doanh số bán hàng, lợi nhuận, … Bộ liệu báo cáo liệu dạng bảng Dữ liệu lấy lấy từ thông tin top 2000 doanh nghiệp bảng xếp hạng Forbes năm 2013 – 2015 – 2017 Các thuộc tính đề cập tới liệu bao gồm: • Rank (Thứ hạng): Vị trí xếp hạng doanh nghiệp năm tương ứng • Company (Cơng ty): Tên cơng ty • Country (Quốc gia): Quốc gia nơi cơng ty đặt trụ sở • Sales (Bán hàng): Doanh số bán hàng cơng ty • Market Values (Giá trị thị trường): Giá trị thị trường cơng ty tính đến thời điểm xét • Profit (Lợi nhuận): Lợi nhuận cơng ty năm • Assets (Tài sản): Tổng giá trị khối tài sản cơng ty • Sector (Khu vực): Lĩnh vực kinh doanh công ty (VD: Tài chính, Cơng nghệ,…) Trong trường Sales, Market Values, Profit, Assets chứa liệu dạng số, trường lại liệu dạng chuỗi Trường Profits có liệu bị thiếu 1.2 Vấn đề bù liệu thiếu Một số liệu trường Profits bị thiếu (được đánh dấu #FIELD! Như hình đây) Giải pháp: Sử dụng hồi quy tuyến tính (Linear Regression), dựa vào liệu trường Sales, Market Values Assets để bù liệu 1.3 Vấn đề xử lí liệu dạng phân loại (categorical) Trong liệu có trường Country Sector dạng categorical Ta sử dụng one-hot-encoding (tạo n trường tương ứng với n giá trị trường: isAutralia, is-United State, is-Industry, …) để xử lí trường 4 Hình 1: Dữ liệu 1.4 Quy trình hoạt động Khách hàng hướng đến công ty tư vấn đầu tư Đầu vào báo cáo tài số liệu thu thập doanh nghiệp Sau liệu nhập vào, mơ hình (đã luyện từ trước) tiến hành dự đoán lợi nhuận doanh nghiệp để tư đầu tư Hình 2: Quy trình hoạt động kì vọng 5 1.5 Giải pháp thuật toán Giải pháp sử dụng báo cáo học có giám sát liệu Forbes Học có giám sát kĩ thuật ngành học máy để xây dựng hàm từ liệu huấn luyện Dữ liệu huấn luyện bao gồm cặp gồm đối tượng đầu vào đầu mong muốn Đầu hàm giá trị liên tục (hồi qui), dự đoán nhãn phân loại cho đối tượng đầu vào (phân loại) Nhiệm vụ chương trình học có giám sát dự đốn giá trị hàm cho đối tượng đầu vào hợp lệ, sau xem xét số ví dụ huấn luyện Để đạt điều này, chương trình học phải tổng qt hóa từ liệu sẵn có để dự đốn tình chưa gặp phải theo cách "hợp lý" Để hồi quy giá trị doanh thu doanh nghiệp từ liệu đầu vào, ta sử dụng thuật toán Random Forest hồi quy (Regression Forest) Random Forest thuật toán dựa vào tập hợp hàng trăm weak learner, Decision Tree, Decision Tree tạo nên ngẫu nhiên từ việc tái chọn mẫu (chọn random phần data để xây dựng) random biến từ toàn biến trong data Dự đốn cuối mơ hình trung bình dự đốn Hình 3: Kết dự đoán với liệu năm 2013 6 II Đặc tả yêu cầu phần mềm Những yêu cầu phần mềm hệ hỗ trợ định đầu tư vào doanh nghiệp đậc tả chia làm nhóm: • u cầu chức • Yêu cầu phi chức 2.1 Yêu cầu chức 2.1.1 Biểu đồ use-case Chương trình hướng đến tác nhân (actor) nhà quản lí Hình 4: Mơ hình use-case mô tả nghiệp vụ 2.1.2 Chức đăng nhập Mơ tả: Nhà quản lí sử dụng tài khoản cung cấp nhập userID password để đăng nhập vào hệ thống Flow work: • Hệ thống yêu cầu nhập userID Password • Kiểm tra userID Password người dùng nhập Nếu đúng, đưa người dùng vào hệ thống Nếu kiểm tra thất bại, hiển thị form yêu cầu nhập lại 2.1.3 Chức nhập thông tin doanh nghiệp đầu tư Mơ tả: Nhà quản lí lựa chọn doanh nghiệp gọi vốn nhập vào thơng tin cơng ty Flow work: 7 Nhà quản lí đưa thơng tin doanh nghiệp cần đầu tư (thơng tin phận khảo sát đưa lên doanh nghiệp cung cấp) vào hệ thống • Thơng tin đưa vào sở liệu công ty Nếu tên công ty tồn tại, thông báo trùng liệu Nếu khơng, thơng báo nhập liệu thành cơng • 2.1.4 Chức chạy phân tích, dự báo Mơ tả: Chức chương trình, hỗ trợ đưa định đầu tư vào doanh nghiệp Flow word: • Mơ hình luyện từ trước liệu Forbes theo thuật tốn Random Forest • Nhà quản lí chọn doanh nghiệp để tiến hành dự đốn • Hệ thống hiển thị kết dự đoán mơ hình cho nhà quản lí để hỗ trợ định có đầu tư vào doanh nghiệp hay khơng 2.2 Yêu cầu phi chức Độ xác chấp nhận được: Mơ hình đưa dự đốn tốt doanh thu doanh nghiệp dựa vào liệu đưa vào • Bảo mật: Bảo đảm tính bảo mật thông tin tài khoản nhà đầu tư thông tin doanh nghiệp mà nhà đầu tư đưa lên hệ thống • Đa tảng: Hệ thống phát triển tảng web, dễ dàng tiếp cận • Thân thiện: Người dùng khơng có nhiều hiểu biết CNTT dễ dàng sử dụng khai thác tài nguyên hệ thống • 8 III Phân tích hệ thống 3.1 Biểu đồ chức 3.1.1 Chức đăng nhập Hình 5: Biểu đồ chức đăng nhập 9 3.1.2 Chức nhập thông tin doanh nghiệp Hình 6: Biểu đồ chức nhập thông tin doanh nghiệp 3.1.3 Chức chạy phân tích, dự báo 10 10 Hình 7: Biểu đồ chức chạy phân tích dự báo 3.2 Biểu đồ luồng liệu 11 11 3.3 Sơ đồ hệ thống 12 12 3.4 Các framework sử dụng • • • • • HTML CSS JavaScript Python Flask 3.5 Một số hình ảnh sản phẩm 13 13 14 14 15 15 16 16 ... phép hệ thống "học" tự động từ liệu để giải vấn đề cụ thể Có thể kể đến nhiều lĩnh vực mà áp dụng Machine Learning, kể đến hỗ trợ định đầu tư vào doanh nghiệp Việc lựa chọn doanh nghiếp để đầu tư. .. cho nhà quản lí để hỗ trợ định có đầu tư vào doanh nghiệp hay khơng 2.2 u cầu phi chức Độ xác chấp nhận được: Mơ hình đưa dự đoán tốt doanh thu doanh nghiệp dựa vào liệu đưa vào • Bảo mật: Bảo... chương trình, hỗ trợ đưa định đầu tư vào doanh nghiệp Flow word: • Mơ hình luyện từ trước liệu Forbes theo thuật tốn Random Forest • Nhà quản lí chọn doanh nghiệp để tiến hành dự đốn • Hệ thống hiển