Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 15 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
15
Dung lượng
263,5 KB
Nội dung
TRƯỜNG ĐẠI HỌC BÌNH DƯƠNG KHOA CƠNG NGHỆ THƠNG TIN, ROBOT VÀ TRÍ TUỆ NHÂN TẠO TIỂU LUẬN MƠN HỌC NHẬP MƠN KHOA HỌC DỮ LIỆU DỰ ĐỐN MỨC ĐỘ THÀNH CÔNG CỦA MỘT GAME TRÊN STEAM Giảng viên hướng dẫn: Huỳnh Quang Đức Nhóm thực hiện: - Họ tên: Đỗ Nguyễn Tiến Đạt - MSSV:21050060 - Lớp: 24TH01 - Họ tên: Nguyễn Minh Mẫn - MSSV: 21050040 - Lớp: 24Th01 Bình Dương, ngày GVHD: Huỳnh Quang Đức tháng năm 2023 FIRA LỜI CẢM ƠN Trong q trình hồn thành tiểu luận mơn Nhập mơn khoa học liệu với đề tài “Dự đốn mức độ thành cơng game Steam” ngồi nỗ lực thành viên nhóm, chúng em xin gửi lời cảm ơn chân thành đến: - Trường đại học Bình Dương tạo điều kiện cho nhóm em tiếp xúc với môn học Khoa học liệu, sau trải qua buổi lý thuyết thực hành, nhờ kiến thức hữu ích mà giảng viên đem đến giúp nhóm em dễ dàng tiếp cận với ngành Khoa học liệu cách trọn vẹn - Giảng viên hướng dẫn – thầy Huỳnh Quang Đức nhiệt tình hỗ trợ, giảng dạy tâm huyết để nhóm chúng em hồn thành tiểu luận môn học Giúp chúng em có hành trang vững đường nghiệp phía trước Chúng em xin chân thành cảm ơn! GVHD: Huỳnh Quang Đức i FIRA th TÓM TẮT Tin học ngày phát triển, mà nhu cầu giải trí người tăng cao, việc phát triển tựa game trở thành công việc nhiều lập trình viên, nhà phát triển game muốn đưa đến cho người chơi sản phẩm chất lượng phục vụ nhu cầu giải trí họ Nhưng sản phẩm game phát triển xem sản phẩm chất lượng, nhà phát triển muốn biết liệu người chơi, người bỏ tiền mua sản phẩm họ có thực u thích tựa game mà họ phát hành khơng ? Các hướng tiếp cận: - Tìm hiểu nghiên cứu lượt đánh giá người chơi Steam để xác định mức độ yêu thích họ tựa game tích cực, tiêu cực hay trung lập - So sánh đánh giá khác từ cộng đồng người chơi trang đánh giá game uy tín Metacritic, IGN hay GameSpot để phát trò chơi đánh giá tích cực từ người chơi khơng đánh giá tích cực từ chuyên gia ngược lại - Tìm hiểu cập nhật game để đưa đánh giá trước sau cập nhật Sau phân tích ảnh hưởng chúng tới người trải nghiệm game - Theo dõi đánh giá Steam để tìm xu hướng biến động game có cập nhật Cách giải vấn đề đặt ra: Thu thập liệu: - Thu thập dánh giá từ người chơi từ trang đánh giá game tiếng Metacritic, IGN Tiền xử lý liệu: - Loại bỏ liệu nhiễu liệu khơng hợp lý Chuẩn hố liệu đánh giá doanh thu Xây dựng mơ hình Hồi quy tuyến tính: - Sử dụng thuật tốn hồi quy để xây dựng mơ hình dự đốn mức độ thành cơng dựa đánh giá người chơi doanh thu Sau tích hợp liệu để tạo mơ hình hồn chỉnh Đánh giá hiệu suất mơ hình: Tích hợp vào ứng dụng: - Tích hợp mơ hình vào ứng dụng để cập nhật liệu dự đoán mức độ thành GVHD: Huỳnh Quang Đức ii FIRA th TĨM TẮT cơng game theo thời gian thực Cải thiện mơ hình: - Tối ưu hố mơ hình dựa phản hồi từ người dùng (các nhà phát triển game) kết thực nghiệm - Cập nhật liệu định kì để mơ hình ln dự đốn xác GVHD: Huỳnh Quang Đức ii FIRA Tiểu luận môn hoc Nhập môn khoa học liệu MỤC LỤC LỜI CẢM ƠN i TÓM TẮT ii MỤC LỤC DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ PHẦN – GIỚI THIỆU TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài 1.1.1 Phương pháp nghiên cứu 1.1.1.1 Nghiên cứu lý thuyết 1.1.1.2 Nghiên cứu thực nghiệm 1.2 Mục tiêu, phạm vi đề tài 1.3 Mơ hình – Tiến trình thực .4 PHẦN 2- ĐỀ XUẤT MƠ HÌNH HỆ THỐNG 1.1 Trình bày cơng thức tốn học .6 1.2 Trình bày hình vẽ, sơ đồ PHẦN – KẾT QUẢ ĐẠT ĐƯỢC .8 3.1 Chèn bảng: 3.2 Viết tắt 3.3 Qui định báo cáo đạo văn PHẦN – KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 10 TÀI LIỆU THAM KHẢO 11 GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu DANH MỤC KÍ HIỆU VÀ CHỮ VIẾT TẮT CÁC KÝ HIỆU f(w) tần suất xuất từ p(w) xác suất xuất từ CÁC CHỮ VIẾT TẮT NLP Xử lý ngôn ngữ tự nhiên ANN Mạng neural nhân tạo AI Trí tuệ nhân tạo GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu DANH MỤC CÁC BẢNG BIỂU, HÌNH VẼ DANH MỤC HÌNH Hình 2.1: Mơ hình hệ thống DANH MỤC BẢNG Bảng 3.1 Mẫu liệu huấn luyện cho hệ thống GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu PHẦN – GIỚI THIỆU TỔNG QUAN ĐỀ TÀI 1.1 Lý chọn đề tài: - Khi tựa game phát hành Steam, tựa game có lượt đánh giá từ người chơi tải chơi game Các lượt đánh giá tích cực tiêu cực định độ u thích người chơi tựa game đó, nhà phát hành muốn tựa game có tỉ lệ thành công dựa vào lượt đánh giá lượt tải - Để giải vấn đề đó, nhóm em đưa đề xuất xây dựng ứng dụng Khoa học liệu hướng tới nhà phát triển game lấy vấn đề việc liệu tựa game phát hành Steam có thành công hay không ? Dựa vào số lượng đánh giá tích cực, tiêu cực người chơi số lượt tải tựa game Steam, từ tính tốn để đưa tỉ lệ thành cơng tựa game Nhà phát triển game dựa vào để biết tựa game mình, tỉ lệ thành cơng cao họ phát hành phần tựa game đó, tỉ lệ thành cơng thấp tựa game cải thiện theo đánh giá người dùng để nâng cao trải nghiệm tích cực người chơi 1.1.1 Phương pháp nghiên cứu: 1.1.1.1 Nghiên cứu lý thuyết: - Tìm hiểu khái niệm ứng dụng Khoa học liệu Cách thức biên tập liệu, tiền xử lý, mơ hình hoá liệu biên tập liệu Python Cách sử dụng thư viên để huấn luyện mơ hình triển khai xây dựng úng dụng tảng web - Nghiên cứu ứng dụng Khoa học liệu đưa vào thực tiễn nước - Cách thức thu thập liệu game Steam như: lượt đánh giá từ người chơi, số lượt tải xuống, ngày phát hành 1.1.1.2 Nghiên cứu thực nghiệm: - Xây dựng ứng dụng dự đoán tỉ lệ thành công game Steam dựa lượt đánh giá từ người chơi, số lượt tải đánh giá kết dự đoán GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu 1.2 Mục tiêu, phạm vi đề tài: - Mục tiêu: tạo ứng dụng web giúp nhà làm game dự đốn tỉ lệ thành cơng sản phẩm game phát hành tảng phân phối game trực tuyến Steam - Phạm vi đề tài: ứng dụng hướng tới nhà phát triển game muốn biết tựa game làm có thành cơng mặt chất lượng không ? Dựa vào đánh giá từ người chơi doanh thu bán game 1.3 Mơ hình tổng qt tiến trình thực hiện: - Mơ hình tổng qt: - Tiến trình thực hiện: Người dùng tức nhà phát triển game muốn biết tỉ lệ thành cơng game làm nhập tên game, sau nhập số lượng lượt đánh giá người chơi Steam Sau bấm “Dự đốn”, hệ thống dựa vào thơng tin nhập để tính tốn theo thuật tốn lập trình để dự đốn mức độ thành công game Nếu thông tin nhập vào sai thiếu, ứng dụng thông báo lỗi yêu cầu người dùng nhập lại Nếu thông tin nhập vào đủ, ứng dụng xuất kết dự đoán trang kết tỉ lệ thành cơng game đó, tỉ lệ 90% game thành cơng mặt chất lượng, 25% game khơng thành cơng mặt chất lượng GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu PHẦN 2- ĐỀ XUẤT MƠ HÌNH HỆ THỐNG (ít trang) Tổng quan: phân tích, đánh giá cơng trình nghiên cứu có, tác giả khác ngồi nước liên quan đến nội dung; nêu vấn đề tồn tại; vấn đề mà đề tài cần tập trung nghiên cứu, giải Nêu cách thức giải vấn đề thơng qua mơ hình đề xuất Vẽ mơ hình giải thích cụ thể vấn đề mơ hình 1.1 Trình bày cơng thức tốn học Cơng thức tốn học cần qn tồn làm Sử dụng công cụ GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu MS Word đánh số theo chương, số thứ tự chương Ví dụ cơng thức sau đánh 2.1 Cơng thức tính khoảng cách hai vector 𝑑1(𝑒1, 𝑒2) =∥ 𝑒1 − 𝑒2 ∥= √∥ 𝑒1 ∥2+∥ 𝑒2 ∥2− 2𝑒𝑇𝑒2 (2.1) Trong công thức, có kí hiệu lần sử dụng, cần phải giải thích rõ kí hiệu đại diện cho phần tử đơn vị 𝑒 ∥ e ∥= √∑𝑑 𝑖=1 𝑖2 (2.2) Trong công thức 2.2: ∥ e ∥: độ lớn vector e, với eRd Độ đo cosin sử dụng để đo tương đồng hai vector Độ đo cosin: similar_cosin(𝑒1 𝑒𝑇𝑒2 , )= ∥𝑒1∥∥𝑒2∥ 𝑒2 1.2 Trình bày hình vẽ, sơ đồ Việc đánh số bảng biểu, hình vẽ, phương trình phải gắn với số chương (Thí dụ hình 3.4 có nghĩa hình thứ Chương 3) Mọi bảng biểu, đồ thị lấy từ nguồn khác phải trích dẫn đầy đủ (ví dụ: Nguồn: Tr.35, Tạp chí Khoa học (2012), Sớ 15, NXB Tài chính, TP.HCM) Nguồn trích dẫn phải liệt kê xác Danh GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu mục tài liệu tham khảo Đầu đề bảng, ghi phía bảng; đầu đề hình vẽ ghi phía hình Thơng thường bảng ngắn đồ thị nhỏ phải liền với phần nội dung đề cập tới bảng đồ thị lần thứ Các bảng dài để trang riêng phải phần nội dung đề cập tới bảng lần Hình 2.1: Hình minh họa mơ hình CBOW Skip-gram Nguồn: (https://www.researchgate.net/figure/Illustration-of-the-word2vec-models-a-CBOWb-skip-gram-16-33_fig2_318507923) GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu PHẦN – KẾT QUẢ ĐẠT ĐƯỢC (ít trang) Trình bày sở lý thuyết, lý luận, giả thuyết khoa học phương pháp nghiên cứu sử dụng nội dung nghiên cứu Trình bày cách thức biên tập liệu huấn luyện Cách thể ngữ liệu huấn luyện sau tiền xử lý Cách thức tiến hành huấn luyện cho mơ hình đề xuất Thể kết thơng qua test mơ hình huấn luyện mơ hình Trình bày cách thức tiến hành chạy chương trình giải thích giao diện GVHD: Huỳnh Quang Đức FIRA Tiểu luận môn hoc Nhập môn khoa học liệu PHẦN – KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (từ đến trang) Trình bày tổng kết kết đạt tiểu luận đóng góp nghiên cứu cho khoa học ứng dụng Với kết đạt cải tiến mơ hình, biên tập thêm liệu huấn luyện cải tiến điều Thời gian tới hướng phát triển đề tài ứng dụng hướng phát triển tương lai có khác biệt so với mơ hình liệu GVHD: Huỳnh Quang Đức 10 FIRA Tiểu luận môn hoc Nhập môn khoa học liệu TÀI LIỆU THAM KHẢO Tiếng Việt Đinh Điền (2006) Giáo trình xử lý ngơn ngữ tự nhiên Nhà xuất Đại học Quốc gia thành phố Hồ Chí Minh Lê Hồi Bắc, Tơ Hồi Việt (2014) Giáo trình Cơ sở trí tuệ nhân tạo Nhà xuất Khoa học Kỹ thuật Tống Thành Trung, Nguyễn Thị An (2017) Bài giảng toán rời rạc Nhà xuất Đại học Kinh tế Quốc dân … Tiếng Anh Krishna Bhavsar, Naresh Kumar & Pratap Dangeti (2017), Natural Language Processing with Python Cookbook Rajesh Arumugam, Rajalingappaa Shanmugamani (2018) Hands-On Natural Language Processing with Python Published by Packt Publishing Ltd ISBN 978-1-78913-949-5 Daniel Jurafsky & James H Martin (2018) An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Third Edition draft http://www.nltk.org/data.html … GVHD: Huỳnh Quang Đức 11 FIRA