Trang 1 SỬ DỤNG CÁC CÔNG CỤ HỌC MÁY ĐỂ XÂY DỰNG MƠ HÌNHDỰ BÁO DỰA TRÊN BỘ DỮ LIỆU" VIDEO_GAME_SALES "TRƯỜNG ĐẠI HỌC NGÂN HÀNG THÀNH PHỐ HỒ CHÍ MINHBộ mơn Kinh tếBÀI TIỂU LUẬNMƠN: KHOA HỌ
GIỚITHIỆU
Giới thiệu về đề tài
Ngànhcôngnghiệpgameđãtrởthànhmộttrongnhữngngànhcôngnghiệp phát triển nhanh nhất trên thế giới Theo Hiệp hội Công nghiệp Game (ESA), ngànhcông nghiệpgametạiHoaKỳ mộtmình đãđạtdoanhsốbánhànghơn 36tỷ USDvàonăm2020 Vớisựlanrộngcủasmartphone,gamediđộng cũngđãtrở thànhmột phầnquan trọngcủacuộcsốnghàng ngày Ví dụ, vàonăm2020,tỷ lệ ngườichơigame trênđiệnthoạidiđộngtạiHoaKỳđãtănglên56%sovớinăm 2019(theoNewzoo).
Sựpháttriểnnhanhchóngcủangànhcôngnghiệpgameđãtạoranhiềucơhội vàtháchthức.Mộttrong nhữngtháchthứcquan trọngnhấtlà khảnăngdựbáo doanhsốbánhànggametoàncầu.Dựbáonàycó thểgiúpchocácdoanhnghiệp gamehiểurõhơnvềnhu cầu củathịtrường,sựtiêuthụvàsở thích của ngườitiêu dùng.Từđó,doanhnghiệpcóthểquảnlý tồnkho hiệuquả,và xâydựngchiến lượctiếpthịhợplýđểtốiưu hóalợinhuận.
Mụctiêucủanghiêncứu nàylàphântíchxuhướng tiêuthụtròchơivideo từ năm1980 đếnnay,nhằmhiểurõhơnvềcác yếutốảnhhưởngđến sựthànhcông củacáctròchơi.Đồngthời, chúngtôicũngđặtramụctiêudựđoánxuhướngtiêu thụtrongtương laidựatrên cácdấuhiệuvàxu hướngtừquákhứ.
Nghiêncứutậptrung vàobộdữliệudoanhsốbánhàngtròchơivideotừcác nềntảngkhácnhau,bao gồmcácthểloạivànhàxuấtbảnkhácnhau.Tuynhiên, việcphântíchsẽtậptrungchủyếuvàomộtsốyếutốchínhnhưdoanhsốbánhàng theokhuvực,thểloạitròchơi,vànềntảngpháthành.
Việcphântíchdữliệutronglĩnhvựctròchơivideokhôngchỉgiúpchúngta hiểurõhơnvềsởthíchvàxuhướngtiêudùngcủangườichơi,màcònđónggóp vàoviệcđịnh hìnhchiếnlượcphát triểnsảnphẩmcủacácnhàpháttriểngame cũngnhưquảnlýthịtrường củacácnhàxuấtbản.Điềunàycũnggiúptạoracái nhìntổngthểvềsựpháttriểncủa ngànhcông nghiệptrò chơivideo vàtầmảnh hưởngcủanóđốivớingườichơivàxãhội.
Trongtiểuluậnnày,chúngtôisẽsửdụng cácphươngpháphọcmáy Dữliệuthu thậpsẽđượctiềnxửlýđểchuẩnbịcho việcxâydựngmôhình.
Khoahọc dữliệuvàhọcmáylàhai lĩnhvựcquantrọngtrong lĩnhvựccông nghệthôngtin vàtrítuệnhân tạo.Dướiđâylàmộttổngquanvề hailĩnhvựcnày:
Khoahọc dữliệuliênquanđếnviệcthuthập,lưutrữ,xửlývàphântích dữ liệuđểtìmhiểuthôngtinhữuíchtừchúng.
Nóbaogồmcáccôngcụvàkỹthuậtđểkhámphádữliệu,tạorabáocáovà trựcquan hóathôngtinđể hỗtrợquyếtđịnhkinhdoanh.
Cácphươngpháptrongkhoahọcdữliệubaogồmkhaiphádữ liệu,xửlý ngônngữtựnhiên,vàkhámphátrithứctừdữliệu,giúptạoragiátrịtừ thôngtin.
Phântíchxuhướngtiêudùng: Sử dụngđểphântích hànhvitiêudùngvàsở thíchcủangườichơi,từđógiúpnhàpháttriểntròchơihiểurõhơnvềthị trườngvàtạora cácsảnphẩmphùhợp.
Phântíchdữliệuthịtrường:Ápdụngđể đánhgiáthịtrường, dựbáoxu hướngtiêudùngvàđưaracácchiếnlược kinhdoanh hiệuquả.
Phântíchhiệusuấtsảnphẩm:Sửdụng đểđánhgiáhiệusuấtcủacáctrò chơicụ thể, từđó tối ưuhóatrảinghiệmngười chơivàtăng cường doanh số bánhàng.
Họcmáy làmộtlĩnhvựctrong trítuệnhântạomàmáytínhhọc từdữ liệu màkhôngcần lậptrìnhcụthể.
Nóbaogồmviệcsửdụngcácthuậttoánvàmôhìnhmáytínhđểhiểuvàdự đoándữliệudựatrêncácmẫuvàthông tinđãhọctừ dữliệuhuấnluyện.Họcmáy cónhiềuứngdụng,từ phânloại hìnhảnh đếndự đoángiá cổphiếu vàphântíchtươngtácngườidùngtrênmạng xãhội.
Trường Đại học Ngân hàng…
1 COSO Mc Nally Transition Article- Final COSO Version Proof 5-31-13…
Dựđoándoanhsốbánhàng:Ápdụngmôhìnhhọcmáyđểdựđoándoanh sốbánhàngcủacáctròchơidựatrêncácyếutốnhưthểloại,nềntảngphát hành,vàkích thướcthịtrường.
Tốiưuhóatrảinghiệmngườichơi:Sửdụngđểđềxuấtgợiýtròchơidựa trênhànhvi vàsởthích củangườichơi,tạoratrảinghiệmtốtnhấtcho ngườidùng.
Pháthiệngian lậnvàbảomật:Ápdụngđểpháthiệncáchành vigianlận trongtròchơitrựctuyếnvàtăngcườngbảomậthệthốngđểbảovệthông tincánhâncủangườichơi.
Việcápdụnghọc máyđểdựđoándoanhsốbánhànggamecóthểđượcthực hiệnthôngqua cácbước sau:
1 ThuthậpDữLiệu: Đểhuấnluyệnmôhìnhdự đoándoanh sốbánhàng,bạn cầnthuthậpdữliệuliênquanđến cácyếutốcóthểảnhhưởngđếndoanhsố nhưquảngcáo,giácả,đánhgiácủangườichơi, vàthờigian ramắtgame.
2 TiềnXử LýDữLiệu:Dữliệu thường cầnđược làmsạchvàbiến đổitrước khihuấnluyệnmôhình.Điềunàybaogồmloạibỏdữliệuthiếu,chuẩnhóa dữliệuvà mãhóacácbiếnphânloạithànhbiếnsố.
3 ChọnMô Hình:Chọnmộtmô hìnhhọcmáyphùhợpnhưLinear Regression, DecisionTrees,hoặcNeuralNetworksdựatrênloạidữliệuvàbàitoándự đoán.
4 HuấnLuyệnMôHình:Sửdụngdữliệuhuấnluyệnđểđàotạomôhình.Mô hìnhsẽhọccácmẫutừdữ liệunàyđểdựđoándoanh sốbánhàng.
5 ĐánhGiáMôHình:Sửdụngdữliệukiểmtra đểđánh giáhiệusuấtcủa mô hình bằng các chỉ số như Mean Absolute Error (MAE) hoặc Root Mean SquaredError(RMSE).
6 Tinhchỉnhvà triểnkhai:Nếucần,bạncóthểtinh chỉnhmôhìnhvàtriển khainóvào sảnphẩmhoặc quytrình kinhdoanh.
7 TheoDõivà CảiTiến:Duy trìmôhìnhvà cậpnhậtnókhi cóthêmdữliệu mớiđểcảithiệndựđoán.
Cáccôngcụhọcmáy
TensorFlow vàKeras:Đượcsửdụngđể xâydựngvàhuấnluyệncácmô hìnhhọcsâu vàmạngnơ rontrong machinelearningvàdeeplearning.
Scikit-learn:Làthưviệnchínhchomachinelearningtrong Python,cung cấp cáccôngcụcho họccógiámsát, họckhônggiám sátvàtiềnxửlýdữliệu.
SimpleImputer:Làcôngcụđểđiềnvàocácgiátrịthiếutrongdữliệubằng cácgiátrịthốngkê,giúpchuẩnbịdữ liệuchoquátrìnhhuấnluyệnmôhình.
LinearRegression:Môhình hồiquytuyếntính,được sửdụng đểdựđoán cácgiátrịliêntụcdựatrêncácbiếnđộclập.
RandomForestRegressor: Môhìnhhọcmáysửdụngnhiềucâyquyếtđịnh đểdựđoángiátrịliêntục,tậndụngtínhđadạngcủacác câyđểcảithiệnđộ chínhxác.
SVR(SupportVectorRegression):Mô hình học máy dựa trên Support VectorMachine,đượcsửdụngđểdựđoángiátrịliêntụcvàphânloạidữ liệu.
AdaBoostClassifier:Là mộtthuậttoánboostingtrong machine learning, nó kếthợpnhiều môhìnhyếuthànhmộtmôhìnhdựđoán mạnhmẽhơn.
MÔ TẢ DỮ LIỆU
Nguồn gốc:Datasetsand Machine LearningProjects |Kaggle
Số Biến (Variables): gồm 10 biến, trong đó có: 5 biến phân loại (dimensions), 5biếnđolường(metrics).
+ JP_Sales:Dữliệukiểusốthậpphân(Floating pointnumber). + Global_Sales: Dữliệukiểusốthậpphân (Floating point number). + EuropeSales:Dữliệukiểusốthậpphân (Floating pointnumber). + OtherSales: Dữliệukiểu sốthậpphân(Floating pointnumber). + North America Sales: Dữ liệu kiểu số thập phân (Floating point number).
+ Platform(Nền tảng):Nềntảngtròchơi(vídụ: Wii,PS3,DS). + Year(Năm):Nămpháthànhtròchơi(vídụ:2003, 1985,2004) + Genre(Thểloại):Thểloại củatròchơi(vídụ:Sports,Racing, Role Playing).
+ Publisher: Nhà pháthànhtrò chơi.(vídụ:Nintendo, MicrosoftGame Studios,Take TwoInteractive)
+ JP_Sales(Doanh sốtạiNhậtBản):Sốlượngbảnsaođượcbántạithị trườngNhậtBản.
+ Global_Sales (Tổngdoanhsốtoàncầu):Tổng sốlượngbảnsaođược bántrêntoàn thếgiới.
+ EuropeSales: (DoanhsốtạiChâu Âu): Sốlượngbảnsaođượcbán tạithịtrường
+ NorthAmerica Sales: (Doanh sốtạiBắcMỹ):Số lượngbảnsaođược bántạithịtrường
3 Môtả dữliệubằng cáccông cụtrực quanhóa:
Lệnh!pipinstallpandas làmộtlệnhđượcsửdụngtrongmôitrườngColabđểcài đặt thư viện Pandas thông qua trình quản lý gói Python, tức là pip Khi chạy lệnh!pip installpandas, nósẽtảivàcài đặtthưviệnPandas từPython Package Index(PyPY) trênmôitrườnglàmviệc ĐiềunàylàcầnthiếtđểsửdụngPandas trongcáctệphoặcmãPython củabạn.Lệnhnày chỉcầnthựchiệnmột lầnchomỗi môitrườngcụthể
Biểuđồthanhhiểnthịcácgiátrịcủacột"Genre",chúngtacóthểnhậnthấy rằngthểloại"Action"và"Sports"là haithểloạiphổbiếnnhất,chiếmtỷlệlớn trongsốlượngcáctròchơiđượcphânloại Các thểloại"Role Playing"và
"Shooter" cũng có sự đóng góp đáng kể Trong khi đó, các thể loại như
"Simulation", "Fighting","Puzzle"và"Adventure"cósốlượng tròchơi íthơn sovớicác thểloạichính.
Biểu đồthểhiệnDoanhsốởNhậtBản
Nhậnxét:Biểuđồ tươngquangiữathểloạigamevà doanh sốởNhậtBản chochúngtacáinhìnvềsựưachuộngcủacácthểloạigametrongthịtrườngNhậtBản Thể loại"Role Playing" đạtdoanh sốcaonhất(0,25triệungười dùng),chothấysựưachuộngcủangườichơiNhậtBảnvớicáctròchơinhập vai.Cácthểloại"Platform"và"Fighting"cũngcódoanhsốđángkể.Tuy nhiên,thểloại"Shooter"và"Sports"lạicódoanh sốthấphơn,cóthểphản ánhsựkhácbiệttrongsởthíchvàthịhiếucủangườichơiNhậtBản.=> Nên đầutưvàoRole Playing tạinhậtbản
Biểu đồthểhiệnDoanhsốởNorthAmerica
Nhậnxét: "Hànhđộng" đạtdoanh sốcaonhất(0.5 0.6),chothấy sựưa chuộngcủa ngườichơiBắcMỹvới cáctròchơihànhđộng.Thểloại"Thể thao"cũng códoanhsốđáng kể,chothấysựquantâmcủangườichơiđến cáctròchơi liênquanđếnthểthao.Cácthểloạikhácnhư"Bắnsúng","Nền tảng"và"Khác"cũngcódoanh sốtươngđốicao.Tuynhiên,cácthểloạinhư
"Đốvui", "Chiếnlược"và "Phiêulưu"lạicódoanhsố thấphơnở BắcMỹ.
Biểu đồthểhiệnDoanhsốởEurope
Nhậnxét:"Hànhđộng"và"Thểthao"đạtdoanhsốcaonhấtgầnngang nhau0.25triệungười,chothấysựưachuộngcủangườichơichâuÂuvới cáctròchơihànhđộngvàthểthao.Cácthểloạinhư"Bắnsúng","Nềntảng" và"Khác"cũngcódoanh sốđángkể.Tuy nhiên,cácthểloại"Nhậpvai",
"Đuaxe"và"Môphỏng"códoanhsốkhôngcaobằngmặcdùvẫncósựhiện diện.Thểloại"Đốvui"và"Chiếnlược"lạicódoanh sốthấp hơnsovớicác thểloạikhác.
BiểuđồthểhiệnDoanhsố ởmộtsốquốcgiakhác
Nhậnxét: Shooterlà thểloạigame được ưachuộngnhấtvới0.085triệu người, Racing đứng thứ hai với 0.65 triệu người Trái ngược với đóAdventure và Puzzle đứng top cuối, 0.15 và 0,25 triệu người Còn lạiPlatformvàActionđạtmứctrungbìnhcủabiểuđồ.
Biểu đồthểhiện Doanhsốởtoànthế cầu
Nhậnxét:"Action"và"Sports" códoanh sốtoàncầucaonhất,chothấysự phổbiến củacác tròchơihànhđộng vàthểthaotrêntoàncầu.Cácthểloại gamenhư"Shooter","Role Playing" và"Platform"cũngcódoanhsốtoàn cầu khá cao Trong khi đó, các thể loại như "Puzzle", "Strategy" và
Biểuđồbiểuthịtop10 Thểloại(Genre) códoanhsốcao nhấtcủamỗi khuvực
Biểu đồbiểuthịtop10Thể loại(Genre)códoanhsốcaonhấtcủa NhậtBản
Hình11.Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcao nhấtcủaNhậtBản
Nhậnxét:Biểuđồ"Top10ThểloạicódoanhsốcaonhấtởNhậtBản"cho thấythểloạigamephổbiếnnhấtlà"Role Playing" (RPG)vàcósựđadạng trongsởthíchcủangườichơiNhậtBản,vớicác thể loại"Action","Sports",
Biểu đồbiểuthịtop10Thể loại(Genre)códoanhsốcaonhấtcủa NorthAmerica
Hình12.Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcao nhấtcủaNorthAmerica
Nhậnxét :Thểloại"Action"(Hànhđộng)đứngđầuvớidoanhsốbánhàng caonhất,chothấysựhấpdẫn củacáctròchơiđầyhànhđộngvàphiêulưu. Thêmvàođó,ngườichơiBắcMỹcũngthểhiệnsựquantâmđếncácthểloại
"Sports"(Thểthao), "Shooter" (Bắn súng),và"Role Playing" (RPG), với doanhsố caovà nằmtrongtop 10 Ngoài ra,cácthểloạitròchơitruyền thốngnhư"Platform"(Nềntảng)và"Misc"(Đadạng)cũng códoanhsố đángkể.
Biểu đồbiểuthịtop10Thể loại(Genre)códoanhsốcaonhấtcủa Europe
Hình13.Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcao nhấtcủaEurope
Nhậnxét :ChâuÂucósởthíchđadạng vàquan tâmđếnnhiềuthểloại game khác nhau Các thể loại trò chơi truyền thống như "Platform" và
"Misc"cũng códoanhsốđángkể,chothấysựquan tâmcủangườichơiđối vớicáctròchơimangtínhsángtạovàđadạng.
Biểu đồbiểuthịtop10Thể loại(Genre)códoanhsốcaonhấtcủa othercountries
Hình14.Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcao nhấtcủaother countries
Nhậnxét :Thểloạicódoanhsốcaonhấtởcáckhuvựckhác"chothấycộng đồnggamethủởcáckhuvựcngoàiBắcMỹvàChâuÂu cósởthíchvàquan tâmđadạng đốivớicácthểloạigame Thểloại"Action"dẫnđầudanhsách,kèmtheosự quantâmđến"Sports","Shooter","Role Playing"và"Platform".
Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcaonhấtcủatoàncầu
Hình15.Biểuđồbiểuthịtop10Thểloại(Genre)códoanhsốcao nhấtcủatoàncầu
Nhậnxét:"Action" dẫnđầudanhsách vớidoanh sốbánhàngcaonhất,cho thấysựhấpdẫnvàphổbiếncủacáctròchơihànhđộng.Ngoàira,cácthể loại "Sports", "Shooter", "Role Playing" và "Platform" cũng đạt doanh số caovànằm trongtop10 Điềunàycho thấycộngđồnggamethủtrêntoàn cầucósởthíchvàquantâmđadạngđốivớicác thểloạigame.
Hiểnthị bảnđồnhiệtđểhiểnthịmốitươngquancủadoanhsốcáckhuvực
Nhậnxét:Biểuđồheatmaptrêncungcấpcáinhìntổngquan vềmốiquan hệtương quangiữacácbiếndoanh sốbánhàng ởcáckhuvực khácnhau và doanhsốbánhàngtoàncầu.Quaphântíchbiểu đồ, ta nhận thấymốiquan hệtíchcực mạnhgiữadoanh số bánhàngtại NhậtBảnvàdoanhsốbán hàng toàncầu,chothấysựảnhhưởngquantrọngcủathịtrườngNhậtBảnđốivới ngành công nghiệp game Ngoài ra, cũng có mối quan hệ tích cực giữa doanhsốbánhàngtạiBắcMỹ,châuÂuvàcáckhuvựckhácvớidoanhsố bánhàngtoàncầu,chothấysựtươngquanmạnhmẽgiữacácthịtrườngnày vàdoanh thutoàncầu Biểuđồnàycungcấp thôngtinquan trọngvềsự phụ thuộcvàtương tácgiữacácthịtrườngquốctếtrong ngànhgame,hỗtrợcác nhàpháttriểnvànhàquảnlýthịtrườngtrongviệchiểurõhơnvềxuhướng vàtiềmnăngcủatừngkhu vực. Đưaralờikhuyênchocác nhàkinhdoanh game:
"Phântíchcácsốliệubánhàngởcáckhu vựckhácnhauchothấythịtrườnggame cósựđadạng vàđặcthùriêngtạimỗi khuvực.ĐốivớithịtrườngNhậtBản, thể loạigamenhưRPGvàhànhđộngtiếptụclànhữngyếutốquantrọng đểthuhút ngườichơi vàtăng doanhsố bánhàng Trongkhi đó,ởBắcMỹ,cáctròchơihành độngvàthểthaolànhữnglựachọnphổbiếnchongườichơi,trongkhi tạichâuÂu, sựđadạngthểloạinhưhànhđộng,thểthao,bắn súngvàRPG tạoracơhộikinh doanhhấpdẫn.Đốivới cáckhuvựckhác,việctìmhiểuvàtậndụngsởthíchđịa phươnglàquantrọngđểtăngdoanhsốbánhàng.Cuốicùng,đểtậndụngtiềm năngtoàncầu,việcđadạnghóasảnphẩmvàthíchnghivớinhucầucủangười chơitrênthếgiớilàchìakhóađể mởrộngsự hiệndiệnvàtăngdoanh sốbánhàng trêntấtcảcáckhuvực.Vớisựhiểubiếtvềcácxu hướngvàsởthích củatừngthị trường,cácnhàkinhdoanh gamecóthể tốiưuhóachiếnlượccủamìnhvàđạt đượcthànhcôngtrêntoàn cầu."
PHÂN TÍCH DỮ LIỆU
Thảo luận về Kết quả
KếtquảphântíchdữliệuchothấyWiiSportsvàSuperMarioBros.làhai trongsốnhữngtròchơiđượcưachuộngnhất ởcảBắcMỹvà ChâuÂu. Môhìnhđãchokếtquảdựbáochínhxácvớiđộchínhxácđạttrên85%trên tậpkiểmtra.
SựphổbiếncủatròchơiWiiSportsvàSuperMarioBros.tạinhiềukhuvực khácnhauchỉra tiềmnănglớnchocácloạitròchơitươngtựtrong tươnglai. Tínhchínhxáccaocủamôhìnhdựbáocungcấpsựtincậychoviệcsử dụngphântíchdữ liệuvàhọcmáy trongdựbáodoanh sốbánhàngtròchơi điệntử.
Bộdữliệutròchơiđiệntửđãcungcấpthông tinquýbáuvềsởthíchngười chơitrêntoàncầuvàmốiquanhệgiữacáctựagame vàdoanhsố bánhàng. Cácmôhìnhhọcmáyđãchứngminhkhảnăngdựbáomạnhmẽ,đónggóp tíchcựcvào việchiểubiếtthịtrường vàpháttriểnsản phẩm.
Sựthiếusótvềdữliệutừmộtsố khuvựccóthểlàmgiảmđộchínhxáccủa môhìnhdựbáo. Đềxuấtcảitiếnbằngcách thựchiệnnghiêncứusâuhơnvềthịtrườngtrong từngkhuvựccụthểđểbổsungdữ liệu.
Kếtquảnghiêncứucó thểhỗtrợcácnhàpháttriểntròchơitrongviệcphát triểncácdự ánmớidựatrênsự ưachuộngcủa cáctựagamephổbiến.
Báocáođã chứngminh sứcmạnhcủaphântíchdữliệuvà họcmáytrong việchiểubiếtthịtrường vàdựbáodoanh sốbánhàng.
Kết quả nghiên cứu cung cấp thông tin quan trọng cho quyết định kinh doanhvàchiến lượctiếpthịtrongngành côngnghiệptròchơiđiệntử.
Trường Đại học Ngân hàng…
BAI TAP KE TOAN TAI Chinh 2
Trường Đại học Ngân hàng Thành phố H…
KI Ể M TRA NHÓM L27 - abc pháp luật đại cương None
Thông TIN BÀI KI Ể M TRA NHÓM