Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 24 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
24
Dung lượng
1,75 MB
Nội dung
ĐẠI HỌC HUẾ KHOA KỸ THUẬT VÀ CÔNG NGHỆ BÁO CÁO ĐỒ ÁN (TIỂU LUẬN, BÀI TẬP LỚN) Học kỳ I, năm học 2021 - 2022 Học phần: Phân tích liệu R Đề tài: Phân tích liệu phim IMDb Số phách (Do hội đồng chấm thi ghi) Thừa Thiên Huế, ngày tháng năm 2022 ĐẠI HỌC HUẾ KHOA KỸ THUẬT VÀ CÔNG NGHỆ BÁO CÁO ĐỒ ÁN (TIỂU LUẬN, BÀI TẬP LỚN) Học kỳ I, năm học 2021 - 2022 Học phần: Phân tích liệu với R Đề tài: Phân tích liệu phim IMDb Giảng viên hướng dẫn: Hồ Quốc Dũng Sinh viên thực hiện: Nguyễn Trịnh Tấn Đạt Lớp: KHDL&TTNT Số phách (Do hội đồng chấm thi ghi) Thừa Thiên Huế, ngày tháng năm 2022 ĐẠI HỌC HUẾ KHOA KỸ THUẬT VÀ CÔNG NGHỆ PHIẾU ĐÁNH GIÁ ĐỒ ÁN/TIỂU LUẬN/BÀI TẬP LỚN Học kỳ I, năm học 2021 - 2022 Cán chấm thi Nhận xét: Cán chấm thi Nhận xét: Điểm đánh giá CBCT1: Điểm đánh giá CBCT2: Bằng số: Bằng số: Bằng chữ: Bằng chữ: Điểm kết luận: Bằng số: Bằng chữ: Thừa Thiên Huế, ngày tháng năm 2021 Cán chấm thi Cán chấm thi (Ký ghi rõ họ tên) (Ký ghi rõ họ tên) MỤC LỤC CHƯƠNG I: GIỚI THIỆU NGÔN NGỮ R I: Khái quát chung Giới thiệu R Ưu điểm R II: Hướng dẫn sử dụng R Cài đặt giao diện Nhập liệu R 2.1 Nhập liệu trực tiếp từ dòng lệnh theo cấu trúc từ hàm c(): 2.2 Nhập liệu từ cửa sổ nhập Data Editor: 2.3 Nhập liệu từ File text 2.4 Nhập liệu từ File Excel .8 Các lệnh hệ thống 3.1 Lệnh môi trường vận hành R 3.2 Lệnh 3.3 Trợ giúp R .9 Tổ chức liệu R Các hàm thống kê đồ thị 5.1 Các hàm thống kê 5.2 Phân phối thống kê .10 5.3 Phân tích thống kê 10 5.4 Đồ thị 11 CHƯƠNG II: ĐỒ ÁN PHÂN TÍCH DỮ LIỆU VỚI R .12 I: Mổ tả tổng quan liệu sử dụng 12 II: Phân tích thơng kê mơ tả liệu 12 III: Phân tích số liệu 22 CHƯƠNG I: GIỚI THIỆU NGÔN NGỮ R I: Khái quát chung Giới thiệu R Năm 1996, báo quan trọng tính tốn thống kê, hai nhà thống kê học Ross Ihaka Robert Gentlan thuộc Trường đại học Auckland, New Zealand phác hoạ ngôn ngữ cho phân tích thống kê mà họ đặt tên R Sáng kiến nhiều nhà thống kê học giới tán thành tham gia vào việc phát triển R Vậy R gì? Nói cách ngắn gọn, R phần mềm sử dụng cho phân tích thống kê vẽ biểu đồ Thật ra, chất, R ngơn ngữ máy tính đa năng, sử dụng cho nhiều mục tiêu khác nhau, từ tính tốn đơn giản, tốn học giải trí(recreational mathatics) , tính tốn ma trận(matrix) , đến phân tích thống kê phức tạp Vì ngơn ngữ, người ta sử dụng R để phát triển thành phần mềm chuyên môn cho vấn đề tính tốn cá biệt Ưu điểm R R có chứa nhiều loại kỹ thuật thống kê: mơ hình hóa tuyến tính phi tuyến, kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm, v v đồ họa R R có tính mở rộng cao cách sử dụng gói cho người dùng đưa lên cho số chức lĩnh vực nghiên cứu cụ thể Một điểm mạnh khác R tảng đồ họa tạo đồ thị chất lượng cao biểu tượng toán học Dù R dùng chủ yếu nhà thống kê dùng làm cơng cụ tính tốn ma trận tổng quát với kết đo đạc cạnh tranh so với GNU Octave đối thủ thương mại nó, MATLAB Giao diện RWeka thêm vào phần mềm khai phá liệu phổ biến Weka, cho phép đọc/ghi định dạng arff cho phép sử dụng tính khai phá liệu Weka thống kê R Ngơn ngữ R có nhiều ưu điểm so với ngơn ngữ lập trình bậc cao C , C++ , Java… R có khả điều khiển liệu lưu trữ số liệu, R có tính ngun R cho phép sử dụng ma trận đại số Có thể sử dụng bảng băm biểu thức quy R hỗ trợ lập trình hướng đối tượng Khả biểu diễn đồ họa phong phú Ngôn ngữ R cung cấp cấu trúc điều khiển ngôn ngữ lập trình bậc cao khác Ví dụ :If…else…;while… ;for……vv II:Hướng dẫn sử dụng R Cài đặt giao diện Để sử dụng R, việc phải cài đặt R máy Khi tải R xuống máy tính, bước cài đặt vào máy tính Để làm việc này, đơn giản nhấn chuột vào tài liệu làm theo hướng dẫn cách cài đặt hình Đây bước đơn giản, cần phút việc cài đặt R hồn tất Sau hồn tất việc cài đặt, icon xuất desktop máy tính(Hình bên) Đến sẵn sàng sử dụng R Cóthể nhấp chuột vào icon có cửa sổ sau: Nhập liệu R Dữ liệu mà R hiểu phải liệu data.frame 2.1 Nhập liệu trực tiếp từ dòng lệnh theo cấu trúc từ hàm c(): Tên_biến_lưu_dữ_liệu