ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KHOA HỌC - KỸ THUẬT MÁY TÍNH CẤU TRÚC RỜI RẠC CHO KHMT (CO1007) Đề tập lớn cho Nhóm n Thống kê mô tả Xác suất rời rạc với R GVHD: SV thực hiện: Nguyễn An Khương Huỳnh Tường Nguyên Nguyễn Văn A – 22102134 Trần Văn B – 88471475 Lê Thị C – 36811334 Phạm Ngọc D – 97501334 Kiều Thị E – 12341334 Tp Hồ Chí Minh, Tháng /2016 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Mục lục Hướng dẫn yêu 1.1 Hướng dẫn 1.2 Yêu cầu 1.3 Nộp cầu 2 2 Đề Cách đánh giá xử lý gian lận 3.1 Đánh giá 3.2 Xử lý gian lận 4 Tài liệu Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016 Trang 1/5 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Hướng dẫn yêu cầu 1.1 Hướng dẫn • Cài đặt đồng thời R Rstudio • Đọc kĩ xử lý lại tất thí dụ có file mẫu • Tìm hiểu kĩ cách soạn thảo văn LaTeX cách sử dụng phần mềm R file hướng dẫn tìm hiểu thêm tài liệu khác • Tạo chung folder chung chứa thứ cần thiết để share thành viên nhóm cloud services Google Drive hay Dropbox, • Dùng Doodle để lên kế hoạch họp nhóm • Dùng Trello để quản lý project • Đối với Bài toán 4, cần tham khảo kĩ cú pháp để tính số liệu website Wolfram Alpha nhúng liên kết vô kết Bài tập mẫu số 1.2 Yêu cầu • Thời gian làm bài: Từ 12/12/2015-29/1/2016 Đối với toán, yêu cầu sinh viên trình bày lời giải theo lối truyền thống, sử dụng công thức, kết lý thuyết phần kiến thức chuẩn bị Đồng thời, sau trình bày kết tính toán biểu đồ minh họa R • Trình bày code R kết tính toán R gống file mẫu • Viết báo cáo theo bố cục file mẫu LaTeX • Mỗi nhóm nộp cần phải nộp theo file log (nhật ký) ghi rõ: tiến độ công việc, phân công nhiệm vụ, trao đổi thành viên, 1.3 Nộp • SV nộp qua hệ thống Sakai: nén tất file cần thiết (file tex, file R, ) thành file tên “BTL-CO1007-MT151-Nhom-n.zip” nộp mục Assignment • Lưu ý: nhóm cần thành viên nhóm trưởng nộp Đề Bài toán Trong gói mistat, tập tin FILMSP.csv chứa liệu thu thập từ 217 cuộn phim Dữ liệu chứa tốc độ phim đo phòng đặc biệt Các lệnh R sau cài đặt gói mistat, đọc tập liệu FILMSP tốc độ phim đo được, hiển thị chúng hình máy tính > # Sau dấu comment > install.packages("mistat", # Cài đặt gói mistat dependencies=TRUE) # tất gói có liên quan đến Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016 Trang 2/5 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính > > > > library(mistat) # Gọi tập liệu hàm có gói data(FILMSP) # Gọi tập liệu tốc độ phim đo help(FILMSP) # Đọc tất thông tin hỗ trợ tập liệu FILMSP FILMSP # Đưa số liệu FILMSP hình máy tính Hãy trích xuất tốc độ phim đo 30 cuộn phim số 217 cuộn phim tập liệu kể từ cuộn phim thứ 100 + n? (n số thứ tự nhóm.) Tính tần số, tần suất tần suất tích lũy mẫu 30 cuộn phim Vẽ biểu đồ tần số mẫu 30 cuộn phim Vẽ biểu đồ tần suất mẫu 30 cuộn phim Vẽ biểu đồ tần suất tích lũy mẫu 30 cuộn phim Tính tốc độ trung bình, trung vị mẫu, cực đại mẫu, cực tiểu mẫu 30 cuộn phim Hãy đo mức độ phân tán tộc độ phim (xung quanh giá trị trung bình) 30 cuộn phim Tính độ méo lệch (skewness), độ nhọn (kurtosis) liệu 30 cuộn phim Tính tứ phân vị (quartile) thứ (Q1 ) thứ ba (Q3 ) mẫu 30 cuộn phim 10 Tính phân vị thứ (100 − n)%, phân vị thứ n%, phân vị thứ (50 ± n2 )% mẫu 30 cuộn phim Bài toán Một máy dùng để kiểm tra tình trạng hàng (khiếm khuyết D, tốt G) bị lỗi Xác suất lỗi cho sau P(A|G) = (100 − P(A|D) = n )%, 1000 2n , 1000 A biến cố “món hàng xem tốt (G) sau kiểm tra” Nếu P(G) = 3n )%, xác suất D biết A bao nhiêu? (100 − 1000 Bài toán Có 1000 − n bo mạch điện tử đựng hộp, biết có bo mạch bị lỗi Lấy ngẫu nhiên không hoàn lại bo mạch Tính xác suất để tìm thấy xác 100 − n bo mạch tốt lần rút bo lỗi lần rút bo lỗi thứ hai? Bài toán Một khối tín hiệu gồm 256 bit dẫn theo kênh truyền với xác suất bị lỗi bit p = n × 10−3 Biết khả bị lỗi bit độc lập với Số bit lỗi khối tín hiệu tuân theo luật phân phối xác suất nào? Nói cách khác, tuân theo mô hình xác suất nào? Vì sao? Hãy vẽ biểu đồ minh họa phân phối xác suất (điểm) số bit lỗi khối tín hiệu với X ≤ 30? Hãy vẽ đồ thị hàm phân phối xác suất (tích lũy) số bit lỗi khối tín hiệu với X ≤ 30? Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016 Trang 3/5 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Tính xác suất để khối tín hiệu có 100 − n bit lỗi? Tính xác suất để khối tín hiệu có tối đa n + 10 bit lỗi? Tính xác suất để khối tín hiệu có nhiều n + bit lỗi? Tính xác suất để khối tín hiệu có 100 + n bit lỗi? Tính xác suất để khối tín hiệu có từ 100 đến 200 − n bit lỗi? Tính số bit lỗi trung bình khối tín hiệu đó? 10 Tính độ phân tán số bit lỗi khối tín hiệu đó? Bài toán Một❤lô hàng gồm✭N = 5000 − n sản phẩm có chứa M = 150 − n sản phẩm lỗi Lấy ❤❤ ✭✭lại n + 50 sản phẩm Tính xác suất có nhiều n sản phẩm lỗi ✭ ❤ mẫu ngẫu nhiên ✭ không hoàn ✭✭❤ ❤❤ mẫu? Bài toán (Tùy chọn) Đọc kỹ “Birthday Problem” “Birthday Attack” slides Chương (từ slide 7.18-7.22) Sau đó, tìm công thức tính xác suất công thức xấp xỉ hàm mũ công thức cho biến thể “Bài toàn sinh nhật” Có nhóm gồm k nam giới nhóm khác gồm phụ nữ (k, ≥ 1) Hãy tính xác suất để có đôi nam nữ có ngày sinh Cách đánh giá xử lý gian lận 3.1 Đánh giá Mỗi làm đánh sau Nội dung Giải toán công thức lập luận Các lệnh (hàm) R sử dụng đắn hợp lý Trình bày kiến thức chuẩn bị rõ ràng, phù hợp Trình bày văn đẹp, chuẩn 3.2 Tỉ lệ điểm (%) 30% 30% 20% 20% Xử lý gian lận Bài tập lớn phải sinh viên (nhóm) TỰ LÀM Sinh viên (nhóm) bị coi gian lận nếu: • Có giống bất thường thu hoạch (nhất phần kiến thức chuẩn bị) Trong trường hợp này, TẤT CẢ nộp có giống bị coi gian lận Do sinh viên (nhóm) phải bảo vệ làm • Sinh viên (nhóm) không hiểu làm viết Sinh viên (nhóm) tham khảo từ nguồn tài liệu nào, nhiên phải đảm bảo hiểu rõ ý nghĩa tất viết Bài bị phát gian lận sinh viên bị xử ý theo quy định nhà trường Đây làm thêm, dành cho bạn yêu thích tổ hợp Có thể nộp riêng theo SV để lấy điểm thưởng Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016 Trang 4/5 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa Học Kỹ Thuật Máy Tính Tài liệu [Dal] Dalgaard, P Introductory Statistics with R Springer 2008 [K-Z] Kenett, R S and Zacks, S Modern Industrial Statistics: with applications in R, MINITAB and JMP, 2nd ed., John Wiley and Sons, 2014 [Ker] Kerns, G J Introduction to Probability and Statistics Using R, 2nd ed., CRC 2015 Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016 Trang 5/5 ... tex, file R, ) thành file tên “BTL-CO1007-MT151-Nhom-n.zip” nộp mục Assignment • Lưu ý: nhóm cần thành viên nhóm trưởng nộp Đề Bài toán Trong gói mistat, tập tin FILMSP.csv chứa liệu thu thập... project • Đối với Bài toán 4, cần tham khảo kĩ cú pháp để tính số liệu website Wolfram Alpha nhúng liên kết vô kết Bài tập mẫu số 1.2 Yêu cầu • Thời gian làm bài: Từ 12/12/201 5-2 9/1/2016 Đối với... phối xác suất (tích lũy) số bit lỗi khối tín hiệu với X ≤ 30? Đề tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 201 5-2 016 Trang 3/5 Trường Đại Học Bách Khoa Tp.Hồ Chí Minh Khoa Khoa