Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 28 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
28
Dung lượng
0,92 MB
Nội dung
BỘ THÔNG TIN VÀ TRUYỀN THÔNG HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - - BÀI TIỂU LUẬN Môn học: An Ninh Mạng Viễn Thông ĐỀ TÀI: TẠO SỐ NGẪU NHIÊN (RANDOM NUMBER GENERATION) Giảng viên hướng dẫn: Thầy Nguyễn Chiến Trinh Nhóm sinh viên thực hiện: Nhóm 14 Danh sách thành viên: Hoàng Thị Ngọc Anh – B12DCVT293 Đinh Hoàng An – B12DCVT095 Nguyễn Minh Hùng – B12DCVT114 Lương Bảo Toàn – B12DCVT338 Hà Nội – 5/2016 Phân công công công việc nhóm 14: Hoàng Thị Ngọc Anh: Các thuật toán để tạo số ngẫu nhiên Lương Bảo Toàn: Tìm hiểu phần tạo biến ngẫu nhiên phương pháp phép biến nghịch đảo Lấy mẫu từ phân phối xác suất liên tục Nguyễn Minh Hùng: Tìm hiểu phần tạo biến ngẫu nhiên phương pháp Lấy mẫu từ phân phối xác suất riêng biệt Lấy mẫu từ phân phối xác suất thực nghiệm Đinh Hoàng An: Tìm hiểu phần tạo biến ngẫu nhiên phương pháp loại trừ (Rejection) phương pháp Monte Carlo MỤC LỤC MỞ ĐẦU 2.1 GIỚI THIỆU .2 2.2 THUẬT TOÁN TẠO RA CÁC SỐ GIẢ NGẪU NHIÊN 2.2.1 Phương pháp nửa bình phương 2.2.2 Phương pháp đồng dư bậc hai 2.2.3 Phương pháp đồng dư tuyến tính 2.2.4 Phương pháp đồng dư cộng CHƯƠNG III: TẠO BIẾN NGẪU NHIÊN 3.1 GIỚI THIỆU .1 3.2 CÁC PHƯƠNG PHÁP ĐỂ TẠO BIỄN NGẪU NHIÊN 3.2.1 Phương pháp phép biến nghịch đảo 3.2.2 Lấy mẫu từ phân phối xác suất liên tục .3 3.2.3 Lấy mẫu từ phân phối xác suất riêng biệt 3.2.4 Lấy mẫu từ phân phối xác suất thực nghiệm 3.2.5 Phương pháp loại trừ (Rejection) .11 3.2.6 Phương pháp Monte Carlo 13 MỞ ĐẦU Các số ngẫu nhiên đã được sử dụng từ hàng nghìn năm trước Dù là tung đồng xu hay tung một xúc xắc thì chúng đều đưa tới kết quả là một giá trị ngẫu nhiên Những bộ tạo số ngẫu nhiên cũng tương tự – người thiết lập đều cố gắng để tạo các giá trị đạt tới ngưỡng không thể dự đoán và là một kết quả ngẫu nhiên Việc tạo số ngẫu nhiên được sử dụng cho nhiều mục đích khác Bên cạnh các ứng dụng tạo số ngẫu nhiên cho việc cờ bạc hay đơn giản là tạo kết quả ngẫu nhiên cho trò chơi điện tử, tính ngẫu nhiên còn rất quan trọng cho ngành mật mã học Mật mã học đòi hỏi những số mà những người tấn công hay có thể gọi là hackers không thể dự đoán được Vì vậy mà chúng ta không thể cứ sử dụng những số giống lặp lặp lại mãi Chúng ta muốn tạo những số theo một cách không thể dự đoán và vậy những kẻ tấn công sẽ không thể đoán được chúng Những số ngẫu nhiên này vì vậy rất cần cho ngành mật mã học, cho dù bạn mã hóa tệp của bạn hay sử dụng website HTTPS Internet Có thể các bạn đều tự hỏi rằng một cái máy tính làm thế nào nó có thể tạo những số ngẫu nhiên Tính ngẫu nhiên nó đến từ đâu ?? Nếu nó chỉ là phần code máy tính, chẳng phải rằng những số mà máy tính tạo đều có thể dự đoán được hay Vì vậy, việc tạo số ngẫu nhiên vô cần thiết ngày nay, đặc biệt an ninh mạng Các số ngẫu nhiên hữu ích nhiều ứng dụng khác Trong thuật toán mật mã, thuật toán sử dụng số ngẫu nhiên để mã hoá giải mã thông tin, ví dụ thuật toán mã hoá khóa RSA, Diffiel-Hellman, DES, 3DES, AES Bên cạnh đó, số ngẫu nhiên đóng vai trò quan trọng việc mô Ngay không cần số ngẫu nhiên, việc mô cần số tùy ý dùng làm liệu nhập, điều cung cấp thuận lợi công cụ tạo số ngẫu nhiên Việc tạo số giả ngẫu nhiên coi mẫu mô phân phối cho trước Kỹ thuật mẫu mô coi kỹ thuật Monte Carlo sử dụng để giải toán lý thuyết xếp hàng, toán cung ứng vật tư vấn đề liên quan đến xấp xỉ nghiệm phương trình vi phân, tích phân CHƯƠNG I: RANDOM NUMBER GENERATION LÀ GÌ ? Random number generation (RNG) – tạo số ngẫu nhiên thiết bị tính toán thiết bị vật lý thiết kế để tạo chuỗi số ký hiệu dự đoán trước lựa chọn ngẫu nhiên Các ứng dụng khác ngẫu nhiên dẫn đến phát triển nhiều phương pháp khác cho việc tạo liệu ngẫu nhiên, số phương pháp tồn từ thời cổ đại, cụ thể với ví dụ việc tung xúc xắc, tung đồng xu, xáo bài, việc sử dụng cọng cỏ thi (đối với bói toán) Kinh Dịch, vô số kỹ thuật khác Do tính chất học kỹ thuật, việc tạo số lượng lớn số ngẫu nhiên (quan trọng thống kê) đòi hỏi khối công việc lớn thời gian dài Ngày nay, sau đời máy phát số ngẫu nhiên, số lượng lớn xổ số phủ điều hành trò chơi xổ số bắt đầu sử dụng RNG thay phương pháp vẽ truyền thống RNG sử dụng [của ai?] Để xác định tỷ lệ cá cược máy tính đại Hiện nay, có nhiều phương pháp tính toán cho hệ số ngẫu nhiên tồn Trong đó, nhiều phương pháp thất bại việc đáp ứng cho ngẫu nhiên đạt kết Dù cho với đáp ứng đó, xác suất thành công khác nhau, bảng kiểm tra thống kê tính ngẫu nhiên dự đoán kết chúng Tuy nhiên, có thiết kế với phương pháp tính toán dựa mã hóa an toàn để tạo số ngẫu nhiên, chẳng hạn việc dựa thuật toán Yarrow, Fortuna (PRNG), số thuật toán khác CHƯƠNG II: TẠO SỐ GIẢ NGẪU NHIÊN 2.1 GIỚI THIỆU Số giả ngẫu nhiên là một sự thay thế cho số ngẫu nhiên chuẩn Một máy tính có thể sử dụng một giá trị gốc và một thuật toán để có thể tạo các số xuất hiện ngẫu nhiên, thực tế chúng có thể dự đoán được Máy tính không nhận bất kỳ một dữ liệu ngẫu nhiên nào từ môi trường Điều này rất khác với số ngẫu nhiên chuẩn Có nhiều phương pháp đáng tin cậy để sinh số giả ngẫu nhiên cho việc mô ngẫu nhiên thông qua sinh số giả ngẫu nhiên với sở toán học vững Chúng ta xem xét số phương pháp tạo số ngẫu nhiên quan trọng Một phương pháp chấp nhận để tạo số giả ngẫu nhiên phải đạt yêu cầu sau: Các số tạo phải tuân theo phân phối đều, thực sự kiện ngẫu nhiên tuân theo phân phối Vì vậy, mô kiện ngẫu nhiên tuân theo quy luật hay xấp xỉ Các số tạo cần phải độc lập, nghĩa giá trị số dãy số giả ngẫu nhiên không ảnh hưởng đến giá trị số Dãy số giả ngẫu nhiên tạo cần phải tái tạo lại Điều cho phép lặp lại thí nghiệm mô Dãy số không lặp lại chiều dài Theo lý thuyết có, mục đích thực tế khả lặp lại chu kỳ dài phù hợp Chu kỳ lặp lại số ngẫu nhiên gọi giai đoạn Việc tạo số giả ngẫu nhiên cần phải nhanh chóng nghiên cứu mô phỏng, đòi hỏi cần có nhiều số ngẫu nhiên, việc tạo số diễn chậm nhiều thời gian tăng giá thành nghiên cứu mô Trong việc taọ số giả ngẫu nhiên nên sử dụng nhớ tốt Mô hình mô thường đòi hỏi nhớ lớn, nhớ thường có hạn nên việc giảm tối đa việc chiếm dụng nhớ trở nên cần thiết việc tạo số ngẫu nhiên Chúng ta tìm hiểu số phương pháp để tạo số giả ngẫu nhiên Dựa vào phương pháp này, tiếp tục chương để xem xét phương pháp tạo số ngẫu nhiên mà có phân phối định, phân phối số mũ, phân phối chuẩn, 2.2 THUẬT TOÁN TẠO RA CÁC SỐ GIẢ NGẪU NHIÊN 2.2.1 Phương pháp nửa bình phương Kỹ thuật nửa bình phương John von Neuman phát triển vào năm 40 Bắt đầu từ số cho trước, ta bình phương lên số số bình phương dùng làm số thứ hai dãy số Kế tiếp, bình phương số thứ hai lấy số số bình phương làm số thứ ba cho dãy số Quá trình lặp lại tiếp tục Ví dụ 1: Giả sử số đầu x0 = 25, số ngẫu nhiên có chữ số gồm: (25)2 = 0625 ⇒ x1 = 62 (62)2 = 3844 ⇒ x2 = 84 (84)2 = 7056 ⇒ x3 = 05 (05)2 = 0025 ⇒ x4 = 02 (02)2 = 0004 ⇒ x5 = 00 (00)2 = 0000 ⇒ x6 = 00 Ví dụ 2: Giả sử số đầu x0 = 3187, số ngẫu nhiên có chữ số gồm : (3187)2 = 10156969 ⇒ x1 = 1569 (1569)2 = 02461761 ⇒ x2 = 4617 (4617)2 = 21316689 ⇒ x3 = 3166 (3166)2 = 10023556 ⇒ x4 = 0235 (0235)2 = 00055225 ⇒ x5 = 0552 (0552)2 = 00304704 ⇒ x6 = 3047 (3047)2 = 09284209 ⇒ x7 = 2842 Phương pháp nửa bình phương có số tính chất sau: + Các dãy số tạo có chu kỳ ngắn + Bất kỳ lúc số tạo số (trường hợp ví dụ 1) 2.2.2 Phương pháp đồng dư bậc hai Phương pháp gần tương đương với phương pháp nửa bình phương có chu kỳ dài Mối quan hệ phép đệ quy cho phương pháp xác định bởi: xn+1 = (xn(xn + 1)) mod m, với n ≥ 0, xo mod =2, m= 2k Ví dụ: Với x0 = 2, m = 16 tạo dãy số ngẫu nhiên sử dụng phương pháp đồng dư bậc hai x0 = x1 = (x0(x0 + 1)) mod 16 = (2(2 + 1)) mod 16 = x2 = (x1(x1 + 1)) mod 16 = (6(6 + 1)) mod 16 = 10 x3 = (x2(x2 + 1)) mod 16 = (10(10 + 1)) mod 16 = 14 x4 = (x3(x3 + 1)) mod 16 = (14(14 + 1)) mod 10 = x5 = (x4(x4 + 1)) mod 16 = (2(2 + 1)) mod 10 = x6 = (x5(x5 + 1)) mod 16 = (6(6 + 1)) mod 10 = 10 x7 = (x6(x6 + 1)) mod 16 = (10(10 + 1)) mod 10 = 14 x8 = (x7(x7 + 1)) mod 16 = (14(14 + 1)) mod 10 = Dùng phần mềm R để tạo 50 số ngẫu nhiên theo phương pháp ta có câu lệnh sau: > x for(j in 1:50){ + x[0] 0) Chú ý : Nếu a=1: phương pháp gọi phương pháp cộng Nếu c=0: phương pháp gọi phương pháp nhân (multiplicative congruential random number generator) Nếu c ≠ 0, phương pháp gọi phương pháp đồng dư hỗn tạp (mixed congruential random number generator) Các LCG nhân (c=0) nhanh LCG hỗn tạp (c ≠ 0) chúng có phép toán cộng Trong thực tế phương pháp nhân dùng nhiều phương pháp cộng Bởi theo phương pháp xi+1 xác định xi Do (m+1) giá trị xo,x1, , xm phân biệt, nên có giá trị xuất lần, ví dụ xi xi+k Khi xi+k,…, xi+k-1 lặp lại xi+k,…, xi+2k-1 dãy số xi tuần hoàn với chu kỳ k0: chu kỳ tối đa m đạt a mod ≡ c số lẻ (thường chọn 1) Ví dụ, xét sinh LCG (a, 1, 16, x0): chu kỳ tối đa 16 đạt a=1, 5, hay 13 Khi a=3, hay 11 chu kỳ 8; a=7 chu kỳ 4; a=5 chu kỳ Chẳng hạn chuỗi số nguyên giả ngẫu nhiên sinh với LCG(5,1,16,1) 1, 6, 15, 12, 13, 2, 11, 8, 9, 14, 7, 4, 5, 10, 3, 0, 1, 6, 15, 12, 13, 2, 11, 8, 9, 14, Khi m=2n c=0: chu kỳ tối đa m/4 đạt a mod ≡ hay a mod ≡ (thường chọn) giá trị khởi đầu số lẻ Ví dụ, với sinh LCG(a, 0, 16, x0), chu kỳ tối đa đạt a=3, 5, 11 hay 13 Khi m số nguyên tố a>1 (không quan tâm đến c = hay không): chu kỳ tối đa m-1 đạt a số nguyên thủy modul m Như vậy, tham số quan trọng LCG modul m Kích thước ràng buộc chu kỳ (m thường chọn số nguyên tố lũy thừa 2) Đối với sinh đồng dư tuyến tính với modul số nguyên tố, việc sử dụng gia số c≠0 không tăng chu kỳ ngoại trừ a = Thông thường, a phải lớn để chuỗi sinh có tính ngẫu nhiên Ví dụ 1: Xét sinh LCG (a, 0, 13, 1), xét tính ngẫu nhiên chuỗi sinh ra, a=6 a=11 tốt a=2 hay a=7 chúng sinh chu kì đầy đủ Người ta thường mong muốn sinh có chu kỳ đầy đủ sinh có chu kỳ ngắn CHƯƠNG III: TẠO BIẾN NGẪU NHIÊN 3.1 GIỚI THIỆU Để tạo một số ngẫu nhiên chuẩn, máy tính sẽ sử dụng thêm một vài các hiện tượng vật lý diễn bên ngoài môi trường Ví dụ, máy tính có thể lưu lại thời gian chính xác mà bạn gõ phím bàn phím của bạn một cái nguồn dữ liệu không thể dự đoán hay mã hóa Giả sử máy tính của bạn ghi dấu lại thời điểm bạn gõ phím là chính xác 0,23456789 giây sau giờ chiều Kết hợp cái mốc thời gian chính xác đó với các phím được gõ, chúng ta sẽ có một nguồn cho việc mã hóa bạn có thể để tạo dãy số ngẫu nhiên Nó không phải là một dãy số có thể đoán được và những kẻ tấn công không thể dự đoán được khoảnh khắc bạn gõ phím Ở Linux, để tạo dãy số ngẫu nhiên chuẩn, máy tính sẽ thu thập thêm các dữ liệu từ việc chúng ta sử dụng các ứng dụng, gõ phím hoặc thậm chí là di chuyển chuột Việc này giúp cho hệ thống có dữ liệu ngẫu nhiên mà nó cần để tạo số ngẫu nhiên chuẩn Trong chương này, ta bàn luận kỹ thuật để phát sinh số ngẫu nhiên với phân phối đặc biệt Những số ngẫu nhiên sau phân phối đặc biệt gọi random variates stochastic variates (những biến ngẫu nhiên) Biến ngẫu nhiên thuật ngữ dùng toán học thống kê Trong phép thử ngẫu nhiên (random experiment), đầu (outcome) giá trị số Ví dụ phép thử ngẫu nhiên tung đồng xu lên xét mặt đồng xu phía trên, kết đầu {sấp, ngửa} (đầu số) Ví dụ phép thử ngẫu nhiên tung xúc sắc xem mặt nằm phía có chấm, kết đầu {1,2,3,4,5,6} (đầu số) Tuy nhiên, ứng dụng thống kê, người ta muốn đầu gắn với đại lượng đo đạc được, hay gọi thuộc tính có giá trị số Để thực điều này, người ta định biến ngẫu nhiên để ánh xạ đầu phép thử ngẫu nhiên với giá trị số Biến ngẫu nhiên hàm toán học với đặc điểm: gán giá trị số cho kết (đầu ra) phép thử ngẫu nhiên (thực nghiệm) Với ζ đại diện cho đầu thực nghiệm, x số thực, X hàm ánh xạ (hay biến ngẫu nhiên) Vì thế, người ta gọi X biến ngẫu nhiên giá trị thực (real-valued random variable) Có nhiều kỹ thuật để sinh biến ngẫu nhiên Phương pháp phép biến nghịch đảo số kỹ thuật thường sử dụng Ngoài có số phương pháp để tạo biến ngẫu nhiên từ phân phối lý thuyết liên tục riêng biệt xác định 3.2 CÁC PHƯƠNG PHÁP ĐỂ TẠO BIỄN NGẪU NHIÊN 3.2.1 Phương pháp phép biến nghịch đảo Phương pháp áp dụng cho trường hợp hàm mật độ tích lũy đảo ngược phân tích Giả thiết ta muốn sinh biến ngẫu nhiên từ hàm mật độ xác suất (bdf - Probability Density Function) f(x) Giả sử F(x) hàm mật độ tích lũy Chú ý F(x) định nghĩa [0,1] Xét thuộc tính hàm mật độ tích lũy để thu máy phát biến ngẫu nhiên đơn giản sau Trước hết, sinh số ngẫu nhiên r thiết lập cho F(x), F(x)=r Số lượng x thu cách nghịch đảo F, x = F −1 (r ) , x = F −1 (r ) phép biến đổi nghịch đảo F Trong ví dụ, giả sử ta giả thiết muốn tạo biến ngẫu nhiên với mật độ xác suất tuân theo hàm f(x) = 2x, = Hàm mật độ tích lũy: x x 0 F ( x) = ∫ f (t )dt = ∫ ae − at tdt = − e − ax Kỳ vọng phương sai xác định theo: ∞ E ( x) = ∫ aet −at dtdt = a ∞ VAR( x) = ∫ (t − E ( x)) e −at tdtdt = a2 Phương pháp phép biến nghịch đảo để sinh biến ngẫu nhiên sau: a r=F(x)=1-e-ax 1-r =e-ax x = − log(1 − r _ = − E ( x) log(1 − r ) Từ phân phối - F(x) không xác định [ 0,1], sử dụng thủ tục rút gọn sau: a r=e-ax x = − log r Lấy mẫu từ phân phối Erlang Một phân phối mũ không đại diện trạng thái thực tế Chẳng hạn, thời gian thực chương trình máy tính, thời gian mà dùng để sản xuất thiết bị, không phân phối mũ Nó xác định, nhiên, số phân phối mũ cung cấp vị trí liên tiếp Nếu trung bình tất dịch vụ riêng lẻ thế, toàn thời gian dịch vụ theo phân phối Erlang, đưa hình 3.3 Hình 2.3 Phân phối Erlang Phân phối Erlang cuộn k phân phối mũ có tính chất 1/a Một phân phối Erlang gồm có k phân phối mũ tham chiếu tới Ek Kỳ vọng phương sai biến ngẫu nhiên x xác định theo phân phối Erlang: E ( x) = k a k Var ( X ) = a Những biến ngẫu nhiên Erlang sinh trình sinh đơn giản ngẫu nhiên phân phối Erlang đặt sở Quá trình hoàn thành việc lấy tổng k biến ngẫu nhiên phân phối mũ, x 1, x2, , xk với điều kiện 1/a Chúng ta có: k x = ∑ xi = − i =1 k k 1 log ri = − log ∑ ri ∑ a i =1 a i =1 Lấy mẫu từ phân phối chuẩn Một biến ngẫu nhiên X với hàm mật độ xác xuất −1 ( x − µ ) 2 f ( x) = e σ ,−∞ < x < +∞ σ 2π Trong đó, σ >0 xác định để có phân phối chuẩn với tham số µ σ Phương sai kỳ vọng X tương ứng µ σ Nếu µ = σ = phân phối chuẩn xác định phân bố bình thường chuẩn hàm mật độ xác xuất 1 − x2 f ( x) = e ,−∞ < x < +∞ 2π Nếu biến ngẫu nhiên X theo phân phối chuẩn với trung bình µ phương sai σ , biến ngẫu nhiên Z định nghĩa sau: Z= X −µ theo phân phối bình thường chuẩn σ Để sinh biến ngẫu nhiên từ phân phối chuẩn với tham số µ σ , ta sử dụng định lý giới hạn trung tâm Đặc biệt định lý giới hạn trung tâm phát biểu tóm tắt x1, x2, , xn n biến ngẫu nhiên độc lập, biến có phân phối xác suất với E(Xi) = µ Var(Xi) = σ , tổng ∑ X i = X1 + X2 + + Xn tiếp cận phân phối chuẩn n lớn Kỳ vọng phương sai phân phối chuẩn này: E ( ∑ X i ) = nµ Var (∑ X i ) = nσ Thủ tục sinh biến ngẫu nhiên bình thường yêu cầu k số ngẫu nhiên r 1, r2, ,rk Khi ri số ngẫu nhiên phân tán không xác định [0, 1], ta có: a+b = 2 (b − a ) Var (ri ) = = 12 12 E (ri ) = Sử dụng định lý giới hạn trung tâm, ta có tổng ∑ri k số ngẫu nhiên tiếp cận phân phối chuẩn : k k ∑ ri ~ N , 12 ∑ ri − k 12 k ~ N (0,1) (3.1) Bây giờ, ta xem xét phân phối chuẩn với tham số µ σ từ muốn sinh biến ngẫu nhiên bình thường Giả sử x biến ngẫu nhiên bình thường Thì: x−µ ~ N (0,1) σ (3.2) Cân (3.1) (3.2) ta có x−µ = σ ∑ ri − k 12 k x = σ 12 k ∑ ri − + µ k 2 Phương trình cung cấp cho ta công thức đơn giản để sinh biến ngẫu nhiên bình thường với trị trung bình µ độ lệch chuẩn σ Giá trị k phải lớn, từ lớn làm độ xác tốt Thông thường, phải cân xác để mang lại hiệu Giá trị nhỏ cần thiết k = 10 Một cách tiếp cận thay để phát sinh biến ngẫu nhiên bình thường (được biết cách tiếp cận trực tiếp) sau Giả sử r r2 hai số ngẫu nhiên độc lập phân bố không xác định Thì x1 = (−2 log r1 ) cos 2πr2 x2 = (−2 log r1 ) sin 2πr2 hai biến ngẫu nhiên phân phối chuẩn bình thường Phương pháp sinh kết tốc độ tính toán so sánh tốt với cách tiếp cận giới hạn trung tâm để hàm chương trình đạt hiệu đặc biệt 3.2.3 Lấy mẫu từ phân phối xác suất riêng biệt Trong phần này, ta sử dụng phương pháp phép biến đổi nghịch đảo để phát sinh biến ngẫu nhiên từ phân phối theo cấp số nhân Đồng thời, mô tả kỹ thuật lấy mẫu từ phân phối nhị thức, kỹ thuật lấy mẫu từ phân phối Poisson Lấy mẫu từ phân phối theo cấp số nhân Xem xét dãy thử nghiệm độc lập nối tiếp nhau, kết thử nghiệm thất bại thành công Giả sử p q xác suất thành công thất bại tương ứng Chúng ta có p + q = Biến ngẫu nhiên xác định số lần thất bại liên tiếp xuất trước thành công xuất theo phân phối cấp số nhân Hàm mật độ xác xuất phân phối cấp số nhân p(n) = pqn, n = 0,1,2, , mật độ xác xuất tích lũy n F ( n) = ∑ pq s , n = 0,1,2, s =0 Phương sai kỳ vọng biến ngẫu nhiên theo phân phối theo cấp số nhân là: E ( x) = p q Var ( X ) = p q2 Sinh biến ngẫu nhiên hình học sử dụng phương pháp phép biến đổi nghịch đảo hình thành sau n n s =0 s =0 F (n) = ∑ pq s = p ∑ q s = p − q n+1 1− q Từ biểu thức p = - q, có F(n) = - q n+1 Từ biểu thức thu - F(n) = qn+1 Chúng ta quan sát - F(n) biến đổi Bởi vậy, giả sử r la biến ngẫu nhiên ta có r=qn+1 log(r)=(n+1)log(q) n= log r −1 log q Cách khác, từ biểu thức (1-F(n))/q=qn (1-F(n))/q biến đổi khoảng r=qn n = log r log q Lấy mẫu từ phân phối nhị thức Xét thử nghiệm độc lập nối tiếp (những thử nghiệm Bernoulli) Giả sử p xác suất thành công q = - p xác suất thất bại Giả sử x biến ngẫu nhiên số lượng phép thử thành công n thử nghiệm Thì, biến ngẫu nhiên theo phân phối nhị thức Hàm mật độ xác suất x là: p (k ) = n k n −k p q , k = 0,1,2, k Kỳ vọng phương sai xác định E(X)=np Var(X)=npq Chúng ta sinh biến ngẫu nhiên từ phân phối nhị thức với n p cho sau Sinh n số ngẫu nhiên, sau đặt biến k = Cho số ngẫu nhiên ri, i = 1, 2, , n, kiểm tra thực biến k i tăng lên sau: k i −1 + 1, ri < p ki = k i −1 , ri > p Số lượng cuối k n biến ngẫu nhiên nhị thức Phương pháp sinh biến ngẫu nhiên biết phương pháp loại trừ Phương pháp bàn luận chi tiết bên mục Lấy mẫu từ phân phối Poisson Mô hình biến cố phân phối Poisson kiện đặc biệt thời gian Giả sử λ số lượng biến cố trung bình thời gian đơn vị Số lượng biến cố x đơn vị thời gian có hàm mật độ xác suất sau: p(n)=e-λ(λn/n!), n=0,1,2,… Nó biểu diễn qua thời gian hai biến cố liên tiếp kiện phân tán lũy thừa với trung bình 1/λ, f(t) =λeλt Một phương pháp để sinh biến ngẫu nhiên Poisson theo phương thức lũy thừa khoảng thời gian phân tán t1, t2, t3, với kỳ vọng 1/λ Những khoảng tích lũy chúng lớn đơn vị chu kỳ thời gian Như là: n n +1 i =1 i =1 ∑ ri < < ∑ ri Biến ngẫu nhiên n đơn giản số lượng kiện xuất thời gian đơn vị chu trình Bây giờ, từ ti = log ri , n thu từ cộng thêm số −λ ngẫu nhiên tổng n +1 lớn số lượng e λ Điều đó, n sinh từ biểu thức: n n +1 i =0 i =0 ∑ ri > e −λ > ∑ ri 3.2.4 Lấy mẫu từ phân phối xác suất thực nghiệm Phân phối xác suất thực nghiệm thường xuyên không xấp xỉ thỏa mãn phân phối lý thuyết phổ biến Trong trường hợp đó, bắt buộc sinh biến ngẫu nhiên theo phân phối xác suất thực nghiệm đặc biệt Ở đây, ta đưa cách thức lấy mẫu từ phân phối thực nghiệm riêng biệt phân phối thực nghiệm liên tục Lấy mẫu từ phân phối xác suất riêng biệt Giả sử x biến ngẫu nhiên riêng biệt, p(x = i) = pi, pi tính toán từ liệu thực nghiệm Giả sử p(X ← i) = Pi xác suất tích lũy Những biến ngẫu nhiên từ phân phối xác suất dễ dàng sinh sau Bây giả sử r số ngẫu nhiên Ta giả thiết r rơi P2 P3 (như hình 2.4) Biến ngẫu nhiên x = Nói chung, Pi - < r < Pi x = i Phương pháp dựa vào việc p i = Pi - Pi-1 từ r số ngẫu nhiên, rơi vào khoảng (Pi, Pi - 1) pi% thời gian r P3 Hình 2.4: Lấy mẫu từ phân phối xác suất thực nghiệm riêng biệt P2 P1 …… n x Trong ví dụ, giả sử xem xét vấn đề newsboy tiếng Giả sử X số lượng tờ báo bán newsboy ngày Từ liệu lịch sử có phân phối sau cho X X F 0 0.1 (X) 20 20 30 15 Phân phối xác suất tích luỹ X f (X) 0 0.8 20 40 70 Sinh biến ngẫu nhiên tổng kết sau: Lấy mẫu số ngẫu nhiên r Định vị khoảng mà r rơi vào để xác định biến ngẫu nhiên x • Nếu 0.85 < r