*Phương pháp khoảng cách
Với giả thuyết quá trình Poisson thì theo Định lý 1.5 ta có đẳng thức D(r)H (r),rS 0. (2.4) Đẳng thức này khẳng định rằng với giả thuyết quá trình điểm Poisson thì phân phối của khoảng cách lân cận gần nhất và phân phối tiếp xúc cầu là như nhau. Từ các phép đo khoảng cách ta có thể tính toán được hàm phân phối thực nghiệm tương ứng của D và HS, từ đó kiểm định sự bằng nhau của chúng.
Byth và Ripley (1980) đã đưa ra một phương pháp để giải bài toán trên. Chọn ngẫu nhiên 2m vị trí trong cửa sổ W. m điểm trong số đó được sử dụng để đo khoảng cách tới điểm gần nhất trong mẫu, kí hiệu các khoảng cách đó là
1 2 m
u , u , ..., u . m điểm còn lại được dùng để xác định các miền con sao cho mẫu điểm trong nó được nghiên cứu thấu đáo. Các miền con được chọn sao cho có khoảng 5 điểm của mẫu rơi vào trong nó. Mỗi miền con được chọn ngẫu nhiên một điểm của mẫu và xác định khoảng cách lân cận gần nhất. Kí hiệu các khoảng cách đó 1, 2,...,m. Với giả thuyết quá trình Poisson
S
(D(r)H (r)) thì 2 mẫu trên được lấy từ phân phối xác suất 2
F(r) 1 exp( .r ), r0 (bỏ qua ảnh hưởng biên).
Nếu m không quá lớn thì các mẫu đó xấp xỉ độc lập với nhau. Byth và Ripley đã chỉ ra rằng giá trị của m nên vào khoảng 5% tổng số điểm trong cửa sổ W. Với giả thuyết quá trình điểm Poisson thì các đại lượng 2 2 2
1 2 m
2 2 1, ..., m
là xấp xỉ độc lập và có cùng phân phối mũ với tham số . Vì vậy các thống kê m 2 i i 1 F m 2 i i 1 u h và 2 m i N 2 2 i 1 i i u 1 h m u
có các phân phối xấp xỉ phân phối F với (2m, 2m) bậc tự do và phân phối chuẩn có trung bình 1
2 và phương sai m
12 tương ứng. (Các đại lượng u ,i i trong công thức hNđược tính theo cặp. Các cặp này có thể được lấy một cách ngẫu nhiên).
Các kết quả phân phối xấp xỉ này cho phép chúng ta xây dựng tiêu chuẩn kiểm định giả thuyết quá trình điểm Poisson. Các giá trị lớn hay nhỏ đối với hF hoặc hN chứng tỏ độ sai lệch từ giả thuyết Poisson. Vấn đề là dùng thống kê nào cho phù hợp. Điều đó phụ thuộc vào các đối thiết. Nếu các đối thiết liên quan đến nhóm (đến sự kết tập) thì hF phù hợp hơn trong khi
N
h là thích hợp với các đối thiết mô tả tính chính quy của mẫu.
*Phương pháp dựa vào phân phối khoảng cách giữa các biến cố
Giả sử được quan sát qua cửa sổ W với hàm phân phối khoảng cách giữa các biến cố H(t) đã biết. Kí hiệu tij là khoảng cách giữa các biến cố trong mẫu. Khi đó hàm phân phối khoảng cách thực nghiệm, kí hiệu là H (t)1
1
1 1 ij
H (t) { n(n 1)} #(t t) 2
trong đó n là số biến cố trong mẫu.
Tiêu chuẩn kiểm định giả thuyết quá trình điểm Poisson dựa trên hàm phân phối khoảng cách giữa các điểm như sau:
Biểu diễn các điểm lên mặt phẳng toạ độ với tung độ là H (t)1 và hoành độ là H(t). Khi đó nếu dữ liệu phù hợp với quá trình điểm Poisson thì đồ thị thu được là gần tuyến tính. Mức ý nghĩa có thể được tìm từ phân phối H (t)1
của mẫu dưới giả thiết quá trình Poisson. Tuy nhiên điều này là phức tạp vì sự phụ thuộc giữa khoảng cách của các điểm với cùng điểm cuối, vì vậy ta xử lí như sau:
Tính các hàm phân phối thực nghiệm H (t), ii 2,3,...,s từ s 1 mô phỏng độc lập của n điểm độc lập, được phân phối đều trên W và định nghĩa các bao trên, bao dưới như sau
i i
i 2,3,...,s i 2,3,...,s
U(t) max {H (t)} ; L(t) min {H (t)}.
Các bao trên và bao dưới được sử dụng để bác bỏ giả thiết. Theo tiêu chuẩn Monte Carlo, dưới giả thuyết quá trình điểm Poisson, với mỗi t thì
P{H (t)1 U(t)} = P 1 1
{H (t) L(t)} s .
Hình 2.3: Vị trí của 65 cây thông non Nhật Bản trong hình vuông 5.7m x 5.7m (Numata,1961)
Hình vẽ 2.4 cho hình ảnh của H (t), U(t), L(t)1 và H(t). Từ hình vẽ trên ta thấy rằng đồ thị của H (t)1 ứng với dữ liệu nằm giữa U(t) và L(t) trong miền giá trị của nó, điều này là cơ sở cho ta chấp nhận giả thuyết quá trình Poisson. Dựa trên tiêu chuẩn phù hợp 2 Bartlett (1964), Besag và Diggle (1977) cũng đưa ra khẳng định tương tự.
Hình 2.4: ... là các bao trên và bao dưới từ 99 mô phỏng, đường ở giữa là đường ứng với dữ liệu
Ví dụ 2.5. Cho mẫu điểm như Hình 2.5
Hình 2.5: vị trí của 62 cây thông Nhật Bản trong hình vuông 23m 23m (Strauss, 1975; Ripley, 1977)
Hình vẽ 2.6 cho hình ảnh của H (t),U(t),L(t)1 và H(t). Từ sơ đồ trên ta thấy rằng H (t)1 lớn hơn U(t) khi H(t) nhận giá trị nhỏ và ta có
1
H (0.08)H(0.08) hay H (0.08)1 H (0.08), ii 2,3,...,s. Vì vậy giả thuyết quá trình Poisson bị bác bỏ. Bằng phương pháp Chỉ số tán xạ ở phần sau ta cũng có kết luận tương tự.
Hình 2.6: ...là các bao trên và bao dưới từ 99 mô phỏng, đường ở giữa là đường ứng với dữ liệu
*Phương pháp dựa vào phân phối khoảng cách từ điểm tới biến cố gần nhất
Cho mẫu điểm gồm n vị trí của n biến cố được quan sát trong W. Một mẫu điểm gồm m điểm trong W đã được chọn. Kí hiệu xi là khoảng cách từ các điểm đến các biến cố gần nhất trong W. Khi đó hàm phân phối thực nghiệm
1
1 i
F (x)m #(x x) đo các “miền trống” trong W theo nghĩa
1
1 F (x) là ước lượng cho diện tích Bx của miền Bx gồm tất cả những điểm trong W mà khoảng cách đến mỗi biến cố bất kì trong n biến cố trong W không nhỏ
Lotwich (1981), dựa vào thuật toán Green – Sibson, đã mô tả một thuật toán tính chính xác Bx khi W là hình chữ nhật. Trong thực hành, m điểm được lấy trong W là một lưới điểm vuông k k. Việc chọn giá trị k như thế nào cho hợp lý phụ thuộc vào hình dạng của n biến cố trong W. Diggle (1981) đề nghị lấy k n. Việc dùng hàm phân phối khoảng cách từ điểm tới biến cố gần nhất để nhận biết quá trình Poisson cũng được tiến hành tương tự đối với hàm phân phối khoảng cách giữa các biến cố.
*Phương pháp đếm ô vuông (quadrat count methods)
Xét trường hợp mẫu điểm được lấy bởi số điểm rơi vào những miền con. Giả sử cửa sổ W được chia thành những ô vuông có diện tích bằng nhau và bằng 2(Q). Khi đó với giả thuyết quá trình điểm Poisson dừng thì số điểm rơi vào trong mỗi ô vuông (hay số đếm trong mỗi ô vuông) có phân phối Poisson độc lập với nhau và có trung bình là 2(Q). Các tiêu chuẩn kiểm định có thể dựa trên tính chất phân phối này.
Tiêu chuẩn Chỉ số tán xạ (Index-of-dispersion): Dựa trên sự bằng nhau giữa trung bình và phương sai của phân phối Poisson, tiêu chuẩn phù hợp cổ điển 2 sẽ xét phân phối của số đếm ô vuông.
Chỉ số tán xạ I được xác định bởi (n 1)S2 I
X
trong đó n là số ô vuông, X là số điểm trung bình trên mỗi ô vuông và S2 là phương sai mẫu của số điểm trên mỗi ô vuông. Khi đó với giả thuyết quá trình điểm Poisson dừng thì chỉ số I có phân phối 2 với (n - 1) bậc tự do (điều kiện n > 6 và 2(Q) > 1). Với mức ý nghĩa 0 1thì
2 n 1 I ( ) 2 hoặc I 2n 1(1 ) 2
Ví dụ 2.6. Cho mẫu điểm như hình 2.7
Sử dụng lưới gồm 3 3 ô vuông ta có kết quả
4 10 6 8 4 15 8 3 7
Ta có n = 9, X = 7.22, S2 = 13.7 và chỉ số tán xạ I = 15.17. Khi đó với độ tin cậy = 0.05 ta có 28(0.025) 17.5 và 82(0.975)2.18. So sánh với I ta chấp nhận giả thuyết quá trình Poisson.
Hình 2.7: Vị trí của 65 cây thông non Nhật Bản trong hình vuông 5.7m 5.7m (Numata, 1961)
Hình 2.8: Vị trí của 62 cây thông Nhật Bản trong hình vuông 23m 23m (Strauss, 1975; Ripley, 1977)
Sử dụng lưới gồm 3 3 ô vuông ta có kết quả
0 13 5 6 8 9 13 2 5
Ta có n = 9, X = 6.778, S2 = 19.94 và chỉ số tán xạ I = 23.54. Khi đó với độ tin cậy = 0.05 ta có 28(0.025) 17.5 và 28(0.975)2.18.So sánh với I ta bác bỏ giả thuyết quá trình Poisson.
Tiêu chuẩn phù hợp 2
Giả sử quá trình điểm với cường độ được quan sát qua cửa sổ W. Giả thiết cửa sổ mẫu được chia thành các ô vuông có diện tích bằng nhau và bằng 2(Q). Kí hiệu ni là số ô vuông chứa i điểm, i = 0, 1, 2, ... Khi đó với giả thuyết quá trình Poisson thì số điểm trong mẫu rơi vào mỗi ô là độc lập và có phân phối Poisson với tham số 2(Q). Trong trường hợp này, dãy số liệu
0 1 2
n ,n ,n ,...chính là các giá trị quan sát về biến ngẫu nhiên có phân phối Poisson với tham số 2(Q). Dựa trên tiêu chuẩn phù hợp ta kiểm định xem dãy số liệu n ,n ,n0 1 2,...có phù hợp với phân phối Poisson với tham số (Q)
hay không ( là ước của theo các phần ở trên). Nếu dãy số liệu phù hợp với phân phối Poisson, khi đó ta chấp nhận giả thuyết quá trình điểm là Poisson.
Phương pháp Greig-Smith
Phương pháp này không chỉ dùng số đếm ô vuông riêng biệt mà còn dùng các số đếm ô vuông được nhóm lại bởi các ô vuông lân cận.
Giả sử số ô vuông là q
n 2 , q là một số tự nhiên. Các đại lượng 1 2 n
s ,s ,...,s được đếm. q 1 2
1 i
2 s (Số điểm trong ô vuông thứ i )2
k 1
( 2
số điểm thuộc cặp ô vuông thứ k)2
.
q 2 2 2
j
2 s ( Số điểm trong ô vuông thứ j)2
k 1
( 2
số điểm thuộc cặp 4 ô vuông thứ k)2
...
Trong trường hợp q = 6 các ô vuông có thể được đánh số theo kí hiệu bàn cờ, vì 2q 64. Các cặp ô vuông là (a ,a ), (a ,a ),..., (b ,b ), (b ,b ),...1 2 3 4 1 2 3 4 Các cặp 4 ô vuông là (a a ,b ,b ), (a ,a ,b ,b ),...1 2 1 2 3 4 3 4
Các đại lượng 2 i
s là ước lượng không chệch cho phương sai của số điểm trong mỗi ô vuông nhỏ. Vì vậy công thức chỉ số tán xạ được tính toán theo các chỉ số j
q j 2
j j
I 2 s X và tiêu chuẩn 2 được dùng đối với mỗi chỉ số.
ở đây X là số điểm trung bình trên mỗi ô vuông và số bậc tự do cho các thống kê I , I ,...,1 2 là 2q 1 ,2q 2 ,...
Ta có kết luận như sau: Giả thuyết quá trình điểm Poisson dừng được chấp nhận nếu tất cả các chỉ số Ij nằm giữa các giá trị tiêu chuẩn hai phía của thống kê 2. Nếu trái lại ta bác bỏ giả thuyết quá trình điểm là Poisson.
Hình 2.9: Số miệng núi lửa lớn trong 32 miền có diện tích như nhau của bề mặt Sao Hoả (Lipskij, 1977)
Trong trường hợp này, ta áp dụng phương pháp Greig-Smith với q = 5 và X
= 0.97. Tính toán ta có bảng số liệu sau i Bậc tự do 2 i s 2(0.95) Ii 2(0.05) 1 16 1.97 8.0 32.5 26.3 2 8 0.84 2.7 6.9 15.5 3 4 4.48 0.7 20.0 9.5 4 2 0.16 0.1 0.3 6.0 5 1 7.03 0.0 7.2 3.8
Dựa vào bảng trên ta so sánh các giá trị của Ii với các giá trị của 2 tại 0.05
thấy rằng với i = 1, 3 và 5 thì các chỉ số tán xạ vượt ra ngoài giá trị tiêu chuẩn nên ta bác bỏ giả thuyết quá trình Poisson.
kết luận
Nghiên cứu đề tài này trên cơ sở những kiến thức của Lý thuyết xác suất và Thống kê ứng dụng ta đã có cơ hội tìm hiểu sâu hơn về quá trình điểm Poisson, các tính chất cơ bản, mômen, độ đo mômen của quá trình điểm Poisson, đặc biệt là phân tích thống kê quá trình điểm Poisson.
Do thời gian nghiên cứu và năng lực còn hạn chế nên khoá luận chỉ đạt được một số kết quả nhất định. Vì vậy em rất mong nhận được sự đóng góp ý kiến của các thầy cô giáo cùng toàn thể các bạn sinh viên để khoá luận của em được hoàn thiện hơn, đồng thời em cũng có thêm kinh nghiệm trong việc nghiên cứu khoa học.
Tài liệu tham khảo
Tiếng Việt
1. Đào Hữu Hồ (2006), Xác suất thống kê, Nxb Đại học quốc gia Hà Nội. 2. Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống kê toán học, Nxb Đại học quốc gia Hà Nội.
3. Nguyễn Duy Tiến, Vũ Viết Yên (2003), Lý thuyết xác suất, Nxb Giáo dục.
Tiếng Anh
4. Kallenberg, O. (1975), Random measures, Akademie – Verlagg. 5. Kallenberg, O. (1997), Foundations of Modern Probability, Springer. 6. Ripley, B.D. (1981), Spatial Statistics, Willey – Interscience.
7. Stoyan, D. , Kendall, W.S. Mecke (1995), Stochastic geometri and its applications, 2nd edition, Willey.