MẪU THỐNG KÊ HAI CHIỀU

Một phần của tài liệu Bài giảng toán thống kê đh nông nghiệp hà nội (Trang 45 - 46)

1.1. Biến ngẫu nhiên hai chiều

Trong thực tế có thể có nhiều biến ngẫu nhiên cùng tồn tại trong một tổng thể. Chẳng hạn, chỉ số thể lực của ngƣời đƣợc xác định bởi ba biến ngẫu nhiên: chiều cao X, cân nặng Y, vòng ngực Z; hoặc lƣợng nƣớc mƣa trong năm X và năng suất cây trồng Y; v.v… Các biến ngẫu nhiên này tồn tại trong từng cá thể của tổng thể. Ngƣời ta gọi bộ các biến ngẫu nhiên đó là biến ngẫu nhiên (hay véc tơ ngẫu nhiên) nhiều chiều; bộ ba (X,Y,Z) là biến (véc tơ) ngẫu nhiên ba chiều (khi khảo sát thể lực); bộ hai biến (X,Y) gọi là biến (véc tơ) ngẫu nhiên hai chiều (nhƣ khi khảo sát lƣợng nƣớc mƣa và năng suất). Chúng ta giới hạn việc nghiên cứu ở biến ngẫu nhiên hai chiều (X,Y).

Chú ý rằng, các kết quả trong chƣơng này vẫn đúng trong trƣờng hợp một trong hai biến (X hoặc Y) là biến chủ động, chẳng hạn nhƣ biến X là lƣợng phân bón còn Y là năng suất tƣơng ứng của cây trồng hoặc X là vốn đầu tƣ còn Y là lợi nhuận tƣơng ứng, …

1.2. Mẫu thống kê hai chiều

Để nghiên cứu biến ngẫu nhiên hai chiều (X,Y) tồn tại trong một tập hợp chính nào đó, ta lấy mẫu dung lƣợng n và khảo sát cả X và Y của từng cá thể và đƣợc n cặp giá trị (x1,y1), (x2,y2), …, (xn,yn) của (X,Y). Bộ số liệu (x1,y1), (x2,y2), …, (xn,yn) gọi là mẫu thống kê hai chiều dung lƣợng n của (X,Y).

Việc đầu tiên là phải sắp xếp lại các số liệu thu đƣợc. Có ba cách sắp xếp nhƣ sau:

a) Nếu mẫu nhỏ (n nhỏ)

Khi đó xếp các số liệu thành bảng 2 dòng nhƣ sau:

X x1 x2 … xn

Y y1 y2 … yn

b) Nếu mẫu lớn và có nhiều số liệu trùng nhau

Khi đó đếm các cặp số liệu trùng nhau và xếp các số liệu thành bảng có tần số:

X x1 x2 … xk

Y y1 y2 … yk

ni n1 n2 … nk

Trong đó có ni cặp số liệu (xi,yj) trong bộ số liệu ban đầu và n = n1 + n2 + … + nk là dung lƣợng mẫu.

c) Nếu mẫu lớn và các số liệu ít trùng nhau

Khi đó tiến hành phân các giá trị của X thành r lớp với xi là giá trị đại diện của lớp i (giá trị giữa lớp i của X). Phân các giá trị của Y thành s lớp với yj là giá trị đại diện của lớp j (giá trị giữa lớp j của Y). Xếp các số liệu thành bảng hai lối vào:

X Y x1 x2 … xr y1 n11 n12 … n1r y2 n21 n22 … n2r … … … … … ys ns1 ns2 … nsr

Trong đó có nji cặp giá trị mà (xi,yj) là đại diện và n = n11 + n12 + … + nsr là dung lƣợng mẫu, nếu nij = 0 thì ô tƣơng ứng để trống.

Chú ý 1: Trong mẫu thống kê hai chiều của (X,Y) có thể chủ động trƣớc một biến (thƣờng là biến X). Chẳng hạn khi nghiên cứu lƣợng phân bón X và năng suất Y của cây trồng ta có thể chủ động các giá trị của X.

Chú ý 2: Giống nhƣ mẫu thống kê một chiều, trong mẫu thống kê (x1,y1); (x2,y2);…; (xn,yn), ngƣời ta cũng coi xi là một giá trị cụ thể của biến ngẫu nhiên Xi và yi là một giá trị cụ thể của biến ngẫu nhiên Yi. Bộ n biến ngẫu nhiên (X1,Y1); (X2,Y2); …; (Xn,Yn) gọi là mẫu ngẫu nhiên của biến ngẫu nhiên hai chiều (X,Y) hay không gian mẫu thống kê của (X,Y).

Một phần của tài liệu Bài giảng toán thống kê đh nông nghiệp hà nội (Trang 45 - 46)