Trong thực tế, ngƣời ta thƣờng phải nghiờn cứu một tập hợp các phần tử đồng nhất theo một hay nhiều dấu hiệu định tớnh hoặc định lƣợng đặc trƣng cho các phần tử đó. Chẳng hạn, một doanh nghiệp phải nghiờn cứu tập hợp các khách hàng của nó thỡ dấu hiệu định tớnh có thể là mức độ hài lũng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp, cũn dấu hiệu định lƣợng là nhu cầu của khách hàng về số lƣợng sản phẩm của doanh nghiệp.
Để nghiờn cứu tập hợp các phần tử này theo một dấu hiệu nhất định đụi khi ngƣời ta sử dụng phƣơng pháp nghiờn cứu toàn bộ, tức là thống kờ toàn bộ tập hợp đó và phõn tớch từng phần tử của nó theo dấu hiệu nghiờn cứụ Chẳng hạn để nghiờn cứu dõn số của một nƣớc theo các dấu hiệu nhƣ tuổi tác, trỡnh độ văn hoá địa bàn cƣ trỳ, cơ cấu nghề nghiệp . . . có thể tiến hành tổng điều tra dõn số và phõn tớch từng ngƣời theo các dấu hiệu trờn, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ dõn số của nƣớc đó. Tuy nhiờn trong thực tế phƣơng pháp này gặp phải những khó khăn chủ yếu sau:
- Nếu quy mụ của tập hợp quá lớn thỡ việc nghiờn cứu toàn bộ sẽ đũi hỏi nhiều chi phớ vật chất và thời gian.
- Nhiều khi cũng do quy mụ của tập hợp quá lớn nờn có thể xảy ra trƣờng hợp tớnh trựng hoặc bỏ sót các phần tử của nó.
- Do quy mụ nghiờn cứu lớn mà trỡnh độ tổ chức nghiờn cứu lại hạn chế dẫn đến các sai sót trong quá trỡnh thu thập thụng tin ban đầu, hạn chế độ chớnh xác của kết quả phõn tớch.
- Trong nhiều trƣờng hợp khụng thể nắm đƣợc toàn bộ các phần tử của tập hợp cần nghiờn cứu, do đó khụng thể tiến hành nghiờn cứu toàn bộ đƣợc. . .
Vỡ thế trong thực tế phƣơng pháp nghiờn cứu toàn bộ thƣờng chỉ đƣợc áp dụng đối với các tập hợp có quy mụ nhỏ, cũn chủ yếu ngƣời ta áp dụng phƣơng pháp nghiờn cứu khụng toàn bộ, đặc biệt là phƣơng pháp nghiờn cứu chọn mẫụ Phƣơng pháp này chủ trƣơng từ tập hợp cần nghiờn cứu chọn ra một số phần tử (gọi là mẫu), phõn tớch các phần tử này và dựa vào đó mà suy ra các kết luận về tập hợp cần nghiờn cứụ Giả
sử theo một phƣơng pháp nào đó từ tổng thể lấy ra n phần tử tạo nờn mẫu kớch thước n. Nếu mẫu đƣợc chọn ra một cách ngẫu nhiờn và xử lý bằng các phƣơng pháp xác suất thỡ vừa thu đƣợc các kết luận một cách nhanh chóng, đỡ tốn kộm mà vẫn đảm bảo độ chớnh xác cần thiết.
Việc thu thập, sắp xếp và trỡnh bày các số liệu của tổng thể hoặc một mẫu gọi là
thống kờ mụ tả. Cũn việc sử dụng thụng tin của mẫu để tiến hành các suy đoán, kết luận về tổng thể gọi là thống kờ suy diễn.
Giả sử mẫu kớch thƣớc N từ tổng thể nghiờn cứu có dấu hiệu là biến ngẫu nhiờn X, đƣợc lập theo phƣơng pháp chọn mẫu ngẫu nhiờn đơn giản. Với cách chọn mẫu này, mỗi lần chọn một phần tử của mẫu nhƣ làm một phộp thử độc lập rỳt ngẫu nhiờn một giá trị của X từ tập các giá trị của nó. Rỳt ngẫu nhiờn đƣợc hiểu là rỳt phự hợp với luật phõn phối xác suất của X nghĩa là xác suất để giá trị đƣợc rỳt đó thuộc bộ phận nào đó, bằng xác suất của X thuộc bộ phận đó. Vỡ vậy ta có thể coi thành phần thứ i trong mẫu là biến ngẫu nhiờn Xicó cựng luật phõn phối của X.
Định nghĩa: Mẫu ngẫu nhiờn kớch thước n là tập hợp của n biến ngẫu nhiờn độc lập X1 , X2 , . . . , Xn được thành lập từ biến ngẫu nhiờn gốc X trong tổng thể nghiờn cứu và cú cựng phõn phối xỏc suất với X.
Mẫu ngẫu nhiờn thƣờng đƣợc ký hiệu là:
W = (X1 , X2 , . . . , Xn)
Giả sử một giá trị của nó là: X1 = x1 , X2 = x2 , . . . , Xn = xn. Tập hợp n giá trị x1, x2, . . . , xn tạo thành một giá trị của mẫu ngẫu nhiờn, hay cũn gọi là một mẫu cụ thể,
ký hiệu: w = (x1 , x2 , . . . , xn)
Nhƣ vậy, mẫu ngẫu nhiờn là tập hợp của n biến ngẫu nhiờn, cũn mẫu cụ thể là tập hợp của n giá trị cụ thể quan sát đƣợc khi thực hiện một phộp thử đối với mẫu ngẫu nhiờn.
Vớ dụ 1: Khi nghiờn cứu chiều cao của một cộng đồng ngƣời, gọi X là ĐLNN chỉ chiều caọ Chỳng ta dự định đo chiều cao của 100 ngƣời đƣợc chọn ngẫu nhiờn. Trƣớc khi chƣa tiến hành chọn mẫu, ta chƣa biết đƣợc ngƣời thứ nhất đƣợc chọn vào mẫu có chiều cao là bao nhiờu, nó đóng vai trũ là một ĐLNN, ký hiệu X1, có cựng phõn phối xác suất với X. Tƣơng tự, ta có chiều cao của ngƣời thứ 100 là X100. Khi đó bộ (X1,
X2, ..., X100) là một mẫu tổng quát có kớch thƣớc 100. Sau khi đo đạc ta sẽ xác định đƣợc các giá trị của Xi là xi, khi đó bộ số thực (x1, x2, ..., x100) là một mẫu cụ thể.