PHƯƠNG PHÁP NGHIÊN CỨU
2.2. Xây dựng hệ thống kích thước cơ thể nam sinh viên Thành phố Hồ Chí Minh ứng dụng phương pháp đo gián tiếp 2D
2.2.3. Tính toán thống kê
Sai số thô tạo nên các kết quả đo không đúng có thể là quá bé hoặc là quá lớn so với các kết quả khác. Sai số thô do nhiều nguyên nhân gây ra như do đọc nhầm, nghe nhầm, ghi nhầm hay vì một lý do bất thường nào đó trong quá trình đo như người đo sử dụng thiết bị đo không đúng, xác định các mốc đo bị nhầm lẫn. Do đó trước khi nhập số liệu ta cần kiểm tra phiếu đo và loại bỏ ngay những phiếu đo có kết quả sai do sai số thô gây ra.
- Tính các đặc trưng thống kê: sử dụng phần mềm SPSS 20 [5] và Excel để tính các giá trị thống kê như sau:
Khoảng phân phối:Khoảng phân phối là khoảng cách giữa trị số cực tiểu (min) và trị số cực đại (max) của một phân phối thực nghiệm. Tập hợp, sắp xếp các số đo thành dãy phân phối thực nghiệm theo kích thước chiều cao cơ thể từ nhỏ (Min) đến lớn (Max).
Số cực tiểu (Min): là số nhỏ nhất trong dãy phân phối.
Số cực đại (Max): là số lớn nhất trong dãy phân phối.
Giá trị trung bình cộng: Gọi M là số trung bình cộng; n là tổng số các số đo trong một phân phối thực nghiệm; x1, x2, x3…xn là trị số của từng số đo; f1, f2, f3…fn là tần suất của các số đo có trị số x1, x2, x3…xn, thì số trung bình cộng M bằng tổng số các trị số của các số đo chia cho tổng số các số đo n. Tính giá trị trung bình cộng theo công thức:
n
x f x
f x
M f1 1 2 2... i i
= n
x fn n
(2.17) Trong đó: x1, x2,...xi: là trị số của từng số đo
f1, f2, ...fi: là tần số của trị số đo n: là tổng số các số đo
n= f1+f2+ …+fi
Độ lệch chuẩn ( ): Độ lệch chuẩn là đặc trưng thống kê hay dùng nhất để đánh giá độ tản mạn của phân phối thực nghiệm, cho biết mức độ phân tán của các giá trị xi so với số trung bình.
với n>30 =
n fi xi M
( )2
(2.18)
với n<30 =
1
)
( 2
n fi xi M
(2.19)
Hệ số biến sai (CV): Là tỉ lệ % giữa độ lệch tiêu chuẩn và số trung bình cộng.
CV không phụ thuộc vào đơn vị đo và trị số của M và nói lên giá trị tương đối của độ lệch tiêu chuẩn so với số trung bình cộng. Vì vậy, hệ số biến sai cho phép ta có thể so sánh mức độ tản mạn của hai phân phối thực nghiệm có số trung bình cộng khác nhau và đơn vị đo khác nhau. Tính hệ số biến sai theo công thức:
CV= 100(
M
) % (2.20) Số trung tâm hay số trung vị (Me): Số trung tâm hay số trung vị là con số đứng giữa dãy số phân phối và chia dãy đó thành hai phần bằng nhau.Cách xác định:
Nếu dãy phân phối gồm một số lẻ (n=2k+1) giá trị thì con số ở vị trí thứ k+1 là số trung vị.
Nếu dãy phân phối gồm một số chẵn (n=2k) giá trị thì số trung vị sẽ nằm giữa khoảng giá trị của con số thứ k và k+1.
x f
n K Me
2
(2.21) Trong đó :
Me : Số trung vị.
x: Trị số của hàng biến số.
n: Số lượng tập hợp; K: Bước nhảy
: Tần số tích lũy đứng ngay trước hàng biến số.
f: Tần số ứng với hàng.
Số trội (Mo): Số trội là giá trị phổ biến nhất, có tần số lớn nhất trong dãy phân phối. Trên đồ thị của dãy phân phối liên tục trị số của Mo ứng với đỉnh của đường cong.
2 1
1 0
0 0
2f f f
f K f
x M
M M
(2.22) Trong đó:
Mo : Số trội; x : Giới hạn đầu của hàng số trội K : Bước nhảy; fMo: Tần số ứng với hàng số trội f1 : Tần số ứng với hàng đứng ngay trước hàng số trội f2 : Tần số ứng với hàng đứng ngay sau hàng số trội
Hệ số bất đối xứng (Skewness) – Ký hiệu là SK: Hệ số bất đối xứng thể hiện mức độ bất đối xứng của đồ thị phân phối của dãy số so với đường cong phân phối chuẩn (SK=0). Hệ số bất đối xứng của đồ thị được là phân phối chuẩn bao giờ cũng nhỏ hơn hệ số bất đối xứng giới hạn trên [S].
3
) 2 )(
1
(
M x n
n
SK n i (2.23) Hệ số nhọn (Kurtosis) – Ký hiệu là KU: Hệ số nhọn thể hiện độ nhọn của đồ thị phân phối của dãy số so với đường cong phân phối chuẩn (KU=0). Hệ số nhọn của đồ thị phân phối chuẩn bao giờ cũng nhỏ hơn hệ số nhọn giới hạn trên [K].
) 3 )(
2 (
) 1 ( 3 )
3 )(
2 )(
1 (
) 1
( 2 4 2
n nnn n x M n n n
KU
(1.24) Tính giới hạn trên hệ số bất đối xứng [S]:
[S] = 3
1 3
1 6
n n
n (1.25)
Tính giới hạn trên hệ số nhọn [K]:
[K] = 3
1 3 5
3 2 24
2
n n n
n n
n (1.26)
Chuẩn x2: Tính mức khác biệt tin cậy giữa các phân bố thực nghiệm và lý thuyết của hai kích thước chủ đạo. Dùng chuẩn x2 để xem sự khác biệt giữa chúng tới mức nào và xác định giới hạn khác biệt để biết khi nào thì sự khác biệt có thể coi là không đáng kể, tức phân bố lý thuyết có thể coi như đồng nhất với phân bố chuẩn.
lt lt
f f x f
2
2 ( )
(2.27) f – tần số thực nghiệm
flt– tần số lý thuyết
Tần số lý thuyết: Tần số lý thuyết các kích thước đo của tập hợp biến thiên hay xác suất thể hiện x, được xác bằng công thức sau:
flt =
2
nk 2 2
2 M x
e
(2.28) Trong đó:
flt - tần số lý thuyết
n- số lượng mẫu nghiên cứu k- độ lớn khoảng giữa hàng e - số log tự nhiên (e=2,7118)
Quy luật phân phối chuẩn của kích thước chủ đạo: Xét quy luật phân phối chuẩn của kích thước chủ đạo dựa vào đặc trưng thống kê SK, KU, [S], [K] của các kích
thước chủ đạo. Nếu SK<[S] và KU<[K]; 2tính toán từ thực nghiệm < 2lý thuyết thì phân bố thực nghiệm của các kích thước chủ đạo thuộc loại phân bố chuẩn.
Tính số lạc và loại số lạc: Sử dụng phần mềm Excel để tính số lạc. Số lạc được coi là những giá trị quá lớn hoặc quá bé so với các giá trị còn lại của tập hợp các kết quả đo, có xác suất xuất hiện rất thấp nhưng ảnh hưởng đến tính chính xác của kết quả nghiên cứu. Do đó các phiếu đo có chứa số lạc cần phải được loại bỏ ngay. Số lạc là những số thỏa điều kiện sau: Số lạc ≤ M-3. và số lạc ≥ M+3. . Những số liệu còn lại sẽ có giá trị nằm trong phạm vi từ M M-3. đến M-3. , đạt với tỉ lệ đáp ứng tổng số mẫu nghiên cứu 99,73%.