A. XỬ LÝ SỐ LIỆU THỐNG KÊ TRONG PHÂN TÍCH THỰC PHẨM. 3 I. MỘT SỐ KHÁI NIỆM TRONG PHÂN TÍCH THỐNG KÊ 3 1) Giới thiệu 3 2) Giá trị trung bình của phép đo 3 3) Độ tin cậy của phương pháp phân tích. 4 4) Mức độ đo lường chính xác 6 II. XỬ LÝ SỐ LIỆU VÀ HIỆU CHỈNH HÓA. 7 1) Nguyên nhân của sai số 7 2) Làm tròn số 9 3) Loại bỏ số liệu 9 4) Các tiêu chí để hiệu chính hoá 10 III. Hồi quy tuyến tính 11 1) Liên hệ tương quan và phương pháp phân tích tương quan 11 2) Liên hệ tương quan tuyến tính giữa hai chỉ tiêu 11 3) Hệ số tương quan 12 4) Sai số trong hồi quy tuyến tính 13 IV. PHÂN TÍCH THỐNG KÊ DỮ LIỆU VÀ PHƯƠNG PHÁP THỐNG KÊ TRONG PHÂN PHỐI CHUẨN 15 1. Phân tích thống kê dữ liệu 15 2. Phương pháp thống kê trong phương pháp chuẩn 18 B. ỨNG DỤNG TRONG PHÂN TÍCH THỰC PHẨM. 21 I. PHƯƠNG PHÁP ĐƯỜNG CHUẨN 21 1. Chất chuẩn: 22 2. Dung dịch chuẩn: 22 3. Xây dựng đường chuẩn: 22 4. Đo mẫu: 23 5. Xử lý kết quả: 24 6. Chấp nhận kết quả: 24 7. Trình bày kết quả: 24 II. ÁP DỤNG KỸ THUẬT THỐNG KÊ TRONG PHÂN TÍCH ĐỊNH LƯỢNG 25 1. Mục đích: 25 2. Lĩnh vực áp dụng: 25 3. Nội dung: 25 4. Phương pháp xử lý số liệu: 26 5. Chấp nhận kết quả: 27 A. XỬ LÝ SỐ LIỆU THỐNG KÊ TRONG PHÂN TÍCH THỰC PHẨM. I. MỘT SỐ KHÁI NIỆM TRONG PHÂN TÍCH THỐNG KÊ 1) Giới thiệu Seminar này trước hết đánh giá kết quả của sự phân tích các mẫu, xử lý số liệu sau kết quả phân tích nhằm đạt được sự chính xác cao. Thêm vào đó, seminar đưa ra phương pháp hồi quy tuyến tính trong quá trình xử lý số liệu. Trong việc phân tích thực phẩm, một trong những khó khăn của việc phân tích dữ liệu là chúng ta phải xử lý dữ liệu và kết quả của phép đo. Chúng ta dựa trên cơ sở hợp lý để xây dựng phương pháp chuẩn để khắc phục sai số cũng như những khó khăn xuất hiện trong quá trình phân tích. Khi thiết kế và đánh giá một phương pháp phân tích, chúng ta cần khắc phục 3 lỗi thường gặp: Trước khi tiến hành, ta phải đánh giá những sai số liên quan đến phép đo để chắc chắn rằng chúng không ảnh hưởng đến kết quả phân tích, do đó có thể giảm thiểu sai số trong phân tích. Thứ hai, ta phải luôn giám sát quá trình phân tích, để chắc chắn rằng quá trình thực hiện luôn nằm trong tầm kiểm soát. Cuối cùng, khi kết thúc việc phân tích, phải so sánh phép đo và kết quả thu được với các tiêu chuẩn đã thiết lập sẵn. 2) Giá trị trung bình của phép đo Để tăng sự chính xác trong phân tích, ta phải đo các mẫu phân tích nhiều lần, ít nhất là 3 lần thông thường người ta đo lớn hơn 3 lần. Bởi vì chúng ta không biết được giá trị nào gần giá trị thực nhất do đó chúng ta lấy giá trị trung bình theo công thức sau. Giá trị trung bình : là giá trị thu được khi ta đem chia tổng của những kết quả của những phép đo riêng biệt cho số lần đo. Trong đó: Xi: là giá trị của phép đo thứ i n: số lần đo độc lập Ví dụ ta đo độ ẩm của hamburger chưa nướng cho bốn lần đô thu được số liệu như sau:64,53%, 64,45%, 65,10%, và 64,78% Vậy giá trị trung bình ta tính được như sau: Mặc dù có một số cá biệt có thể gần với giá trị thực hơn giá trị trung bình, nhưng ta vẫn chọn giá trị trung bình bởi vì không thể xác định được giá trị thực của nó. Hơn nữa số ở giữa cũng không được dùng, ta biệt một nửa số liệu thực nghiệm sẽ lớn hơn giá trị ở giữa, một nửa sẽ thấp hơn giá trị giữa, nhưng ta lại sử dụng giá trị trung bình thay cho giá số ở giữa ( hay giá trị giữa) bởi tính ước lượng thực nghiệm chính xác hơn. 3) Độ tin cậy của phương pháp phân tích. Trong ví dụ trên chúng ta không biết được làm cách nào để một phép đo lặp lại tốt, hoặc làm cách nào để có kết quả gần với giá trị thực thì các mục tiếp theo sẽ trả lời các câu hỏi này. 3.1 Độ chính xác của phép đo So sánh độ chính xác và độ lặp lại tốt. (a) Độ chính xác tốt và độ lặp lại tốt (b) Độ lặp lại tốt và độ chính xác kém (c) Độ chính xác tốt và độ lặp lại không tốt (d) Độ chính xác không tốt và độ lặp lại không tốt Độ lệch chuẩn Nếu chúng ta có nhiều mẫu thì ta có độ lệch chuẩn biểu diễn như sau ( theo ký tự Hy lạp) Trong đó : độ lệch chuẩn xi : giá trị của từng mẫu riêng biệt : giá trị thực n: tổng số mẫu Bởi vì không biết giá trị thực nên ta dùng đại lượng gần với độ lệch chuẩn để làm trong thực nghiệm cũng được gọi là giá trị chuẩn trong đó thế giá trị thực bằng giá trị trung bình của các mẫu đo. Giá trị chuẩn này miêu tả độ lệch của những phép đo riêng biệt so với giá trị trung bình Ta có ví dụ về độ ẩm của hamburger như sau Độ lệch chuẩn tương đối: sr = Nếu độ chuẩn tương đối này bé hơn 5% thì có thể chấp nhận được . Như ví dụ trên ta có do đó ta có thể chấp nhận được. Ta có giá trị thực nằm trong khoảng . Với z = 1 thì ta có xác suất tương ứng là 68%, với z = 2 ta có xác suất là 95%, với z =3 ta có xác suất là 99,7%. Độ tin cậy của giá trị trung mẫu là:
Trang 2Mục Lục
A XỬ LÝ SỐ LIỆU THỐNG KÊ TRONG PHÂN TÍCH THỰC PHẨM 3
I MỘT SỐ KHÁI NIỆM TRONG PHÂN TÍCH THỐNG KÊ 3
1) Giới thiệu 3
2) Giá trị trung bình của phép đo 3
3) Độ tin cậy của phương pháp phân tích 4
4) Mức độ đo lường chính xác 6
II XỬ LÝ SỐ LIỆU VÀ HIỆU CHỈNH HÓA 7
1) Nguyên nhân của sai số 7
2) Làm tròn số 9
3) Loại bỏ số liệu 9
4) Các tiêu chí để hiệu chính hoá 10
III Hồi quy tuyến tính 11
1) Liên hệ tương quan và phương pháp phân tích tương quan 11
2) Liên hệ tương quan tuyến tính giữa hai chỉ tiêu 11
3) Hệ số tương quan 12
4) Sai số trong hồi quy tuyến tính 13
IV PHÂN TÍCH THỐNG KÊ DỮ LIỆU VÀ PHƯƠNG PHÁP THỐNG KÊ TRONG PHÂN PHỐI CHUẨN 15
1 Phân tích thống kê dữ liệu 15
2 Phương pháp thống kê trong phương pháp chuẩn 18
B ỨNG DỤNG TRONG PHÂN TÍCH THỰC PHẨM 21
I PHƯƠNG PHÁP ĐƯỜNG CHUẨN 21
1 Chất chuẩn: 22
2 Dung dịch chuẩn: 22
3 Xây dựng đường chuẩn: 22
4 Đo mẫu: 23
5 Xử lý kết quả: 24
6 Chấp nhận kết quả: 24
7 Trình bày kết quả: 24
II ÁP DỤNG KỸ THUẬT THỐNG KÊ TRONG PHÂN TÍCH ĐỊNH LƯỢNG 25
1 Mục đích: 25
2 Lĩnh vực áp dụng: 25
3 Nội dung: 25
4 Phương pháp xử lý số liệu: 26
5 Chấp nhận kết quả: 27
Trang 3A XỬ LÝ SỐ LIỆU THỐNG KÊ TRONG PHÂN TÍCH
Trong việc phân tích thực phẩm, một trong những khó khăn của việc phân tích
dữ liệu là chúng ta phải xử lý dữ liệu và kết quả của phép đo Chúng ta dựa trên cơ
sở hợp lý để xây dựng phương pháp chuẩn để khắc phục sai số cũng như nhữngkhó khăn xuất hiện trong quá trình phân tích
Khi thiết kế và đánh giá một phương pháp phân tích, chúng ta cần khắc phục 3lỗi thường gặp:
- Trước khi tiến hành, ta phải đánh giá những sai số liên quan đến phép đo đểchắc chắn rằng chúng không ảnh hưởng đến kết quả phân tích, do đó có thể giảmthiểu sai số trong phân tích
- Thứ hai, ta phải luôn giám sát quá trình phân tích, để chắc chắn rằng quátrình thực hiện luôn nằm trong tầm kiểm soát
Cuối cùng, khi kết thúc việc phân tích, phải so sánh phép đo và kết quả thu được với các tiêu chuẩn đã thiết lập sẵn
2) Giá trị trung bình của phép đo
Để tăng sự chính xác trong phân tích, ta phải đo các mẫu phân tích nhiều lần, ít nhất là 3 lần thông thường người ta đo lớn hơn 3 lần Bởi vì chúng ta không biết được giá trị nào gần giá trị thực nhất do đó chúng ta lấy giá trị trung bình theo công thức sau
Giá trị trung bình : là giá trị thu được khi ta đem chia tổng của những kết quảcủa những phép đo riêng biệt cho số lần đo
Trong đó: Xi: là giá trị của phép đo thứ i
Trang 4Mặc dù có một số cá biệt có thể gần với giá trị thực hơn giá trị trung bình, nhưng
ta vẫn chọn giá trị trung bình bởi vì không thể xác định được giá trị thực của nó Hơn nữa số ở giữa cũng không được dùng, ta biệt một nửa số liệu thực nghiệm sẽ lớn hơn giá trị ở giữa, một nửa sẽ thấp hơn giá trị giữa, nhưng ta lại sử dụng giá trịtrung bình thay cho giá số ở giữa ( hay giá trị giữa) bởi tính ước lượng thực
nghiệm chính xác hơn
3) Độ tin cậy của phương pháp phân tích.
Trong ví dụ trên chúng ta không biết được làm cách nào để một phép đo lặp lại tốt,hoặc làm cách nào để có kết quả gần với giá trị thực thì các mục tiếp theo sẽ trả lờicác câu hỏi này
Trang 5Bởi vì không biết giá trị thực nên ta dùng đại lượng gần với độ lệch chuẩn để làm trong thực nghiệm cũng được gọi là giá trị chuẩn trong đó thế giá trị thực bằng giá trị trung bình của các mẫu đo.
Giá trị chuẩn này miêu tả độ lệch của những phép đo riêng biệt so với giá trị trung bình
Ta có ví dụ về độ ẩm của hamburger như sau
Độ lệch chuẩn tương đối: sr =
Nếu độ chuẩn tương đối này bé hơn 5% thì có thể chấp nhận được
Như ví dụ trên ta có 0.293 0.453%
64.72
sx do đó ta có thể chấp nhận được
Trang 6Ta có giá trị thực nằm trong khoảng Với z = 1 thì ta có xác suất tương ứng là 68%, với z = 2 ta có xác suất là 95%, với z =3 ta có xác suất là 99,7%.
Độ tin cậy của giá trị trung mẫu là:
Độ ngờ:
Độ ngờ là phép đo để đạt được giá trị gần với giá trị kỳ vọng µ+ Hay nói cáchkhác, độ ngờ là khái niệm biểu thị sự khác biệt giữa giá trị đo được của một đạilượng x với giá trị thực sự μ của nó
Độ ngờ thường được dùng để biểu diễn sai số tuyệt đối:
Trang 7Độ chính xác là độ trải rộng của dữ liệu trong phép đo xung quanh giá trị trungtâm và được biểu diễn trong một vùng gọi là độ lệch chuẩn hay phương sai Độchính xác thường được chia làm 2 loại: độ lặp lại và độ tái xuất hiện
Độ lặp lại là độ chính xác đạt được khi thực hiện phép đo trong cùng điều kiệnthí nghiệm, sử dụng cùng một dung môi và thiết bị
Mật độ tái xuất hiện đạt được khi ta thu được cùng một độ chính xác khi ta tiếnhành thí nghiệm trong những điều kiện khác nhau
Do độ tái xuất hiện luôn thay đổi nên trong phân tích, ta thường sử dụng độ lặplại
Sai số ảnh hưởng đến việc thiết lập phép đo xung quanh giá trị trung tâm đượcgọi là sai số bất định và được miêu tả bằng sự thay đổi ngẫu nhiên cả về phươnghướng lẫn kích cỡ Sai số bất định không được ảnh hưởng đến kết quả phân tích.Sai số bất định phân tán ngẫu nhiên xung quanh giá trị trung tâm, có giá trị dươnghay âm
Nguyên nhân gây nên sai số bất định: sai số bất định do nhiều nguyên nhân gâynên, bao gồm việc thu thập mẫu, thao tác trong quá trình phân tích và thực hiệnphép đo
Khi thu thập mẫu có thể tổn thất hay tăng lên một lượng nhỏ, điều này dẫn đếnsai số bất định
Trong quá trình phân tích, những biến đổi nhẫu nhiên sinh ra trong quá trình
xử lý mẫu cũng gây nên sai số bất định
Cuối cùng, bất kỳ một phép đo nào cũng có sai số bất định, do việc đọc số liệu,thường là ước lượng do nó dao động ngẫu nhiên, hay do tạp âm
Ví dụ như burette có độ chia nhỏ nhất là 0.1 ml có sai số bất định là ± 0.03 ml khi ước lượng thể tích đến hàng trăm ml
0.01-Tính toán sai số bất định: tuy không thể bỏ qua sai số bất định nhưng có thểgiảm thiểu nó nếu biết được nguyên nhân và mức độ ảnh hưởng tương đối của nóđến kết quả Sai số bất định có thể được ước lượng bằng mức độ lấy xấp xỉ củaphép đo Điển hình như ta có thể dùng độ lệch chuẩn để thay thế sai số bất địnhtrong một vài trường hợp Việc tạo ra các dụng cụ và thiết bị phân tích giúp choviệc thực hiện phép đo và ước lượng được dễ dàng Sai số bất định được đề nghịbởi các nhà phân tích Trong trường hợp xử lý mẫu không đồng nhất thì việc ướclượng càng khó khăn hơn
II XỬ LÝ SỐ LIỆU VÀ HIỆU CHỈNH HÓA.
1) Nguyên nhân của sai số
Trang 8Sai số có 2 loại là sai số hệ thống và sai số ngẫu nhiên.
a Sai số ngẫu nhiên hay sai số không xác định:
Là các sai số không biết trước và không xác định được ví dụ như độ lặp lại củakết quả phân tích không theo quy luật, do các nguyên nhân không rõ ràng Chỉ cóthể giảm sai số ngẫu nhiên khi tăng số lần đo Trong toán học, khi số lần đo tăngtới vô hạn thì sai số tiến tới bằng không
b Sai số hệ thống hay sai số xác định:
Là sai số do những nguyên nhân có thể biết trước và xác định được, gồm:
- Do dụng cụ, thiết bị hay hoá chất
- Do nhược điểm của phương pháp
- Do thao tác của người thực hiện
Nếu sai số xác định dương, thì giá trị trung tâm sẽ lớn hơn giá trị thực Còn nếusai số xác định âm thì giá trị trung tâm sẽ nhỏ hơn giá trị thực Dù sai số xác định
âm hay dương đều ảnh hưởng đến kết quả phân tích Khi 2 giá trị bằng nhau thìgiá trị trung tâm sẽ không có sai số xác định
Sai số xác định được chia làm 4 loại:
- Sai số chuẩn
- Sai số phương pháp
- Sai số phép đo
- Sai số do người đo (sai số chủ quan)
Sai số chuẩn: sai số xảy ra khi ta sử dụng mẫu tiêu biểu, đặc biệt khi mẫu
gồm những vật liệu không đồng thể Ví dụ như để xác định chất lượng môi trườngcủa hồ nước bằng cách lấy mẫu ở những vị trí gần nguồn ô nhiễm, tại đầu ra củanguồn chất thải công nghiệp, dẫn đến kết quả phân tích sai
Sai số chuẩn: khi x ∞
thì μ là giá trị thực của đại lượng đo
và s σ là giá trị sai số chuẩnTrong phân tích, người ta xem 20 < n < 30 là ∞, tức là coi như ~ μ
Sai số phương pháp: sai số xuất hiện khi ta thừa nhận không có mối quan
hệ giữa tín hiệu và chất cần phân tích
Mối quan hệ giữa tín hiệu đo và hàm lượng chất cần phân tích:
(phương pháp phân tích toàn bộ)
Trang 9(phương pháp phân tích nồngđộ)
Sai số phương pháp tồn tại khi độ nhạy k và tín hiệu đo được xác định khôngchính xác do thuốc thử Sreag Sai số phương pháp có thể được giảm thiểu bằng cáchchuẩn hóa phương pháp
Sai số phép đo: thiết bị và dụng cụ phân tích như thủy tinh, cân thường
có giá trị khoảng sai số đo lớn nhất, gọi là sai số cho cho phép
Sai số phép đo có thể được giảm thiểu bằng cách căn chỉnh dụng cụ đo Nhưng
sự căn chỉnh này không đảm bảo rằng nó không thay đổi trong suốt quá trình phântích
Sai số chủ quan: cuối cùng, việc phân tích luôn phụ thuộc vào sai số chủ
quan của người đo: như khả năng nhận biết sự thay đổi màu sắc của chất chỉ thịđược dùng làm ký hiệu kết thúc quá trình chuẩn độ
Xác định sai số xác dịnh: rất khó để xác định sai số xác định Nếu khôngbiết giá trị thực của một phép phân tích hay giá trị trung bình (tình huống thườnggặp), thì sẽ không có kết quả nào được chấp nhận khi ta đem so sánh với kết quảthực nghiệm
Tuy nhiên vẫn có một vài cách để ta xác định đâu là sai số xác định
Một vài sai số được xác định từ thực nghiệm bằng cách phân tích một vài mẫu
có kích thước khác nhau Hằng số sai số xác định xuất hiện khi sai số xác địnhgiống nhau cho tất cả các mẫu, và nó trở nên đặc biệt quan trọng hơn khi phân tíchnhững mẫu nhỏ hơn Có thể kiểm tra hằng số sai số xác định bằng cách phân tíchmẫu có hàm lượng khác nhau và ra đặc tính của sự thay đổi theo hệ thống khi thựchiện phép đo
Trang 10- Loại bỏ HL* và tính HLtb(N-1) và s(N-1).
3.2 Sau khi loại bỏ “điểm nghi ngờ”, thực hiện lại phương pháp xử lý kết quả
với (N-1) điểm còn lại
Chú ý: Số điểm tối thiểu còn lại phải bằng 4:
3.3 Ghi chú: Sau khi xử lý kết quả với (N-1) điểm còn lại, nếu độ biến động
của hàm lượng mẫu vẫn còn lớn hơn 5% (hoặc 10% cho phân tích vi lượng, cóhàm lượng nhỏ hơn ppm) - thì lại phải thực hiện lại phương pháp “loại bỏ số đo domắc mắc độ lệch thô bạo”
4) Các tiêu chí để hiệu chính hoá
4.1 Giới hạn phát hiện (giới hạn dò, cực tiểu phát hiện, Limit Of Detection
-LOD):
Định nghĩa : Cực tiểu phát hiện (LOD) hay giới hạn phát hiện của một loại
đầu dò (hay của một phương pháp) là hàm lượng hoặc trọng lượng tối thiểu củachất cần phân tích có thể được phát hiện ở đầu dò nhưng không thể định lượngđựoc một cách chính xác
Nguyên tắc : LOD của mỗi loại đầu dò được xác định bằng cách so sánh
-trên cùng một thang đo - chiều cao tín hiệu S (signal) của cấu tử cần phân tích vớichiều cao của đường nền n (noise) trong trường hợp phân tích có mẫu và không cómẫu
Thực hiện phân tích mẫu trắng (mẫu chỉ chứa dung môi), vẽ và đo chiều caocủa đường nền n (mm) trong vùng lân cận của tín hiệu
Thực hiện phân tích dung dịch chứa mẫu có nồng độ tối thiểu biết trước Cmin,
vẽ và đo chiều cao của tín hiệu S (mm) sao cho:
Trong đó: - n: chiều cao đường nền
- S: chiều cao của tín hiệu pick của dẫn xuấtKết quả:
LOD có thể được biểu diễn theo nồng độ (ppm, ppb, ppt) hoặc theo trọnglượng tuyêt đối
Trang 114.2 Giới hạn định lượng (Limit Of Quantitation - LOQ):
Giới hạn định lượng của một phương pháp (Method Limit Of Quantitation MLOQ) là hàm lượng hoặc trọng lượng tối thiểu của chất phân tích có thể địnhlượng được bằng phương pháp này với độ chính xác và độ lặp lại tin cậy được.Thông thường, đặt giới hạn định lượng lớn gấp 3-5 lần giới hạn phát hiện MLOD
So sánh ttn với tlt ở v = (nA + nB - 2) là số bậc tự do với mức xác suất f%
- Nếu : hai giá trị trung bình khác nhau do sai số ngẫu nhiên
- Nếu : hai giá trị trung bình khác nhau do sai số hệ thống
So sánh độ lặp lại:
Tra bảng tìm FvA/vB là giá trị lý thuyết xác đinh theo các bậc tự do vA = nA - 1;
vB = nB - 1 và xác suất f%
- Nếu : hai dãy thí nghiệm có độ lặp lại giống nhau
- Nếu : hai dãy thí nghiệm có độ lặp lại khác nhau
III Hồi quy tuyến tính
1) Liên hệ tương quan và phương pháp phân tích tương quan
Trang 12Mối liên hệ ràng buộc lẫn nhau giữa các chỉ tiêu hoặc tiêu thức của hiện tượng (từ đây chỉ dùng từ "chỉ tiêu" đặc trưng cho cả hai), trong đó sự biến động của một chỉtiêu này (chỉ tiêu kết quả) là do tác động của nhiều chỉ tiêu khác (các chỉ tiêu nguyên nhân) gọi là liên hệ tương quan - một hình thức liên hệ không chặt chẽ.
2) Liên hệ tương quan tuyến tính giữa hai chỉ tiêu
a Phương trình hồi quy tuyến tính (đường thẳng)
Nếu gọi y và x là các trị số thực tế của chỉ tiêu kết quả và nguyên nhân có thể xây dựng được phương trình hồi quy đường thẳng như sau:
Trong đó: là trị số lý thuyết (điều chỉnh) của chỉ tiêu kết quả; a và b là các hệ
số của phương trình (trong đó b > 0 thì đường thẳng đi lên, b < 0 thì đường thẳng
đi xuống và b = 0 đường thẳng song song với trục hoành)
Có thể biểu diễn giá trị thực tế và giá trị lý thuyết của chỉ tiêu kết quả (qua trục tung) trong quan hệ với chỉ tiêu nguyên nhân (qua trục hoành) qua đồ thị
Đặc trưng mối quan hệ giữa chỉ tiêu kết quả (y) và chỉ tiêu nguyên nhân (x)
Trang 13Hệ số tương quan r được dùng để đánh giá mức độ chặt chẽ của sự
phụ thuộc tương quan tuyến tính giữa hai đại lượng ngẫu nhiên X và Y, nó có các tính chất sau đây:
i)
ii) Nếu = 1 thì X và Y có quan hệ tuyến tính.
iii) Nếu càng lớn thì sự phụ thuộc tương quan tuyến tính giữa X và Y càng chặt chẽ.
iv) Nếu = 0 thì giữa X và Y không có phụ thuộc tuyến tính tương quan v) Nếu r > 0 thì X và Y có tương quan thuận (X, Y cùng tăng hoặc cùng tăng) Nếu r < 0 thì X và Y có tương quan nghịch (X giảm thì Y tăng hoặc ngược lại).
Cả hai hình đều có cùng phương trình đường thẳng Hình a có hệ số tương quan lớn hơn Hình b có hệ số tương quan thấp hơn
Cả hai có chung một đường thẳng nhưng số liệu phân tích của hình a có độ lặp lại tốt hơn số liệu phân tích của hình b
4) Sai số trong hồi quy tuyến tính
Trang 14Ví dụ ta có nồng độ của một chất ở 60ppm theo đồ thị thì ta tra được diện tích peak từ 4000 đến 6000 Ta có 2 đường cong ở trên và ở dưới so với đường thẳng
là upper limit và lower limit Nếu sai số của các số liệu tra so với đường thẳng là 5% thì ta có thể chấp nhận được
Trang 15Ta biết hồi quy đường thẳng chỉ đúng khi chúng nằm trong một giới hạn nào đó, nằm ngoài khoảng giới hạn đó sẽ gây ra sai số Ví dụ giới hạn đầu của đường thẳng trên bắt đầu có số liệu đo giảm xuống khi nồng độ trăng đến điểm z chẳng hạn Do đó để xác định ngưỡng đường thẳng ta cho số liệu có nồng độ cao hơn điểm z để kiểm tra xem thực sự chúng có giảm về kết qủa đo hay không
( measured value) Nếu chúng giảm thực sự thì ta chi có thể ngoại suy đúng trong vùng đường thẳng ta có Ta phải xác định giới hạn để số liệu đó có thể hồi quy về đường thẳng để tránh sai số khi ngoại suy
IV PHÂN TÍCH THỐNG KÊ DỮ LIỆU VÀ PHƯƠNG PHÁP THỐNG
KÊ TRONG PHÂN PHỐI CHUẨN
1 Phân tích thống kê dữ liệu
1.1 Tiêu chuẩn ý nghĩa:
Giả sử ta có hai mẫu máu được lấy từ cùng một bệnh nhân khi sử dụng thuốcgiảm nồng độ glucose trong máu Một mẫu được lấy trước khi bệnh nhân dùng,thuốc mẫu thứ hai lấy vài giờ sau khi dùng thuốc Mẫu được đem đi phân tích vàthu được giá trị trung bình cùng với phương sai kỳ vọng Làm thế nào để nhận biếtviệc sử dụng thuốc là thành công trong việc giảm nồng độ glucose trong máu bệnhnhân
Câu trả lời dựa trên việc thiết lập đường cong phân bố xác suất của mỗi mẫu và
so sánh 2 đường cong với nhau