Các mô hình loga tuyến tính rất hữu ích cho khai thác dữ liệu mô tả; chúng điều tra những sự kết hợp giữa các biến được xét. Việc làm khớp một mô hình loga tuyến tính cho tất cả 20 biến nhị thức có thể đòi hỏi quá nhiều tham số cần được ước lượng. Do đó để tiết kiệm và để đáp ứng các hạn chế tính toán ta sẽ phân tích các kết quả thăm dò trong hình 3.1.
Hình 3.1 cho thấy sự tồn tại của 5 nút bị cô lập: milk, biscuits, water, coffee, yoghurt,
có thể coi chúng độc lập với các nút khác.
Do đó ta sẽ cố gắng làm khớp một mô hình loga tuyến tính đồ thị cho 15 biến với các tương tác lên tới bậc 2:
{ } { } 1 2 15 1 2 15 j k 1 2 15 jk i i ...i i i i i i e 1 j k 15 log m u u u ... u u ; i 0;1 , e 1;2;...;15 ≤ < ≤ = + + + + + ∑ ∈ ∈
Bảng sự kiện này có 215 =32768 ô tuân theo phân phối đa thức (có ràng buộc ∑πi i ...i1 2 15 =1
). Trong đó ie =0 tức là sản phẩm thứ ekhông xuất hiện, ie =1 tức là sản phẩm thứ e xuất
hiện. Ở đây có thêm ràng buộc i jk
0 11
u = ∀0, i, u ≠ ∀0, j,k và các tương tác còn lại đều bằng không. Sau khi kiểm định, mô hình này được chấp nhận. Bảng 3.6 thể hiện các ước lượng hợp lý cực đại của các tham số trong mô hình.
Các kết quả ở bảng 3.6 thu được bằng cách sử dụng SAS, thủ tục CATMOD. Để so sánh
bảng 3.6 với bảng 3.5, chú ý rằng tỷ số chênh bằng exp(4×tham số tương tác trong bảng
3.6). Do đó tỷ số chênh ngưỡng bằng 2 trong bảng 3.5 tương ứng với một giá trị ngưỡng của
tham số tương tác trong bảng 3.6 là ln 2
0,1732
4 ≈ . Vì vậy ta có thể chọn các tham số tương
tác vượt qua được ngưỡng này.
Từ bảng 3.6 chỉ ra rằng tất cả các tương tác được tìm thấy trong bảng 3.5 vẫn mạnh đáng kể, ngoại trừ (rice, pasta), (brioches, ice cream) và (crackers, juices) chúng có tỷ số chênh ước lượng thấp hơn 2 một chút. Hơn nữa có 14 kết hợp dương mạnh nữa: 9 trong số chúng là tinned meat kết hợp với coke, crackers, juices, oil, tomato sauce, beer, frozen vegetables, frozen fish và ice cream; 3 trong số chúng là ice cream kết hợp với frozen vegetables, rice và frozen fish; 2 kết hợp cuối cùng là (mozzarella, rice) và (crackers, rice). Bảng 3.6 cho thấy rằng không có các tương tác âm nào đáng kể.