Giải thuật Gibbs

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu các phương pháp tạo chỉ số thống kê và ứng dụng (Trang 30)

Giải thuật Gibbs là một thuật toán trong phương pháp Markov chain Monte Carlo. Nội dung thuật toán gắn với một lớp bài toán cụ thể “bài toán sinh mẫu” trên các khía cạnh ý tưởng, cách thức triển khai, hoạt động cũng như tính đúng của thuật giải. Bên cạnh đó, những vấn đề liên quan tới giải thuật cũng được nêu ra cho thấy tiềm năng ứng dụng trong thực tế.

Ta sẽ đi qua các nội dụng chính của Giải thuật Gibbs gồm: 1. Bài toán sinh mẫu.

2. Thuật toán Gibbs giải bài toán sinh mẫu. 3. Minh họa.

1.6.1 Bài toán sinh mẫu

Phát biểu bài toán

Sinh mẫu ngẫu nhiên từ một phân phối cho trước, bài toán được diễn đạt bằng ngơn ngữ tốn học như sau:

(X1, ..., Xk). Hãy sinh ra một dãy các giá trị x(1) = (x(1)1 , ..., x(1)k ), x(2) = (x(2)1 , ..., x(2)k ),. . . ,x(n) = (x(n)1 , ..., x(n)k ) tuân theo phân phối f(x1, ..., xk).

Giờ ta sẽ xác định đầu vào, đầu ra của bài tốn như sau:

• Đầu vào: f(x1, ..., xk).

• Đầu ra: dãy x(1), x(2), ..., x(n) có cùng phân phối f(x1, ..., xk).

Ta gọi f(x1, ..., xk)cần sinh mẫu là phân phối mục tiêu. 1.6.2 Thuật toán Gibbs giải bài toán sinh mẫu

Ý tưởng

Chúng ta không sinh trực tiếp mẫu từ phân phối mục tiêu. Thay vào đó, ta chọn những phân phối đơn giản, dễ sinh mẫu hơn. Yêu cầu mẫu sinh ra từ những phân phối thay thế phải đảm bảo hoặc chính xác hoặc xấp xỉ mẫu sinh ra từ phân phối mục tiêu. Xét biến ngẫu nhiên k chiều X = (X1, ..., Xk)(k ≥ 2) có phân phối đồng thời f(x1, ..., xk). Đây là phân phối mục tiêu cần sinh mẫu.

Ký hiệu:

• X−i = (X1, ..., Xi−1, Xi+1, ..., Xk)là biến ngẫu nhiên k−1chiều, các thành phần lấy từ biến ngẫu nhiên X = (X1, ..., Xk) ngoại trừ thành phần thứ i.

• fXi|X−i(.|x1, ..., xi−1, xi+1, ..., xk)là phân phối có điều kiện đầy đủ của Xi.

• fX−i(x1, ..., xi−1, xi+1, ..., xk) là phân phối riêng củaX−i. Các ký hiệu có quan hệ như sau:

fXi|X−i = f(x1, ..., xk)

fX−i

Chúng ta chọn những phân phối có điều kiện đầy đủ fXi|X−i(.|x1, ..., xi−1, xi+1, ..., xk)

để sinh mẫu, vì:

• Những phân phối này xác định duy nhất phân phối mục tiêu.

• Những phân phối này có dạng đơn giản, quen thuộc (giả thiết đơn giản hơn phân phối mục tiêu).

• Số chiều đã được giảm đi.

Xuất phát từ phương pháp Markov chain Monte Carlo, chúng ta tạo ra các chuỗi Markov có phân phối dừng là fXi|X−i(.|x1, ..., xi−1, xi+1, ..., xk) của từng thành phần Xi. Từ đó, chúng ta tạo được một chuỗi Markov chung có phân phối dừng là phân phối

mục tiêu f(x1, ..., xk). Chúng ta gọi phương pháp này là giải thuật sinh mẫu Gibbs

(đơn giản gọi là giải thuật Gibbs).

Điểm khác biệt của giải thuật Gibbs so với các giải thuật khác trong phương pháp MCMC là:"Tại một thời điểm chỉ duy nhất thành phần xi được coi là biến số, các thành phần xj(j 6=i) còn lại được cố định."

Như vậy, bài tốn ban đầu có chút thay đổi về đầu vào như sau:

• Đầu vào:fX1|X−1, fX2|X−2, ..., fXk|X−k.

• Đầu ra: x(1), x(2), ..., x(n). Chi tiết các bước của giải thuật:

• Bắt đầu

– Bước khởi tạo

Chọn giá trị khởi tạo x(0) = (x(0)1 , ..., x(0)k ).

– Bước sinh mẫu. Cho t= 1 tới n.

(1) Sinh x(t)1 từfX1|X−1(x1|x(t−1)2 , ..., x(t−1)k ).

(2) Sinh x(t)2 từfX2|X−2(x2|x(t)1 , x(t−1)3 , ..., x(t−1)k ).

...

(i) Sinh x(t)i từfXi|X−i(xi|x(t)1 , ...x(t)i−1, x(t−1)i+1 , ..., x(t−1)k ).

...

(k) Sinhx(t)k từfXk|X−k(xk|x(t)1 , ..., x(t)k−1).

Cập nhật x(t)1 = (x(t)1 , ..., x(t)k−1).

• Kết thúc

Hình 1.9: Minh họa thuật tốn Gibbs

Minh họa giải thuật Gibbs

Để dễ hình dung, ta sử dụng sơ đồ khối ở Hình 1.10 sau đây để mô tả giải thuật Gibbs.

Ta viết đoạn mã như sau: Gibbs()

Bắt đầu

Khởi tạo x(0); Cho t= 1 tới n

Cho i= 1 tới k

Sinh x(t)i từ fXi|X−i(xi|x1(t), ...x(t)i−1, x(t−1)i+1 , ..., x(t−1)k ).

Cập nhật x(t). Trả lại dãy x(1), ..., x(n). Kết thúc

Đối chiếu với thuật toán MCMC cơ bản.

- Gọi x(t)i là trạng thái hiện thời,x∗i là trạng thái đề xuất từ phân phối qi(x∗i|x(t)i ) = fXi|X−i(xi|x(t)1 , ..., x(t)i−1, x(t−1)i+1 , ..., x(t−1)k ).

- Đặtx(t)−i = (xi|x(t)1 , ..., x(t)i−1, x(t−1)i+1 , ..., x(t−1)k )thìx∗−i = (xi|x(t)1 , ..., x(t)i−1, x(t−1)i+1 , ..., x(t−1)k ).

Hình 1.10: Sơ đồ khối giải thuật Gibbs

x(t)i =x∗i.

- Bên cạnh đó f(x(t)) = fXi|X−i(xi(t)|x(t)−i)fX−i(x(t)−i).

- Vì vậy

f(x∗i)qi(x(t)i |x∗ i)

f(x(t)i )qi(x∗i|x(t)i ) =

f(x∗i|x∗

−i)fX−i(x∗−i)f(x(t)i |x∗ −i)

f(x(t)i |x(t)−i)fX−i(x−i(t))f(x∗i|x(t)−i) = 1

do x(t)−i =x∗−i - Từ đó suy ra α(x(t)i , x∗i) = min ( 1, f(x ∗ i)qi(x(t)i |x∗ i) f(x(t)i )qi(x∗ i|x(t)i ) ) = 1.

Chương 2

Mơ hình phản hồi thời gian ứng đáp câu hỏi lognormal

2.1 Giới thiệu

Từ lâu, thời gian phản hồi đã được coi là một nguồn thông tin quan trọng để đánh giá năng lực của một người nhưng ta khơng có cách nào ghi lại được các thông tin này. Ngày nay, các bài kiểm tra đều có thể thực hiện trên máy tính, câu trả lời và thời gian trả lời của thí sinh đều có thể được lưu trữ lại dễ dàng. Những thơng tin trong thời gian phản hồi có thể giúp cải thiện từng phần trong quy trình kiểm tra như hiệu chỉnh câu hỏi, chọn lựa câu hỏi thích ứng, đánh giá năng lực tiềm ẩn, cũng như khám phá và đo lường các yếu tố ảnh hưởng đến quá trình thực hiện bài kiểm tra.

Vấn đề làm thế nào để mơ hình hóa thời gian phản hồi đã được tiếp cận từ ba khía cạnh khác nhau. Cách tiếp cận đầu tiên là mơ hình hóa thời gian phản hồi với các tham số thời gian được thêm vào mơ hình IRT thơng thường (ví dụ Roskam, 1997; Thissen, 1983; and Verhelst, Verstraalen, và Jansen, 1997). Cách thứ hai là mơ hình hóa thời gian phản hồi tách biệt hẳn với các câu phản hồi của thí sinh (ví dụ Maris, 1993; Scheiblechner, 1979; Schnipke và Scrams (1997), van der Linden, Scrams, và Schnipke (1999), và van der Linden và van Krimpen-Stoop (2003). Van der Linden đã thảo luận về việc chọn các mơ hình này cho thời gian phản hồi các câu hỏi kiểm tra. Trong cách tiếp cận thứ ba được giới thiệu bởi Van der Linden (2007), thời gian phản hồì và các câu phản hồi được mơ hình hóa kiểu phân cấp. Ở cấp độ đầu tiên, ta giả sử phân bố của độ chính xác trong câu phản hồi và thời gian phản hồi là hai mơ hình riêng biệt, mỗi cái có một bộ tham số người và câu hỏi khác nhau. Tham số con người được biểu diễn bởi tốc độ và độ chính xác (hoặc năng lực) của thí sinh khi làm mỗi câu hỏi. Như vậy, nhìn chung chọn tốc độ hay sự chính xác là một lựa chọn khá giằng co và phụ thuộc vào mỗi thí sinh. Ở cấp độ mơ hình đầu tiên, ta giả sử thời gian phản hồi (RTs)

và độ chính xác của phản hồi (RA) là độc lập có điều kiện tương ứng với tham số tốc độ và tham số chính xác[4]. Tuy nhiên ở bậc hai, các tham số này được cho phép phụ thuộc vào nhau. Trong khuôn khổ luận văn này sẽ tập trung vào việc nghiên cứu tạo chỉ số đánh giá thời gian phản hồi bằng mơ hình logarit chuẩn hóa để phục vụ cho cách tiếp cận thứ ba.

Lịch sử phát triển Mơ hình IRT điển hình mơ tả phân bố của biến số phản hồi bằng việc sử dụng tham số thí sinh và tham số câu hỏi. Coi Uij là biến số phản hồi cho thí sinh j và câu hỏi i, với Uij = 1 là câu phản hồi đúng, Uij = 0 là phản hồi chưa đúng. Một trong nhưng mơ hình IRT được dùng nhiều nhất là mơ hình logistic ba tham số (3PL):

P r{Uij = 1}=pi(θ, ai, bi, ci)≡ci+ (1−ci)Ψ(θ) (2.1) với

Ψ(θ) = exp[ai(θ−bi)

1 +exp[ai(θ−bi)] (2.2)

là hàm logistic. Trong mơ hình này, tham số θi là tham số năng lực của người thứ i, với −∞ < θ < ∞. θ thường được chuẩn hóa phân phối với giá trị trung bình là 0 và độ lệch chuẩn là 1; tham số ai > 0 chỉ độ phân biệt của câu hỏi thứ i; tham số bi là độ khó của câu hỏi thứ i, −∞ ≤ b ≤ ∞; tham số cj chỉ xác suất đoán đúng câu trả lời cho câu hỏi thứ i, 0 ≤ c ≤ 1; p(−∞) = c. Các mơ hình IRT khác thường có cấu trúc tham số khá phức tạp để làm việc với các năng lực đa dạng nhiều chiều, và biến số trong những điều kiện có thể quản lý được các bài kiểm tra.

Trong cách tiếp cận đầu tiên, người ta mơ hình hóa thời gian phản hồi trong khn khổ mơ hình IRT vì họ giả định rằng, sự tương tác giữa các tham số sẽ chi phối phân bố của biến phản hồi và biến thời gian phản hồi của mỗi thí sinh trong các câu hỏi. Họ tin rằng mơ hình thời gian phản hồi nên dựa trên sự đánh đổi giữa tốc độ và độ chính xác, theo như các cơng trình nghiên cứu tâm lý học trước đây về thời gian phản hồi. Điều này được thực hiện bằng cách áp dụng một tham số năng lực IRT trong mơ hình thời gian phản hồi. Hơn thế nữa, người ta thường giả thiết rằng càng nhiều câu hỏi khó thì càng cần nhiều thời gian hơn để giải quyết chúng. Giả định này dường như nhắc ta về sự cần thiết của tham số độ khó câu hỏi trong mơ hình thời gian phản hồi. Thissen(1983) là một trong những người đầu tiên mơ hình hóa thời gian phản hồi bằng cách sử dụng các giả thiết trên. Mơ hình của Thissen là mơ hình lơ-ga-rít chuẩn có phân bố thời gian trả lời cho mỗi câu hỏi, với cấu trúc tham số chứa điều kiện hồi

quy trong ai(θ−bi) trong mơ hình phản hồi ở phương trình (2.1) và (2.2), bên cạnh các tham số mới về thí sinh và câu hỏi có giải thích yếu tố thời gian. Vì vậy, nó phản ánh hai sự đánh đổi khác nhau, một là giữa các tham số câu hỏi trong mơ hình và một giữa các tham số thí sinh. Về cơ bản, mơ hình của Roskam(1987) cũng là một mơ hình hồi quy, nó chính là mơ hình Rasch với phần thêm vào cấu trúc tham số nhằm hồi quy ra xác suất để có câu trả lời đúng trực tiếp từ thời gian quan sát. Trong phiên bản sau vào năm 1997, Roskam đã kết hợp mơ hình này với phân bố Weibull cho thời gian phản hồi như sau:

pi(θj) = [1 + exp(θj+ lntij −bi)]−1 (2.3) Mơ hình kết hợp tương tự được đưa ra bởi Verhelstm Verstraalen và Jansen (1997). Các mơ hình kể trên đều là mơ hình logistic có một tham số năng lực và một tham số tốc độ cho mỗi thí sinh. Các mơ hình này dựa vào giả thiết phân bố của các giá trị cực đại được kết hợp với phân bố gamma cho thời gian phản hồi.[4]

Trong cách tiếp cận thứ hai, phân bố của thời gian phản hồi được mơ hình hóa mà khơng có bất kỳ mối quan hệ nào với phân bố của biến trả lời câu hỏi. Một trong những mơ hình đầu tiên của cách truyền thống này là mơ hình của Scheiblechner (1979,1985). Mơ hình của Scheiblechner giả định rằng mật độ mũ cho thời gian phản hồi tij của ngườij câu hỏi i, là f(tij) =λexp[−λtij], với tham số trung bình λ >0được tham số hóa như sau

λ=θj+i. (2.4)

Các tham số này là tham số thời gian cho người j và câu hỏi i. Mơ hình này được đề xuất bởi một mình Oosterloo(1975), lấy cảm hứng từ mơ hình Poisson của Rasch (1960) về những phản hồi đếm được trong bài kiểm tra ấn định thời gian. Phân bố mũ cho ta biết thời gian chờ giữa các phản hồi trong quá trình Poisson, và mang ý nghĩa tương tự trong mơ hình của Rasch và Scheiblechner. Scheiblechner đã mở rộng mơ hình bằng cách phân tách các phần tuyến tính của tham số câu hỏi i thành các tham số mang tính quyết định cho thời gian phản hồi của câu hỏi, đồng thời đưa ra cách ước lượng mơ hình và cách kiểm tra độ khít với dữ liệu phản hồi bằng lý thuyết likelihood cực đại có điều kiện.

Maris (1993) có một cách tiếp cận tương tự với phân bố gamma cho thời gian phản hồi. Phân bố gamma là phân bố hai tham số tổng quát của phân bố mũ. Maris đã giới thiệu cấu trúc tuyến tính cho cả tham số câu hỏi và tham số thí sinh, rồi sử dụng chúng cho để mơ hình hóa các loại khác cho q trình tâm lý học cơ bản. Mơ hình lơ-ga-rít chuẩn đưa ra bởi Schnipke and Scrams (1997) có tham số trung bình của biến

cấp độ, thí sinh và câu hỏi. Van der Linden, Scrams and Schnipke (1999) đã sử dụng mơ hình giống như vậy để hiệu chỉnh các bài kiểm tra thích ứng cho các tốc độ khác nhau; Van der Linden và van Krimpen-Stoop (2003) sử dụng nó cho các bài kiểm tra thích ứng về độ sai lệch trong hành vi của thí sinh. Mơ hình này đều có cùng giả thiết phân bố với mơ hình của Thissen(1983) nhưng chỉ có các tham số cho thời gian phản hồi [3].

Trong cách tiếp cận thứ ba, phân bố của câu phản hồi và thời gian phản hồi được xác định bởi hai tham số phân biệt, liên hệ về mặt thống kê với nhau qua bậc hai của mơ hình như trong Hình 2.1. Ví dụ, ở bậc một, xét 1 thí sinh cố định, ta có giả thiết rằng thí sinh đó làm các câu với năng lực và tốc độ khơng đổi; thí sinh phải đánh đổi giữa tốc độ và sự chính xác dựa vào lựa chọn của bản thân. Sau khi đã quyết định lựa chọn thì lúc này, phân bố của thời gian phản hồi chỉ dựa vào tốc độ của thí sinh đó, và thời gian phản hồi trở thành độc lập với điều kiện tốc độ cho trước. Tuy nhiên, với một nhóm mẫu thí sinh, ta coi năng lực và tốc độ là phụ thuộc về mặt thống kê, và ta cần một mơ hình cho nhóm mẫu thí sinh ở bậc phân cấp thứ hai để biểu diễn sự phụ thuộc.

Hình 2.1: Biểu đồ miêu tả mơ hình phân cấp của phản hồi và thời gian phản hồi (RT) trong các câuhỏi của bài kiểm tra ở cáp tiếp cận thứ ba.[6] hỏi của bài kiểm tra ở cáp tiếp cận thứ ba.[6]

với từng thí sinh nhất định. Nếu có mơ hình này thì ta có thể sử dụng nó như bước đầu tiên cho mơ hình phân cấp của phản hồi và thời gian phản hồi. Cịn nếu khơng có mối liên hệ nào giữa IRT và tham số thời gian cho nhóm mẫu ở bậc thứ hai thì mơ hình được tìm ra có thể được sử dụng độc lập để phân tích yếu tố thời gian phản hồi trong bài kiểm tra. Mơ hình đang cần tìm chính là mơ hình lơ-ga-rít chuẩn kết hợp với IRT.

Chọn mơ hình lơ-ga-rít chuẩn bởi độ phù hợp tuyệt vời của nó cho phân bố thực của thời gian phản hồi trong các bài báo cáo nghiên cứu của Thissen (1983), Schnipke và Scrams (1997); Van der Linden, Scrams và Schnipke (1999). Tuy vậy, mơ hình mới này có cấu trúc tham số khác so với những phiên bản cũ ở chỗ: các biến của phân bố sẽ được mơ hình như một tham số câu hỏi phụ thuộc, điều này khá là thú vị bởi mơ hình mới sẽ có cấu trúc tương đối giống mơ hình logistic ở phương trình (2.2)[3]. Sau khi trình bày mơ hình, ta sẽ cùng tìm hiểu tiếp cách ước lượng tham số trong mơ hình bằng cách sử dụng chuỗi xích Markove Monte Carlo (MCMC) với giải thuật Gibbs. Rồi sử dụng kết quả từ giải thuật Gibbs để đánh giá độ phù hợp của mơ hình lơ-ga-rít chuẩn.

2.2 Mơ hình thời gian phản hồi lognormal IRT - LNIRT

2.2.1 Giả thiết của mơ hình

Một trong những vấn đề thiếu sự quan tâm cần thiết trong phương pháp nghiên cứu giáo dục và tâm lý là việc quy đổi giữa thời gian cho một câu hỏi/công việc với tốc độ của người tham gia. Ví dụ, gần như tất cả phương pháp trong bài thi SAT đều coi tốc độ là thời gian trung bình cho mỗi câu hỏi/cơng việc (cũng như độ chính xác đơn giản chỉ là phần trăm trả lời đúng). Tuy nhiên, thời gian và tốc độ rõ ràng là hai biến hồn tồn khác biệt. Nếu nó giống nhau thì xe của chúng ta đã khơng cần đồng hồ đo tốc độ.

Giả thiết đầu tiên của mơ hình thời gian phản hồi (response time-RT) chỉ đơn giản là định nghĩa tốc độ: Tốc độ là độ thay đổi của đơn vị đo lường nào đó theo thời gian. Hai ví dụ khác về tốc độ là tốc độ của lạm phát bằng tổng lạm phát theo thời gian trong kinh tế và tốc độ truyền nhiễm của vi khuẩn được đo bằng số lượng tăng của

Một phần của tài liệu (LUẬN văn THẠC sĩ) tìm hiểu các phương pháp tạo chỉ số thống kê và ứng dụng (Trang 30)

Tải bản đầy đủ (PDF)

(62 trang)