Trước tiên, chúng ta tìm hiểu kỹ hơn về MLE trên mô hình thống kê để nhận diện quy luật phân phối xác suất của một biến ngẫu nhiên (trong luận văn này chính là thời gian hoàn thành các công việc). Dẫn ra một vài ví dụ về ước lượng hợp lý cực đại trên một số mẫu dữ liệu quan sát và giải bài toán. Sau đó, chúng ta ứng dụng trên các mẫu quan sát thời gian hoàn thành các công việc.
3.2.3.1. Phương pháp ước lượng hợp lý cực đại trên mẫu quan sát
Chúng ta có một mô hình xác suất M của hiện tượng nào đó. Chúng ta biết chính xác cấu trúc của M, nhưng không biết là những giá trị của những tham số xác suất θ của nó. Mỗi sự hiện diện của M cho một sự quan sát x[i], tương ứng với phân phối của M.
Mục tiêu của chúng ta là với các mẫu x[1],…, x[N], ước lượng những tham số xác suất θ từ quá trình phát sinh quan sát dữ liệu trên.
a. Khái quát về ước lượng hợp lý cực đại
Hàm khả năng (Likelihood Function) tương ứng với các mẫu x[1],…, x[N] được cho bởi mô hình những tham số θ với mô hình xác xuất có điều kiện M, được định nghĩa như sau:
L(θ) = P(x[1],..., x[N ] | θ, M )
Điều kiện đặt ra cho những mô hình chúng ta sẽ xem xét cho những mẫu x[1], x[2], …, x[N] là:
- Tập giá trị x[i] (i =1, …, N) được xác định.
- Sự phân bố của mỗi mẫu có khả năng xảy ra là nhưnhau.
- Mỗi mẫu được lấy độc lập với những mẫu trướcđó.
Trong MLE chúng ta tìm kiếm tham số mẫu θ làm cho hàm trên đạt giá trị cực đại. Hay là phải tìm một vectơ của những tham số θ mà được phát sinh từ bộ dữ liệu đã cho.
b. Ví dụ về ước lượng hợp lý cực đại
Chúng ta sẽ bắt đầu với từ một ví dụ đơn giản nhất là đánh giá sự thiên lệch khi tung một cây đinh bấm, sau đó đến những mô hình phức tạp hơn từ đó áp dụng MLE tới phỏng đoán cây sinh loài.
Hình 3.2. Hai trường hợp xảy ra khi tung đinh bấm
Đối với cây đinh, khi được tung lên khi rơi xuống nó có thể ở một trong hai trường hợp sau (hình vẽ trên): Đầu (H) hoặc Đuôi (T), Chúng ta biểu thị bởi θ (chưa biết) là xác suất P(H).
Cho một sự nối tiếp những mẫu quan sát D: x[1], x[2], …, x[N] mà chúng ta muốn ước lượng P(H) =θ và P(T ) =1- θ
Từ bộ mẫu dữ liệu quan sát trên ta có hàm khả năng là:
1
( ) ( ) ( [ ])
n D
i
L P D P x i
Với ví dụ trên, giả sử dãy mẫu quan sát là H, T, T, H, H ta có hàm hợp lý:
LD(θ) = θ.(1- θ).(1- θ).θ. θ c. Giải bài toán ước lượng hợp lý cực đại
Nguyên lý ước lượng hợp lý cực đại: Chọn những tham số mà làm cực đại hàm khả năng.
Nguyên lý này được sử dụng rộng rãi trong việc ước lượng trong thống kê, cả trong việc nhìn nhận của trực giác.
Logarit hàm hợp lý:
Kỹ thuật khác để làm cho việc tính toán dễ hơn khi làm việc trên logarit hàm likelihood hơn chính hàm likelihood. Lý do chính cho điều này bởi tính toán hơn là lý thuyết. Nếu chúng ta nhân lên nhiều số rất nhỏ cùng nhau (ví dụ nhỏ hơn 0.0001) thì chúng ta sẽ khó có thể biểu hiện số trên với một máy tính thông thường nào đó hiện nay vì nó quá gần với 0. Tình trạng này thường xuất hiện trong việc tính toán xác suất, khi chúng ta đang nhân những xác suất nhiều sự kiện hiếm có nhưng độc lập để tính toán xác suất chung. Log của hàm likelihood thường đơn giản nhiều cho tính toán, và chúng ta thấy nghiệm thỏa giá trị lớn nhất của hàm log likelihood cũng là nghiệm giá trị lớn nhất của chính hàm likelihood. Với ví dụ ở trên, log likelihood là:
lD(θ)=ln LD (θ) hay lD(θ) = NH ln θ + NT ln(1- θ)
Công thức này thoạt nhìn không có vẻ đơn giản, nhưng thật ra nó rất dễ dàng khi tính đạo hàm cho log likelihood trong trường hợp này cũng như nhiều trường hợp khác.
Lấy đạo hàm và cho chúng bằng 0, chúng ta được:
' (1 ) ( )
( ) 0
1 .(1 ) .(1 )
H T H T H H T
D
N N N N N N N
l
H
H T
N
N N
Bảng 3.3. Bảng biến thiên của hàm hợp lý
với là nghiệm chúng ta cần tìm, phù hợp với những gì chúng ta mong muốn.
d. Tổng quát hóa bài toán ước lượng hợp lý cực đại Ước lượng hợp lý cực đại trên mẫu quan sát
Nếu x là biến ngẫu nhiên với hàm phân bố:
fx[i]( θ1, θ2, …, θK)
với θ1, θ2, …, θKlà K tham số cần phải ước lượng, với dãy N mẫu độc lập là x[1],x[2], ..., x[N]. Thì hàm likelihood được cho bởi tích sau:
1 2 [ ] 1 2
1
( , ,..., ) ( , ,..., )
n
D K x i K
i
L f
và hàm ln likelihood như sau:
[ ] 1 2
1
( ) ln ( ) ln ( , ,..., )
n
D D x i K
i
l L f
MLE của θ1, θ2, …, θK đạt được khi LD(θ) hay lD(θ) là lớn nhất, chúng ta đã biết xác định giá trị lớn nhất với lD(θ) dễ hơn với LD(θ), vậy MLE của θ1, θ2, …, θK là giải hệ K phương trình sau:
( ) 0, 1, 2,...,
j
l j K
Ví dụ: Tung một con xúc sắc có K = 6 mặt, chúng ta muốn xác định những tham số θ1, θ2, …, θK là xác suất của mặt có nút tương ứng 1, 2,…, K nhận được khi tung xúc sắc. Từ quan sát ta có N1, N2,..., NK là số lượng tương ứng của từng mặt khi quan sát.
Theo công thức hàm khả năng sẽ:
1
( ) j
K N
D j
i
L
và hàm ln likelihood tương ứng sẽ là:
1
( ) ln ( ) ln( )
K
D D i i
i
l L N
Sau khi giải hệ phương trình chúng ta được:
1
1,...,
K K
l l
N víi k K
N
3.2.3.2. Ứng dụng MLE vào nhận diện quy luật xác suất của biến thời gian (ngẫu nhiên) hoàn thành các công việc
Theo trên, giải phương trình hợp lý làm cực đại phương trình:
L(θ) = f1(θ)u1f2(θ)u2… fn(θ)un với ui ∈ N.
Hiện nay có hai hướng tiếp cận khác nhau để giải quyết bài toán này, trong mỗi phương pháp có những ưu và khuyết điểm riêng của nó:
Phương pháp gần đúng: Giải phương trình hợp lý bằng phương pháp tìm kiếm cục bộ, heuristics, …Ưu điểm của phương pháp này là nhanh chóng, có thể giải quyết trên những bài toán lớn. Nhược điểm lớn nhất của phương pháp này là tính tin cậy không cao.
Phương pháp tính toán đại số: Ngược lại với phương pháp gần đúng trên, phương pháp tính toán đại số hiện nay chỉ giải quyết được với những bài toán nhỏ, nhưng cho kết quả chính xác. Với sự tiến bộ của khoa học kỹ thuật nói chung và ngành máy tính cũng như lãnh vực đại số máy tính nói riêng, đã mở ra con đường cho hướng tiếp cận này.
Trong phạm vi luận văn này, chúng tôi chọn phương pháp tính toán đại số với sự trợ giúp của phần mềm Matlab để nhận diện quy luật phân phối xác suất biến thời biến thời gian (ngẫu nhiên) hoàn thành các công việc. Hình vẽ dưới đây trình bày một ví dụ minh họa cho công việc A của hạng mục nhà lớp học Trường THPT Lê Trung Đình. Trong đó, chúng tôi giả thuyết công việc A có thể tuân theo các quy luật cho trước như: Phân phối chuẩn, Log-normal, Weilbull, Beta, Reyleigh…
Hình 3.3.Nhận diện quy luật phân phối xác suất hoàn thành công việc A
Để xác định quy luật hợp lý nhất trong số các quy luật giả thuyết, chúng tôi sử dụng phương pháp bình phương bé nhất để so sánh kết quả của các quy luật phân phối đã giả sử với đồ thị đường thực nghiệm (đường tần suất ở hình vẽ trên). Với ví dụ trên với công việc A, chúng tôi nhận thấy quy luật phân phối phù hợp nhất là log- normal. Và quy luật Beta không phù hợp như giả định của phương pháp xác suất truyền thống của sơ đồ mạng PERT đã thừa nhận.
Với cách làm như trên, chúng tôi có kêt quả nhận diện quy luật phân phối xác suất của thời gian hoàn thành các công việc ở hai loại công trình trên như sau:
Bảng 3.4. Công trình nhà lớp học
TT Tên công việc Quy luật
phân phối
Tham số
Trung bình Độ lệch chuẩn 1 Chuẩn bị mặt bằng xây dựng Log-normal 4,7 1,4 2 Đào móng công trình bằng máy và thủ
công Log-normal 10,9 4,9
3 Công tác bê tông cốt thép móng nhà Normal 30,5 4,1 4 Xây đá hộc, gạch thẻ móng và đắp
nền công trình Log-normal 13,8 7,3
5 Công tác bê tông giằng móng nhà 14,2 12,6
6 Công tác bê tông cột từng tầng (F1,
F2,…) Normal 58,6 6,0
7 Công tác bê tông cốt thép giằng, xà,
dầm sàn từng tầng Log-normal 104,1 35,18
8 Xây tường gạch bao che từng tầng Log-normal 45,6 27,9 9 Sản xuất và lắp dựng các cấu kiện bê
tông đúc sẵn Normal 47,5 33,2
10 Công tác bê tông cốt thép cầu thang
từng tầng Log-normal 18,1 8,7
11 Sản xuất, lắp dựng cấu kiện gỗ, xà gồ,
lợp mái ngói Log-normal 40,6 7,8
12 Trát tường trong ngoài, láng cấu kiện Log-normal 124,6 21,9
13 Công tác ốp lát Log-normal 78,2 13,8
14 Quét vôi, quét sơn Normal 78,7 7,9
15 Gia công và lắp dựng khung, cửa
chính, cửa sổ Log-normal 37,8 11,0
16 Công tác lắp đặt hệ thống điện nước Log-normal 80,8 13,9 17 Hoàn thiện và dọn dẹp vệ sinh Normal 13,9 4,4
Bảng 3.5. Công trình nhà thi đấu đa chức năng
TT Tên công việc Quy luật
phân phối
Tham số
Trung bình Độ lệch chuẩn 1 Chuẩn bị mặt bằng xây dựng, lán
trại, vật tư, máy móc Log-normal 5,4 1,4
2 Đào móng công trình bằng máy
và thủ công Log-normal 14,17 7,23
3 Công tác bê tông cốt thép móng
công trình Log-normal 33,7 3,4
4 Làm bể tự hoại, lấp đất – xây
móng đá chẻ Normal 20,6 2,1
5 Công tác bê tông cốt thép giằng,
dầm móng Log-normal 37,3 3,9
6 Công tác bê tông cốt thép cột Normal 55,5 5,7 7 Công tác bê tông cốt thép dầm,
bậc khan đài Log-normal 69,2 19,4
8 Công tác bê tông cốt thép dầm,
sàn mái Log-normal 70,3 17,4
9 Xây tường nhà, lanh tô, lam các
loại Log-normal 80,1 20,1
10 Gia công lắp dựng vì kèo, mái,
lợp tole Log-normal 23,5 14,8
11 Tô trát toàn nhà
Normal 94,7 8,5
12 Công tác ốp gạch, đá granit tường
nhà, quét vôi, sơn nước Normal 117,9 29,7
13 Gia công lắp dựng hệ thống cửa,
vách kính Normal 60,1 25,7
14 Láng granito, lát gạch sàn nhà, lan
can, biểu tượng thể thao Normal 73,4 9,7
15 Thi công hệ thống điện nước công
trình Log-normal 48,4 12,3
16 Hệ thống chống sét và phòng
chống cháy Log-normal 69,9 18,2
17 Hoàn thiện, dọn dẹp và bàn giao
công trình Log-normal 15,9 4,3