Khởi tạo các tham số

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật lai ghép trong giải thuật di truyền (Trang 59 - 60)

Chƣơng 3 SỬ DỤNG GIẢI THUẬT DI TRUYỀN TÁCH TỪ TIẾNG VIỆT

3.3. Sử dụng giải thuật di truyền để tách từ tiếng Việt

3.3.4. Khởi tạo các tham số

Ở bƣớc này, ta gán giá trị các tham số nhƣ số lƣợng thế hệ tiến hóa, kích thƣớc quần thể, xác suất lai ghép (pc), đột biến (pm) và tỉ lệ tái sinh… Các tham số của giải thuật di truyền nhƣ sau:

- Số lƣợng thế hệ tối đa = 100.

- Số lƣợng cá thể trong quần thể = 100 - Xác suất lai ghép = 0.8

- Xác suất đột biến = 0.1

- Phép chọn N = 100 cá thể tốt nhất

Các cá thể ban đầu của quần thể đƣợc sản sinh ngẫu nhiên. Tuy nhiên, nhằm tối ƣu hóa các chuỗi ngẫu nhiên đƣợc sinh ra có thể áp dụng một số ràng buộc, cụ thể:

- Mỗi đoạn gồm tối đa 4 tiếng.

- Xác suất tạo ra đoạn gồm 2 tiếng cao hơn xác suất tạo ra đoạn có độ dài khác 2 tiếng.

o Xác suất từ 1 tiếng = 0.1

o Xác suất từ 2 tiếng = 0.7

o Xác suất từ 3 tiếng = 0.1

o Xác suất từ 4 tiếng = 0.1

Với cách khởi tạo nhẫu nhiên, sinh ngẫu nhiên xác suất f (0 ≤ f ≤ 1) để chọn loại từ:

- Nếu 0 ≤ f < 0.1: sinh loại từ 1 tiếng. - Nếu 0.1 ≤ f < 0.8: sinh loại từ 2 tiếng. - Nếu 0.8 ≤ f < 0.9: sinh loại từ 3 tiếng. - Nếu 0.9 ≤ f ≤ 1: sinh loại từ 4 tiếng.

Ngoài ra, áp dụng dạng đơn giản của giải thuật đối sánh Left Right Maximum Matching (Theo ChihHao Tsai [8]) để tạo ra hai cá thể đặc biệt: cá thể “tiến” và cá thể “lùi”. Thực hiện tách từ theo hai hƣớng từ trái sang phải và từ phải sang trái, nếu hai cách tách từ trùng nhau sẽ chọn một và gộp vào số cá thể đƣợc khởi tạo ngẫu nhiên. Phƣơng pháp LRMM chỉ cần duyệt tuyến tính, sẽ giảm thiểu đƣợc chi phí và thời gian tính toán so với phƣơng pháp khác. Đây là bƣớc khởi tạo rất quan trọng và là điểm cải tiến so với IGATEC với hi vọng quần thể ban đầu sẽ có một số cá thể tối ƣu hóa cục bộ, giúp tăng tốc độ quá trình tiến hóa.

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật lai ghép trong giải thuật di truyền (Trang 59 - 60)

Tải bản đầy đủ (PDF)

(71 trang)