Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
580,22 KB
Nội dung
HỌC
VIỆN
CÔNG
NGHỆ
BƯU
CHÍNH
VIỄN
THÔNG
NGUYỄN
THỊ
PHƯƠNG
PHÂN
CỤM
MỜ
SỬ
DỤNG
LÝ
THUYẾT
ĐẠI
SỐ
GIA
TỬ
Chuyên
ngành:
KHOA
HỌC
MÁY
TÍNH
Mã
số:
60.48.01
TÓM
TẮT
LUẬN
VĂN
THẠC
SỸ
KĨ
THUẬT
HÀ NỘI – NĂM 2012
Luận văn được hoàn thành tại:
HỌC
VIỆN
CÔNG
NGHỆ
BƯU
CHÍNH
VIỄN
THÔNG
Người
hướng
dẫn
khoa
học
:
TS.
NGUYỄN
MẠNH
HÙNG
Phản biện 1:…………………………… …………………….
Phản biện 2:
…………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
1
I.
MỞ
ĐẦU
Công nghệ Logic mờ được giáo sư Lotfi Zadeh công bố lần đầu tiên tại Mỹ
vào năm 1965. Sự bùng nổ của thời đại thông tin như hiện nay, lượng thông tin được
tạo
ra
hàng
ngày
là
rất
lớn.
Nhu
cầu
cần
thiết
đến
các
quá
trình
tự
động
tìm kiếm
thông tin hữu ích, các quan hệ phát hiện các tri thức. Để làm được điều đó các nhà
nghiên cứu đã đề xuất và nghiên cứu lĩnh vực này như phân lớp và nhận dạng mẫu,
hồi quy và dự báo, phân cụm… dựa trên tâp mờ.
Lý thuyết tập mờ được coi là nền tảng của lập luận xấp xỉ, nhưng lýthuyết tập
mờ vẫn chưa mô phỏng đầy đủ, hoàn chỉnh cấu trúc ngôn ngữ mà con người vẫn sử
dụng. Vì thế năm 1990 N.C.Ho & W.Wechler đã khởi xướng phương pháp tiếp cận
đại số dựa trên miền giá trị của biến ngôn ngữ.
Với ý nghĩa như vậy mục tiêu của luận văn đặt ra cụ thể như sau:
- Trình bày về tập mờ, logic mờ
- Trình bày thuật toán FCM
- Trình bày về Đạisốgiatử
- Ứng dụngđạisốgiatử
- Giải thuật di truyền để tối ưu bộ sốgiatử
Về bố cục luận văn được chia làm 4 chương:
Chương
1
: Trình bày các vấn đề về logic mờ và bài toán phân cụm. Trong đó
sẽ đi tìm hiểu giải thuật Fuzzy C-Means, so sánh với K-Means để thấy được
ưu/nhược điểm của thuật toán.
Chương
2
: Trong chương này sẽ trình bày về đạisốgia tử, tìm hiểu cấu trúc,
định lý, tính mờ của một ngôn ngữ. Sửdụngđạisốgiatử sẽ sửa đổi khoảng cách từ
mẫu tới tâm cụm, đo độ mờ của giá trị ngôn ngữ
Chương
3
: Là chương phân tích thiết kế và cài đặt thử nghiệm. Bộ hoa Iris là
tập dữ liệu đầu vào, qua chương trình sẽ đánh giá tính hiệu năng của thuật toán, thấy
được tỉ lệ nhận dạng đúng khi phân loại bộ hoa Iris.
Chương
4
: Đánh giá kết quả và cài đặt tối ưu. Để có được tỉ lệ nhận dạng cao,
sử dụng giải thuật di truyền để tối ưu bộ sốgia tử.
2
II.
NỘI
DUNG
Chương
1:
LOGIC
MỜ
VÀ
BÀI
TOÁN
PHÂN
CỤM
Thực tế cho thấy khái niệm mờ luôn luôn luôn tồn tại, ứng dụng trong các bài
toán và ngay cả trong cách thức suy luận của con người. Bằng các phương pháp tiếp
cận khác nhau các nhà nghiên cứu đã đưa ra kết quả về lýthuyết cũng như ứng dụng
trong
các
bài
toán
điều
khiển
mờ,
hệ
hỗ
trợ
quyết
định…
Vậy
để
làm được
những
điều
đó
luận
văn
sẽ
đi
trình
bày
những
ngữ
nghĩa
của
thông
tin
mờ,
tìm cách
biểu
diễn chúng bằng khái niệm toán học là tập mờ và xét bài toán phân cụm.
1.1.
Logic
mờ
1.1.1.
Lý
thuyết
tập
mờ
Lý thuyết tập mờ lần đầu tiên được Lotfi.A.Zadeh, một giáo sư thuộc trường
Đại học Caliornia, Berkley giới thiệu trong một công trình nghiên cứu vào năm 1965.
Lý thuyết tập mờ bao gồm logic mờ, số học mờ, quy hoạch toán học mờ, hình học
tôpô mờ, lýthuyết đồ
thị mờ, và phân tích dữ liệu mờ, mặc dù thuật ngữ logic mờ
thường được dùng chung cho tất cả.
Không
giống
như
tập
rõ
mà
ta
đã
biết
trước
đây,
mỗi
phần
tử
luôn
xác
định
hoặc thuộc hoặc không thuộc nó, thì với tập mờ chỉ có thể xác định một phầntử liệu
thuộc vào nó là nhiều hay ít, tức mỗi một đối tượng chỉ là phầntử của tập mờ với một
khả năng nhất định mà thôi.
Trọng tâm của lýthuyết tập mờ là việc đề xuất khái niệm tập mờ (fuzzy sets).
Về
mặt
toán
học,
một
tập
mờ
A
là
một
hàm
số
(gọi
là
hàm
thuộc
(
membership
function)) xác định trên khoảng giá trị số mà đối số x có thể chấp nhận (gọi là tập vũ
trụ (universe of discourse)) X, cho bởi:
A
(
x
)
:
X
[0.0;1.0]
Trong đó, A là nhãn mờ của biến x, thường mang một ý nghĩa ngôn ngữ nào đó, mô
tả định tính thuộc tính của đối tượng, chẳng hạn như cao, thấp, nóng, lạnh, sáng, tối
…
Một khái niệm cơ bản khác được đưa ra - biến ngôn ngữ (linguistic variables).
Biến
ngôn ngữ
là
biến
nhận
các giá
trị ngôn ngữ (linguistic
terms)
chẳng
hạn như
3
"già ", " trẻ " và "trung niên ", trong đó, mỗi giá trị ngôn ngữ
thực chất là một tập mờ
xác định bởi một hàm thuộc và khoảng giá trị số tương ứng, chẳng hạn giá trị ngôn
ngữ "trung niên" là một tập mờ có hàm thuộc dạng hình tam giác cân xác định trong
khoảng
độ
tuổi
[25
, 55].
Logic mờ
cho
phép
các
tập
này có
thể
xếp
phủ
lên
nhau
(chẳng hạn, một người ở tuổi 50 có thể trực thuộc cả
tập mờ " trung niên ” lẫn tập
mờ " già ", với mức độ trực thuộc với mỗi tập là khác nhau).
1.1.2.
Logic
mờ
Trong logic rõ thì mệnh đề là một câu phát biểu đúng, sai. Trong logic mờ thì
mỗi mệnh đề mờ là một câu phát biểu không nhất thiết là đúng hoặc sai. Mệnh đề mờ
được gán cho một giá trị trong khoảng từ 0 đến 1 để chỉ mức độ đúng (độ thuộc) của
nó.
Các phép toán mệnh đề trong logic mờ được định nghĩa nhưsau:
-
Phép phủ định : v(Pphủ định) = 1 - v(P).
-
Phép tuyển :v(P1∨P2) = max(v(P1), v(P2)).
-
Phép hội :v(P1∧P2) = min(v(P1), v(P2))
-
Phép kéo theo: v(P→Q) = v(Pphủ định∨Q) = max(v( Pphủ định), v(Q))
Xét cho cùng, tập mờ
là một công cụ toán học cho phép chuyển đổi từgiá trị
định lượng sang giá trị định tính
Như vậy có thể nói, sự ra đời của lýthuyết tập mờ đã mở ra một nhánh quan
trọng trong việc biểu diễn tri thức và ý nghĩ của con người. Đây chính là công cụ toán
học và logic để tiến hành xây dựng ứng dụngphâncụmmờ sẽ được cụ thể hóa trong
các chương tiếp theo.
1.2.
Bài
toán
phân
cụm
mờ
Bài toán phâncụmmờ được ứng dụng rất nhiều như trong việc nhận dạng mẫu
(vân tay, ảnh), xử lí ảnh, y học (phân loại bệnh lí, triệu chứng)…
Tuy nhiên với giải thuật thứ 2, tức là sửdụng logic mờ để phâncụm dữ liệu
mềm dẻo hơn rất nhiều (so với giải thuật K-means). Nó cho phép một đối tượng có
thể
thuộc
vào
một
hay
nhiều
phân
vùng
khác
nhau
được
biểu
diễn
thông
qua
khái
niệm hàm thuộc hay mức độ thuộc.
j=1
(x
D(x,y)
=
d
2
2
(x,y)
=
x
−
y
2
=1
(
v
i
=
1
x
k
∈G
i
x
k
4
1.2.1.
Phân
cụm
rõ
Phương pháp đơn giản và dễ hiểu này vẫn được dùng khá phổ biến trong nhiều
ứng dụng. Với giải thuật này, việc phâncụm sẽ được thực hiện qua 2 bước:
-
Tính toán tâm cụm
-
Sắp xếp lại các đối tượng sao cho gần với tâm vùng nhất.
1.2.2.
Phân
cụm
mờ
Tập các đối tượng sẽ được phân vùng
X={x1,…,xN} ; (k=1,2,…,N)
Việc đánh giá quan hệ không đồng dạng trong 1 không gian cho trước thường sử
dụng
nhiều
đến
khái
niệm
metric,
metric
giữa
2
đối
tượng
x,y
là
m(x,y)
cần
thỏa
mãn:
Khái niệm gần gũi chúng ta nhất là khoảng cách Euclid:
D2(x,y) =
p
j
− y
j
)
2
=
x − y
2
Với những ứng dụng xây dựng trong không gian Euclid, hàm quan hệ đánh giá
mức
độ
không
đồng
dạng
D(X,Y)
chúng
ta
dùng
(được
mô
tả
dưới
đây)
được
xác
định bằng bình phương khoảng cách Euclid :
2
=
−
)
2
Tiến hành phân chia X={x1,…, xN} vào c phân vùng Gi (i=1,2,…,c). Trong
mỗi vùng, giá trị tâm vùng là xác định
Thuật toán có thể được mô tả như sau :
-
Bước 1: tạo ngẫu nhiên c phân vùng với c tâm vùng Vi tương ứng
-
Bước 2: sắp xếp các đối tượng sao cho gần tâm vùng nhất,
điều này có
nghĩa là:
x
k
∈
G
i
D
(
x
k
,
v
i
)
=
min
1≤j≤c
D(x
k
,
v
j
)
-
Bước 3:
Tính toán lại tâm vùng:
G
i
-
Bước 4: Dừng nếu vùng hội tụ, quay lại bước 2 trong trường hợp khác
Như vậy với việc đưa vào G,V và hàm mục tiêu J, ta có thể mô tả lại việc xác định
tâm vùng và gom cụm như sau:
U
ki
=
1
x
k
∈
G
i
,
5
- Bước 2 : Tối thiểu hàm J với G trong khi V được cố định
- Bước 3 : Tối thiểu J với V trong khi G được cố định
Bằng việc xây dựng ma trận U (NxC)
U
=
(
U
ki
)
0
(x
k
∉
G
i
)
Trong đó N là số đối tượng, C là sốphân vùng, chúng ta viết lại hàm mục tiêu J như
sau:
0
,
=
(
,
)
=1
=1
Nhược điểm lớn nhất của Fuzzy C- Means là việc xử lí gặp khó khăn khi tập
dữ
liệu
lớn,
tập
dữ
liệu
nhiều
chiều,
nhạy
cảm
đối
với
nhiễu
và
phần
tử
ngoại
lai
trong dữ liệu, tức là các trung tâm cụm có thể sẽ nằm xa so với trung tâm thực của
cụm. Để giải quyết vấn đề này, đã có nhiều phương pháp được đề xuất như phâncụm
dựa
trên
xác
suất
(Keller,
1993),
phân
cụm
nhiễu
mờ
(Dave, 1991),
thuật
toán
Є
–
Intensitive Fuzzy C- Means và FCM cải tiến.
1.3.
Kết
luận
chương
1
Như vậy qua chương 1 luận văn đã trình bày cơ sởlýthuyết về logic mờ cũng
như khái niệm ban đầu về giải thuật phân cụm.Trong chương tiếp theo luận văn sẽ đề
cập tới lýthuyếtđạisốgiatử và áp dụnglýthuyết này vào bài toán phâncụm dữ liệu.
6
Chương
2:
PHÂN
CỤM
MỜ
SỬ
DỤNG
ĐẠI
SỐ
GIA
TỬ
Trong chương này luận văn sẽ trình bày:
-
Lý thuyết về đạisốgiatử
-
Phân cụmmờsửdụnglýthuyếtđạisốgiatử
2.1.
Lý
thuyết
đại
số
gia
tử
Một đặc điểm quan trọng nữa cần chú ý khi cải thiện giải thuật FCM là hình
dạng của cụm. Trong trường hợp tâm cụm là một điểm, hình dạng của cụm phụ thuộc
hoàn toàn vào việc tính toán khoảng cách. Vì vậy thay đổi cách tính toán khoảng cách
cho
phép
ta
xử
lí
với
nhiều
hình
dạng
phân
cụm.
Ví
dụ
như
giải
thuật
Gustafson-
Kessel (GK) xử lí tốt với những phâncụm dạng elip. Trong một số nghiên cứu, các
tác giả trong [12] đã chỉ ra khả năng của đạisốgiatử với việc biểu diễn giá trị của
các biến ngôn ngữ dựa trên cấu trúc ngữ nghĩa của chúng. Việc ứng dụngđạisốgia
tử trong thực hiện thông qua các bước:
-
Sử dụng cấu trúc đạisốgiatử thay đổi ước lượng khoảng cách từ mẫu
dữ liệu tới tâm cụm.
-
Mẫu dữ liệu chắc chắn thuộc vào một phâncụm nếu như mức độ thuộc
của nó không nhỏ hơn giá trị phầntử trung lập của đạisốgiatử (w). Chỉ những mẫu
dữ liệu rơi trên ngưỡng w mới có thể tham gia tiếp vào quá trình tính toán tâm cụm
trong quá trình cập nhật lại tâm cụm, do vậy sẽ chịu ít ảnh hưởng của nhiễu.
2.1.1.
Định
nghĩa
đại
số
gia
tử
Một cấu trúc đạisố AT = (T, G, H, ≤) với H được phân hoặch thành H+ và H-
các giatử ngược nhau được gọi là một đạisốgiatử nếu nó thỏa mãn các tiên đề sau:
(1) Mỗi giatử hoặc là dương hoặc là âm đối với bất kỳ một giatử nào khác, kể cả với
chính nó.
(2)
Nếu
hai
khái niệm u
và
v
là
độc
lập
nhau, nghĩa
là u∉H(v)
và
v∉H(u), thì
(∀x
∈H(u)) {x∉H(v)}. Ngoài ra nếu u và v là không sánh được thì bất kỳ x∈H(u) cũng
không sánh được với bất kỳ y∈H(v). (H(u) là tập các giá trị được sinh ra do tác động
của các giatử của H vào u).
(3) Nếu x ≠ hx thì x∉H(hx) và nếu h ≠ k và hx ≤ kx thì h’hx ≤ k’kx, với mọi giatử h,
k, h’ và k’. Hơn nữa nếu hx ≠ kx thì hx và kx là độc lập.
7
(4) Nếu u∉H(v) và u ≤ v (hoặc u ≥ v) thì u ≤ hv (hoặc u ≥ hv) đối với mọi giatử h.
Xét đạisốgiatử AT có đúng 3 phầntử sinh: dương, âm và một phầntử trung
hòa w nằm giữa hai phầntử sinh kia và có tính chất hw = w, với mọi h∈H. Một phần
tử y được gọi là phầntử đối nghịch của phầntử x nếu có tồn tại một biểu diễn của x
có dạng x = hn…h1g, w ≠ g ∉ G, sao cho y = hn…h1g’, với w ≠ g’∈G và g’ ≠ g (nói
cách khác: hai phầntử của đạisốgiatử được gọi là đối nghịch nhau nếu chúng có
dạng biểu diễn với cùng một dãy các giatử nhưng phầntử sinh của chúng khác nhau,
một cái là dương và một cái là âm).
Đặc
biệt
phần
đối
nghịch
của
w
được
định
nghĩa
chính
là
w.
Phần
tử
đối
nghịch của x được ký hiệu là –x với chỉ số nếu cần thiết. Nhìn chung một phầntử có
thể có nhiều phầntử đối nghịch.
2.1.2
Các
định
lý
Định lý 1 :
Một đạisốgiatử AT là đối xứng nếu với mọi x, x là điểm dừng khi và chỉ khi
–x cũng là điểm dừng
Định lý 2 :
Nếu tập các toán tử (gia tử) H+ và H- có quan hệ thứ tự sắp xếp tuyến tính thì
có tồn tại một đẳng cấu từđạisốgiatử đối xứng AT = (T, G, H, -, ∪,
∩, ⇒,
≤) vào
cấu trúc logic đa trị tựa trên đoạn [0, 1]
Định lý 3 :
Có tồn tại một hệ tiên đề hoá sao cho mỗi miền ngôn ngữ AT của biến ngôn
ngữ trở thành dàn đầy đủ (complete lattice) có một phầntử 0, một phầntử đơn vị 1 và
một phầntử trung hoà.
2.1.3
Tính
mờ
của
một
giá
trị
ngôn
ngữ
Cho
trước
một hàm định
lượng ngữ
nghĩa
f
của
X. Xét bất kỳ x∈X, tính mờ
của x khi đó được đo bằng đường kính tập f(H(x)) ⊆ [0, 1].
8
2.2
Phân
cụm
mờ
sử
dụng
lý
thuyết
đại
số
gia
tử
Việc cải tiến giải thuật gồm những nội dung chính sau:
Sử dụng lí thuyếtđạisốgiatử cho việc sửa đổi khoảng cách từ mẫu tới
tâm cụm. Độ đo mờ của giá trị ngôn ngữ được dùng như trọng số tương ứng với mỗi
mẫu.
Một mẫu thuộc về một phân vùng được xác định khi mức độ thuộc của
nó đối với cụm đó có giá trị lớn hơn phầntử trung gian w của đạisốgia tử. Theo đó
chỉ có những mẫu có giá trị độ thuộc vượt trên w mới được tham gia vào quá trình
tính toán lại tâm cụm sau này. Việc này sẽ làm hạn chế tầm ảnh hưởng của các phần
tử nhiễu.
Do vậy việc sửdụngđạisốgiatử cho phép ta tạo lập các trọng số phù hợp với
mỗi mẫu dữ liệu dựa trên khoảng cách từ nó đến tâm vùng. Tâm cụm mới thu được
qua
phép
biểu
diễn
có
sử
dụng
đại
số
gia
tử
này
ta
tạm
gọi
là
tâm
cụm
ngôn
ngữ
(LCC-linguistic cluster center). Việc xác định LCC được thực hiện qua 3 bước:
1.
Xác định giá trị k-level ngôn ngữ và độ đo mờ của chúng (Ở đây, một k-
level ngôn ngữ được xác định thông qua số lượng giatử đi kèm theo phầntử sinh, lấy
ví dụ Very very True là một 3-level, tuy nhiên trong suốt đồ án này sẽ chỉ làm việc
liên quan tới 2-level linguistic tức là các giá trị ngôn ngữ có dạng Very True. Độ đo
mờ
của
chúng
được
tính
toán
dựa
trên
giá
trị
biến
gia
tử(Very)
và
giá
trị
phần
tử
sinh(True)).
2.
Xác định khoảng cách lớn nhất có thể từ mẫu dữ liệu bất kì tới tâm cụm
cj
kí
hiệu
là
d
max
Sau khi hoàn thành việc xây dựng tâm cụm ngôn ngữ, tiếp theo chúng ta cần
xác
định
giải
thuật
tính
toán
trọng
số
cho
mỗi
mẫu
dữ
liệu
tương
ứng
với
các
tâm
cụm ngôn ngữ này.
Đầu vào: các mẫu xi, 1<=i<=N, tâm cụm cj, các tham sốđạisốgiatử gồm có k-level
linguistic
(ở
đây
cố
định
k=2),
giá
trị
trung
gian
w,
độ
đo
mờ
của
các
biến
gia
tử
fm(hi).
Đầu ra: trọng số tương ứng cho khoảng cách tương ứng dij từ xi tới cj.
[...]... tiếp cận mờ với sửdụngđạisốgiatử Như vậy với việc tìm hiểu đạisốgiatử ở trên dễ thấy được ưu điểm của đạisốgiatửso với tiếp cận mờ theo hướng truyền thống Nếu như phương pháp luận mờ phụ thuộc vào yếu tố là hàm thuộc, mà xác định hàm thuộc với các bài toán lớn là rất khó khăn dẫn đến nhiều sai số thì phương pháp lập luận mờsửdụngđạisốgiatử chỉ cần tập trung đến độ đo tính mờ hay tối... đạisốgiatử chỉ cần tập trung đến độ đo tính mờ hay tối ưu được bộ sốgiatử Có rất nhiều các nghiên cứu đã so sánh và đưa ra các kết quả tối ưu khi áp dụng đại sốgiatử 2.4 Kết luận chương 2 Như vậy, luận văn đã trình bày các vấn đề về đạisốgiatử và phâncụmmờsửdụng lý thuyếtđạisốgiatử Trong chương tiếp theo sẽ tiến hành phân tích thiết kế và cài đặt giải thuật để làm rõ hơn bài toán đã... Cài đặt thành công giải thuật phâncụmmờsửdụng lý thuyếtđạisốgiatử Qua đó đánh giá được hiệu năng của thuật toán 4 Cài đặt thành công chương trình tối ưu bộ sốgiatử đầu vào thông qua thuật giải di truyền Đây là phần phát triển thêm của luận văn Vì luận văn chọn phương án tối ưu tham số đầu vào thì tỉ lệ nhận dạng mẫu đúng cao hơn rất nhiều khi chưa tối ưu bộ sốgiatử Đề xuất hướng nghiên cứu... Luận văn đạt được một số kết quả sau đây: 1 Trình bày về tập mờ cũng như về logic mờ Đây là một lĩnh vực được áp dụng rất nhiều trong khoa học công nghệ, từ đó có được một khung nhìn tổng quan nhất Đặc biệt đã tiếp cận đến bài toán phân cụm, phân tích được giải thuật này 2 Trình bày về lý thuyếtđạisốgia tử, khẳng định một lần nữa đại sốgiatử được quan tâm, phát triển liên tục nhằm nghiên cứu định... Giao diện chính 3.3.2 Chức năng phâncụm Chọn và tải dữ liệu bộ hoa Iris 12 File sau khi phân cụm: 3.4 Kết luận chương 3 Như vậy chương 3 đã trình bày việc phân tích, thiết kế chức năng, cài đặt thành công chương trình phâncụm dữ liệu Một vấn đề đặt ra là tỉ lệ nhận dạng mẫu này phụ thuộc vào giá trị tham số đầu vào đó chính là bộ sốgiatử Vậy để có thể tối ưu bộ sốgiatử này trong chương tiếp theo... cài đặt giao diện Giao diện cửa sổ tối ưu: Bộ sốgiatử tối ưu: Kết quả sau khi phâncụm đạt tới 97% nhận dạng đúng mẫu 15 4.4 Kết luận chương 4 Như vậy luận văn đã trình bày giải thuật di truyền và cài đặt giải thuật thành công tìm ra bộ sốgiatử tối ưu Tuy nhiên việc tối ưu hóa này cũng mất khá nhiều thời gian do việc phải thực thi số vòng lặp khá lớn 16 KẾT LUẬN Luận văn đạt được một số kết quả... hiện cài đặt phâncụmmờ trên tập dữ liệu mẫu đã phân lớp sẵn cho phép ta có cơ sở đánh giá sai số cũng như hiệu quả của thuật toán về sau 3.2 Phân tích và thiết kế chức năng Chương trình được tạo dựng với 3 lớp chính đó là: - Lớp Iris chứa mô tả thuộc tính đối tượng - Lớp HaFuzzy cài đặt thuật toán phâncụm - Lớp FinalHA cài đặt giao diện chương trình 11 3.3 Mô tả chương trình 3.3.1 Giao diện chính... vào thì tỉ lệ nhận dạng mẫu đúng cao hơn rất nhiều khi chưa tối ưu bộ sốgiatử Đề xuất hướng nghiên cứu tiếp theo: 1 Tối ưu được thuật toán khi chọn được bộ sốgiatử 2 Áp dụng giải thuật phâncụm để thực hiện trên các bài toán nhận dạng mẫu, phâncụm ảnh… ... đánh giá được hiệu năng của thuật toán 10 Chương 3: PHÂN TÍCH THIẾT KẾ VÀ CÀI ĐẶT THỬ NGHIỆM Dựa trên những lýthuyết đã trình bày trong chương 2, ở chương 3 sẽ đi vào trình bày những nội dung chính là: - Tập dữ liệu đầu vào hoa Iris - Phân tích, thiết kế chương trình - Giao diện, chức năng của chương trình 3.1 Mô tả bài toán Dữ liệu mẫu IRIS đem phâncụm gồm 150 đối tượng hoa thuộc vào 3 lớp khác nhau,... giải giúp tối ưu bộ sốgiatử để có được phần trăm nhận dạng mẫu cao hơn 13 Chương 4: ĐÁNH GIÁ KẾT QUẢ, CÀI ĐẶT TỐI ƯU Để tối ưu hóa việc phân cụm, nội dung trình bày trong chương là: - Giải thuật di truyền - Cài đặt giải thuật 4.1 Giải thuật di truyền Thuật giải di truyền thuộc lớp các giải thuật xác suất, nhưng lại rất khác những giải thuật ngẫu nhiên vì chúng kết hợp các phầntử tìm kiếm trực tiếp . trình bày:
-
Lý thuyết về đại số gia tử
-
Phân cụm mờ sử dụng lý thuyết đại số gia tử
2.1.
Lý
thuyết
đại
số
gia
tử
Một đặc điểm.
dụng đại số gia tử.
2.4.
Kết
luận
chương
2
Như vậy, luận văn đã trình bày các vấn đề về đại số gia tử và phân cụm mờ sử
dụng lý thuyết