III Cơng trình nghiên cu liên quan
4 Các cơng trình liên quan đn đánh giá đ mn
M c đ nghiêm tr ng c a m n là ch s mà bác s da li u s d ng đ cho thu c đi u tr các t n th ng do m n tr ng cá. M c dù khơng có h th ng phân lo i nào đ c ch p nh n trên toàn c u, nh ng m t s nghiên c u đã c g ng tìm ra tiêu chí
thích h p đ phân lo i m c đ t n th ng do m n tr ng cá d a trên c s hai ph ng pháp đ c đ xu t là ”H th ng phân lo i m n toàn c u” [37] và ”H th ng đ m m n Hayashi” [35].
Quan sát t tiêu chí Hayashi [35], Xiaoping Wu1 và các c ng s [24] có th th y r ng vi c đ m m n có ý ngh a th c t nh t đ nh trong nhi m v phân lo i m c đ nghiêm tr ng c a m n tr ng cá. Thông tin v s l ng m n tr ng cá có th phân lo i m c đ m n thành m t trong b n m c đ nghiêm tr ng (t c là nh , trung bình, nghiêm tr ng và r t nghiêm tr ng).
xác minh thu t toán và thúc đ y nghiên c u sâu h n v phân lo i b nh y t , Xiaoping Wu1 và các c ng s xây d ng b d li u phân lo i m c đ nghiêm tr ng c a m n tr ng cá có tên là ACNE04. B d li u ACNE04 bao g m các chú thích v s l ng m n và m c đ nghiêm tr ng c a m n tr ng cá trên t ng b nh nhân. Theo các yêu c u c a tiêu chí ch m đi m Hayashi [35], t t c các hình nh đ c ch p góc x p x 70 đ so v i m t tr c c a b nh nhân. Sau đó, các chun gia chú thích hình nh theo cách th cơng b ng cơng c chú thích. T th c nghi m c c a 1457 hình nh b nh nhân, ph ng pháp đánh giá đ t đ c sai s th p h n c trung bình cho
t ng m c đ nghiêm tr ng c a m n tr ng cá. c bi t là s c i thi n đáng k v m c
đ nghiêm tr ng c a m n tr ng cá ”r t n ng” ch ng t tính n đ nh c a ph ng pháp đ c đ xu t.
xác nh n giá tr ng d ng th c t c a h th ng ch n đoán, bài báo đã so sánh ph ng pháp c a mình v i 2 bác s da li u chuyên nghi p và 2 bác s đa khoa. T đó đ a ra nh n xét r ng r ng ki n th c chun mơn có t m quan tr ng l n trong quy trình phân lo i m n tr ng cá. Các bác s đa khoa cho th y đ chính xác trung bình trên m i ch s đánh giá. Các bác s da li u đ t đ c đ chính xác t t h n trên t t c các ch s . Kho ng cách trong k t qu c a h là do s khác bi t gi a kinh nghi m ch n đoán m n tr ng cá và ch quan c a cá nhân. có th cung c p b ng ch ng ch n đốn có giá tr cho bác s ho c b nh nhân. M c dù vi c phân lo i m c đ nghiêm tr ng c a m n v n là m t nhi m v khó kh n, v n có m t s k t qu khơng nh t qn, sai sót. Vì v y, chúng ta có th c n gi i thi u thêm ki n th c chun mơn ho c tiêu chí y t cho h th ng ch n đoán.
Vào n m 2012, Ramli và các c ng s [37] đã nghiên c u đ xu t vi c đánh giá k t qu d đoán m c đ m n đ c th c hi n d a trên tiêu chí phân lo i m n toàn di n, đ c g i là H th ng phân lo i m n toàn c u [37].Trên th c nghi m cho th y k t qu khi d a trên đ ng ý v i ít nh t hai trong s ba k t qu c a chuyên gia v i đ chính
xác là 68,7 %. Recall gi a đ m t n th ng và phân lo i so v i bác s da li u t
Vào n m 2014, Malik và các c ng s [17] đã đ xu t vi c đánh giá m c đ m n theo ph ng pháp mGAGS (H th ng phân lo i tiêu chu n đã ch nh s a) [37]. m c đ nghiêm tr ng đ c xác đ nh nh nh , trung bình, n ng và r t n ng (mild, moderate, severe, very severe). Trong quá trình th c nghi m,Các m u hình nh m n đ c thu th p t 50 b nh nhân v i 4 m c đ khác nhau (nh , trung bình, n ng và r t n ng). Các m u này đ c l y t i Khoa Da li u, B nh vi n Kuala Lumpur (HKL) b ng máy nh Digital Single Lens Reflex (DSLR). H th ng ch m đi m m n tr ng cá toàn c u đã đ c s a đ i (mGAGS) đ c s d ng đ phân lo i, chia khn m t thành 5 v trí (trán, m i, c m, má ph i và má trái). Trong v trí đó (0 = khơng có t n th ng, 1 = m n b c, 2 = s n viêm đ , 3 = m n m và 4 = m n nang). Sau đó, đi m cho m i khu v c là tích s c a t n th ng n ng nh t, nhân v i h s khu v c. Các đi m s riêng l
này sau đó đ c c ng l i đ thu đ c t ng đi m. i v i t ng đi m trong kho ng t
1 đ n 13, b nh nhân đ c phân lo i là nh trong khi đ i v i t ng đi m t 14 đ n 22, b nh nhân đ c x p vào lo i trung bình, n u t ng đi m t 23 đ n 28 thì x p lo i n ng
và n u trên 29 thì r t n ng. xác th c đ chính xác c a ph ng pháp phân đo n t
đ ng, nhóm đã th nghi m ph ng pháp này trên 50 hình nh v các lo i m n và lo i màu da khác nhau. K t qu c a vi c phân đo n 50 hình nh này đã đ c so sánh v i hình nh ”Ground Truth” t ng ng. V i m i hình nh đ nh y (sensitivity), đ đ c hi u (specificity) và đ chính xác ( accuracy) đã đ c tính tốn.
Ngồi ra c ng có m t s cơng trình nghiên c u liên quan khác nh Tingting Zhao và các c ng s [26] đã làm vi c v i Nestlé SHIELD (SkinHealth, Innovation, Education, and Long Life Development, NSH) đ phát tri n m t mơ hình h c sâu có th đánh giá m c đ nghiêm tr ng c a m n tr ng cá t hình nh selfie m t cách chính xác nh bác s da li u. S d ng thang đánh giá là IGA Scoring 0Not Acne, 1Clear, 2Almost
Clear, 3Mild, 4Moderate, and 5Severe. t đ RMSE th p h n RMSE trên các
hình nh th nghi m gi m xu ng 0,482, t t h n so v i RMSE trung bình c a 11 bác s da li u là 0.517. T cơng trình đ xu t c a Tingting Zhao và các c ng s , Ziying Vanessa Lim và các c ng s [27] đã đ xu t s d ng 472 b c nh góc nhìn tr c di n t 416 b nh nhân m n tr ng cá đã đ c s d ng. Các b c nh đ c dán nhãn theo thang đi m IGA trong ba nhóm IGA là rõ ràng g n nh rõ ràng (0 1), IGA nh (2) và
IGA trung bình đ n n ng (34). chính xác c a th c nghi m phân lo i t t nh t là
67%.
T các cơng trình liên quan có th th y quy trình phân lo i m c đ nghiêm tr ng c a m n tr ng cá toàn c u là th t s c n thi t nh ng đây c ng là m t tác v khó kh n v i c ng i c ng nh h th ng.
5. Các cơng trình liên quan đ n h th ng g i ý
5.1 Khái quát các gi i pháp g i ý s n ph m
Trong nh ng n m g n đây, s quan tâm c a ng i dùng đ i v i nh ng s n ph m ch m sóc cho khn m t ngày càng t ng trên toàn c u, t p trung vào ch m sóc da. Trong quá kh , ng i dùng ph thu c vào các s n ph m bán ch y nh t ho c các g i ý c a c a hàng. Tuy nhiên, m i ng i có tình tr ng da khác nhau, vì v y đây khơng ph i là ph ng pháp hi u qu đ đánh giá đ t ng thích gi a s n ph m và ng i dùng.
Vào n m 2018, Joanna Cristy Patty, Elika Thea Kirana và Made Sandra Diamond Khrismayanti Giri [8] đã gi i thi u h th ng khuy n ngh cho vi c mua m ph m b ng cách s d ng l c d a trên n i dung. Nhóm tác gi c a nghiên c u này s đ a ra m t h th ng khuy n ngh thi t k m ph m b ng ph ng pháp L c d a trên n i dung s d ng thu t toán TFIDF. L c d a trên n i dung đ c th c hi n d a trên các ph ng pháp ph bi n là h s m c và h s ng i dùng (The Goddess, 2013).
Bên c nh nh ng nghiên c u g i ý s n ph m d a trên n i dung. Thì tác gi Villia Putriany và nh ng đ ng nghi p đã nghiên c u và đ a ra ph ng pháp l c trên n i dung và phân c m Kmeans đ g i ý s n ph m [25].
Vào n m 2020, Gyeongeun Lee và các c ng s đã đ xu t h th ng g i ý s n ph m
ch m sóc da d a trên n i dung. [6]. xu t này t p trung vào vi c thi t k h th ng
đ xu t s n ph m ch m sóc da d a trên lo i da c a ng i dùng và thành ph n nguyên li u c a s n ph m. L c d a trên n i dung đ c s d ng đ xác đ nh các thành ph n hóa h c c a s n ph m và tìm các s n ph m có thành ph n t ng t . Ph ng pháp l c cho đ chính xác trung bình cao h n 75%, vì v y cách hi u qu đ gi i thi u s n ph m phù h p cho ng i dùng, v i đi u ki n 50% là trung tính. Nh ng k t qu ch đ n t m t m u nh , và do đó c n ph i đi u tra thêm đ có đ c đ chính xác đáng tin c y h n.
5.2 H th ng khuy n ngh s n ph m ch m sóc da d a trên n i dung [2020] Bài báo ”A Contentbased Skincare Product Recommendation System” đ c nghiên c u b i Gyeongeun Lee và c ng s thu c đ n v Computer Science c a đ i h c Earlham College đ c th c hi n t i n m 2020 [6]. Bài báo b t đ u b ng cách th o lu n v công vi c liên quan và gi i thi u các h th ng khuy n ngh hi n có bao g m l c c ng tác, l c d a trên n i dung và l c k t h p. Sau đó, thi t k c a h th ng đ c đ xu t đ c gi i thích chi ti t b ng m t s đ . Nó khơng ch xây d ng khn kh mà cịn bao g m t ng thành ph n c a h th ng khuy n ngh . H n n a, ph ng pháp
xác minh cho h th ng và k ho ch th nghi m đ c thêm vào ph n thi t k .
Thu th p d li u. D li u đ c l y t sephora.com, m t trang web cung c p các s n ph m làm đ p t nhi u th ng hi u. Trong s nhi u lo i m t hàng ch m sóc cá nhân, ch có sáu lo i đ c chi t xu t đ t p trung vào các s n ph m ch m sóc da. Sáu lo i này bao g m kem d ng m, ch m sóc da m t, s a r a m t, m t n d ng da, đi u tr m t và ch ng n ng. T p d li u bao g m 1472 m c bao g m thông tin v th ng hi u, tên, giá c , c p b c, lo i da và thành ph n hóa h c c a m i s n ph m.
L c d a trên n i dung. Ng i dùng cung c p m t trong n m lo i da (da h n h p, khô, da th ng, da d u và nh y c m) và ch n m t s n ph m t m t trong sáu lo i (kem d ng m, ch m sóc da m t, s a r a m t, m t n , đi u tr m t và ch ng n ng). Lo i da nh h ng tr c ti p đ n h th ng gi i thi u trong khi các thành ph n đ c chi t xu t t s n ph m. Sau đó, lo i da c a ng i dùng và các thành ph n c a s n ph m đ c g i đ n h th ng gi i thi u d a trên n i dung cùng v i d li u Sephora, ch a thông tin v các s n ph m khác. Trong ph ng pháp này, các đ xu t v s n ph m đ c đ a ra trên t t c sáu lo i. Sau khi đánh giá m c đ gi ng nhau c a thành ph n nguyên li u trong các s n ph m, h th ng s tr v s l ng khuy n ngh cho t ng lo i s n ph m.
H th ng đ c đ xu t cung c p tính n ng l c d a trên n i dung ho c l c không d a trên n i dung tùy thu c vào vi c ng i dùng có nh p s n ph m ngay t đ u hay không.
L c IFIPF. N u ng i dùng cung c p lo i da c a mình nh ng khơng cung c p s n ph m, h th ng s l y thông tin đ u vào c a h đ đ t đ c hi u qu làm đ p mong mu n bao g m ch ng lão hóa, d ng m, ki m sốt d u, tr m n, ki m soát m n đ và thu nh l chân lơng. Sau đó, nó s d ng thu t ng t n s ngh ch đ o t n s tài li u (TFIDF) đ l c các s n ph m và đ a ra các đ xu t đ nh d ng t ng t nh l c d a trên n i dung.
Chi t xu t thành ph n. Ban đ u, d li u thu th p đ c l c theo đ u vào lo i da c a ng i dùng. Khi ng i dùng ch n m t s n ph m mà h ch n, h th ng s trích xu t các thành ph n c a s n ph m đó và g i đ n h th ng gi i thi u cùng v i t p d li u Sephora. Danh sách t t c các thành ph n đ c l y t c t thành ph n c a t p d li u. Sau khi ki m tra s trùng l p, m i thành ph n đ c cung c p m t ch s duy nh t đ l u trong t đi n.
Ti p theo, ma tr n thu t ng tài li u đ c t o gi a các s n ph m và thành ph n t ng ng cho t ng s n ph m. M t ma tr n tr ng đ c kh i t o và ch a đ y các s 0. đây, s hàng th hi n s l ng s n ph m ch m sóc da và s c t th hi n t ng s thành ph n. Sau đó, mã hóa m t nóng đ c s d ng đ đi n vào ma tr n thành ph n
Hình 29: Ki n trúc h th ng khuy n ngh d a trên n i dung
m ph m v i 1 (hi n t i) ho c 0 (khơng có), tùy thu c vào s t n t i c a các thành ph n trong m i s n ph m. M t ví d v ma tr n nh v y đ c minh h a trong.
Hình 30: Ma tr n thành ph n m ph m [7]
Trong ph ng pháp này, ph ng pháp tính đ t ng t cosine đ c s d ng đ đo m c đ t ng t c a thành ph n thành ph n gi a các s n ph m. Nó đ c áp d ng đ đ a ra khuy n ngh cho danh m c s n ph m đ x p h ng m ph m có đ c tính t ng t v i s n ph m g c. Cosθ= a•b a b = n 1aibi n 1a2 i n 1b2 i
S d ng ma tr n đ c t o trên, t t c các m t hàng m ph m đ c vector hóa thành các t a đ hai chi u. Các t a đ này đ c cài đ t vào ph ng trình 1 đ thu
đ c kho ng cách gi a các đi m khác nhau. Cu i cùng, các giá tr này đ c s p x p theo th t t ng d n đ x p h ng t s n ph m t ng t nh t đ n s n ph m ít t ng t nh t. Quá trình này đ c l p l i b ng cách chuy n các danh m c s n ph m khác nhau đ l c d li u. Vi c chia nh t p d li u thành các lo i khác nhau cho phép h th ng đ xu t các s n ph m trên nhi u danh m c.
B l c IFIPFtrong tr ng h p ng i dùng ch a t ng s d ng ho c yêu thích b t k s n ph m nào c a Sephora, h có th nh n đ c khuy n ngh d a trên lo i da và hi u qu làm đ p mong mu n. Thành ph n hàng đ u giúp t ng hi u qu làm đ p nh t đ nh đ c xác đ nh b ng cách tính tốn các giá tr TFIDF, trong d án c a tôi, đ c g i là t n s s n ph m ngh ch đ o t n s thành ph n (IFIPF). IF(i, X) = m p=1 np−αp,i np
np :s l ng các thành ph n duy nh t có trong s n ph m ptrong nhóm tác d ng
làm đ pX
m:s l ng s n ph m trong nhóm tác d ng làm đ pX
αp,i :th h ng c a thành ph niđ c li t kê trong s n ph mp
IP F(i) =log N pf(i)
N :S l ng s n ph m trong t p d li u
pf(i) :S l ng s n ph m có thành ph ni
IF −IP F(i, X) =IF(i, X)xIP F(i)
Các s n ph m có ch a các thành ph n đó sau đó đ c l c và phân lo i thành 6 lo i s n ph m. Cu i cùng, các đ xu t hàng đ u t m i danh m c đ c tr l i cho ng i