(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu(Đồ án tốt nghiệp) Tìm hiểu bài toán phối trang phục dùng học sâu
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀ NH PHỐ HỒ CHÍ MINH KHOA ĐÀ O TẠO CHẤT LƯỢNG CAO ĐỒ ÁN TỐT NGHIỆP TÌM HIỂU BÀI TỐN GỢI Ý PHỐI TRANG PHỤC DÙNG HỌC SÂU SVTH 1: HUỲNH DUY ANH MSSV: 15110004 SVTH 2: NGUYỄN DANH NGHI MSSV: 15110087 Khóa: 2015 Ngành: CƠNG NGHỆ THƠNG TIN GVHD: TS NGUYỄN THIÊN BẢO Tp Hồ Chí Minh, tháng năm 2020 LỜI CẢM ƠN Nhóm chúng em xin chân thành cảm ơn thầy Nguyễn Thiên Bảo hướng dẫn, giảng giải, cô Võ Hồng Anh, anh/chị/bạn khóa trước nhiệt tình giúp đỡ, đưa ý kiến hữu ích để chúng em hồn thành tốt báo cáo Em xin chân thành cảm ơn quý thầy cô khoa Công nghệ thông tin trường Đại học Sư phạm Kỹ thuật thành phố Hồ Chí Minh tận tình truyền đạt kiến thức năm em học tập trường Với vốn kiến thức tiếp thu q trình học tập khơng tảng cho q trình nghiên cứu khóa luận mà cịn hành trang để em bước vào đời cách vững Với vốn kiến thức hạn hẹp thời gian thực có hạn nên em khơng tránh khỏi thiếu sót Rất mong nhận ý kiến đóng góp q thầy để em tiếp tục phát triển luận văn lên thành đồ án tốt nghiệp Xin chân thành cảm ơn! vi LỜI MỞ ĐẦU Có nhìn tổng quan AI, Machine Learning Tìm hiểu sâu kiến thức cơng trình nghiên cứu để ứng dụng lĩnh vực vào thực tế, đặc biệt Deep Learning Từ sở lý thuyết kiến thức từ cơng trình nghiên cứu cơng bố mà nhóm tìm hiểu, từ nhóm muốn thấy lợi ích việc ứng dụng AI, Machine Learning vào thực tế nhằm đem đến lợi ích nhiều lĩnh vực quan trọng kinh tế, giáo dục, y tế, quốc phịng, xã hội… vii MỤC LỤC NHIỆM VỤ ĐỜ ÁN TỐT NGHIỆP i PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ii PHIẾU NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN iv LỜI CẢM ƠN vi LỜI MỞ ĐẦU vii MỤC LỤC viii DANH MỤC CÁC CHỮ VIẾT TẮT x DANH MỤC CÁC BẢNG BIỂU xi DANH MỤC HÌNH ẢNH .xii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 13 CHƯƠNG 2: BÀI TOÁN GỢI Ý TRANG PHỤC 16 CHƯƠNG 3: TỔNG QUAN VỀ HỌC SÂU 16 3.1 Deep Learning 18 3.2 Convolutional Neural Network 18 3.3 Recurrent Neural Network 22 CHƯƠNG 4: GIẢI PHÁP ĐỀ XUẤT CHO BÀI TOÁN GỢI Ý TRANG PHỤC 24 4.1 Tổng quan 24 4.2 Bộ mã hóa hình ảnh phần phần 26 4.3 Matching Decoder 30 4.4 Hàm mát 31 CHƯƠNG 5: CÀI ĐẶT THỬ NGHIỆM 32 5.1 Ứng dụng vào việc phân vùng đối tượng ảnh thời trang 32 5.2 Tập liệu 32 5.3 Môi trường 32 5.4 Kết 33 CHƯƠNG 6: KẾT LUẬN 38 viii 6.1 Tổng kết 38 6.2 Ưu điểm, nhược điểm 38 6.3 Công việc tương lai 38 TÀI LIỆU THAM KHẢO 39 ix DANH MỤC CÁC CHỮ VIẾT TẮT CNN: Convolutional Neural Network AUC: Area Under the ROC Curve MAP: Maximum A Posteriori MRR: Mean Reciprocal Rank RNN: Recurrent neural network GPU: Graphics Processing Unit RAM: Random Access Memory x DANH MỤC CÁC BẢNG BIỂU Bảng 5.1: Kết train với tập gồm 400 hình ảnh thời trang 33 Bảng 5.2: Kết train với tập gồm 5000 hình ảnh thời trang 34 Bảng 5.3: Kết train với tập gồm 10000 hình ảnh thời trang 35 Bảng 5.4: Kết train với tập gồm 18000 hình ảnh thời trang 36 Bảng 5.5: Kết train với tập gồm 25000 hình ảnh thời trang 37 xi DANH MỤC HÌNH ẢNH Hình 1.1: Trang phục từ Chictopia Người dùng chia sẻ rộng rãi thành phần trang phục họ với công chúng 13 Hình 1.2: Mơ hình gợi ý trang phục Bao gồm danh sách ngắn trang phục gợi ý điểm số phù hợp 14 Hình 3.1: Bộ lọc sử dụng lớp tích chập ma trận kích thước 3x3 -1, 20 Hình 3.2: Ví dụ lọc cạnh (đứng phải, đứng trái, ngang dưới, ngang trên) với đầu vào ảnh số viết tay 20 Hình 3.3: Ví dụ pooling theo giá trị cực đại 21 Hình 3.4: Kiến trúc mơ hình RNN 22 Hình 4.1: (a) Bộ mã hóa hình ảnh trích xuất tính hình ảnh 𝐹𝑡 𝐹𝑏 từ hình ảnh (b) Sử dụng chế ý lẫn nhau, chuyển đổi tính trực quan sang biểu diễn tiềm ẩn 𝑣𝑡 𝑣𝑏 Sau đó, Matching Decoder dự đoán số phù hợp 𝑟𝑡𝑏 25 Hình 4.2: 4x4x3 RGB Image 26 xii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI Gợi ý phối trang phục đóng vai trị ngày quan trọng thị trường bán lẻ trực tuyến Mục đích việc để thúc đẩy sự quan tâm tham gia người vào mua sắm trực tuyến cách gợi ý trang phục thời trang mà họ quan tâm Những nghiên cứu đề tài gợi ý phối trang phục thường dựa liệu nhỏ [1,2], điều ngăn cản sự phát triển mơ hình phức tạp cần dataset lớn (ví dụ: mơ hình dựa học sâu) Trong năm gần đây, với sự phát triển cộng đồng định hướng thời trang trực tuyến, ví dụ Polyvore, Chictopia, người chia sẻ nhận xét thành phần trang phục, Hình 1.1 Các thơng tin có giá trị để xây dựng hệ thống thơng minh xác Hình 1.1: Trang phục từ Chictopia Người dùng chia sẻ rộng rãi thành phần trang phục họ với công chúng 13 Nhiệm vụ cần làm đề xuất mơ hình gợi ý phối trang phục dùng học sâu Bài toán đưa phần (ví dụ: áo sơ mi), cần đề xuất danh sách ngắn phần (ví dụ: quần, váy, vv…) phù hợp với phần từ sưu tập lớn ngược lại Chúng ta cần làm mơ hình hóa khả tương thích yếu tố thời trang, ví dụ: màu sắc, chất liệu, hoa văn, hình dạng, v.v [4] Hình 1.2: Mơ hình gợi ý trang phục Bao gồm danh sách ngắn trang phục gợi ý điểm số phù hợp Để gợi ý trang phục, sử dụng mạng lưới thần kinh tích chập (CNN - convolutional neural network) với chế ý lẫn (Mutual Attention) để trích xuất đặc điểm hình ảnh trang phục Cụ thể, trước tiên, sử dụng CNN để mơ hình hóa phần phần thành vectơ tiềm ẩn, sau đề xuất chế ý lẫn nhau, trích xuất đặc điểm hình ảnh bật phần phần cách sử dụng vectơ để khớp với vectơ ngược lại Các tính hình ảnh sau giải mã thành điểm đánh giá Matching Decoder Đã có số nghiên cứu khuyến nghị trang phục tương tự [1,2,5] Song cộng sự [4], người sử dụng mạng mã hóa tự động kép để tìm hiểu khơng gian tương thích tiềm ẩn, họ mơ hình hóa mối quan hệ kết hợp tính trực 14 tính hình ảnh từ tất khu vực địa phương để có tính hình ảnh tổng quát g 𝑡 ∈ ℝ𝐷 𝐼𝑡 biểu thức 3: 𝐿 g 𝑡 = ∑ 𝑓𝑡𝑖 𝐿 (3) 𝑖=1 Sau đó, khu vực địa phương thứ i 𝐼𝑏 , tính trọng số ý 𝑒𝑡,𝑖 với 𝑔𝑡 𝑓𝑏𝑖 biểu thức [17] 𝑒𝑡,𝑖 = 𝑣𝑎𝑇 tanh(𝑊𝑎 𝑓𝑏𝑖 + U𝑎 g 𝑡 ) (4) Trong 𝑊𝑎 𝑈𝑎 ∈ ℝ𝐷×𝐷 𝑣𝑎 ∈ ℝ𝐷 Các trọng số ý chuẩn hóa biểu thức 5: 𝛼𝑡,𝑖 = exp(𝑒𝑡,𝑖 ) ∑𝐿𝑖=1 exp(𝑒𝑡,𝑖 ) (5) Sau đó, chúng tơi tính tổng trọng số 𝑓𝑏𝑖 𝛼𝑡,𝑖 để có attentive global visual features g 𝑎𝑏 ∈ ℝ𝐷 of 𝐼𝑏 : 𝐿 g 𝑎𝑏 = ∑ 𝛼𝑡,𝑖 𝑓𝑏𝑖 (6) 𝑖=1 Tương tự, tính tốn trọng số ý từ lên có attentive global visual features g 𝑎𝑡 𝐼𝑡 : g 𝑏 = ∑𝐿𝑖=1 𝑓𝑏𝑖 𝐿 𝑒𝑏,𝑖 = 𝑣𝑎𝑇 tanh(𝑊𝑎 𝑓𝑡𝑖 + U𝑎 g 𝑏 ) , (7) 𝛼𝑏,𝑖 = exp(𝑒𝑏,𝑖 ) 𝐿 ∑𝑖=1 exp(𝑒𝑏,𝑖 ) , g 𝑎𝑡 = ∑𝐿𝑖=1 𝛼𝑏,𝑖 𝑓𝑡𝑖 𝑓 𝑓 Sau đó, chúng tơi chiếu 𝑔𝑡𝑎 𝑣à 𝑔𝑏𝑎 vào vectơ đặc trưng trực quan 𝑣𝑡 𝑣𝑏 ∈ ℝ𝑚𝑣 : ReLU dựa tư tưởng việc loại bỏ bớt tham số không quan trọng q trình training điều cho mạng trở nên nhẹ việc training nhanh chóng có hiệu Hàm thực việc rât đơn giản 28 sau: giữ nguyên giá trị đầu vào lớn 0, giá trị đầu vào nhỏ coi 𝑓 𝑣𝑡 = 𝑅𝑒𝐿𝑈 (𝑊𝑃 𝑔𝑡𝑎 ), 𝑓 𝑣𝑏 = 𝑅𝑒𝐿𝑈(𝑊𝑃 𝑔𝑏𝑎 ), (8) Cuối cùng, dựa hiểu biết sâu sắc từ phương pháp dựa yếu tố ma trận [19,20,3], chúng tơi tìm hiểu yếu tố tiềm ẩn top T ∈ ℝ𝑁𝑇×𝑚𝑣 yếu tố tiềm ẩn bottom B ∈ ℝ𝑁𝑏 ×𝑚𝑣 thơng qua chúng tơi kết hợp thơng tin lọc cộng tác để bổ sung cho tính trực quan Cụ thể, với đỉnh t đáy b, có yếu tố tiềm ẩn 𝑣𝑡𝑇 𝑣𝑏𝐵 : 𝑣𝑡𝑇 = 𝑇(𝑡, : ), 𝑣𝑏𝐵 = 𝐵(𝑏, : ), (9) 𝑣𝑡𝑇 𝑣𝑏𝐵 ∈ ℝ𝑚𝑣 Và kết hợp vectơ đặc trưng hình ảnh yếu tố tiềm ẩn để có biểu diễn tiềm ẩn 𝑣𝑡 𝑣𝑏 𝑓 𝑣𝑡 = [𝑣𝑡 , 𝑣𝑡𝑇 ], 𝑓 𝑣𝑏 = [𝑣𝑏 , 𝑣𝑏𝐵 ], (10) Khi 𝑣𝑡 𝑣𝑏 ∈ ℝ𝑚 , 𝑚 = 2𝑚𝑣 29 4.3 Matching Decoder Như hiển thị Hình 4.1(b), chúng tơi sử dụng mạng thần kinh nhiều lớp để tính xác suất khớp t b Cho đại diện tiềm ẩn 𝑣𝑡 𝑣𝑏 tính biểu thức 10, ánh xạ 𝑣𝑡 𝑣𝑏 vào không gian chung: ℎ𝑟 = 𝑅𝑒𝐿𝑈 (𝑊𝑠 𝑣𝑡 + 𝑈𝑠 𝑣𝑏 ) (11) ℎ𝑟 ∈ ℝ𝑛 , 𝑊𝑠 𝑈𝑠 ∈ ℝ𝑛×𝑚 ma trận ánh xạ cho 𝑣𝑡 𝑣𝑏 Sau đó, chúng tơi ước tính xác suất khớp sau: p(𝑟𝑡𝑏 ) = softmax(𝑊𝑟 ℎ𝑟 ), (12) 𝑊𝑟 ∈ ℝ2×𝑛 𝑣à 𝑝(𝑟𝑡𝑏 ) ∈ ℝ2 cung cấp phân phối xác suất theo 𝑟𝑡𝑏 = (tương ứng với p(𝑟𝑡𝑏 = 1)) 𝑟𝑡𝑏 = (tương ứng với p(𝑟𝑡𝑏 = 0)) Ở đây, 𝑟𝑡𝑏 = biểu thị t b khớp 𝑟𝑡𝑏 = biểu thị t b không khớp Cuối cùng, chúng tơi đề xuất đỉnh đáy theo p(𝑟𝑡𝑏 ) 30 4.4 Hàm mát Sử dụng negative log-likelihood (NIL) cho tác vụ khớp Đối với tác vụ khớp, xác định hàm mát sau: 𝐿𝑚𝑎𝑡 = ∑{𝑟𝑡𝑏|(𝑡,𝑏)∈𝜌+∪𝜌−} −𝑙𝑜𝑔𝑝(𝑟𝑡𝑏 ), (13) 𝜌+ = {(𝑡𝑖1 , 𝑏𝑗1 ), (𝑡𝑖2 , 𝑏𝑗2 ), … , (𝑡𝑖𝑁 , 𝑏𝑗𝑁 ), 𝑡𝑖 ∈ 𝜏, 𝑏𝑖 ∈ 𝛽} tập hợp kết hợp dương, cặp top bottom trích xuất từ kết hợp trang phục Polyvore 𝜌− = {(𝑡, 𝑏) | 𝑡 ∈ 𝜏, 𝑏 ∈ 𝛽 ∧ (𝑡, 𝑏) ∉ 𝜌+ } tập hợp kết hợp âm, hình thành đỉnh đáy lấy mẫu ngẫu nhiên Ở đây, kết hợp dương, p (𝑟𝑡𝑏 ) có nghĩa xác suất p (𝑟𝑡𝑏 = 1)., tức là, cặp cho khớp; cặp âm, p (𝑟𝑡𝑏 ) có nghĩa xác suất p (𝑟𝑡𝑏 = 0)., tức là, cặp cho không khớp 31 CHƯƠNG 5: CÀI ĐẶT THỬ NGHIỆM 5.1 Ứng dụng vào việc phân vùng đối tượng ảnh thời trang Trong báo cáo mơ hình CNN trích xuất đặc điểm hình ảnh trang phục, sau chuyển đổi thành biểu diễn tiềm ẩn 𝑣𝑡 𝑣𝑏 dùng Matching Decoder dự đoán số phù hợp 𝑟𝑡𝑏 Đầu vào ảnh thời trang, đầu ảnh thời trang đầu vào đối tượng ảnh có đa giác bao xung quanh 5.2 Tập liệu FashionVC: 25,000 hiǹ h ảnh trang phục thu thập Polyvore: - Hình màu (RGB), 150x150 - Top: 14867; Bottom: 13661 5.3 Môi trường Thực nghiệm Google Colaboratory: - Think iPython + Google Drive - Notebook-based với backend Python Chip xử lý: Intel(R) Xeon(R) CPU @ 2.30GHz RAM: 25 GB Disk: 140 GB GPU: Nvidia Tesla P1000 16GB 32 5.4 Kết (Khi cho top vào ta nhận bottom phù hợp với số điểm tương ứng.) Với tập train 400 hình: Input (Top) Output (Bottom) Score: 0.8096316 Id: 181510621 0.6513389 Id: 197603446 0.6276382 Id: 120648842 Id: 177841780 0.57148856 Id: 119281562 0.5637948 Id: 177304182 Bảng 5.1: Kết train với tập gồm 400 hình ảnh thời trang 33 Với tập train 5000 hình: Input (Top) Output (Bottom) Score: 0.7296728 Id: 187130785 0.68861955 Id: 186138466 0.6823128 Id: 177304182 Id: 177841780 0.6777388 Id: 197142144 0.6675345 Id: 148069634 Bảng 5.2: Kết train với tập gồm 5000 hình ảnh thời trang 34 Với tập train 10000 hình: Input (Top) Output (Bottom) Score: 0.7575436 Id: 186138466 0.726945 Id: 172915735 0.7176412 Id: 200359037 Id: 177841780 0.7053268 Id: 124605419 0.7044494 Id: 177304182 Bảng 5.3: Kết train với tập gồm 10000 hình ảnh thời trang 35 Với tập train 18000 hình: Top Bottom Score: 0.7116264 Id: 177304182 0.694852 Id: 179538691 0.689612 Id: 120648842 Id: 177841780 0.68788755 Id: 159267861 0.6821649 Id: 187130785 Bảng 5.4: Kết train với tập gồm 18000 hình ảnh thời trang 36 Với tập train 25000 hình Input (Top) Output (Bottom) Score: 0.82485515 Id: 158793076 0.81329304 Id: 174494652 0.7958464 Id: 18913740 Id: 177841780 0.78493565 Id: 174193990 0.7541059 Id: 179538691 Bảng 5.5: Kết train với tập gồm 25000 hình ảnh thời trang 37 CHƯƠNG 6: KẾT LUẬN 6.1 Tổng kết Báo cáo nghiên cứu nhiệm vụ gợi ý trang phục mơ hình CNN với chế ý lẫn để trích xuất đặc điểm hình ảnh trang phục Sử dụng liệu fashionCV để chứng minh sự cải tiến đáng kể mặt MAP, MRR AUC Điều chế ý lẫn hữu ích cho việc gợi ý trang phục 6.2 Ưu điểm, nhược điểm Ưu điểm: Phương pháp đề xuất chứng minh có hiệu thử nghiệm liệu có liệu quy mơ lớn xây dựng có mục đích Nhược điểm: Mơ hình cịn hạn chế sự đa dạng mặt hàng thời trang phụ kiện kính, mũ, giày, … 6.3 Công việc tương lai Trong tương lai, chúng em hi vọng khám phá thêm nhiều sự kết hợp thời trang Kết hợp nhiều mơ hình khác để làm việc gợi ý trang phục ngày đơn giản dễ dàng 38 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Bitcoin Vietnam News (12/2019) “Deep Learning gì? Tiềm Deep Learning” https://bitcoinvietnamnews.com/deep-learning-la-gi [2] Deep Learning (3/2019) “Convolutional neural network” https://nttuan8.com/bai-6-convolutional-neural-network/ [3] Do Duong (2018) “ Recurrent Neural Network” https://viblo.asia/p/recurrent-neural-networkphan-1-tong-quan-va-ung-dungjvElaB4m5kw [4] “Mạng nơ-ron tích chập - Convolutional Neural Network (CNN)” https://dlapplications.github.io/2018-07-17-cnn-introduction/ [5] “Nền tảng deep learning - Multi-layer Perceptron” (15/6/2018) https://dlapplications.github.io/2018-06-15-MLP/ [6] https://mc.ai/understanding-of-recurrent-neural-networks-lstm-gru/ Tiếng Anh [1] Tomoharu Iwata, Shinji Watanabe, and Hiroshi Sawada, “Fashion coordinates recommender system using photographs from fashion magazines,” in International Joint Conference on Artificial Intelligence, 2011, pp 2262–2267 https://aclweb.org/anthology/D16-1244 [2] Si Liu, Jiashi Feng, Zheng Song, Tianzhu Zhang, Hanqing Lu, Changsheng Xu, and Shuicheng Yan, “Hi, magic closet, tell me what to wear!” in ACM Multimedia, 2012, pp 619–628 [3] Ruslan Salakhutdinov and Andriy Mnih, “Probabilistic matrix factorization,” in Annual Conference on Neural Information Processing Systems, 2007, pp 1257–1264 39 [4] Xuemeng Song, Fuli Feng, Jinhuan Liu, Zekun Li, Liqiang Nie, and Jun Ma, “Neurostylist: Neural compatibility modeling for clothing matching,” in ACM Multimedia, 2017, pp 753–761 [5] Yang Hu, Xi Yi, and Larry S Davis, “Collaborative fashion recommendation: A functional tensor factorization approach,” in ACM Multimedia, 2015, pp 129–138 [6] Steffen Rendle, Christoph Freudenthaler, Zeno Gantner, and Lars Schmidt-Thieme, “Bpr: Bayesian personalized ranking from implicit feedback,” in Conference on Uncertainty in Artificial Intelligence, 2009, pp 452–461 [7] Vignesh Jagadeesh, Robinson Piramuthu, Anurag Bhardwaj, Wei Di, and Neel Sundaresan, “Large scale visual recommendations from street fashion images,” in ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2014, pp 1925–1934 [8] Julian McAuley, Christopher Targett, Qinfeng Shi, and Anton van den Hengel, “Image-based recommendations on styles and substitutes,” in International Conference on Research and Development in Information Retrieval, 2015, pp 43–52 [9] Ruining He and Julian McAuley, “VBPR: Visual bayesian personalized ranking from implicit feedback,” in AAAI Conference on Artificial Intelligence, 2016, pp 144–150 [10] Yuncheng Li, Liangliang Cao, Jiang Zhu, and Jiebo Luo, “Mining fashion outfit composition using an endto-end deep learning approach on set data,” in IEEE Transactions on Multimedia, vol 19 IEEE, 2017, pp 1946–1955 [11] Wang Cheng Kang, Chen Fang, Zhaowen Wang, and Julian McAuley, “Visuallyaware fashion recommendation and design with generative image models,” in International Conference on Data Mining, 2017, pp 207– 216 [12] Xintong Han, Zuxuan Wu, Yu-Gang Jiang, and Larry S Davis, “Learning fashion compatibility with bidirectional lstms,” in ACM Multimedia, 2017, pp 1078–1086 40 [13] Xuemeng Song, Fuli Feng, Xianjing Han, Xin Yang, Wei Liu, and Liqiang Nie, “Neural compatibility modeling with attentive knowledge distillation,” in International Conference on Research on Development in Information Retrieval (SIGIR’18), 2018 [14] Yann LeCun, L´eon Bottou, Yoshua Bengio, and Patrick Haffner, “Gradient-based learning applied to document recognition,” in Proceedings of the IEEE, vol 86, no 11 IEEE, 1998, pp 2278–2324 [15] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun, “Deep residual learning for image recognition,” in IEEE Conference on Computer Vision and Pattern Recognition, 2016, pp 770–778 [16] Gao Huang, Zhuang Liu, Laurens van der Maaten, and Kilian Q Weinberger, “Densely connected convolutional networks,” in IEEE Conference on Computer Vision and Pattern Recognition, 2017, pp 4700–4708 [17] Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio, “Neural machine translation by jointly learning to align and translate,” in International Conference on Learning Representations, 2015 [18] Minh Thang Luong, Hieu Pham, and Christopher D Manning, “Effective approaches to attention-based neural machine translation,” in Empirical Methods on Natural Language Processing, 2015, pp 1412–1421 [19] Yehuda Koren, Robert Bell, and Chris Volinsky, “Matrix factorization techniques for recommender systems,” in IEEE Computer Society Press, vol 42, no IEEE, 2009, pp 30–37 [20] Daniel D Lee and H Sebastian Seung, “Algorithms for non-negative matrix factorization,” in Annual Conference on Neural Information Processing Systems, 2000, pp 535–541 41 ... xác Hình 1.1: Trang phục từ Chictopia Người dùng chia sẻ rộng rãi thành phần trang phục họ với công chúng 13 Nhiệm vụ cần làm đề xuất mơ hình gợi ý phối trang phục dùng học sâu Bài toán đưa phần... ảnh thời trang 36 Bảng 5.5: Kết train với tập gồm 25000 hình ảnh thời trang 37 xi DANH MỤC HÌNH ẢNH Hình 1.1: Trang phục từ Chictopia Người dùng chia sẻ rộng rãi thành phần trang phục họ... .xii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 13 CHƯƠNG 2: BÀI TOÁN GỢI Ý TRANG PHỤC 16 CHƯƠNG 3: TỔNG QUAN VỀ HỌC SÂU 16 3.1 Deep Learning 18 3.2 Convolutional