Sử dụng các thuật toán riêng biệt nào đó.Machine learning cho phép máy tính đào tạo dữ liệu đầu vào và sử dụng phântích thống kê để đưa ra các giá trị nằm trong một phạm vi cụ thể.. Từ đ
HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ BÀI TẬP LỚN TRÍ TUỆ NHÂN TẠO TRONG KINH DOANH ĐỀ TÀI:Ứng dụng Computer Vision tự động nhận diện loại trang phục có phù hợp hay khơng khách tham quan đến chùa Giảng viên hướng dẫn : Đinh Trọng Hiếu Mã lớp học phần : IS42A14 Nhóm sinh viên thực : Nhóm Hà Nội,2022 DANH SÁCH THÀNH VIÊN NHÓM ST T Họ tên Mã sinh viên Trần Thùy Trang 23A4030440 - Thu thâp liệu - Chạy code - Xây dựng nội dung 100% Trần Thị Lan Anh 23A4030037 - Thu thâp liệu - Xây dựng nội dung - Chạy code 100% Phạm Quỳnh Anh 23A4010056 - Thu thập liệu - Thuyết trình - Xây dựng nội dung 100% Đặng Thị Thùy Trang 23A4030357 - Thu thập liệu - Làm word - Chạy code 100% Nguyễn Thị Trang 23A4030437 - Thu thập liệu - Làm power point 100% Nhiệm vụ Đánh giá MỤC LỤC I Xác đ nhị vấấn đềề 1.1 Giới thiệu chung 1.2 Đặt vấn đề 1.3 Đặt toán .4 II T ổ ng quan vềề thuật toán 2.1 Giới thiệu chung thuật toán 2.2 Thuật toán sử dụng 2.3 So sánh với thuật toán Teachable Machine 2.3.1 Giới thiệu chung thuật toán Teachable Machine 2.3.2 Nhược điểm mơ hình Teachable Machine III Triển khai xấy dựng mơ hình .9 3.1 Đăng nhập vào cách công cụ cần thiết: .10 3.2 Chuẩn bị liệu 10 3.3 Tải liệu lền Google Drive 10 3.4 Tạo file Colab notebook trền Google Drive 12 3.5 Chạy mơ hình .12 IV Mô hình mở rộng .17 4.1 Khai báo thư viện sử dụng 17 4.2 Kềất nôấi với Google Drive để đọc lưu d ữ liệụ 17 4.3 Khai báo đường dấẫn thư mục chứa liệu ảnh 17 4.4 Gán nhãn liệu .17 4.5 Tiềền xử lý liệu ảnh với ImageDataGenerator .18 4.6 Đọc liệu train validation 18 4.7 Xấy dựng mơ hình mở rộng .19 4.8 Tham sôấ thiềất lập .20 4.9 Huấấn luyện mơ hình 20 4.10 Ki ể m ch ứ ng m ứ c đ ộtơất mơ hình 22 4.11 Sử d ụng mơ hình 23 4.11 Đánh giá mơ hình 25 V Kềất luận 26 Tài liệu tham khảo 29 I Xác định vấn đề 1.1 Giới thiệu chung Đã từ lâu tiềm thức người Việt Nam, Chùa nơi thiêng liêng để thờ phụng vị phật, thần anh hùng dân tộc có cơng lao to lớn đất nước Khơng vậy, cịn nơi có khơng gian tĩnh lặng, nơi người đến nương nhờ Đức Phật để cầu sức khỏe, hạnh phúc cho gia đình tìm bình an cho tâm hồn, an ủi tinh thần người Chính vậy, chùa trở thành truyền thống văn hóa người Việt bao đời 1.2 Đặt vấn đề Chùa chiền nơi tơn kính thờ Đức Phật vị thánh, coi trọng tâm nên việc lựa chọn trang phục phù hợp chùa quan trọng.Tuy nhiên, bên cạnh xu hướng phát triển ngành công nghiệp thời trang khiến người tương đối thoải mái, đa dạng phóng khống cách lựa chọn trang phục cho thân mình; có phận bạn thường mắc lỗi chọn trang phục lễ chùa Điều ảnh hưởng đến tôn nghiêm, gây phản cảm cho hình ảnh nơi linh thiêng Mặc dù có hình thức truyền thơng qua báo đài, mạng xã hội, truyền nhắc nhở việc lựa chọn trang phục phù hợp không phù hợp đến chùa, nhiều bạn trẻ đến đền, chùa để cầu nguyện hay tham gia lễ hội, ăn mặc có phần “thiếu vải”, hở hang, không với linh thiêng, trang nghiêm nơi thờ tự Cụ thể năm trước đây, thói ăn chơi đua địi cách sống số người bắt chước nhau, đua đòi cách sống thích xài sang, chạy theo mốt, họ đến chùa với quần bò rách gối, áo ngắn cũn cỡn, giày cao gót, áo thun mỏng, bó sát, áo thụng, quần tất lưới, đồ xuyên thấu, Việc làm xuất hình ảnh phong mỹ tục, thiếu tôn trọng, gây mỹ quan, làm xấu hình ảnh văn hóa Việt Nam mắt du khách nước 1.3 Đặt tốn Với tình hình dịch COVID-19 kiểm sốt thời gian gần đây, việc tham quan, cầu nguyện đền, chùa ngày tấp nập Bởi vậy, để tránh hình ảnh gây “phản cảm” cho nơi linh thiêng cần có hệ thống giám sát nhận diện phát ăn mặc phù hợp không phù hợp chùa Từ đó, nhắc nhở kịp thời, tránh cho trường hợp lần sau vi phạm, đảm bảo trang nghiêm chùa nơi thờ tự Đánh giá giải pháp phương hướng tối ưu: Dựng biến nhắc nhở quy định trang phục đến chùa + Ưu điểm: Khơng tốn nhiều chi phí, thời gian nguồn lực để thực + Nhược điểm: Khó kiểm sốt cịn phụ thuộc vào ý thức thái độ người có đọc thực theo hay không Việc cần có lực lượng kiểm tra Yêu cầu nguồn nhân lực kiểm tra rà soát khách vào chùa nhằm mục đích phát trường hợp ăn mặc không phù hợp thiếu lịch + Ưu điểm: Có thể theo dõi trang phục khách vào chùa cách sát để kịp thời nhắc nhở Việc hạn chế tối đa người thiếu ý thức cách ăn mặc đến chùa + Nhược điểm: Cần có lực lượng kiểm soát từ cổng vào đến chùa, dẫn đến cần lượng chi phí nhân cơng khơng thấp, làm việc liên tục vất vả Đồng thời, khắc phục tình trạng ăn mặc khơng phù hợp khách tham quan Xây dựng hệ thống AI nhận diện người có trang phục phù hợp hay khơng phù hợp vào chùa Document continues below Discover more from: Trí tuệ nhân tạo AI Học viện Ngân hàng 15 documents Go to course Tiểu luân chủ đề 23 Trí tuệ nhân tạo AI 100% (1) NHĨM-1663 221IS42A06 - Btap… Trí tuệ nhân tạo AI None Bài tập lớn AI - Bài 58 tập lớn chat bot… Trí tuệ nhân tạo AI None Bai tap thuc hanh chuong Trí tuệ nhân tạo AI None Exercise in Lesson Trí tuệ nhân tạo AI None 28 Bao cao KTXH 11 Summary Trí tuệ… + Ưu điểm: Tiết kiệm nguồn lực, chi phí thuê nhân cơng giámnhân sát, cịn kiểm Trí tuệ None sốt chặt chẽ, khơng bị bỏ sót trường hợptạo ăn AI mặc thiếu lịch sử, “thiếu vải” + Nhược điểm: Tốn khoản chi phí để lắp đặt hệ thống, xuất hiệnnhững sai số Lựa chọn biện pháp: Xây dựng hệ thống Computer Vision đặt cửa ravào, góc có tầm nhìn rộng để nhận diện trang phục phù hợp không phù hợp khách đến chùa Sử dụng biện pháp hệ thống Computer Vision vừa đạt hiệu tối ưu, vừa tiết kiệm nguồn nhân lực, chi phí nhân cơng, tránh nhược điểm biện pháp khác Tuy chi phí đầu tư ban đầu để xây dựng hệ thống lớn sử dụng lâu dài mang lại hiệu cao II Tổng quan thuật toán 2.1 Giới thiệu chung thuật toán Học máy lĩnh vực liên tục phát triển, lĩnh vực “nóng” nhiều người dùng cơng nghệ quan tâm Nó trở lên phổ biến hữu ích Vậy Machine Learning gì? Machine Learning nhánh nhỏ thuộc lĩnh vực nghiên cứu trí tuệ nhân tạo AI Sử dụng thuật tốn riêng biệt Machine learning cho phép máy tính đào tạo liệu đầu vào sử dụng phân tích thống kê để đưa giá trị nằm phạm vi cụ thể Do đó, machine learning tạo điều kiện cho máy tính xây dựng model từ liệu mẫu để tự động hóa quy trình định dựa liệu đầu vào Hay nói cách khác, Machine Learning lập trình khả tự học hỏi cho thiết bị máy tính đại Machine Learning có phương pháp học tập có giám sát khơng giám sát, phương pháp tiếp cận thuật toán phổ biến Machine learning Workflow Cách sử dụng thuật toán để huấn luyện mơ hình: Xác định loại liệu huấn luyện Thu thập tập liệu huấn luyện Xác định việc biểu diễn đặc trưng đầu vào cho hàm mục tiêu cần tìm Xác định cấu trúc hàm mục tiêu cần tìm giải thuật học tương ứng Hoàn thiện thiết kế chương trình 2.2 Thuật tốn sử dụng Machine Learning với phương pháp học máy có giám sát cho phép máy học cách mơ hình hóa mối quan hệ dựa liệu gán nhãn Các liệu đầu vào đầu tương ứng gắn nhãn Máy tính học qua liệu đưa vào liệu đầu vào mới, máy cho kết tương ứng Điều đồng nghĩa với việc liệu thu thập theo tỉ lệ 215 ảnh Train 137 ảnh Validation gắn nhãn Từ đó, mơ hình AI học liệu đưa quy luật định với hình ảnh cho kết dự đốn trang phục chùa phù hợp hay khơng phù hợp Mơ hình học máy có giám sát 2.3 So sánh với thuật toán Teachable Machine 2.3.1 Giới thiệu chung thuật toán Teachable Machine Teachable Machine tảng sử dụng thư viện mã nguồn mở Tensorflow thư viện dành cho máy học Javascript Google phát triển, trang cho phép cho bạn training model phân biệt vật thể, âm hành động cách truy cập vào webhttps://teachablemachine.withgoogle.com/train/image Các mơ hình sử dụng kỹ thuật gọi học chuyển giao (transfer learning) Có mạng nơ-ron đào tạo trước bạn tạo lớp (class) riêng Cách sử dụng thuật tốn để huấn luyện mơ hình: Gather Train Export Teachable Machine dựa kỹ thuật học sâu phổ biến gọi học chuyển giao (transfer learning) Transfer learning việc ứng dụng kỹ năng, tri thức học từ vấn đề với ứng dụng sang vấn đề khác với ứng dụng khác có liên quan Khi upload hình ảnh phân class web tiến hành training Sau training xong tiến hành download model để - MaxPooling2D: lớp Pooling thường dùng lớp convolutional, để giảm kích thước liệu giữ thuộc tính quan trọng Kích thước liệu giảm giúp giảm việc tính tốn model - Hàm kích hoạt Relu áp dụng kích hoạt max (0,x) lên đầu lớp Convolutional, dùng để loại giá trị âm đưa chúng thành tránh ảnh hưởng cho việc tính tốn lớp ẩn sau - Flatten: chuyển ảnh từ dạng ma trận mảng chiều Sau ảnh truyền qua nhiều lớp CNN mơ hình học đặc điểm ảnh, output lớp CNN cuối ma trận, chuyển vector chiều - Lớp ẩn: Dense thể lớp kết nối đầy đủ (fully connected layer), tức toàn unit layer trước nối với tồn unit layer Dense 512 thể việc có 512 unit layer (đầu linear regression 512) - Lớp Output: Sử dụng hàm softmax lớp cuối phân loại dựa mạng nơron Softmax sử dụng để phân loại mơ hình hồi quy logistic Bước 8.Thiết lập tham số để huấn luyện mơ hình - Compile: chọn tham số để huấn luyện mơ hình 15 - Optimizer: thuật tốn huấn luyện mơ hình, nhóm sử dụng thuật toán RMSprop - Learning rate: tốc độ học sử dụng lr = 0.001 - loss: hàm tính tốn sai số giá trị học giá trị thực tế, trường hợp có nhiều lớp tốn nhóm sử dụng categorical_crossentropy - Metrics: thước đo để đánh giá độ xác accuracy mơ hình Bước 9.Huấn luyện mơ hình - Số vịng lặp nhóm lựa chọn để huấn luyện cho mơ hình EPOCHS = 100 - Kết thúc vòng lặp thu kết quả: Bước 10.Sử dụng mơ hình 16 - Chạy đoạn code, xuất kết yêu cầu chọn hình ảnh để phân loại, kích chọn nút Chọn tệp, xuất hộp thoại Open chọn ảnh để phân loại Đánh giá độ xác mơ hình - Thực kiểm tra với đối tượng, đối tượng ảnh để kiểm tra độ xác mơ hình ban đầu - Trang phục Phù Hợp có độ xác 6/7, tương đương 85.7% 17 - Trang phục Khơng Phù Hợp có độ xác 5/7, tương đương 71.4% Như qua việc kiểm tra đối tượng mơ hình ban đầu ta nhận độ xáckhoảng 70%-90%, nhiên cịn xảy số trường hợp nhận diện không phù hợp mơ hình xây dựng cịn đơn giản, chưa có tính chun mơn cao áp dụng kỹ thuật phức tạp IV Mơ hình mở rộng Thực bước: 4.1 Khai báo thư viện sử dụng 4.2 Kết nối với Google Drive để đọc lưu liệụ 4.3 Khai báo đường dẫn thư mục chứa liệu ảnh 4.4 Gán nhãn liệu 4.5 Tiền xử lý liệu ảnh với ImageDataGenerator - Giống phần xây dựng mơ hình bên 4.6 Đọc liệu train validation - Thực chuẩn hóa kích thước ảnh: target_size = (100,100), biến đổi ảnh huấn luyện (train validadtion) kích thước 100x100 pixel 18 - Vì giới máy tính, máy tính đọc hiểu nội dung theo số Các hình ảnh đưa vào biểu diễn dạng mảng chiều số gọi pixel - Mỗi ảnh đưa vào máy biểu diễn dạng ma trận liệu số có giá trị nguyên khoảng [0, 255] riêng biệt cho ảnh Sau chuẩn hóa liệu ảnh cách điều chỉnh giá trị pixel khoảng 0-1, ta ma trận liệu số có giá trị khoảng [0,1] Cụ thể toán : - Đầu vào ban đầu ma trận liệu số khoảng [0,1] có kích thước 50x50 Tuy nhiên có giá trị khoảng 0-1 thể đặc trưng ảnh, giá trị gần giá trị mang đặc trưng ảnh ngược lại, giá trị xa giá trị không mang đặc trưng ảnh Chính chuẩn hóa ảnh đầu vào với kích thước lớn, ma trận biểu diễn hình ảnh chi tiết - Việc tăng kích thước ảnh huấn luyện từ 50x50 pixel lên 100x100 pixel làm cho việc output xuất chi tiết hơn, dẫn đến tỷ lệ dự đoán xác cải thiện Tuy nhiên, nhược điểm lớn phương pháp khiến cho kích thước liệu trở nên lớn 4.7 Xây dựng mơ hình mở rộng - Thêm lớp CNN vào mơ hình: lớp CNN thứ ba gồm 128 lọc kích thước 3x3, thay đổi số lượng kích thước lọc 19 - Qua tầng CNN1 CNN2, kích thước liệu cịn lớn, cần thêm tầng CNN3 để hạ tải trọng tính tốn giữ thơng tin quan trọng - Mục đích tầng CNN3: + Hình ảnh gốc tinh chỉnh, lọc gộp lại để tạo tập hình ảnh lọc thu gọn nhiều để mang lại kết xác Chúng lọc thu gọn lại liên tục qua tầng CNN Tầng CNN3 giúp cho feature thu tầng CNN2 trở nên lớn phức tạp hơn, hình ảnh trở nên nhỏ gọn + Khi có thêm tầng CNN3, tầng CNN3 cho feature thể khía cạnh tinh vi hình ảnh, chẳng hạn hình khối (shape) hình mẫu (pattern) Làm bật đặc trưng loại trang phục 4.8 Tham số thiết lập - Thay đổi tham số optimizer + Thuật tốn RMSprop cho kết nghiệm local minimum không đạt global minimum Momentum Vì nhóm sử dụng thuật tốn tối ưu Adam 20 + Nếu giải thích theo tượng vật lí Adam cầu nặng có ma sát, dễ dàng vượt qua local minimum tới global minimum tới global minimum không nhiều thời gian dao động qua lại quanh đích có ma sát nên dễ dừng lại 4.9 Huấn luyện mơ hình - Tăng số vịng lặp chạy mơ hình từ 100 lên 200 vịng - Theo quy tắc, số lần lặp tăng dần, trạng thái mơ hình chuyển dần từ underfitting sang optimum sau overfitting Theo quy tắc việc tăng số vịng lặp giúp sai số mơ hình liệu huấn luyện giảm xuống tăng độ xác mơ hình (trạng thái optimum) Tuy nhiên training lâu, độ xác mơ hình giảm overfitting tức việc học thực liệu nhiễu liệu bất thường huấn luyện Chính thế, thay đổi số vịng lặp từ 100 lên 200 giảm sai số khơng bị overfitting 21 - Ta có kết sau: - Đến thấy, thêm lớp CNN3 chạy 200 vòng, tức epoch tăng lên từ 100 lên 200, thì: + Train Acc Val Acc tăng, epoch 200/200 cho kết train_acc = 1.0000 val_acc = 0.6250, tức tỷ lệ xác mơ hình tập Train Validation cải thiện + Epoch 200/200 cho kết train_loss giảm val_loss tăng 2.5272, tỷ lệ chênh lệch lớn 4.10 Kiểm chứng mức độ tốt mơ hình - Ta sử dụng khối lệnh sau: 22 - Kết cho ra: Mơ hình cải thiện mơ hình cũ Train Loss giảm dần, Validation Acc tăng dần, Validation Loss gần không đổi Train Acc đạt tuyệt đối 4.11 Sử dụng mơ hình 23 - Chạy khối lệnh: - Ta kết quả: 4.11 Đánh giá mơ hình Nhìn chung mơ hình mở rộng có độ xác cao mơ hình ban đầu 24 - Mơ hình ban đầu cho kết quả: - Mơ hình mở rộng cho kết quả: 25 V Kết luận Về tính thực tiễn, khơng có quy định hay u cầu cụ thể mặc đồ lên chùa, nhiều người cho trang phục lễ chùa cần kín đáo, trang nghiêm, tránh trang phục phản cảm hay hở hang Mơ hình nhận diện tương đối tốt điều kiện đủ, giúp việc phát cá nhân có trang phục khơng mực lễ chùa, từ nhằm nhắc nhở, đề xuất trang phục trang nghiêm, chỉnh tề cho cá nhân nhiều người khác, đặc biệt giới trẻ Những bạn trẻ nắm bắt thời trang nhanh chóng, nhiên chưa có nhiều ý thức tôn nghiêm lễ chùa nên khơng khó bắt gặp trang phục khơng chuẩn mực Nhờ ứng dụng mơ hình nhận diện vật thể giúp giảm thiểu tình trạng Qua trình thực hiện, chúng em rút ưu điểm đồng thời hạn chế toán ứng dụng nhận diện vật thể, mong điều tiếp tục phát huy/khắc phục tương lai để mơ hình trở nên ngày dễ tiếp cận tới nhiều đối tượng Ưu điểm: Q trình xử lí thơng tin đơn giản nhanh nhờ hệ thống tự động quét lưu thơng tin vật thể Q trình xử lí khơng tốn nhiều thời gian Độ xác: độ xác Thị giác máy tính đảm bảo độ xác tốt Phạm vi sử dụng rộng rãi: nhận diện nhiều vật thể lúc thời điểm Tính ứng dụng cao, giảm chi phí: giảm thời gian tỷ lệ lỗi q trình thực hiện, giúp giảm chi phí th đào tạo nhân viên đặc biệt để thực hoạt động Nâng cao hiệu tiết kiệm thời gian, nguồn lực Nhược điểm: Tính xác mơ hình trở ngại lớn ứng dụng khơng thể cam kết độ xác 100% 26 Trong điều kiện không đủ độ xác, ảnh có dung lượng thấp giảm độ xác đánh giá Cần có giúp sức chuyên gia: Khi có chuyên gia, họ biết cách hoạt động thiết bị tận dụng toàn lợi Thị giác máy tính Ngồi ra, chun gia sửa chữa lỗi xảy cần thiết Việc loại bỏ yếu tố người tốt số trường hợp Nhưng máy thiết bị bị lỗi, khơng thơng báo khơng lường trước vấn đề Trong người biết trước người khơng đến Vì khó để máy tự vận hành mà khơng có giám sát bảo trì người Xử lý hình ảnh khơng thành cơng: thiết bị bị lỗi vi rút vấn đề phần mềm khác, xảy lỗi xử lý hình ảnh Vì tiếp xúc với trí tuệ nhân tạo máy học khoảng thời gian ngắn nên lực chuyên môn ứng dụng nhóm cịn nhiều hạn chế, vậy, mơ hình nhóm xây dựng cịn đơn giản nhiều sai sót Tuy nhiên, mơ hình thực tốt mục đích đặt ban đầu, kết chạy thử nghiệm đạt mức 70%-90% Điều cho thấy ứng dụng mơ hình giúp kiểm soát tốt trang phục phù hợp lễ chùa Trong tương lai, nhóm em mong mơ hình tiếp tục cải tiến hoàn thiện hơn, nâng cao mức độ xác trở thành giải pháp hữu ích cho việc bảo tồn trang nghiêm cho nơi yêu cầu mực trang phục, khơng riêng nhà chùa mà cịn cơng sở, nhà thờ, Thơng qua trình nghiên cứu ứng dụng Thị giác máy tính (Computer Vision) nhận diện trang phục phù hợp chùa, nhóm có nhìn mẻ nhận thấy lợi ích AI nhận diện vật thể phát triển công nghệ thơng tin học máy Nhóm có hội tiếp cận với ngơn ngữ lập trình sử dụng cơng cụ để giải tốn nhận diện đơn giản thực tiễn, ứng dụng hiệu tạo mơ hình giúp giải vấn đề sống đơn giản dễ dàng 27 Đây tốn có tính ứng dụng cao cách lựa chọn trang phục đến chùa khách tham quan, chất lượng phân loại hình ảnh trang phục mơ hình chưa cao Và nhược điểm mơ hình để áp dụng vào thực tế mang tính chất tham khảo cần phải tính đến phương án tốt Tuy nhiên, kiến thức nhóm có hạn nên chưa thể tìm hiểu nâng cấp mơ hình để đạt hiệu định thời gian ngắn Chính vây, nhóm xin tiếp tục tìm hiểu cải thiện mơ hình tương lai 28 Link Google Colab: https://colab.research.google.com/drive/1dmdMzOXWfu1i_LKLmAvBbB1CZzEPPee?usp=sharing Link video: https://youtu.be/Rgj_U8A84Dc Link liệu: https://drive.google.com/drive/folders/1psHLOjCOkr0hVtO9PVK8dJb0AehZ3 omp?usp=sharing Tài liệu tham khảo Slide giảng Trí tuệ nhân tạo kinh doanh 29