1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài tập lớn Trí tuệ nhân tạo Ứng dụng Computer Vision tự động nhận diện lứa tuổi (trẻ con, trưởng thành, người già) của người đi trong thang máy để phát clip quảng cáo phù hợp. (Áp dụng cho doanh nghiệp PG

25 108 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 1,49 MB

Nội dung

1 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ -🙞🙞🙞🙞🙞 - BÀI TẬP LỚN Môn: Trí tuệ nhân tạo kinh doanh Chủ đề Ứng dụng Computer Vision tự động nhận diện lứa tuổi (trẻ con, trưởng thành, người già) người thang máy để phát clip quảng cáo phù hợp (Áp dụng cho doanh nghiệp P&G) Giảng viên : Bùi Thị Hồng Nhung Lớp : K22CLCB Nhóm thực : 10 Hà Nội, ngày 10 tháng 04 năm 2022 Danh sách thành viên Họ tên MSV Tỉ lệ % đóng góp Nguyễn Thị Lan 22A4010150 33% Phạm Thị Minh Hằng 22A4010281 34% Đỗ Minh Hằng 22A4010258 33% Mục Lục Mở đầu Nội dung I XÁC ĐỊNH VẤN ĐỀ 1, Giới thiệu doanh nghiệp P&G 2, Các vấn đề tồn 3, Mong muốn công ty II LẬP KẾ HOẠCH 1, Lý P&G nên áp dụng trí tuệ nhân tạo AI nhận diện khuôn mặt 2, Xác định liệu cần thu thập III THUẬT TOÁN SỬ DỤNG 10 1, Giới thiệu tổng quan thuật toán 10 2, CNN gì? 11 IV MÃ LỆNH CHƯƠNG TRÌNH 15 1, Đăng nhập Google Colab 15 2, Mã lệnh chương trình 15 2.1 Bài tốn 1: Chạy mơ hình nhận diện lứa tuổi 15 2.2 Bài toán 2: Mở rộng toán 20 V ĐỀ XUẤT NÂNG CAO MƠ HÌNH VÀ ĐÁNH GIÁ 23 1, Nhận xét chung toán 23 2, Tóm tắt phần mở rộng mơ hình 24 Kết luận 24 Tài liệu tham khảo 25 Mở đầu Theo dòng chảy cách mạng 4.0, trí tuệ nhân tạo ngày phổ biến ứng dụng rộng rãi lĩnh vực sống, John McCarthy – nhà khoa học máy tính người Mỹ đề cập lần vào năm 1950 đến ngày thuật ngữ trí tuệ nhân tạo thực biết đến rộng rãi “ông lớn” làng công nghệ chạy đua phát triển AI công nghệ sử dụng đến kỹ thuật số có khả thực nhiệm vụ mà bình thường phải cần tới trí thơng minh người, xem phổ biến Đặc trưng công nghệ AI lực “tự học” máy tính, tự phán đốn, phân tích trước liệu mà không cần hỗ trợ người, đồng thời có khả xử lý liệu với số lượng lớn tốc độ cao Các nhà khoa học xây dựng thuật tốn, lập trình công cụ phần mềm công nghệ thông tin, giúp máy tính tự động xử lý hành vi thơng minh người Trí tuệ nhân tạo kinh doanh thuật ngữ quan tâm năm gần đây, thị trường ngày cạnh tranh khốc liệt lên AI tạo thay đổi lĩnh vực kinh doanh Có thể hiểu đơn giản trí tuệ nhân tạo kinh doanh công việc ứng dụng trí tuệ nhân tạo (AI) hoạt động kinh doanh Sử dụng trí tuệ nhân tạo xu hướng tất yếu trình phát triển sản xuất, kinh doanh, giúp doanh nghiệp nâng cao chất lượng sản phẩm, tiết kiệm chi phí vận hành, chăm sóc khách hàng tốt Hiểu nắm bắt tầm quan trọng trí tuệ nhân tạo cách mạng công nghệ 4.0 này, em đề xuất công nghệ AI Computer Vision nhiều doanh nghiệp sử dụng : “Nhận diện diện lứa tuổi (trẻ con, trưởng thành, người già) thang máy để phát clip quảng cáo phù hợp với độ tuổi, áp dụng cho doanh nghiệp P&G” Mục đích dự án giúp cho doanh nghiệp tối ưu hố việc marketing sản phẩm đến với khách hàng tiềm năng, tiết kiệm nguồn nhân lực chi phí cho doanh nghiệp Nội dung I XÁC ĐỊNH VẤN ĐỀ 1, Giới thiệu doanh nghiệp P&G P&G viết tắt từ Procter & Gamble tập đoàn đa quốc gia chuyên nhóm ngành hàng tiêu dùng đến từ Hoa Kỳ có trụ sở nằm trung tâm Cincinati – Bang Ohio Đây coi nhà sản xuất sản phẩm, nhãn hiệu hàng tiêu dùng hàng đầu giới với số lượng đa dạng với doanh thu với số vơ ấn tượng Chính yếu tố mà hãng coi “ông lớn” ngành hàng FMCG ( Fast Moving Consumer Goods - ngành hàng tiêu dùng nhanh) giới, hãng coi tập đoàn tiếng sáng kiến kinh doanh quản trị thương hiệu, quảng cáo sản phẩm Nó chuyên sản phẩm chăm sóc vệ sinh nhân; sản phẩm tổ chức thành nhiều phân khúc bao gồm Làm đẹp; Chăm sóc sức khỏe; Vải & Chăm sóc nhà; chăm sóc em bé, phụ nữ gia đình Trước Pringles cho Kellogg's, danh mục sản phẩm bao gồm thực phẩm, đồ ăn nhẹ đồ uống Với mở rộng chiến lược thâm nhập thị trường đắn P&G có mặt 70 quốc gia, phân phối 180 thị trường Doanh số bán hàng hãng đạt mức cao thị trường FMCG lợi nhuận lên đến 10,5 tỷ với thị trường trọng điểm Châu Á rộng lớn Hiện nay, nơi coi trung tâm sáng tạo P&G bao gồm thị trường Trung Quốc, Mỹ Latin số nơi Châu Phi (Ảnh: Các sản phẩm P&G) 2, Các vấn đề tồn a, Có nhiều đối thủ cạnh tranh Sự cạnh tranh ngành đối thủ P&G lớn khốc liệt Công ty phải đối mặt với nhiều đối thủ cạnh tranh Johnson & Johnson, Unilever, Nestlé, Nivea, Colgate-Palmolive, Kraft Foods, Mars Incorporated, Reckitt Benckiser Henkel Đây hầu hết đối thủ lớn có tiềm lực tài mạnh Ngoài người tiêu dùng dễ dàng chuyển đổi sử dụng sản phẩm từ hãng sang hãng khác Chính vậy, áp lực cạnh tranh đến từ đối thủ ngành lớn P&G cần coi yếu tố đối thủ cạnh tranh yếu tố quan tâm hàng đầu b, Quyền thương lượng từ khách hàng Chi phí chuyển đổi sản phẩm P&G sản phẩm công ty khác thấp Chính mà yếu tố góp phần ảnh hưởng đến khả thương lượng khách hàng Không vậy, thông tin truyền thông ngày phát triển mạnh mẽ, người tiêu dùng tiếp cận so sánh thơng tin xác sản phẩm, từ giúp họ dễ dàng định lựa chọn mua sản phẩm P&G hay nhãn hàng khác Ví dụ: Người mua so sánh sản phẩm từ thành phần, bao bì mẫu mã, giá cách dễ dàng trực quan thông tin trực tuyến Ngoài việc mua hàng đơn lẻ người tiêu dùng cá nhân không ảnh hưởng đến lợi nhuận P&G Tuy nhiên chi phí chuyển đổi thấp khả tiếp cận thông tin cao vượt trội yếu tố ảnh hưởng mạnh mạnh đến hoạt động kinh doanh hàng tiêu dùng P&G c, Sự đe dọa đến từ sản phẩm thay Chi phí chuyển đổi thấp giúp người tiêu dùng dễ dàng tiếp cận gần đến với sản phẩm thay P&G Yếu tố bên tác động mạnh mẽ đến công ty môi trường ngành hàng tiêu dùng d, Mối đe dọa từ doanh nghiệp tham gia Chi phí chuyển đổi thấp cho phép doanh nghiệp tham gia gây áp lực mạnh mẽ chống lại P&G Điển hình doanh nghiệp nội địa công, cạnh tranh thị trường với doanh nghiệp ngoại Ví dụ: Người tiêu dùng dễ dàng định dùng thử sản phẩm hãng Tuy nhiên, để xây dựng thương hiệu mạnh P&G cần nguồn vốn vơ vùng lớn khơng phải doanh nghiệp làm Hơn P&G tận dụng lợi quy mô kinh tế cao, hỗ trợ giá cạnh tranh hiệu tổ chức cao mà công ty thường thiếu Kết là, công ty mạnh dù có người gia nhập; cần cảnh giác trước phát triển không ngừng doanh nghiệp nội 3, Mong muốn công ty P&G mong muốn cung cấp sản phẩm dịch vụ có thương hiệu với chất lượng giá trị vượt trội để cải thiện sống người tiêu dùng giới, cho hệ Bên cạnh đó, cơng ty muốn nhiều người tiêu dùng biết đến sản phẩm với chất lượng tốt khác biệt mà khơng doanh nghiệp khác có.Từ đây, cơng ty muốn tiếp tục giữ vị trí đặc biệt thị trường hàng hóa để khẳng định cho đối thủ cạnh tranh biết thân P&G doanh nghiệp dễ đánh bại II LẬP KẾ HOẠCH 1, Lý P&G nên áp dụng trí tuệ nhân tạo AI nhận diện khuôn mặt Thị trường ngày sôi nổi, đa dạng với nhiều sản phẩm sản xuất phân phối rộng khắp miền đất nước Người tiêu dùng thường bị phân vân, bối rối nhiều lựa chọn nhãn hàng sản phẩm tiêu dùng, chăm sóc cho gia đình P&G cạnh tranh trực tiếp với Unilever nhiều phân khúc thị trường Yếu tố giá người quan tâm, có đối thủ mạnh Unilever để mang lại lợi marketing quảng cáo sản phẩm nơi dễ thấy, dễ gặp điều bắt buộc doanh nghiệp P&G Với phát triển cơng nghệ 4.0, trí tuệ nhân tạo khơng cịn q xa lạ với hệ với kinh tế lớn mạnh, đời sống tinh thần vật chất người nâng cao Đặc biệt, người có xu hướng chuyển thành phố lớn để hưởng thụ nhiều tiện ích sống, khơng thể kể đến chung cư, trung tâm thương mại hay văn phòng tồ nhà cao tầng, Ở ln có nhiều tiện ích khu dân cư thu nhỏ thành phố lớn Và dĩ nhiên tồ nhà khơng thể khơng có thang máy thang cuống - giúp cho người dễ dàng di chuyển tiết kiệm thời gian Có thể thấy doanh nghiệp tận dụng AI để nhận diện hình ảnh người (từ độ tuổi em bé người già) chiếu quảng cáo phù hợp họ thang máy - không gian hẹp dễ để nhận diện hình ảnh Từ đó, doanh nghiệp P&G có chiến lược quảng cáo phù hợp, thời điểm với độ tuổi để đánh vào nhu cầu người Có thể thấy tình hình phức tạp dịch bệnh, việc cắt giảm chi phí cần thiết, việc quảng cáo marketing phải đạt hiệu tối ưu để trì doanh thu doanh nghiệp Vì vậy, chúng tơi đề xuất cho P&G chiến lược quảng cáo kết hợp với AI nhận diện khuôn mặt (trẻ em, người trưởng thành, người cao tuổi) để phát quảng cáo phù hợp không gian cụ thể thang máy Kế hoạch cụ thể giúp doanh nghiệp tiết kiệm chi phí có hiệu cao mà xác nhận đối tượng nhận thông tin từ nhãn hàng Đối với trẻ em (độ tuổi từ tuổi đến 15 tuổi): P&G phát video quảng cáo ngắn sản phẩm chăm sóc miệng bàn chải Oral-B, kem đánh Cest; sản phẩm xà bơng Safeguard… Vì trẻ nhỏ sản phẩm phải sử dụng hàng ngày để vệ sinh cá nhân, P&G phát clip quảng cáo vui nhộn có thơng điệp hay vừa thu hút trẻ em thân thiện vừa hướng tới việc giáo dục trẻ em nên xây dựng thói quen tự chăm sóc miệng, tay chân cần thiết Bên cạnh đó, P&G có sản phẩm chăm sóc trẻ em bỉm Pamper, Đối với người trưởng thành người cao tuổi: Ở độ tuổi trưởng thành, phụ nữ có nhiều nhu cầu sản phẩm chăm sóc, tiêu dùng gia đình xà phịng, dầu gội, băng vệ sinh, nước giặt, nước rửa chén, Nhìn nhận, đánh giá nhu cầu chị em phụ nữ độ tuổi trưởng thành này, từ nguồn liệu sẵn có cơng nghệ AI nhận dạng đối tượng người trưởng thành doanh nghiệp phát clip quảng cáo sản phẩm: - Sản phẩm nước giặt: Ariel, Downy, Tide - Sản phẩm dầu gội, sữa tắm: Head & Shoulders, Pantene, Rejoice - Sản phẩm chăm sóc da Olay, Gillette Bên cạnh đó, người cao tuổi, họ thường ưu tiên sản phẩm đồ dùng gia đình chăm sóc sức khỏe, quan tâm đến chất lượng, thành phần có an tồn, đảm bảo Sản phẩm chăm sóc nhà cửa máy khử mùi Ambi Pur cần thiết người cao tuổi, họ thích khơng khí nhà lúc phải sẽ, lành Từ việc nhận diện khn mặt, doanh nghiệp phát quảng cáo Ambi pur AI nhận biết có người cao tuổi thang máy 2, Xác định liệu cần thu thập + Số lượng người thang máy + Tập hình ảnh để nhận dạng trẻ con: nhóm tìm kiếm, thu thập hình ảnh trẻ em nhiều độ tuổi từ lúc bé sơ sinh độ tuổi hết lớp để AI có nguồn liệu nhiều nhận diện khoảng tuổi xác đối tượng trẻ con: Tập hình ảnh để nhận dạng người trưởng thành: người trưởng thành thường người độ tuổi từ 17 đến 55, họ phát triển mặt tâm sinh lý, có nhận thức đầy đủ Các hình ảnh người lớn gồm tập liệu hình ảnh khác giới tính nam, nữ; biểu cảm, tâm trạng vui, buồn, giận dữ, thể khn mặt: Tập hình ảnh để nhận dạng người cao tuổi: dựa quy định luật Việt Nam, người lớn tuổi thường người từ 60 tuổi trở lên, nhóm thu thập hình ảnh người lớn tuổi có đặc điểm bên ngồi sau: tóc bạc, da nhăn, đứng chậm chạp, Thu thập liệu bao gồm: Số lượng hình ảnh người cung cấp từ phần mềm theo dõi Data hình ảnh mẫu nhóm người cụ thể nhóm phân loại trên, lấy từ mạng xã hội hay tảng internet Hình ảnh trích xuất từ camera thang máy chung cư, tồ nhà văn phịng cao tầng Số lượng tệp liệu ảnh Gồm tệp: train, test, validation Tệp train: tệp nhỏ “treem”, “truongthanh”, “nguoigia” gồm 120 ảnh Tổng cộng tệp train có 358 ảnh nhận diện Tệp validation: tệp nhỏ “treem”, “truongthanh”, “nguoigia” chứa 50 ảnh Vậy tổng cộng tệp validation chứa 148 ảnh nhận diện Tệp test gồm 60 ảnh bật Cách tổ chức lưu trữ liệu máy tính Đăng nhập vào google drive -> “drive tôi” -> “thư mục mới” đặt tên AI Tạo thêm thư mục với tên “Data” Lên trình duyệt google tìm kiếm ảnh lứa tuổi chọn bài: trẻ con, trưởng thành, người già Bước tìm đủ 120 ảnh định dạng jpg trẻ xong lưu máy Bước bấm giữ phím ctrl nhấn vào ảnh để lúc chọn nhiều ảnh tải lên vào tệp train Bước bấm ctrl + C để chép toàn 120 ảnh vào folder đặt tên train, bấm ctrl + V để chuyển toàn ảnh vào tệp train Tương tự với tệp test validation III THUẬT TOÁN SỬ DỤNG 1, Giới thiệu tổng quan thuật tốn Các thuật tốn: 1.1 Học có giám sát Supervised learning (học có giám sát) thuật tốn dự đoán đầu (outcome) liệu (new input) dựa cặp (input, outcome) biết từ trước Cặp liệu gọi (data, label), tức (dữ liệu, nhãn) Supervised learning nhóm phổ biến thuật toán Machine Learning 10 Trong đề tài này, phần mềm sử dụng liệu gán nhãn (hình ảnh trẻ con, người trưởng thành, người già) dạy cho AI cách nhận biết lứa tuổi để phát clip quảng cáo thang máy cho phù hợp 1.2 Học sâu (deep learning): Đây chức trí tuệ nhân tạo (AI), bắt chước hoạt động não người việc xử lí liệu tạo mẫu để sử dụng cho việc định Học sâu tập học máy AI, có mạng lưới có khả "học" mà khơng bị giám sát từ liệu khơng có cấu trúc khơng gắn nhãn Thuật tốn học sâu giúp AI nhận diện, phân tích lứa tuổi cách nhanh hơn, xác 1.3 Thị giác máy tính: Thị giác máy tính hình thức cơng nghệ dùng để mơ tả khả máy thu nhận phân tích liệu trực quan sau tiến hành đưa định Nói cho dễ hiểu cơng nghệ thuộc lĩnh vực trí tuệ nhân tạo khoa học máy tính, thiết lập cho máy có tầm nhìn xử lý nhận dạng người Trong đề tài này, thơng qua hình ảnh cung cấp từ trước, có người bước vào thang máy, qua camera hình ảnh người gửi đến hệ thống, AI phân tích đặc điểm bên ngồi người tương đương với hình ảnh cung cấp để từ hệ thống tự động phát clip quảng cáo hình thang máy phù hợp với lứa tuổi người 2, CNN gì? Giới Thiệu CNN Convolutional Neural Networks (CNN) mơ hình deep learning phổ biến có ảnh hưởng nhiều cộng đồng Computer Vision CNN dùng trong nhiều tốn nhân dạng ảnh, phân tích video, ảnh MRI, cho lĩnh vự xử lý ngôn ngữ tự nhiên,và hầu hết giải tốt toán Đặc trưng CNN CNN so sánh hình ảnh theo mảnh, mảnh gọi feature (đặc trưng) Mỗi feature coi hình ảnh mini, tức chúng mảng hai chiều nhỏ Các feature khớp với khía cạnh chung ảnh nghĩa feature tương ứng với khía cạnh ảnh chúng khớp lại với Khi xem hình ảnh mới, CNN khơng biết vị trí feature khớp với đâu nên thử chúng tất vị trí khác Trong q trình chúng tạo thành lọc, gọi filter Và để thực điều này, sử dụng phép tốn tích chập Phép tích chập phép nhân điểm ảnh feature với giá trị điểm ảnh tương ứng hình ảnh Về kỹ thuật, mơ hình CNN để training kiểm tra Mỗi hình ảnh đầu vào chuyển qua loạt lớp tích chập với lọc (Kernels/Filters) để phát đặc trưng có tính khơng gian hiệu quả; sử dụng hàm kích hoạt phi tuyến để giới hạn phạm vi biên độ cho phép giá trị đầu ra; sau đến lớp Pooling Layer để làm giảm kích thước ảnh đầu mà giữ thông tin quan trọng ảnh đầu vào; cuối chuyển ma trận đặc trưng lớp trước thành vector chứa xác suất 11 đối tượng cần dự đốn (Fully Connected Layer) Hình tồn luồng CNN để xử lý hình ảnh đầu vào phân loại đối tượng dựa giá trị 2.1 Kiến trúc mạng CNN : CNN bao gồm tập hợp lớp bao gồm: convolution layer + nonlinear layer, pooling layer, fully connected layer Các lớp liên kết với theo thứ tự định Thông thường, ảnh lan truyền qua tầng convolution layer + nonlinear layer đầu tiên, sau giá trị tính tốn lan truyền qua pooling layer, ba convolution layer + nonlinear layer + pooling layer lặp lại nhiều lần network Và sau lan truyền qua tầng fully connected layer softmax để tính sác xuất ảnh chứa vật 2.1.1 Lớp tích chập Convolution Layer Convolution layer lớp quan trọng lớp của mơ hình CNN Lớp có chức phát đặc trưng có tính khơng gian hiệu Trong tầng có đối tượng là: ma trận đầu vào, filters, receptive field, feature map Conv layer nhận đầu vào ma trận chiều filters cần phải học Bộ filters trượt qua vị trí ảnh để tính tích chập (convolution) filter phần tương ứng ảnh Phần tưng ứng ảnh gọi receptive field, tức vùng mà neuron nhìn thấy để đưa định, mà trận cho bới trình gọi feature map Để hình dung, bạn tưởng tượng, filters giống tháp canh nhà tù quét qua không gian xung quanh để tìm kiếm tên tù nhân bỏ trốn Khi phát tên tù nhân bỏ trốn, chuông báo động reo lên, giống filters tìm kiếm đặc trưng định tích chập cho giá trị lớn Tầng convolution feature detector Tầng convolution có chức phát đặc trưng cụ thể ảnh Những đặc trưng bao gồm đặc trưng góc,cạnh, màu sắc, đặc trưng phức tạp texture ảnh Vì filter qt qua tồn ảnh, nên đặc trưng nằm vị trí ảnh, cho dù ảnh bị xốy trái/phải đặc trưng bị phát Ở minh họa dưới, bạn có filter 5x5 dùng để phát góc/cạnh với, filter có giá trị điểm tương ứng góc cong 12 Dùng filter trược qua ảnh nhân vật Olaf trong phim Frozen Chúng ta thấy rằng, vị trí ảnh có dạng góc đặc trưng filter có giá trị lớn feature map, vị trí cịn lại cho giá trị thấp Điều có nghĩa là, filter phát thành cơng dạng góc/cạnh dự liệu đầu vào Tập nhiều filters cho phép bạn phát nhiều loại đặc trưng khác nhau,và giúp định danh đối tượng Các tham số tầng convolution: Kích thước filter, stride padding Kích thước filter tham số quan trọng tầng convolution Kích thước tỉ lệ thuận với số tham số cần học tầng convolution tham số định receptive field tầng Kích thước phổ biến filter 3x3 Ngoài ra, bạn cần lưu ý tham số stride, thể số pixel bạn cần phải dịch chuyển trượt filter qua ảnh Ở ví dụ bên dưới, với tham số stride 2, filter dịch chuyển pixel lần áp dụng phép convolution 13 2.1.2 Lớp kích hoạt phi tuyến (Nonlinear Layer) Lớp kích hoạt phi tuyến xây dựng để đảm bảo tính phi tuyến mơ hình huấn luyện sau thực loạt phép tính tốn tuyến tính qua lớp tích chập Lớp kích hoạt phi tuyến sử dụng hàm kích hoạt phi tuyến ReLU Sigmoid, Tanh, Leaky relu, Maxout… để giới hạn phạm vi biên độ cho phép giá trị đầu Trong số hàm kích hoạt này, hàm ReLU chọn cài đặt đơn giản, tốc độ xử lý nhanh mà đảm bảo tính tốn hiệu Phép tính tốn hàm ReLU đơn giản chuyển tất giá trị âm thành giá trị Lớp Relu áp dụng phía sau lớp tích chập, với đầu ảnh có kích thước giống với ảnh đầu vào, giá trị điểm ảnh hoàn toàn tương tự, trừ giá trị âm bị loại bỏ 2.1.3 Lớp lấy mẫu Pooling Layer (Pooling Layer) Sau hàm kích hoạt, thông thường sử dụng tầng pooling Một số loại pooling layer phổ biến max-pooling, average pooling, với chức giảm chiều tầng trước Với pooling có kích thước 2x2, bạn cần phải trược filter 2x2 vùng ảnh có kích thước tương tự sau tính max, hay average cho vùng ảnh Ý tưởng đằng sau tầng pooling vị trí tuyệt đối đặc trưng khơng gian ảnh khơng cịn cần cần thiết, thay vào vị trí tương đối đặc trưng đủ 14 để phân loại đối tượng Hơn giảm tầng pooling có khả giảm chiều nhiều, làm hạn chế overfit, giảm thời gian huấn luyện tốt 2.1.4 Lớp kết nối đầy đủ (Fully Connected Layer) Lớp cuối mơ hình CNN toán phân loại ảnh lớp Fully Connected Layer Lớp có chức đưa ma trận đặc trưng lớp trước vào mạng kết nối đầy đủ mạng nơ ron bình thường Flatten: chuyển ma trận đặc trưng lớp trước thành vector chứa xác suất đối tượng cần dự đoán (chuyển ảnh từ dạng ma trận mảng chiều) Sau ảnh truyền qua nhiều lớp CNN mơ hình học đặc điểm ảnh, output lớp CNN cuối ma trận, chuyển vector chiều IV MÃ LỆNH CHƯƠNG TRÌNH 1, Đăng nhập Google Colab Bước 1: Tạo thư mục dự án Đăng nhập Gmail, truy cập vào Drive Kích chọn Drive tơi/ chọn Ứng dụng khác Chọn Google Colaboratory, đặt tên thư mục Nhandienkhuonmat Morongbaitoan 2, Mã lệnh chương trình 2.1 Bài tốn 1: Chạy mơ hình nhận diện lứa tuổi Khai báo thư viện sử dụng Trong hầu hết trường hợp bạn thực Import thư viện lệnh import bạn thực phần mềm khác 15 Kết nối với Google Drive để đọc lưu liệu Chạy đoạn code kết sau: Chọn kết nối với Google Drive Chọn vào gmail Cuối cùng, bấm “cho phép” 16 Kết xuất thông báo: Khai báo đường dẫn thư mục chứa liệu ảnh Gán nhãn liệu: tên thứ tự nhãn tương ứng với tên thứ tự thư mục chứa ảnh huấn luyện kiểm định Tiền xử lý liệu ảnh với ImageGenertor Với ảnh, điểm ảnh tương ứng lưu dạng ma trận sữ liệu số khoảng từ đến 255 Tham số rescale cho phép chuyển giá trị pixel từ 0:255 thành thang đo 0:1 Đọc liệu train validation Target size ảnh chỉnh sửa kích thước theo nhóm làm ( 100, 1000) Batch_size = 30 tức lần học có 30 ảnh học hết từ qua khác tới hết ảnh 17 Kết cho thấy tập train có 358 ảnh Validation có 148 ảnh thuộc lớp Xây dựng mơ hình Mơ hình gồm tầng: Input image -> CNN1 -> CNN2 -> Fully connected layer > Output Thiết lập tham số để huấn luyện mơ hình Optimize ta chọn learing_rate 0,001 tức mơ hình cảm thấy họ khơng tốt tự động tăng tỷ lệ học lên 0,001 loss: hàm tính tốn sai số giá trị học giá trị thực tếcategorical_crossentropy dùng trường hợp dự đoán nhiều lớp metrics: thước đo để ta đánh giá độ xác accuracy mơ hình Huấn luyện mơ hình 18 Kết quả: EPOCHS số lần học lặp lại mơ hình Trong lần 74/100 tốt độ xác tệp train chạm tới 100% độ xác validation 98,33% tỷ lệ sai số 0,0253 Sử dụng mơ hình để nhận diện hình ảnh Ấn vào chọn tệp để chọn ảnh 19 2.2 Bài toán 2: Mở rộng toán + Khai báo thư viện cần sử dụng + Kết nối với Google Drive để đọc file lưu file + Khai báo đường dẫn đến thư mục chứa ảnh để huấn luyện kiểm định mô hình 20 + Gán nhãn tương ứng + Tiền xử lí liệu ảnh + Đọc hai liệu train, validation gán nhãn tương ứng với cấu trúc thư mục + Xây dựng mơ hình thêm lớp CNN3 CNN4 + Thiết lập tham số cho mơ hình 21 + Huấn luyện mơ hình Mơ hình tăng số vịng lặp lên 150 vòng Kết quả: + Lệnh lưu model huấn luyện vào thư mục drive + Sử dụng mơ hình để nhận diện lứa tuổi 22 V ĐỀ XUẤT NÂNG CAO MƠ HÌNH VÀ ĐÁNH GIÁ 1, Nhận xét chung toán Trong toán ta sử dụng thêm lớp Mạng nơ-ron tích chập( CNNs) tức tiếp tục dùng ma trận trượt ảnh để tìm thêm điểm bật Ví dụ, người cao tuổi sử dụng lớp CNNs phát trưng da nhăn tóc bạc sử dụng thêm lớp CNNs tìm thêm đặc trưng khác đen,… Ngồi tốn sử dụng số vòng lặp 150 Điều làm cho q trình dự đốn lứa tuổi có kết xác Nếu bạn nhìn kỹ tốn nhận hầu hết độ xác tệp train test lên tới số 100% Điều chứng tỏ mơ hình dự đốn tốt 23 2, Tóm tắt phần mở rộng mơ hình + Thêm lớp CNN CNN tốn + Thay đổi số lượng vịng lặp EPOCHS từ 100 toán thành 150 toán + Thiết lập tham số khác, thay tham số cô hướng dẫn lớp RMSprop thành Adam + Lưu model huấn luyện vào thư mục google drive Kết luận Từ trình thực hành đề tài: “Nhận diện diện lứa tuổi (trẻ con, trưởng thành, người già) thang máy để phát clip quảng cáo phù hợp với độ tuổi, áp dụng cho doanh nghiệp P&G.”, nhóm chúng em nhận thấy tầm quan trọng lợi ích AI nhận diện khuôn mặt thời đại cơng nghệ số phát triển mạnh mẽ Nhóm em tìm hiểu học cách thực hành google colab để áp dụng vào toán nhận diện thực tiễn, đem lại hiệu ứng dụng tốt đời sống - xã hội người Nói chung, AI đem lại nhiều lợi ích cho doanh nghiệp P&G họ tối ưu chi phí quảng cáo xác định đối tượng cần quảng cáo, đem lại hài lòng cho khách hàng thấy quảng cáo nhu cầu thân Không riêng P&G, mà marketing nhiều ngành nghề nên áp dụng AI nhận diện khn mặt để hịa nhập vào thời đại công nghệ số 4.0, bắt kịp với yêu cầu khách hàng Những lợi ích AI trí tuệ nhân tạo ứng dụng Computer Vision để nhận diện tự động lứa tuổi (bao gồm trẻ con, trưởng thành, cao tuổi) người thang máy với P&G nói riêng doanh nghiệp nói chung với lợi ích cho khách hàng: - AI nhận diện, đánh giá cá nhân người dựa lứa tuổi, sau đưa quảng cáo phù hợp với nhu cầu độ tuổi Q trình tìm hiểu nhu cầu cụ thể khách hàng rút ngắn, giúp doanh nghiệp tiết kiệm thời gian chi phí thu thập liệu tạo cảm giác hài lịng cho khách hàng - Có thể thấy việc ứng dụng trí tuệ nhân tạo vào thực tiễn thang máy để phát quảng cáo phù hợp giúp P&G tối ưu hố chi phí quảng cáo, có linh hoạt việc lựa chọn đưa quảng cáo sản phẩm đến với khách hàng thời gian thang máy, từ hiệu marketing doanh nghiệp cải thiện đạt hiệu cao so với doanh nghiệp không tận dụng công nghệ AI - Sự kết hợp doanh nghiệp công nghệ đại điểm cộng lớn mắt khách hàng Điều thể doanh nghiệp biết cách khai thác nhu cầu, thu hút hiếu kỳ người thang máy Từ thấy chiến lược marketing kết hợp AI đem lại hiệu để tâm định khách hàng dành cho sản phẩm công ty họ xem quảng cáo thang máy, từ phát triển mở rộng doanh nghiệp để tiếp cận khách hàng cách dễ dàng 24 Tài liệu tham khảo Bài toán 1: https://colab.research.google.com/drive/1kByM7fklXUklN3l95rGnxYtvZH7qet9 Bài toán 2: Mở rộng toán https://colab.research.google.com/drive/1PiCIZ4hhigkG9xlPlI5cZKp9PGSxT MGX Học viện Ngân hàng khoa Hệ thống thông tin quản lý, Chương Thị giác máy tính (Computer Vision), Side giảng mơn Trí tuệ nhân tạo kinh doanh, Học viện Ngân hàng Trang chủ doanh nghiệp P&G Việt Nam, https://vn.pg.com/ Khánh Hà (2020), “P&G Việt Nam “đuối sức” đường trường?”, https://diendandoanhnghiep.vn/p-g-viet-nam-duoi-suc-duong-truong177716.html 25 ... thực hành đề tài: ? ?Nhận diện diện lứa tuổi (trẻ con, trưởng thành, người già) thang máy để phát clip quảng cáo phù hợp với độ tuổi, áp dụng cho doanh nghiệp P&G.”, nhóm chúng em nhận thấy tầm quan... trọng trí tuệ nhân tạo cách mạng công nghệ 4.0 này, em đề xuất công nghệ AI Computer Vision nhiều doanh nghiệp sử dụng : ? ?Nhận diện diện lứa tuổi (trẻ con, trưởng thành, người già) thang máy để phát. .. giản trí tuệ nhân tạo kinh doanh cơng việc ứng dụng trí tuệ nhân tạo (AI) hoạt động kinh doanh Sử dụng trí tuệ nhân tạo xu hướng tất yếu trình phát triển sản xuất, kinh doanh, giúp doanh nghiệp

Ngày đăng: 28/10/2022, 16:30

TỪ KHÓA LIÊN QUAN

w