1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Tiểu luận) đề tài nhận diện giới tính thông qua avatarmạng xã hội facebook

32 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 4,8 MB

Nội dung

Phép tích chập là phép nhân giữa mỗi điểm ảnh trong feature vớigiá trị của điểm ảnh tương ứng trong hình ảnh đó.Cấu trúc: Trang 10 Thông thường, một ảnh sẽ được lan truyền qua lớp tích

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ BÀI KIỂM TRA HAI Học phần: Trí tuệ nhân tạo kinh doanh ĐỀ TÀI: NHẬN DIỆN GIỚI TÍNH THÔNG QUA AVATAR MẠNG XÃ HỘI FACEBOOK Giảng viên hướng dẫn : Ngơ Thùy Linh Lớp : IS42A_04 Nhóm thực : Nhóm 01 Hà nội, ngày tháng năm 2021 Danh sách thành viên nhóm Học tên - Mã sinh viên Số điện thoại Tìm data 10% Chạy mơ hình Làm báo cáo 40% 50% Tổng TRỊNH THỊ THẢO – 22A4030568 0364396146 2% 8% 10% 20% VŨ THỊ LAN ANH – 22A4030459 0385897566 1% 8% 10% 19% NGUYỄN PHƯƠNG HẢI LINH – 0355723921 3% 8% 11% 22% PHẠM THÀNH VIỆT – 22A4030071 0369669258 2% 8% 9% 19% NGUYỄN LÊ HỒNG NGỌC – 0949072305 2% 8% 10% 20% 22A4050239 23A4050271 Tìm liệu chạy mơ hình phần cơng cho tất thành viên Viết báo cáo Phần I: Phạm Thành Việt + Trịnh Thị Thảo Phần II: Nguyễn Lê Hồng Ngọc + Trịnh Thị Thảo Phẩn III: Nguyễn Lê Hồng Ngọc Phần IV: Nguyễn Phương Hải Linh + Trịnh Thị Thảo Phần V: Vũ Thị Lan Anh MỤC LỤC I Giới thiệu chung .1 1.1 Giới thiệu chúng facebook hoạt động quảng cáo 1.2 Phát biểu tốn nhận dạng giới tính .1 1.3 Lý chọn đề tài: II Chuẩn bị liệu 2.1 Cách thức thu nhập liệu .2 2.2 Kiểu liệu ảnh cần thu nhập 2.3 Số lượng ảnh kiểu liệu ảnh 2.4 Cách thức tổ chức liệu ảnh máy III Giới thiệu tổng quan thuật toán CNN .4 Đặc trưng: Tích chập Cấu trúc: IV Mã lệnh chương trình 4.1 Tạo thư mục dự án 4.2 Đọc liệu tiền xử lý ảnh 4.3 Xây dựng mơ hình 10 4.4 Huấn luyện mơ hình: 14 4.5 Tìm mơ hình tối ưu .16 4.6 Sử dụng mơ hình: 19 V Kết luận 21 5.1 Nhận định 21 5.2 Ý nghĩa thực tế 23 Tài liệu tham khảo 24 Mục lục hình ảnh Hình ảnh 1: Cơng thức Relu ………………………………………………………….11 Hình ảnh 2: Lớp Flatten …………………………………………………………… 12 Hình ảnh 3: Cơng thức Softmax 13 Mục lục bảng Bảng 1: Kết thực nghiệm ……………………………………………………… 22 I Giới thiệu chung 1.1 Giới thiệu chúng facebook hoạt động quảng cáo Facebook trang mạng xã hội cho phép người giữ kết nối trị chuyện với người khác có quan điểm cộng đồng trực tuyến (Rohani & Hock, 2010) Facebook sáng lập Mark Zuckerberg vào năm 2004 trường Đại học Harvard, sau năm 2006 facebook trở thành mạng xã hội thành công Mỹ, vào năm 2011 sử dụng phổ biến khắp giới (Greerand & Yan, 2011) Ngày nay, Facebook chiếm vị trí dẫn đầu lượng người dùng phổ biến toàn giới Đặc biệt Việt Nam, từ cá nhân đơn vị doanh nghiệp tổ chức Họ sử dụng với mục đích đa dạng khác nhằm thỏa mãn nhu cầu xã hội người giữ liên lạc với người quen quảng cáo sản phẩm (Lukka & James, 2014) Facebook Ads viết tắt cụm từ Facebook Advertising, phương thức quảng cáo sử dụng phương tiện Facebook Facebook kiếm 82% doanh thu từ quảng cáo (Wolff, 2012, P 70) Quảng cáo hiển thị phân phối cách tự động tùy vào đặc điểm cá nhân người dùng nhân học, vị trí địa lý, sở thích… 1.2 Phát biểu tốn nhận dạng giới tính Việc phân tích trích xuất thơng tin khn mặt nhà khoa học nghiên cứu từ năm 90 kỷ trước Điều có nhiều thơng tin bổ ích khai thác từ ảnh khn mặt, ví dụ danh tính, cảm xúc, giới tính Trong số thơng tin khai thác giới tính thuộc tính quan trọng có nhiều ứng dụng thực tế thống kê dân số, xác định giới tính để phân loại khách hàng, Tuy nhiên, máy tính đọc hiểu thơng tin ảnh, hoạt động hiệu với nhóm người định, gặp khó khăn nhận dạng người cộng đồng LGBT, người chuyển giới Đặc biệt, việc ứng dụng gây nhiều tranh cãi liên quan đến vấn đề kỳ thị hay phân biệt gây chia rẽ cộng đồng Hoặc người độ tuổi khác có đặc điểm nhận dạng khác nhau, hay khác biệt rõ rệt người châu á, châu âu, người lãnh thổ khác nhau; Để có hình ảnh đối chiếu, công nghệ nhận dạng khuôn mặt yêu cầu khách hàng phải quay rõ mặt phía camera khơng sử dụng trang, mũ, nón Làm giảm trải nghiệm khách hàng Tổng kết lại có nhiều khó khăn q trình nghiên cứu, triển khai ứng dụng toán nhận dạng giới tính đóng vai trị quan trọng dạng toán nhận dạng phân lớp Là tảng sở để phát triển thuật tốn khác, đóng góp vai trị quan trọng cơng nghiên cứu người hành vi họ 1.3 Lý chọn đề tài: Cùng với phát triển mạnh mẽ kinh tế, sống người ngày cải thiện hơn, có thay đổi tích cực đặc biệt họ dành nhiều thời gian cho mạng xã hội Phần lớn kiến thức, thông tin hay xu hướng người tiếp thu qua kênh mạng facebook, instargram, báo điện tử Theo thống kê facebook lượng người dùng facebook Việt Nam tính đến tháng năm 2020 đạt đến 69.280.000, chiếm 70,1% dân số Việt Nam Nhờ chức kết nối với lượng lớn người xã hội, mà cá nhân, tổ chức tận dụng kênh mạng để quảng bá sản phẩm chất lượng dịch vụ Như hoạt động quảng cáo truyền thơng tận dụng tốt lợi mạng xã hội mang lại tạo lợi nhuận vơ lớn Việc quảng cáo mạng xã hội facebook nghiên cứu thực triển khai mạnh mẽ Việc facebook tìm hiểu người dùng qua việc theo dõi trang nguồn truy cập từ khóa tìm kiếm nhiều để đề suất sản phẩm, dịch vụ cho khách hàng Tuy nhiên có nhiều vấn đề sảy lo ngại người dùng riêng tư, hoạt động cá nhân họ liệu có theo dõi họ hay không? Thông tin họ người nhìn thấy, chúng bị sử dụng vào mục đích gì? Thật vậy, hoạt động quảng cáo sản phẩm đến người tiêu dùng có bước chuyển biến tốt, tính thời gian dài sau để phát triển bền vững cần cải tiến Vấn đề đặt làm để người dùng vượt qua rào cản lo ngại bảo mật thơng tin, an tồn cá nhân để n tâm sử dụng facebook đông thời đảm bảo sản phẩm dịch vụ đến gần với khách hàng tiềm Vì vậy, nhóm lựa chọn đề tài “Nhận diện giới tính thơng qua avatar mạng xã hội Facebook” Việc phân loại người dùng facebook thành lớp khác nhau, dễ dàng nhìn thấy đặc điểm chung, xu hướng biến đổi riêng nhóm khách hàng Dễ dàng thực việc đưa thông tin truyền thông đến với người tiêu dùng cách thông minh hiệu II Chuẩn bị liệu 2.1 Cách thức thu nhập liệu Document continues below Discover more from: trí tuệ nahan tạo kinh… 212IS42 Học viện Ngân hàng 111 documents Go to course Bai tap toan cho ban 10 tinh soroban da nen trí tuệ nahan tạo… 100% (1) Bài thi cuối kì ttnt 21 Trí tuệ nhân tạo trí tuệ nahan tạo… 100% (1) Trí tuệ nhân tạo 22 kinh doanh -… trí tuệ nahan tạo… 100% (1) Chương - Hướng dẫn cài đặt… trí tuệ nahan tạo… 100% (1) 19.Lê Thị Minh Hiền trí tuệ 100% (1) tạo…facebook, Dữ liệu lấy từ hình ảnh địa diện cá nhânnahan người dùng thư mục ảnh có mặt chủ tài khoản ảnh bạn bè gắn thẻ Trên thực tế, nhóm thu thập liệu có sẵn Kaggle Các liệu ảnh 06 IS42A16 BTL kiểm tra theo u cầu có khn mặt người để nhận dạng đảm bảoAI thời không bị mờ Tùy nhiên tệp liệu kích thước lớn,Dự đối báo với việc họctiết máy qu… 22 tập validation 5.500 ảnh, ban đầu nhiều thời gian Tập training 23.000 ảnh, trí tuệ 75% (4) nhóm định tiến hành lọc xếp lại liệu Cụ thể trang nguồn data: nahan tạo… https://www.kaggle.com/cashutosh/gender-classification-dataset 2.2 Kiểu liệu ảnh cần thu nhập Ảnh lấy trực tiếp từ facebook cá nhân người dùng khơng giới hạn kích thước Nhưng bắt buộc phải thấy khuôn mặt, trường hợp chủ sở hữu không đặt ảnh thân làm ảnh đại diện linh động chuyển sang thu thập ảnh mà người cơng khai trang cá nhân gắn thẻ có xác thực gương mặt chủ, ảnh phải rõ nét, không bị mờ Thuật tiện cho công đoạn phân loại giới tính 2.3 Số lượng ảnh kiểu liệu ảnh Số lượng ảnh cần thu thập đủ theo loại giới tính, đảm bảo có cân xứng mặt số lượng khơng có ảnh bị trùng, không lấy nhiều ảnh người Cụ thể:  Nam 185 ảnh (trong mơ hình gán nhãn male)  Nữ 185 ảnh (trong mơ hình gán nhãn female) 2.4 Cách thức tổ chức liệu ảnh máy Số lượng liệu thu thập mục 2.3 xếp vào ba mục training, vadilation, test, không chồng chéo lên tức ảnh bị trùng:  Training gồm 150 ảnh, female có 75 ảnh male có 75 ảnh  Validation gồm 120 ảnh, female có 60 ảnh male có 60 ảnh  Test gồm 100 ảnh, female có 50 ảnh, male có 50 ảnh III Giới thiệu tổng quan thuật toán CNN Để dạy thuật tốn nhận diện đối tượng hình ảnh, ta sử dụng loại mạng nơ- ron nhân tạo (Artificial Neural Network): Convolutional Neural Network (CNN – Mạng nơ-ron tích chập) Tên dựa phép tính quan trọng sử dụng mạng tích chập CNN mơ hình Deep Learning tiên tiến giúp cho xây dựng hệ thống thơng minh với độ xác cao Đặc trưng: CNN so sánh hình ảnh theo mảnh, mảnh gọi feature (đặc trưng) Mỗi feature coi hình ảnh mini, tức chúng mảng hai chiều nhỏ Các feature khớp với khía cạnh chung ảnh nghĩa feature tương ứng với khía cạnh ảnh chúng khớp lại với Tích chập Khi xem hình ảnh mới, CNN khơng biết vị trí feature khớp với đâu, thử chúng tất vị trí khác Trong q trình chúng tạo thành lọc, gọi filter Và để thực điều này, sử dụng phép toán tích chập Phép tích chập phép nhân điểm ảnh feature với giá trị điểm ảnh tương ứng hình ảnh Cấu trúc: CNN bao gồm tập hợp lớp bao gồm: lớp tích chập (Convolutional); lớp kích hoạt phi tuyến (Non Linearity); lớp lấy mẫu (Pooling); lớp kết nối đầy đủ (Fullyconnected) Các lớp liên kết với theo thứ tự định Thông thường, ảnh lan truyền qua lớp tích chập lớp kích hoạt phi tuyến đầu tiên, sau giá trị tính toán lan truyền qua lớp lấy mẫu, ba lớp tích chập lớp kích hoạt phi tuyến lớp lấy mẫu lặp lại nhiều lần mạng Và sau lan truyền qua kết nối đầy đủ để tính sác xuất ảnh chứa vật thể Cấu trúc mạng CNN bao gồm: lớp tích chập Convolution Layer, lớp kích hoạt phi tuyến, lớp lấy mẫu Pooling Layer, lớp kết nối đầy đủ Fully Connected Layer IV Mã lệnh chương trình 4.1 Tạo thư mục dự án Gmail thực hiện: hongoc106@gmail.com Đăng nhập vào Gmail thực => Chọn google drive Tạo thư mục mới: 256 thể việc có 256 unit layer (đầu linear regression mơ hình 256); Dense lớp ẩn thứ = 512 thể việc có 512 unit layer (đầu linear regression mơ hình 512) - Softmax: hàm softmax tính khả xuất class tổng số tất class xuất Sau đó, xác suất sử dụng để xác định class mục tiêu cho input Cụ thể, hàm softmax biến vector k chiều có giá trị thực thành vector k chiều có giá trị thực có tổng Giá trị nhập dương, âm, lớn 1, hàm softmax biến chúng thành giá trị nằm khoảng (0:1] + Hàm softmax tối ưu tính tốn xác suất tối đa tham số mơ hình + Tính chất hàm softmax khiến hàm phù hợp với thơng dịch xác suất, hữu ích Machine Learning (Học máy) + Chuẩn hóa softmax cách để giảm thiểu ảnh hưởng giá trị cực trị hay liệu ngoại lai liệu mà chỉnh sửa liệu ban đầu 13 Hình 3: cơng thức Softmax - Sau ảnh truyền qua lớp CNN mơ hình học đặc điểm ảnh, output lớp CNN cuối ma trận, chuyển vector chiều Thiết lâp tham số để huấn luyện mơ hình: - Compile: chọn tham số để huấn luyện mơ hình - Optimizer: thuật tốn huấn luyện mơ hình Thuật tốn sở để xây dựng mơ hình Neutral Network với mục đích học đặc điểm liệu đầu từ tối ưu hóa model Ở đây, ta dùng thuật toán tối ưu RMSprop để giải vấn đề tỷ lệ học giảm dần, khiến cho việc training tối ưu RMSprop thuật tốn tối ưu hóa thiết kế cho mạng nơ-ron, giải vấn đề tỷ lệ học giảm dần - Lr: learning rate – dạng float, tốc độ học siêu tham số sử dụng việc huấn luyện mạng nơ-ron Giá trị số tương đương, nằm khoảng Chúng ta cần phải kiểm tra điều chỉnh mơ hình trước biết xác giá trị cần đặt cho nó, thường phổ biến khoảng 0.01 đến 0.0001 Tốc độ học kiểm soát tốc độ mơ hình thay đổi trọng số để phù hợp với toán Tốc độ học giúp mạng nơ-ron huấn luyện nhanh làm giảm độ xác mơ hình - Hàm mát Loss: tính tốn sai số giá trị học giá trị thực tế, sử dụng ’categorical_crossentropy’ để dự đoán nhiều lớp - Metric=[‘acc’] dùng để đánh giá độ xác model Chúng ta biên dịch mạng nơ-ron lệnh ‘model.compile’ Mơ hình huấn luyện với hàm loss categorical_crossentropy; tiêu chí huấn luyện accuracy; sử dụng metric acc để đánh giá độ xác mơ hình 14 4.4 Huấn luyện mơ hình: Để huấn luyện mơ hình, ta gọi ‘model.fit’ - model.fit: yêu cầu trình tạo liệu đầu vào để chạy mơ hình, bao gồm: train_generator validation_generator - EPOCHS: số lần mơ hình đựơc đào tạo tồn tập liệu; Epoch siêu tham số ANN – Artificial Neural Networks (mạng lưới trí tuệ nhân tạo), epoch hoàn thành tất liệu training đưa vào tràn Neural Network lần (đã bao gồm bước backward forward) - Với epochs=30, độ xác sai số liệu thử nghiệm 30 lần, đưa 30 lần mơ hình đào tạo tồn tập liệu Mơ hình lặp lặp lại 30 lần, bắt đầu đưa dự đốn xác đến đâu dùng thuật tốn huấn luyện mơ hình để cải tiến dự đốn thể lặp lặp lại Dữ liệu đưa cho mơ hình học máy sau ‘hàm fit’ thực việc tìm mối quan hệ liệu đào tạo nhãn thực tế thử 30 lần để tìm mối liên hệ xác - Step_per_epoch: tổng số bước để tạo từ trình tạo trước khai báo epoch kết thúc bắt đầu epoch Nó thường phải số lượng mẫu liệu chia cho kích thước lô - Validation_step tương tự step_per_epoch chạy liệu xác nhận thiết lập thay chạy liệu huấn luyện - Verbose sử dụng đào tạo mơ hình giúp cải thiện độ xác - Output: 15 - Loss acc sai số độ xác tập Training; val_loss val_acc sai số độ xác tập Validation - Loss nhỏ acc tập Training cải thiện, tương tự, val_loss nhỏ val_acc tập Validation tốt 16 4.5 Tìm mơ hình tối ưu Mơ hình gốc: - Kích thước ảnh 50,50 Hai lớp CNN:  Lớp CNN thứ có 32 lọc, lọc có kích thước 3x3  Lớp CNN thứ hai có 64 lọc, lọc có kích thước 3x3 - Một lớp ẩn với lọc 512 - Epochs = 30 - Step_per_epouch = - Verbose = - Validation_steps = Độ xác mơ hình ban đầu 84% có ảnh sai 50 ảnh thử Thay đổi kích thước ảnh - Với kích thước 100x100 mơ hình đạt với độ xác 82%, dự đoán sai ảnh 50 ảnh Hiệu suất mơ hình bị giảm - Với kích thước ảnh 150x150 mơ hình đạt độ xác 76%, dự đoán sai 12 ảnh 50 ảnh Hiệu suất mơ hình bị giảm - Với kích thước ảnh 200x200 mơ hình đạt độ xác 82%, dự đoán sai ảnh 50 ảnh Hiệu suất mơ hình bị giảm Chốt lại, tăng kích thước ảnh lên mơ hình chạy ổn so với mơ hình gốc ban đầu Lượng ảnh dự đoán 50 ảnh kiểm tra ổn định, nhiên khơng thấy tăng khả xác mơ hình Nên giữ kích thước ảnh ban đầu mơ hình gốc (50,50) Tăng lớp CNN mơ hình Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 128 lọc Độ xác mơ hình mơ hình 76%, có 12 ảnh nhận dạng giới tính sai 50 ảnh Giảm so với mơ hình gốc ban đầu Mơ hình hai có: Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 64 lọc 17 Độ xác mơ hình 80%, có 10 ảnh nhận dạng giới tính sai 50 ảnh thử Giảm so với mơ hình ban đầu Mơ hình ba có: Lớp CNN với 32 lọc Lớp CNN với 64 lọc Lớp CNN với 128 lọc Lớp CNN với 256 lọc Độ xác mơ hình 58%, có 21 ảnh sai 50 ảnh đưa vào kiểm tra Giảm mạnh so với mơ hình gốc Như việc tăng lớp CNN khơng làm cho mơ hình chạy hiệu Nếu tăng thêm lớp CNN làm cho mơ hình trở nên cồng kềnh, khó đưa kết nhanh chóng xác Thay đổi lọc lớp CNN Lớp CNN với 32 lọc Lớp CNN với 32 lọc Độ xác mơ hình 78%, 11 ảnh saitrong 50 ảnh đưa vào để kiểm tra mơ hình nhận dạng sai 11 ảnh Hiệu suất bị giảm so với mơ hình gốc ban đầu Mơ hình năm có: Lớp CNN với 64 lọc Lớp CNN với 64 lọc Độ xác mơ hình 78%, có 11 ảnh sai 50 ảnh thử Hiệu suất bị giảm so với mơ hình gốc ban đầu Lớp CNN với 64 lọc Lớp CNN với 128 lọc Độ xác mơ hình 83%, có ảnh sai tổng số 50 ảnh đưa vào mơ hình để kiểm tra Hiệu suất mơ hình tăng Lớp CNN với 128 lọc Lớp CNN với 128 lọc Độ xác mơ hình đạt 82%, dự đốn sai ảnh tổng số 50 ảnh đưa vào mơ hình để kiểm tra Hiệu suất giảm nhẹ so với mô hình gốc ban đầu Như việc thay đổi lọc, cụ thể tăng lọc lớp CNN lên giúp cho mơ hình khơng q cồng kềnh mà chạy với hiệu suất ổn định Thay đổi kích thước lọc convolutional lớp CNN 18 Lớp CNN có 32 lọc, lọc có kích thước 5x5 Lớp CNN có 64 lọc, lọc có kích thước 5x5 Độ xác mơ hình đạt 74%, dự đốn sai 13 ảnh 50 ảnh đưa vào mơ hình để kiểm tra Tuy nhiên hiệu suất mơ hình đạt lại bị giảm so với mơ hình ban đầu Lớp CNN có 32 lọc, lọc có kích thước 7x7 Lớp CNN có 64 lọc, mội lọc có kích thước 7x7 Độ xác mơ hình đạt 80%, dự đốn sai 10 ảnh 50 đưa vào mơ hình Hiệu suất mơ hình giảm Như việc thay đổi kích thước lọc khơng làm cho mơ hình hoạt động hiệu Nên giữ nguyên kích thước lọc ban đầu 3x3 Tăng thêm lớp ẩn Lớp ẩn có 256 lọc Lớp ẩn có 512 lọc Độ xác mơ hình đạt 86%, dự đoán sai 50 ảnh đưa vào kiểm tra Hiệu suất mơ hình tăng Lớp ẩn có 512 lọc Lớp ẩn có 512 lọc Độ xác 70%, dự đốn sai 15 ảnh tổng số 50 ảnh kiểm tra Hiệu suất mơ hình giảm Lớp ẩn có 512 lọc Lớp ẩn có 1024 lọc Độ xác 66%, dự đoán sai 17 tổng 50 ảnh kiểm tra Hiệu suất mơ hình giảm mạnh lớp ẩn có 512 lọc Lớp ẩn có 512 lọc Lớp ẩn có 512 lọc Độ xác 64%, dự đốn sai 18 tổng số 50 ảnh kiểm tra Hiệu suất mô hình bị giảm Như tăng thêm lớp ẩn với lọc lớp ẩn thứ 256 lọc lớn ẩn thứ 512 mơ hình hoạt động tốt hơn, nâng cao độ xác Thay đổi lọc lớp ẩn 19 - Lớp ẩn có 256 lọc Độ xác mơ hình 72%, dự đốn sai 14 ảnh 50 ảnh Hiệu suất mơ hình giảm - Lớp ẩn có 1024 lọc Độ xác mơ hình 82%, dự đốn sai 50 ảnh Hiệu suất mơ hình giảm - Lớp ẩn có 128 lọc Độ xác 64%, dự đốn sai 18 50 ảnh Hiệu suất mơ hình giảm Như lọc lớp ẩn 1024 mơ hình chạy ổn định với hiệu suất giống mơ hình gốc ban đầu, có giảm khơng đáng kể Nếu giảm lọc lớp ẩn hiệu suất mơ hình bắt đầu giảm mạnh Vì lọc lớp ẩn giữ ngun mơ hình gốc khơng thay đổi Mơ hình tối ưu cuối - Kích thước ảnh đầu vào 50x50 - Hai lớp CNN:  Lớp CNN thứ có 32 lọc, lọc có kích thước 3x3  Lớp CNN thứ hai có 64 lọc, lọc có kích thước 3x3 - Hai lớp ẩn  Lớp ẩn thứ 256 lọc  Lớp ẩn thứ hai 512 lọc - Epochs = 30 - Step_per_epouch = - Verbose = - Validation_steps = 4.6 Sử dụng mơ hình: 20 - Khai báo thư viện - Sau tải hình ảnh muốn dự đốn - img=image.load_img(path,target_size=100,100)): tải hình ảnh thay đổi kích thước hình ảnh thành (100,100) - hàm img_to_array() dùng để them kênh cho RGB cho hình ảnh màu xám - expand_dim() sử dụng để thêm số lượng hình ảnh - np.vstack: nối mảng theo chiều dọc - batch_size: số lượng mẫu liệu batch Chúng ta đưa hết toàn liệu vào huấn luyện epoch, cần phải chia tập liệu thành phần (number of batch), phần có kích thước batch_size (tập liệu có 100, batch_size 10)  Thử nghiệm mơ hình: Nhấn chạy đoạn code trên, phía đoạn mã code xuất hộp thoại Choose files => chọn ảnh cần phân loại đợi kết 21 V Kết luận 5.1 Nhận định  Kết mơ hình chạy được: Có hai giá trị mà máy đưa tương ứng với hai giá trị mong đợi, 0.1 tương ứng với male 1.0 tương ứng với female Đây gán nhãn code ban đầu tạo thành, sau trình cho máy nhận dạng cho kết nữ giá trị tương ứng với có cịn giá trị thứ hai số tương ứng với khơng có giá trị Tương tự máy nhận dạng nam giá trị thứ tương ứng với giá trị giá trị thứ hai 22 Tuy nhiên lúc máy học đưa giá trị đẹp 1.0 hay 0.1, dãy số dài thập phân Tất nhiên sảy trường hợp kết đưa male female sai, lẽ ta nhìn thấy giá trị đẹp 1.0 khơng hồn tồn Việc đưa giá trị thập phân định kết việc hai giá trị giá trị cao Ví dụ (1.00000000e + 00, 1.11213524e – 29) 1.00000000e + 00 = 2.7182 1.11213524e – 29 = -25.976 Như giá trị thứ cao giá trị thứ hai, nghĩa khả người nữ cao nam, nên máy đưa kết nữ - female  Kết thực nghiệm: Female Male Dự đoán 47 30 Dự đoán sai 20 94% 60% Tỷ lệ dự đốn xác Thuật toán đơn giản, dễ hiểu, dễ cài đặt thời gian thực không lâu, không phức tạp Với nhận diện giới tính nữ (female) có tỷ lệ độ xác tương đối cao 94 % Cịn với giới nhận diện giới tính nam (male) có tỷ lệ độ xác thấp 60 %, lý do số ảnh có đặc điểm nhận dạng giới tính nam (màu sắc, đặc điểm khn mặt, …) có nét giống với giới tính nữ Đây mơ hình mới, đem lại hiệu tích cực, ln sáng tạo đổi mới, phát triển Mơ hình nhận diện giới tính khơng ứng dụng với Facebook mà cịn lĩnh vực khác sử dụng ứng dụng mua sắm trực tuyến ( shopee, lazada, tiki, amazon, ) dùng để phân loại, thống kê loại khách hàng nam nữ, từ đưa đề xuất sản phẩm phù hợp, tăng hài lòng khách hàng, đẩy mạnh tiêu thụ sản phẩm Mơ hình cịn dễ dàng sử dụng liệu khơng 23 lấy từ ảnh mà cịn lấy ảnh qua ảnh đăng ứng dụng, vô linh hoạt, tiên tiến, tiết kiệm thời gian Với Facebook, để tăng trải nghiệm khách hàng tại, thu hút khách hàng cách tìm hiểu sở thích họ mơ hình nhận diện giới tính lại có ích Với khách hàng tại, phân loại giới tính khách hàng giúp ta tìm sở thích nhóm khách hàng đó, chia sở thích theo nhóm khách hàng đưa đề xuất nội dung, quảng cáo sản phẩm theo sở thích họ Tăng yêu thích khách hàng cầu nối cho khách hàng Với nhóm khách hàng mới, liệu thu thập từ khách hàng tại, từ đề xuất, đưa gợi ý thơng tin thú vị mà họ quan tâm Mơ hình có độ xác cao 86% mơ hình cịn số hạn chế mà nhóm chưa khắc phục góc chụp ảnh mặt người góc nghiêng, số ảnh cịn mờ hay có ảnh nam tóc để dài, trang điểm hay đeo kính, khiến nhận dạng bị sai Có thể số lượng liệu ảnh nhóm thu thập cịn nên khó tránh khỏi sai sót, số thơng số kích thước ảnh, vịng lặp, … cịn chưa tối ưu Bên cạnh đó, giới tính dừng lại nữ (female) nam (male), nhận diện qua bên ngồi, cịn có giới tính thứ ba nhiều nước cơng nhận, họ có nét khn mặt số đặc điểm cịn có chút mâu thuẫn nên máy khó nhận diện xác Để có mơ hình hồn chỉnh hơn, nhóm chúng em tự nhận thấy cần tìm kiếm thêm nguồn liệu xác, đa dạng hơn, điều chỉnh tham số xử lí liệu để tìm mơ hình tối ưu cho độ xác cao 5.2 Ý nghĩa thực tế Phân loại giới tính giúp cho doanh nghiệp có nhìn thực tế xác nhóm khách hàng Dễ dàng theo dõi hoạt động, sản phẩm mà họ yêu thích, đề xuất quảng cáo cách thơng minh có chọn lọc, xa cung cấp số liệu hữu ích cho số công ty nghiên cứu thị trường để từ dễ dàng ứng dụng đề xuất sản phẩm cho khách hàng Ngoài ý nghĩa phân loại giới tính khách hàng để doanh nghiệp có nhìn thực tế hơn, đề xuất sản phẩm cho người, đối tượng, tăng hài lòng khách hàng mơ hình cịn định hướng phát triển vào thực tế cho nhiều lĩnh vực khác Ví dụ ứng dụng hẹn hị sử dụng để kiểm tra giới tính mà người dùng khai báo hồ sơ đề xuất ghép cặp dựa ảnh đại diện Từ mơ hình nhận diện giới tính phát triển lên nhận diện độ tuổi qua hình ảnh Đối với ngành ngân hàng, cho phép khách hàng mở tài khoản cách sử dụng selfie - xác minh giới tính đặc điểm khuôn mặt khách hàng, thông tin khai báo khách hàng họ muốn mở tài khoản thoải mái 24 nhà họ Đây việc làm có lợi cho ngân hàng, họ thu hút nhiều khách hàng tận dụng thời gian, nhân lực để thực nhiệm vụ quan trọng hơn… Rộng hơn, dân số không ngừng tăng, để thống kê dân số, phân loại giới tính người thời gian Chính vậy, sử dụng AI để cải thiện vấn đề hợp lí, đơn giản mà dễ thực Trên hệ thống liệu quốc gia, ảnh chứng minh thư người dân ghi lại có tác dụng để xác minh giới tính, đặc điểm nhận dạng, quê quán, quốc tịch… Đây ứng dụng AI nhận diện hình ảnh 25 Tài liệu tham khảo Link tham khảo lấy liệu https://www.kaggle.com/cashutosh/gender-classification-dataset Tài liệu tiếng Anh: Greerand, J D., & Yan, Y (2011) Newspapers connect with readers through multiple digital tools Newspaper Research Journal Lukka, V., & James, P T (2014) Attitudes toward Facebook advertising Journal of management and Marketing Research Rohani, V A., & Hock, O S (2010) On social network Web sites: Definition, features, architectures and analysis tools Journal of Advances in Computer Research Tài liệu tiếng Việt: Anh Tran - Giới thiệu chung Facebook - Kienthucvui.vn https://kienthucvui.vn/facebook-la-gi-tim-hieu-ve-mang-xa-hoi-facebook-183/ Cách đặt batch_size, step_per epoch bước xác thực, qastack https://qastack.vn/datascience/29719/how-to-set-batch-size-steps-per-epoch-andvalidation-steps Có nghĩa có epochs =30, stackexchange https://ai.stackexchange.com/questions/19922/what-does-it-mean-to-have-epochs-30in-keras-fit-method-given-certain-data Định nghĩa giải thích ý nghĩa verbose, gocnhintangphat https://gocnhintangphat.com/verbose-la-gi/ Giới thiệu matplotlib, viblo https://viblo.asia/p/gioi-thieu-ve-matplotlib-mot-thu-vien-rat-huu-ich-cua-pythondung-de-ve-do-thi-yMnKMN6gZ7P Làm để hiểu acc val_loss val_acc mơ hình, helpex https://helpex.vn/question/lam-the-nao-de-hieu-mat-acc-valloss-valacc-trong-viec-lapmo-hinh-keras-60dd9a7d7a3582d36e896986 Những cần thiết lập step_per_epoch, stackexhange https://datascience.stackexchange.com/questions/47405/what-to-set-in-steps-perepoch-in-keras-fit-generator Mạng nơ ron tích chập CNN https://drive.google.com/file/d/1SfvDRUpkeyrSeDCrv6mt0n-cYrN2VIdO/view Quảng cáo Facebook - brandinfo.biz 26 https://brandinfo.biz/quang-cao-facebook? fbclid=IwAR3XLiy5YcP8mdebxo_ncoIjKJCH6VVf7LLPYidgIy34Wc40w1wfsWh9EXU#mc etoc_1emh5lg6u28 10 Thuật toán CNN- Convolututional neural network, topdev.vn https://topdev.vn/blog/thuat-toan-cnn-convolutional-neural-network/ 11 2016 Lợi ích quảng cáo Facebook - Ưu nhược điểm - adwordsvietnam.com https://www.adwordsvietnam.com/quang-cao-facebook/kien-thuc-facebook/268-loiich-cua-quang-cao-facebook-uu-va-nhuoc-diem.html 12 (2020) Người dùng facebook Việt Nam Quảng cáo tực tuyến 24h.vn https://quangcaotructuyen24h.vn/nguoi-dung-facebook-viet-nam-2020/ 27

Ngày đăng: 03/01/2024, 13:42

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN