HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA AN TOÀN THÔNG TIN BÁO CÁO TIỂU LUẬN CUỐI KHÓA HỌC PHẦN: Phương pháp luận nghiên cứu khoa học MÃ HỌC PHẦN: SKD1108 ĐỀ THI KẾT THÚC HỌC PHẦN
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA AN TOÀN THÔNG TIN
BÁO CÁO TIỂU LUẬN CUỐI KHÓA HỌC PHẦN: Phương pháp luận nghiên cứu khoa học
MÃ HỌC PHẦN: SKD1108
ĐỀ THI KẾT THÚC HỌC PHẦN
Sinh Viên: Nguyễn Minh Hiệu
Mã SV: B21DCAT090 Tên nhóm: 03
Tên lớp: D21AT02-B
Giảng viên hướng dẫn: Th.s Từ Thảo Hương Giang
HÀ NỘI 2024
Trang 2Mục lục
Lời Cảm Ơn 4
Câu 1: Phân tích cấu trúc và nội dung công trình khoa học: “Mô hình phát hiện DGA botnet dựa trên học kết hợp” 5
I Phân tích cấu trúc logic của công trình khoa học 5
1.Tóm tắt (Abstract): 5
2.Giới thiệu (Introduction): 5
3.Các nghiên cứu liên quan (Related Work): 5
4.Mô hình đề xuất (Proposed Model): 6
5.Thử nghiệm và kết quả (Experiments and Results): 6
6.Kết luận (Conclusion): 6
II Xác định câu hỏi nghiên cứu 7
III Luận điểm và các luận cứ 7
1.Luận cứ lý thuyết: 7
2.Luận cứ thực tiễn: 8
4 Phương pháp lập luận 8
5 Gợi ý hướng nghiên cứu mới 8
Câu 2: 9
Đề tài: Ứng dụng công nghệ AI trong cải thiện trải nghiệm khách hàng tại các doanh nghiệp bán lẻ ở Việt Nam 9
9
I Lý do lựa chọn đề tài 9
1.Bối cảnh thực tiễn: 9
2.Ý nghĩa khoa học và thực tiễn: 10
3.Tính cấp thiết: 10
II Tổng quan nghiên cứu 10
1.Tình hình nghiên cứu quốc tế: 10
2.Tình hình nghiên cứu trong nước: 10
3.Khoảng trống nghiên cứu: 10
III Mục tiêu nghiên cứu 10
1.Mục tiêu tổng quát: 10
2.Mục tiêu cụ thể: 10
3 Đối tượng và phạm vi nghiên cứu 11
Trang 34 Câu hỏi và giả thuyết nghiên cứu 11
Câu hỏi nghiên cứu: 11
Giả thuyết nghiên cứu: 11
5 Phương pháp nghiên cứu 11
Thiết kế nghiên cứu: 11
Thu thập dữ liệu: 11
Phân tích dữ liệu: 12
6 Tài liệu tham khảo (APA) 12
Trang 4Lời Cảm Ơn
Trước tiên, em xin gửi lời cảm ơn sâu sắc đến Học viện Công nghệ Bưu chính Viễn thông vì đã đưa môn học "Phương pháp luận nghiên cứu khoa học" vào
chương trình giảng dạy Đặc biệt, em xin gửi lời cảm ơn chân thành đến Th.S Từ
Thảo Hương Giang, người đã tận tình hướng dẫn và truyền đạt những kiến thức
quý báu cho chúng em trong suốt quá trình học tập Những kiến thức từ cô đã giúp em hiểu rõ hơn về ý nghĩa của môn học trong thực tiễn đời sống Không chỉ vậy, cô còn chia sẻ nhiều triết lý sâu sắc và thú vị, giúp em rèn luyện các kỹ năng mềm cần thiết
Môn học cũng trang bị cho em những kinh nghiệm quý báu trong việc viết báo cáo và nghiên cứu khoa học, hỗ trợ rất nhiều cho quá trình thực hiện đồ án tốt nghiệp Đây thực sự là những hành trang bổ ích cho sinh viên năm cuối
Em mong rằng Học viện sẽ tiếp tục triển khai các môn học thuộc lĩnh vực nghiên cứu khoa học để giúp sinh viên nâng cao kiến thức, không chỉ trong học tập mà còn trong cuộc sống và công việc sau này Bài tiểu luận của em chắc chắn không tránh khỏi thiếu sót, rất mong cô xem xét và đóng góp ý kiến
Trang 5Câu 1: Phân tích cấu trúc và nội dung công trình khoa học:
“Mô hình phát hiện DGA botnet dựa trên học kết hợp”
I Phân tích cấu trúc logic của công trình khoa học
Công trình khoa học này được tổ chức theo một cấu trúc logic, rõ ràng, bao gồm các phần chính sau:
1.Tóm tắt (Abstract):
o Nội dung: Mô tả vấn đề phát hiện DGA botnet (Domain Generation Algorithm
botnet), những hạn chế của các phương pháp hiện tại và đề xuất một mô hình phát hiện mới
o Đề xuất: Mô hình phát hiện dựa trên học kết hợp (ensemble learning), cải
thiện khả năng phát hiện cả hai dạng DGA phức tạp là Character-based và
Word-based
o Kết quả: Hiệu quả cao khi phát hiện 37/39 họ DGA botnet với độ chính xác
trung bình trên 89%
2.Giới thiệu (Introduction):
o Bối cảnh: Botnet sử dụng DGA là mối đe dọa lớn với an ninh mạng vì khả
năng tạo tên miền động để tránh bị phát hiện
o Vấn đề: Các phương pháp hiện tại như Naive Bayes hay LSTM chỉ phát hiện
tốt một số dạng DGA cụ thể
o Mục tiêu nghiên cứu: Phát triển mô hình phát hiện DGA mới, khắc phục hạn
chế hiện tại và cải thiện độ chính xác
3.Các nghiên cứu liên quan (Related Work):
o Phân tích các phương pháp trước đây:
▪ Học máy truyền thống: Naive Bayes, kNN, Cây quyết định, Rừng
ngẫu nhiên
▪ Học sâu: LSTM, Attention Mechanism
o Hạn chế: Các phương pháp hiện tại hiệu quả nhưng chỉ hoạt động tốt trên
một số dạng DGA (Character-based hoặc Word-based)
4.Mô hình đề xuất (Proposed Model):
o Phương pháp học kết hợp:
▪ Khái quát về các kỹ thuật như Bagging, Boosting, Stacking
o Mô hình phát hiện DGA botnet:
▪ Kết hợp hai thành phần:
Trang 6▪ CDM (Character-based Detection Model): Sử dụng thuật
toán Random Forest
định J48
▪ Quy trình phát hiện:
▪ Giai đoạn huấn luyện: Tạo bộ phân loại từ dữ liệu huấn luyện
▪ Giai đoạn phát hiện: Kết hợp kết quả từ hai mô hình thành phần bằng quy tắc OR
5.Thử nghiệm và kết quả (Experiments and Results):
o Tập dữ liệu:
▪ CDM: 200.000 tên miền (bình thường và DGA)
▪ WDM: 96.000 tên miền (bình thường và DGA)
o Độ đo hiệu năng:
▪ Các chỉ số chính: PPV (Precision), TPR (Recall), ACC (Accuracy), và F1-Score
o Kết quả:
▪ Mô hình kết hợp đạt hiệu suất vượt trội so với các phương pháp trước đây, phát hiện hiệu quả 37/39 họ DGA botnet
6.Kết luận (Conclusion):
o Tóm tắt các phát hiện chính
o Đề xuất mở rộng nghiên cứu trong tương lai để phát hiện tốt hơn các dạng DGA phức tạp như mixed DGA
Đánh giá cấu trúc:
• Sự đầy đủ: Công trình khoa học bao gồm đầy đủ các phần cần thiết, từ bối cảnh
vấn đề, phương pháp đến thử nghiệm và kết quả
• Tính liên kết: Các phần được liên kết chặt chẽ, giúp người đọc dễ dàng theo dõi
toàn bộ quá trình nghiên cứu
• Tính rõ ràng: Nội dung được trình bày rõ ràng, hỗ trợ tốt cho việc đánh giá và
ứng dụng
Trang 7II Xác định câu hỏi nghiên cứu
"Làm thế nào để phát triển một mô hình phát hiện hiệu quả các DGA botnet thuộc
cả hai dạng chính là Character-based và Word-based, vượt qua những hạn chế của các phương pháp hiện tại?"
Phân tích câu hỏi:
• Bối cảnh:
o DGA (Domain Generation Algorithm) được các botnet sử dụng để tạo tên miền động, né tránh phát hiện
o Các phương pháp hiện tại chỉ hiệu quả với một số loại DGA cụ thể, chưa
đủ khả năng tổng quát hóa
• Mục tiêu:
o Phát triển một mô hình dựa trên học kết hợp để phát hiện hiệu quả cả hai dạng DGA, cải thiện khả năng tổng quát hóa và độ chính xác
III Luận điểm và các luận cứ
Mô hình phát hiện DGA botnet dựa trên học kết hợp có thể phát hiện hiệu quả cả hai dạng Character-based và Word-based DGA, vượt qua các hạn chế của các phương pháp hiện tại.
Luận cứ minh chứng:
1.Luận cứ lý thuyết:
o Học kết hợp (Ensemble Learning):
▪ Nguyên tắc: Kết hợp nhiều mô hình để tăng cường hiệu suất và khả năng tổng quát hóa
▪ CDM (Random Forest) xử lý hiệu quả các đặc trưng ký tự của Character-based DGA
▪ WDM (J48 Decision Tree) khai thác tốt các đặc trưng ngữ nghĩa của Word-based DGA
o Phương pháp kết hợp (quy tắc OR) tối đa hóa hiệu quả phát hiện từ cả hai
mô hình thành phần
2.Luận cứ thực tiễn:
o Kết quả thực nghiệm:
▪ CDM đạt độ chính xác 97.03%, F1-Score 97.03%
▪ WDM đạt độ chính xác 96.99%, F1-Score 97.01%
Trang 8▪ Mô hình kết hợp phát hiện hiệu quả 37/39 họ DGA botnet với độ chính xác trung bình trên 89%
o So sánh với các nghiên cứu trước đây:
▪ Hoàng et al.: Hiệu quả với Character-based nhưng yếu với Word-based
▪ Charan et al.: Tốt với Word-based nhưng không phát hiện được mixed DGA
▪ Mô hình học kết hợp khắc phục hạn chế, phát hiện hiệu quả cả hai dạng DGA
4 Phương pháp lập luận
Phương pháp: Quy nạp
• Tác giả sử dụng dữ liệu thực nghiệm và so sánh khách quan để rút ra kết luận về tính ưu việt của mô hình học kết hợp
Quy trình quy nạp:
1 Thu thập dữ liệu:
o Tập huấn luyện: 200.000 tên miền cho CDM và 96.000 tên miền cho WDM
o Tập kiểm thử: 71.393 tên miền từ 39 họ botnet khác nhau
2 Thực nghiệm và so sánh:
o Phân tích kết quả của từng mô hình thành phần và mô hình kết hợp
o Đánh giá hiệu năng qua các chỉ số PPV, TPR, F1-Score
3 Kết luận:
o Từ dữ liệu và kết quả thực nghiệm, kết luận rằng mô hình học kết hợp vượt trội hơn so với các phương pháp trước đây
5 Gợi ý hướng nghiên cứu mới
Hạn chế hiện tại:
• Mô hình chưa được kiểm chứng đầy đủ trên các dạng mixed DGA (kết hợp Character-based và Word-based)
Ý tưởng mới:
• Đề tài: "Phát triển mô hình học kết hợp kết hợp học sâu để phát hiện hiệu quả các
dạng mixed DGA botnet."
Hướng triển khai:
Trang 91 Mục tiêu:
o Tối ưu hóa khả năng phát hiện mixed DGA
2 Phương pháp:
o Bổ sung thành phần học sâu (Deep Learning) như LSTM hoặc Transformer để khai thác mối liên kết ngữ nghĩa và ký tự
3 Thử nghiệm:
o Thu thập dữ liệu mixed DGA từ nhiều nguồn
o Đánh giá hiệu quả qua các chỉ số PPV, TPR, và F1-Score
4 Ứng dụng:
o Phát hiện và ngăn chặn mixed DGA botnet, nâng cao bảo mật hệ thống DNS
Kết luận
Công trình “Mô hình phát hiện DGA botnet dựa trên học kết hợp” là một bước tiến quan trọng trong lĩnh vực an ninh mạng Mô hình không chỉ giải quyết các hạn chế hiện tại
mà còn mở ra hướng nghiên cứu mới, giúp tăng cường khả năng bảo vệ hệ thống mạng trước các mối đe dọa ngày càng phức tạp
Câu 2:
Đề tài: Ứng dụng công nghệ AI trong cải thiện trải nghiệm khách hàng tại các doanh nghiệp bán lẻ ở Việt Nam
I Lý do lựa chọn đề tài
1.Bối cảnh thực tiễn:
o Công nghệ trí tuệ nhân tạo (AI) đang thay đổi mạnh mẽ cách các doanh nghiệp tương tác với khách hàng Trên thế giới, các tập đoàn như Amazon, Alibaba đã áp dụng thành công AI để nâng cao trải nghiệm khách hàng
o Tại Việt Nam, việc áp dụng AI vào dịch vụ khách hàng còn hạn chế, trong khi tiềm năng của công nghệ này là rất lớn
2.Ý nghĩa khoa học và thực tiễn:
o Nghiên cứu đóng góp vào cơ sở lý thuyết về hiệu quả của AI trong lĩnh vực bán lẻ
Trang 10o Đưa ra các giải pháp cụ thể nhằm hỗ trợ doanh nghiệp tối ưu hóa hiệu quả ứng dụng AI, từ đó nâng cao chất lượng dịch vụ và cạnh tranh trên thị trường
3.Tính cấp thiết:
o Ngành bán lẻ tại Việt Nam đang đối mặt với sự cạnh tranh gay gắt, đòi hỏi các doanh nghiệp phải cải tiến trải nghiệm khách hàng để giữ chân người tiêu dùng
o AI được kỳ vọng là công cụ mạnh mẽ giúp cá nhân hóa dịch vụ, tăng sự hài lòng của khách hàng
II Tổng quan nghiên cứu
1.Tình hình nghiên cứu quốc tế:
o Brynjolfsson và McAfee (2017): Chỉ ra AI có khả năng phân tích hành vi
khách hàng, cá nhân hóa dịch vụ và tối ưu hóa vận hành
o McKinsey (2020): Các doanh nghiệp sử dụng AI hiệu quả có thể tăng
doanh thu từ trải nghiệm khách hàng thêm 20%
2.Tình hình nghiên cứu trong nước:
o Một số nghiên cứu tại Việt Nam đã tập trung vào tiềm năng ứng dụng AI,
ví dụ như Nguyễn Văn A (2022), nhưng chưa có nghiên cứu cụ thể nào đánh giá trải nghiệm khách hàng trong ngành bán lẻ
3.Khoảng trống nghiên cứu:
o Chưa có nghiên cứu thực nghiệm đánh giá mức độ hài lòng và hành vi khách hàng khi sử dụng dịch vụ AI tại các doanh nghiệp bán lẻ Việt Nam
III Mục tiêu nghiên cứu
1.Mục tiêu tổng quát:
o Đánh giá tác động của việc ứng dụng công nghệ AI đến trải nghiệm khách hàng tại các doanh nghiệp bán lẻ ở Việt Nam
2.Mục tiêu cụ thể:
o Xác định các công nghệ AI phổ biến được áp dụng trong ngành bán lẻ
o Đo lường mức độ hài lòng của khách hàng với dịch vụ có ứng dụng AI
o Phân tích các yếu tố quyết định sự hài lòng của khách hàng khi trải nghiệm dịch vụ AI
o Đề xuất giải pháp tối ưu hóa trải nghiệm khách hàng thông qua AI
Trang 113 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu:
o Doanh nghiệp bán lẻ tại Việt Nam như VinMart, Thế Giới Di Động, Shopee
o Khách hàng đã sử dụng dịch vụ có tích hợp công nghệ AI
Phạm vi nghiên cứu:
o Không gian: Tập trung tại Hà Nội và TP Hồ Chí Minh, hai trung tâm kinh
tế lớn của Việt Nam
o Thời gian: Nghiên cứu thực hiện từ tháng 12/2024 đến tháng 5/2025
o Nội dung: Tập trung vào ứng dụng AI trong dịch vụ khách hàng, không
bao gồm các ứng dụng AI trong vận hành nội bộ hoặc quản lý chuỗi cung ứng
4 Câu hỏi và giả thuyết nghiên cứu
4.1 Câu hỏi nghiên cứu:
o Công nghệ AI nào được áp dụng phổ biến nhất trong ngành bán lẻ tại Việt Nam?
o Việc áp dụng AI ảnh hưởng thế nào đến sự hài lòng và hành vi mua sắm của khách hàng?
o Các yếu tố nào quyết định sự hài lòng của khách hàng khi sử dụng dịch vụ AI?
4.2 Giả thuyết nghiên cứu:
o H1: Ứng dụng công nghệ AI giúp nâng cao mức độ hài lòng của khách hàng
o H2: AI tối ưu hóa quy trình mua sắm, tạo sự tiện lợi và tăng cường lòng trung
thành của khách hàng
o H3: Việc thiếu cá nhân hóa trong ứng dụng AI có thể dẫn đến phản ứng tiêu cực
từ khách hàng
5 Phương pháp nghiên cứu
5.1 Thiết kế nghiên cứu:
o Nghiên cứu sử dụng phương pháp hỗn hợp, kết hợp giữa định tính
và định lượng
5.2 Thu thập dữ liệu:
o Dữ liệu định tính:
▪ Phỏng vấn sâu 10 nhà quản lý từ các doanh nghiệp bán lẻ để tìm hiểu vai trò và hiệu quả của AI
Trang 12o Dữ liệu định lượng:
▪ Khảo sát 300 khách hàng đã sử dụng dịch vụ AI, đo lường mức độ hài lòng thông qua thang đo Likert 5 điểm
5.3 Phân tích dữ liệu:
o Dữ liệu định tính: Sử dụng phân tích nội dung từ các câu trả lời phỏng
vấn
o Dữ liệu định lượng:
▪ Sử dụng phần mềm SPSS để phân tích:
▪ Kiểm tra độ tin cậy: Cronbach’s Alpha
▪ Phân tích hồi quy: Đánh giá các yếu tố ảnh hưởng đến mức
độ hài lòng
6 Tài liệu tham khảo (APA)
• Brynjolfsson, E., & McAfee, A (2017) Machine, Platform, Crowd:
Harnessing Our Digital Future New York: W W Norton & Company
• Davenport, T., & Ronanki, R (2018) Artificial Intelligence for the Real
World Harvard Business Review, 96(1), 108–116
• McKinsey & Company (2020) The State of AI in 2020 Retrieved from
www.mckinsey.com
• Nguyễn Văn A (2022) Ứng dụng AI trong quản lý doanh nghiệp bán lẻ tại
Việt Nam Tạp chí Kinh tế và Phát triển
• Vietnam Retail Association (2023) Báo cáo ngành bán lẻ 2023
Kết luận
Báo cáo này đã xây dựng đề cương nghiên cứu khoa học để đánh giá vai trò của
AI trong cải thiện trải nghiệm khách hàng tại Việt Nam Việc ứng dụng công nghệ
AI hứa hẹn mang lại nhiều giá trị thực tiễn và khoa học, đồng thời mở ra hướng
đi mới cho ngành bán lẻ trong thời đại 4.0