TOM TAT KHÓA LUẬN
Chương 2. CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN
Dựa vào các đặc diém, từ khóa liên quan về các thử nghiệm liên quan đên dự đoán,
học máy, học sâu, v.v Dựa trên bài báo liên quan trong những năm gân đây làm tiên
dé dé thực hiện nghiên cứu này và thể hiện chi tiết qua Bang 2.1 dưới đây.
Vào năm 2004, bài báo An Investigation of Practical Approximate Nearest Neighbor
Algorithms [21] đã đề cập phương pháp Locality Sensitive Hashing (LSH) như một phương pháp thành công của việc tìm kiếm gần nhất xấp xỉ và đặt câu hỏi liệu các phương pháp truyền thống có còn đánh bại được phương pháp mới này hay không. Tác giả giới thiệu một phương pháp đo lường sự chồng chéo giữa các điểm dữ liệu
và các thuật toán tìm kiếm xấp xi KNN cho thấy tăng tốc lên đến 31 lần so với LSH. Các thuật toán khác nhau được lần lượt đánh giá bao gom ca LSH, Metric-tree, SR- tree được chạy và so sánh với KNN dé đánh giá hiệu suất và độ chính xác của mỗi phương pháp. Kết quả và tốc độ khi áp dụng phương pháp KNN từ đó lựa chọn ANN làm hệ thống đề xuất tương đồng cho nghiên cứu này. Kết hợp với cau trúc liên GNN
dé tạo nên các nút và mỗi nút sẽ gắn theo các hình ảnh tương đồng của chính nó. Từ
đó có thê mở rộng xa hơn nữa bài toán đề xuất, bên cạnh đó kết hợp với bài toán truy xuất đối tượng trong ảnh sẽ đảm bảo dữ liệu luôn ở trạng thái sẵn sàng khi người
dùng có yêu câu truy xuât.
Vào năm 2005, ý tưởng và thực tiễn che giấu thông tin đã có lịch sử lâu đời. Trong cuốn Lịch sử, sử gia Hy Lạp Herodotus viết của một nhà quý tộc, Histaeus, người cần liên lạc với con rễ của mình ở Hy Lạp. Anh ta cạo đầu một người của những nô lệ đáng tin cậy nhất của mình và xăm thông điệp đó lên da đầu của nô lệ. Khi tóc của
nô lệ mọc lại nô lệ đã được gửi đi với thông điệp ân [23]. Ngày nay steganography chủ yếu được sử dụng trên máy tính với dữ liệu số là kênh phân phối tốc độ cao.
Steganography khác với mật mã ở chỗ mật mã tập trung vào việc lưu giữ nội dung
của một thông điệp bí mật, steganography tập trung vào việc giữ bí mật sự tồn tại của một thông điệp [25]. Steganography và mật mã đều là cách dé bảo vệ thông tin khỏi các bên không mong muốn nhưng không phải công nghệ nào cũng hoàn hảo và có
thé bị xâm phạm. Một khi sự hiện diện của thông tin ẩn được tiết lộ hoặc thậm chí bị nghi ngờ, mục đích của steganography bị đánh bại một phan [25]. Do đó, sức mạnh của kỹ thuật giấu tin có thé được khuếch đại bằng cách kết hợp với thuật toán mã hóa phức tạp khác. Trong bài báo này tác giả đề cập tới các thuật toán Least Significant Bit (LSB), JPEG steganography, JPEG compression. Tác giả đề cập với các phương pháp che dấu thông tin bằng sử dụng các bit dư không sử dụng tới dé thay đôi hoặc chèn các nội dung dưới dạng bit [20]. Đối với phương pháp LSB cho thấy hiệu quả của vượt trội về mức độ tàng hình và sức chứa tốt hơn đáng kể so với hai phương
pháp JPEG steganography, JPEG compression.
Vào năm 2007, tác gia Thanos Athanasiadis và các cộng sự cũng đóng góp công trình
nghiên cứu dé tài nhận diện đối tượng trong ảnh [3]. Họ sử dụng các thuật toán Watershed và Recursive Shortest Spanning Tree đề tập trung vào phân tích ngữ nghĩa của ảnh, nghiên cứu này đóng góp vào phân tích đa phương tiện được hỗ trợ bởi kiến thức và kết nối khoảng cách giữa ngữ nghĩa và đặc trưng hình ảnh cấp thấp. Trong quá trình này, việc sử dụng kiến thức ngữ cảnh điều chỉnh lại kết quả gán nhãn của quá trình phát trién vùng ngữ nghĩa. Điều này thực hiện bằng cách thay đôi mức độ
liên quan của các đôi tượng được nhận diện.
Vào năm 2015, Những thành tựu về trí tuệ nhân tạo đã làm cho các nghiên cứu về xử
lý ảnh được cải thiện về độ chính xác và hiệu suất. Có rất nhiều các nghiên cứu đã được thực hiện với việc áp dụng nhiều mô hình dự báo khác nhau. Trong đó, nghiên
cứu cua các tác gia Haoxiang Li và Zhe Lin đã thực hiện dựa trên mô hình
Convolutional Neural Networks (CNNs) [2]. Mục tiêu của nghiên cứu là xử lý các
thách thức lớn trong việc phát hiện khuôn mặt, như độ biến đổi lớn về góc độ, biéu cảm và ánh sáng, đồng thời giữ cho mô hình có hiệu suất tính toán cao. Kết quả thực nghiệm cho thấy rằng phương pháp đề xuất chạy ở 14 FPS trên một lõi CPU đối với hình ảnh độ phân giải VGA và 100 FPS khi sử dụng GPU, đồng thời đạt được hiệu suất phát hiện hàng đầu trên hai bộ dữ liệu thử nghiệm phô biến về phát hiện khuôn
mặt.
Vào năm 2019, Nghiên cứu trong bài báo A Comprehensive Survey on Graph Neural
Networks cung cấp một cái nhìn tổng quan toàn diện về mạng lưới thần kinh đồ thị (GNN) trong lĩnh vực khai thác dữ liệu và học máy [9]. Đề xuất một nguyên tắc phân loại mới để phân chia nơron đồ thị tiên tiến nhất mạng thành bốn loại, cụ thé là đồ thi thần kinh hồi quy mạng, mạng thần kinh đồ thị tích chập, bộ mã hóa đồ thị tự động
và mạng thần kinh đồ thị không gian-thời gian. Thảo luận về các ứng dụng của mạng lưới thần kinh đồ thị trên nhiều lĩnh vực khác nhau tên miền và tóm tắt mã nguồn mở,
dữ liệu điểm chuẩn tập hợp và đánh giá mô hình của mạng lưới thần kinh đồ thị. Đề
xuất các hướng nghiên cứu tiềm năng trong lĩnh vực dang phát trién nhanh chóng nay
cánh đồng. So sánh các đồ thị mạng lưới thần kinh với bốn loại: mạng lưới thần kinh,
mạng lưới thần kinh đồ thị tích chập, đồ thị bộ mã hóa tự động và mạng lưới thần kinh đồ thị không gian-thời gian và cung cấp một đánh giá kỹ lưỡng và tóm tắt của
các phương pháp trong hoặc giữa các loại,.
Vào năm 2020, bài báo Graph Neural Networks: A review of methods and
applications thiết kế quy trình chung cho các mô hình GNN và thảo luận về các biến thê của từng thành phần, phân loại các ứng dụng một cách có hệ thống và đề xuất bốn vấn đề mở cho nghiên cứu trong tương lai [19]. GRN đã chứng minh được hiệu suất đột phá trong nhiều nhiệm vụ học sâu so với mạng chú ý đồ thị (GAT) và mạng tích chập đồ thị (GCN). Đề xuất bốn van đề mở chỉ ra những thách thức chính và hướng nghiên cứu trong tương lai của đồ thị thần kinh mạng, bao gồm tính mạnh mẽ, khả
năng diễn giải, tiên huân luyện và mô hình câu trúc phức tạp.
Một ứng dụng khác cũng được công bồ vào năm 2020, Dot Product có ứng dụng rộng
rãi trong máy tính thị giác và xử lý ngôn ngữ tự nhiên [27]. Tuy nhiên, bộ nhớ và chi
phí tính toán của nó tăng theo hàm bậc hai với kích thước đầu vào. Bài báo này đề xuất một cơ chế chú ý hiệu quả tương đương Dot Product với chi phí tính toán và bộ nhớ ít hơn đáng kê. Hiệu quả tài nguyên của nó cho phép tích hợp rộng rãi và linh hoạt hơn các mô-đun chú ý vào mạng, dẫn đến độ chính xác tốt hơn.
Hay nghiên cứu mới đây được công bố vào năm 2023, bài báo A Survey of Graph
Neural Networks for Recommender Systems: Challenges, Methods, and Directions
các tác giả đề cập tới hệ thống gợi ý về sản phẩm thương mại điện tử, POI, tin tức, phim, video, âm nhac [12]. Tác giả thu thập dữ liệu từ internet về các dữ liệu khảo sát và đánh giá, xây dựng hệ thống Graph Construction dé tạo ra các nút (nodes) và cạnh (edges) tương ứng. Dé liên kết có hướng tác giả kết hợp và phát triển thành mô hình GNN dé xác định hướng giữa các vector.
Tác giả tập trung vào xử lý dữ liệu có sẵn và phân chia thé loại. Mỗi mạng GNN sẽ
là dành cho các một đối tượng đặc thù như mạng nơ-ron đồ thị (GNN) trong đề xuất ứng dụng, GNN trong khả năng giải thích, GNN trong dé xuất chéo miễn,...
Tổng hợp, phân tích ưu và nhược điểm của các bài báo trong việc xây mạng đồ thị và các phương pháp truy van dữ liệu từ đó triển khai vào ứng dụng của dé tài khóa luận tốt nghiệp này.
Bảng 2.1. Tổng hợp các nghiên cứu liên quan về xử lý hình ảnh
Mô hình sử Nội dung Năm Tác giả Tên bài báo
dụng chính
An Investigation of ; So sánh cách
Ting Liu, / Approximate
Practical thuat toan
Andrew Moore, Nearest
2004 Approximate ; LSH, Metric-
Ke Yang, Neighbor
Nearest Neighbor tree, SR-tree,
Alexander Gray ; (ANN)
Algorithms k-NN
So sánh các thuật toán
Least
T. Morkel 1 , An overview of a ;
Image Significant Bit
2005 | J.H.P. Eloff 2, image
Steganography | (LSB), JPEG M.S. Olivier 3 steganography
steganography,
JPEG
compression.
Thanos
Athanasiadis, ,
Hình ảnh, câu Phivos Watershed,
Semantic Image ; hinh nhan
Mylonas, Recursive ;
2007 Segmentation and được gan với
Yannis ; ; Shortest .
Object Labeling các đôi tượng
Avrithis, Spanning Tree -
nhận diện Stefanos
Kollias
10
Haoxiang L1,
Zhe Lin, A convolutional Convolutional ;
Hinh anh voi
Xiaohui Shen, neural network Neural '
2015 nhiêu độ phân
Jonathan cascade for face Networks ơ
giải khác nhau Brandt, Gang detection (CNNs)
Hua
Zonghan Wu, Na
Dé xuât một
Shirui Pan, ,
A Comprehensive Graph Neural nguyén tac Fengwen Chen, ơơ
2019 Survey on Graph Networks phân loại mới
Guodong Long, : ;
Neural Networks (GNN) dé phan chia
Chengqi Zhang, ơơ
nơron đô thị. Philip S. Yu
Jie Zhou,
Gangu Cu, Thao luận về Shengding Hu, các biến thê
Zhengyan Graph neural ƠNN với từng
: Graph Neural : Zhang, Cheng | networks: A review thanh phan,
2020 Networks
Yang, Zhiyuan of methods and phan loai cac
(GNN)
Liu, Lifeng applications ứng dụng một
Wang, cách có hệ
Changcheng Li, thống.
Maosong Sun.
Dé xuất một
Zhang Efficient Attention: co ché hiéu
Mingyuan Attention with 3 về so sánh
2020 ; Dot Product | 4" Y° 36348
, Zhao Haiyu, Linear tuong duong
Yi Shuai Complexities với chi phi
tính toán và bộ
11
Li Hongsheng, nho cai thién Shen Zhuoran đáng kê.
Chen gao, Yu
zheng, Nian li,
; ; A Survey of Graph Yinfeng li,
Neural Networks Yingrong qin, Graph Neural
for Recommender ,
Jinghua piao, Networks Hệ thông gợi ý
2023 Systems: ;
Yuhan quan, (GNN) da phuong tién
Challenges, Jianxin chang,
- Methods, and Depeng jin, ơ
Directions Xiangnan he,
Yong li
Patrice
Network Anomaly Dữ liệu hoạt Kisanga, Isaac j Graph Neural
Detection Using a động trên
2023 | Woungang, Issa Networks
{ Graph Neural mang: DDoS, Traore, Glaucio (GNN)
Network TOR-nonTOR
H. S. Carvalho
12