Trong đĩ các cán bá nhân viên đ°ÿc giao nhiám vā th°ång xuyên giám sát các quy trình kỹ thuÃt trong ho¿t đáng thanh tốn& để phát hián gian lÃn, khách hàng th°ång đ°ÿc khuyÁn cáo bằng viá
Trang 2Đ ÁN TàT NGHIàP TH¾C S) Hà THàNG THÔNG TIN NG¯äI H¯âNG DÀN:
TS.Vũ Viát ThÅng
Hà Nái – 2024
Trang 31.1 Giãi thiáu bài toán 1
1.2 Các lo¿i hình gian lÃn trong tài chính 1
1.2.1 Gian lÃn thông qua mã khuyÁn mãi 2
1.2.2 Gian lÃn thông qua chính sách thành viên 4
1.2.3 GiÁ m¿o danh tính 9
2.1 Giãi thiáu các thuÃt toán trí tuá nhân t¿o 33
2.1.1 Supervised learning (học có giám sát) 33
Trang 42.1.2 Unsupervised Learning (Học không giám sát) 38
2.1.3 Semi-Supervised Learning (Học bán giám sát): 42
2.1.4 Reinforcement Learning (Học Cÿng Cá/Tăng c°ång): 45
2.2 Āng dāng AI phát hián gian lÃn tài chính 48
2.2.1 Hián tr¿ng các thuÃt toán AI trong phát hián gian lÃn tài chính 48
2.2.2 Mô hình Semi-Supervised learning phát hián gian lÃn tài chính 49
Trang 5DANH MþC HÌNH ÀNH
Hình 1 1 Há tháng phát hián giao dách b¿t th°ång cÿa ngân hàng 20
Hình 1 2 Há tháng phát hián giao dách b¿t th°ång cÿa Alipay(TitAnt) 23
Hình 1 3 KiÁn trúc MaxCompute 25
Hình 1 4 KiÁn trúc há tháng cÿa KunPeng 26
Hình 1 5 KiÁn trúc há tháng cÿa Ali-HBase 27
Hình 1 6 KiÁn trúc há tháng cÿa MS và sā t°¢ng tác vãi các thành phÁn khác 28
Hình 1 7 Chia dataset hu¿n luyán và thử nghiám mô hình dā báo 29
Hình 3 1 KiÁn trúc há tháng sử dāng mô hình Semi-Supervised Graph Neural Network 52
Hình 3 2 Đß thá mái quan há m¿ng xã hái 53
Hình 3 3 Ví dā minh họa node và c¿nh trong c¢ sç dÿ liáu đß thá 54
Hình 3 4 KiÁn trúc dÿ liáu trong Graph DataBase 56
Hình 3 5 Giao dián Neo4j 58
Hình 3 6 Táng quan và ho¿t đáng tiêu chu¿n cÿa th° vián GDS 59
Hình 3 7 KiÁn trúc mô hình Gated Temporal Attention Network (GTAN) 62 Hình 3 8 Hu¿n luyán model 69
Hình 3 9 Lußng triển khai 70
Trang 6DANH MþC CÁC KÝ HIÞU VÀ TỪ VI¾T TÀT
eKYC electronic Know Your Customer Công nghá đánh danh khách hàng
đián tửMS Model Server Máy chÿ triển khai mô hình học
máy IF Isolation Forest ThuÃt toán cô lÃp các điểm dÿ liáu OTS Open Table Service Công cā lÃp kÁ ho¿ch SQL
CF Column Family C¢ sç dÿ liáu NoSQL sử dāng hàng
và cát TID Transaction Identification Đánh danh giao dách
AI Artificial Intelligent Trí tuá nhân t¿o SemiGNN Semi Supervised Graph Neural M¿ng n¢ron đß thá bán giám sát
GTAN Gated Temporal Attention
Network
M¿ng n¢ron sử dāng c¢ chÁ chú ý sử dāng các thông tin thåi gian MLP multi-layer perception Protocol Giao thāc nhÃn thāc nhiÃu lãp
TGA Temporal Graph Attention Đß thá sử dāng c¢ chÁ chú ý thåi
gian
GDS Graph Data Science Khoa học dÿ liáu sử dāng lý thuyÁt
đß thá
Trang 7DANH MþC BÀNG
BÁng 3 1 Mô tÁ dÿ liáu S-FFSD 71
BÁng 3 2 Tháng kê dÿ liáu S-FFSD 72
BÁng 3 3 Tháng kê dÿ liáu đß thá S-FFSD 73
BÁng 3 4 KÁt quÁ so sánh các mô hình trên nhãn Fraud 74
BÁng 3 5 KÁt quÁ so sánh các mô hình trên nhãn Fraud 74
Trang 8LàI CAM ĐOAN
Nhÿng nái dung đ°ÿc trình bày trong luÃn văn là nhÿng kiÁn thāc cÿa riêng cá nhân em tích lũy trong quá trình học tÃp, nghiên cāu, không sao chép l¿i cÿa mát công trình nghiên cāu hay luÃn văn cÿa b¿t cā tác giÁ nào
Trong nái dung cÿa luÃn văn, nhÿng phÁn em đã nghiên cāu, trích dÁn đÃu đ°ÿc nêu trong các tài liáu tham khÁo, có ngußn gác, xu¿t xā tên tuái cÿa các tác giÁ và nhà xu¿t bÁn rõ ràng
Nhÿng điÃu em cam kÁt hoàn toàn là sā thÃt, nÁu sai, em xin cháu mọi hình thāc kỷ luÃt theo quy đánh
Hà Nái, ngày 19 tháng 05 năm 2024
Hác viên thāc hißn
Trang 9Mâ ĐẦU
Nh° chúng ta đã biÁt hián nay vãi sā phát triển bùng ná cÿa công nghá thông tin đã tác đáng lãn đÁn các ho¿t đáng th°ång ngày cÿa xã hái tă viác d¿y học, làm viác, đÁn các nhu cÁu giÁi trí Do đ¿i dách Covid-19, các bián pháp phòng cháng dách phong toÁ, giÿ khoÁng cách, & đ°ÿc triển khai Tă nhÿng v¿n đà này gây ra nhiÃu trç ng¿i đái vãi các ho¿t đáng cÁn tiÁp xúc trāc tiÁp nh° l*nh vāc ngân hàng là mát trong sá đó Do đó giao dách thanh toán trāc tuyÁn không dùng tiÃn mặt trç nên thuÃn tián và phát triển h¢n bao giå hÁt
T¿i Hoa Kỳ, các ho¿t đáng gian lÃn làm cho sá l°ÿng khách hàng bá thiát h¿i đ¿t māc kỷ lāc 15,4 triáu ng°åi, cao h¢n 16% so vãi năm 2015 và gây thiát h¿i khoÁng 6 tỷ đô
Theo tháng kê cÿa Ngân hàng Nhà n°ãc Viát Nam, sá l°ÿng và giá trá giao dách thanh toán đián tử năm 2019 qua kênh Mobile Banking tăng tr°çng lÁn l°ÿt là 198% và 210%; các kênh Internet Banking và ví đián tă tăng tr°çng tă 37% - 86% so vãi cùng kỳ Ngày 26/5/2020, Thÿ t°ãng Chính phÿ đã ban hành chß thá sá 22/CT-TTg và viác đ¿y m¿nh triển khai các giÁi pháp phát triển thanh toán không dùng tiÃn mặt t¿i Viát Nam, qua đó thúc đ¿y m¿nh m¿ các ph°¢ng thāc giao dách đián tử, đßng thåi cho th¿y xu h°ãng t¿t yÁu cÿa viác chuyển dách hình thāc thanh toán Trong bái cÁnh đó, ngân hàng và các công ty công nghá tài chính (Fintech) đã và đang tÃp trung phát triển các āng dāng mãi trên nÃn tÁng công nghá sá, cung c¿p nhÿng sÁn ph¿m, dách vā đi kèm vãi nhÿng hình thāc khuyÁn mãi vô cùng h¿p dÁn h°ãng tãi viác đáp āng káp thåi nhu cÁu thay đái cÿa khách hàng
Bên c¿nh nhÿng lÿi ích to lãn mà giao dách tài chính trāc tuyÁn mang đÁn, ng°åi sử dāng đã và đang phÁi đái mặt vãi nhÿng rÿi ro tiÃm ¿n tă viác th¿t thoát dÿ liáu cá nhân NÁu không có nhÃn thāc đÁy đÿ, ng°åi sử dāng s¿
Trang 10dß dàng trç thành māc tiêu cÿa tái ph¿m tài chính, cĩ nguy c¢ bá lÿi dāng cho nhÿng giao dách b¿t chính và thiát h¿i tài sÁn khơng mong muán
Các ngân hàng tr°ãc đây sử dāng cách bÁo mÃt truyÃn tháng dāa vào yÁu tá con ng°åi nh° cán bá, nhân viên ngân hàng và khách hàng sử dāng dách vā Trong đĩ các cán bá nhân viên đ°ÿc giao nhiám vā th°ång xuyên giám sát các quy trình kỹ thuÃt trong ho¿t đáng thanh tốn& để phát hián gian lÃn, khách hàng th°ång đ°ÿc khuyÁn cáo bằng viác tā bÁo vá tài khoÁn cÿa mình Dß dàng nhÃn th¿y cách truyÃn tháng cĩ đá bÁo mÃt an tồn khơng cao bçi các ho¿t đáng gian lÃn hián nay ngày càng dißn ra hÁt sāc tinh vi và phāc t¿p h¢n Do đĩ, v¿n đà đặt ra cÁn cĩ các giÁi pháp thơng minh h¢n, hiáu quÁ h¢n để tăng c°ång tính bÁo mÃt trong giao dách tài chính thơng qua viác cĩ thể tā đáng phát hián ra các giao dách b¿t th°ång (hoặc các giao dách cĩ nguy c¢ chāa đāng gian lÃn) mát cách nhanh chĩng và hiáu quÁ
Trong bài báo [1] tác giÁ và nhĩm cáng sā cũng nêu rõ các thiát h¿i to lãn trong các giao dách tài chính cĩ tính bÁo mÃt kém Đặc biát trong thåi kỳ đ¿i dách covid đã làm đ¿y nhanh các giao dách tài chính trāc tuyÁn Trong nghiên cāu cũng giãi thiáu táng quan và các ph°¢ng pháp thơng minh nhằm phát hián các giao dách tài chính b¿t th°ång mát cách hiáu quÁ Cũng trong bài báo này tác giÁ cĩ tháng kê các giÁi pháp dāa trên máy học nh°: SVM, CNN, Nạve Bayes, LSTM, v.v Cuái cùng các tác giÁ cũng nêu rõ các thách thāc trong viác phát hián ra các giao dách tài chính bçi các đái t°ÿng phá ho¿i luơn cĩ xu h°ãng thay đái cơng nghá để tránh khßi bá há tháng phát hián
Trong bài báo [2] tác giÁ Shaosheng Cao và các cáng sā đã giãi thiáu há tháng TitAnt cĩ khÁ năng phát hián ra các gian lÃn trong giao dách tài chính online trong thåi gian thāc Trong nghiên cāu cũng trình bày các v¿n đÃ, các ph°¢ng pháp trích chọn đặc tr°ng và phát hián giao dách cĩ gian lÃn bao gßm:
Trang 11thuÃt toán dāa trên tÃp luÃt, thuÃt toán hßi quy logic, thuÃt toán Gradient Boosting Decision Tree (GBDT), v.v Để đÁm bÁo há tháng có thể ho¿t đáng trong thåi gian thāc nhóm tác giÁ đã triển khai mô hình dāa trên các công cā hß trÿ mã ngußn mç nh°: MaxCompute, KunPeng, MS và Ali-Hbase Các công cā này có nhiám vā hß trÿ l°u trÿ phân tán, hu¿n luyán và dā đoán các giao dách online
Mặc dù cũng đã có nhiÃu nghiên cāu khác nhau và bài toán này tuy nhiên ch°a có mát giÁi pháp nào là tuyát đái Theo thåi gian các đái t°ÿng thāc hián hành vi gian lÃn cũng s¿ thay đái cách thāc thāc hián nhằm tránh sā phát hián cÿa há tháng và điÃu này luôn là mát thách thāc vãi nhÿng ng°åi có trách nhiám bÁo mÃt trong các há tháng ngân hàng hay các công ty tài chính
Chính vì các lý do trên đây em đã chọn đà tài <Giải pháp ứng dụng trí tuệ nhân tạo nhằm phát hiện giao dịch bất thường trong hệ thống quản trị giao dịch tài chính=
Trang 12CH¯¡NG 1: TàNG QUAN VÀ GIAN L¾N TRONG GIAO DÞCH TÀI
CHÍNH 1.1 Gißi thißu bài toán
Ngày nay các dách vā tài chính đặc biát là dách vā tài chính trāc tuyÁn mang l¿i nhiÃu lÿi ích kinh tÁ to lãn cho xã hái Tuy nhiên cùng vãi đó các hành vi gian lÃn xu¿t hián ngày càng nhiÃu
Gian lÃn tài chính là hành vi cá ý lăa dái liên quan đÁn các giao dách tài chính nhằm māc đích thu lÿi cá nhân Các tr°ång hÿp gian lÃn th°ång đ°ÿc thāc hián bçi các tin tặc nhằm chiÁm đo¿t tài khoÁn cÿa ng°åi dùng sau đó thāc hián các giao dách chuyển tiÃn nhằm đánh cÅp tài sÁn cÿa ng°åi bá h¿i, các chuyên gia kinh doanh có kiÁn thāc chuyên môn và có ý đánh l¿m dāng kiÁn thāc tài chính cÿa bÁn thân nhằm chuác lÿi, nhÿng tái ph¿m thāc hián các giao dách nhằm māc đích rửa tiÃn mà chúng có đ°ÿc tă các ho¿t đáng phi pháp,& Điển hình nh° t¿i Hoa Kỳ, sá l°ÿng khách hàng bá gian lÃn đ¿t māc kỷ lāc 15,4 triáu ng°åi, cao h¢n 16% so vãi năm 2015 và gây thiát h¿i khoÁng 6 tỷ đô Trên thāc tÁ tßn t¿i nhiÃu lo¿i gian lÃn, nh° gian lÃn trong dách vā thẻ tín dāng, gian lÃn bÁo hiểm, v.v
T¿t cÁ nhÿng hành vi gian lÃn này s¿ gây tán h¿i nghiêm trọng đÁn bÁo mÃt cho cÁ ng°åi dùng và nhà cung c¿p dách vā Vì vÃy, làm thÁ nào để phát hián gian lÃn là mát v¿n đà quan trọng cÁn đ°ÿc nghiên cāu
1.2 Các lo¿i hình gian l¿n trong tài chính
Trang 131.2.1 Gian l¿n thông qua mã khuy¿n mãi
Là hành vi lÿi dāng mát sá lß háng khi doanh nghiáp đ°a ra các ch°¢ng trình khuyÁn mãi tă đó sử dāng nhiÃu lÁn mã khuyÁn mãi nhằm chuác lÿi Các ho¿t đáng gian lÃn phá biÁn nh°:
● Gian lÃn °u đãi: khuyÁn mãi t¿i Shopee đ¢n giÁn là các hành vi t¿o nhiÃu tài khoÁn ng°åi mua trên Shopee vãi māc đích nhÃn quà tặng, mã giÁm giá Shopee cho khách hàng mãi, °u đãi liên kÁt ví Shopee Pay (tr°ãc đây là ví AirPay) Nhÿng °u đãi này các khách hàng cũ đã đ°ÿc nhÃn thì s¿ không đ°ÿc nhÃn nÿa Tr°ãc đây tÃn dāng k¿ hç này có nhiÃu ng°åi đã t¿o ra nhÿng công cā tā đáng đăng ký hàng trăm, thÃm chí hàng ngàn tài khoÁn ng°åi mua trên Shopee để đặt mua các đ¢n hàng 0đ Ngoài ra các mã °u đãi liên quan tãi vÃn chuyển, thanh toán Shopee cho ng°åi mãi cũng r¿t lãn, điển hình là mã freeship shopee 40,000đ cho đ¢n 0đ Hián t¿i hình thāc này vÁn còn tßn t¿i nhß lẻ ç mát sá b¿n ch°a nÅm rõ thông tin, chính sách cũng nh° khÁ năng nhÃn dián chính xác nhÿng tình huáng này t¿i Shopee và dÁn đÁn tài khoÁn Shopee bá khoá Hián nay, Shopee đã đ°a ra nhiÃu hình thāc cháng gian lÃn nh° khóa các tài khoÁn mãi khi th¿y nghi ngå, tăng thåi gian ph¿t đái vãi tài khoÁn cũ hoặc nghiêm trọng h¢n là khóa luôn tài khoÁn cũ vi ph¿m
● Nhân viên bán hàng gian lÃn: là nhÿng ng°åi trāc tiÁp tiÁp xúc vãi khách hàng, thāc hián các giao dách thanh toán liên quan tãi tiÃn b¿c nên nhân viên dß dàng thāc hián gian lÃn mßi khi có c¢ hái Đặc biát nÁu các chÿ cửa hàng l¢ là, lßng lẻo trong viác quÁn lý thì hÃu quÁ có thể bá th¿t thoát lên tãi hàng chāc, hàng trăm triáu đßng
● Báo sai giá: Thông th°ång kiểu gian lÃn này s¿ xÁy ra đái vãi nhÿng cửa hàng kinh doanh nhß, không treo bÁng giá và vÁn sử dāng các cách
Trang 14bán hàng truyÃn tháng Nh° vÃy mßi khi nhà quÁn lý vÅng mặt, nhân viên bán hàng s¿ tā ý tăng giá thêm để l¿y sá tiÃn chênh lách Tuy hình thāc gian lÃn này không khiÁn cửa hàng bá th¿t thoát hàng hóa hay tiÃn b¿c nh°ng s¿ khiÁn cho th°¢ng hiáu bá m¿t uy tín.
● Không ghi chép đ¢n hàng/ in hóa đ¢n: Đây là mánh khóe gây Ánh
h°çng trāc tiÁp đÁn doanh thu cÿa cửa hàng Khi mßi đ¢n hàng mà khách hàng thanh toán, nhân viên chß thanh toán và cÁm tiÃn mà không ghi l¿i đ¢n hàng hoặc sau khi khách và thì nh¿n nút <Hÿy hóa đ¢n= Nh° vÃy dÿ liáu trong hóa đ¢n s¿ không đ°ÿc l°u trong phÁn mÃm bán hàngvà đ°¢ng nhiên b¿n s¿ hoàn toàn không biÁt có mát giao dách đ¢n hàng văa dißn ra Vãi cách thāc gian lÃn này, hàng hóa thì bá m¿t còn sá tiÃn thanh toán l¿i <và túi= nhân viên
● Sửa hóa đ¢n: Sau khi thāc hián xong giao dách và vÁn in hóa đ¢n cho
khách thì nhân viên bán hàng truy cÃp vào há tháng để xem và sửa l¿i hóa đ¢n Họ có thể giÁm sá l°ÿng hàng hóa hoặc xóa bãt mát món hàng Sao cho sá tiÃn khách hàng đã trÁ phÁi nhiÃu h¢n sá tiÃn trên há tháng và nhân viên s¿ l¿y tiÃn chênh lách Viác này s¿ dißn ra nhiÃu lÁn nÁu b¿n th°ång xuyên không có mặt t¿i cửa hàng Và viác phát hián nhân viên tā ý chßnh sửa hóa đ¢n s¿ là r¿t khó nÁu không có các công cā hß trÿ
● Lÿi dāng các ch°¢ng trình °u đãi: Mßi khi cửa hàng có ch°¢ng trình giÁm giá, nÁu chß đ¢n giÁn là treo biển và thāc hián mọi thông báo theo cách thÿ công thì s¿ là c¢ hái lãn để nhân viên bán hàng thāc hián gian lÃn Bçi nhân nhÿng lúc b¿n không để ý, họ có thể đánh tráo các biển giÁm giá hoặc tā ý chßnh sá tiÃn chiÁt kh¿u nhiÃu h¢n quy đánh Hoặc nh° chßnh giá sÁn ph¿m lên cao rßi chiÁt kh¿u đúng vãi giá ban đÁu Nh° vÃy cửa hàng b¿n s¿ bá m¿t uy tín, tá chāc ch°¢ng trình °u
Trang 15đãi mà giá sÁn ph¿m vÁn cao, khách hàng họ s¿ không muán quay l¿i lÁn thā 2
● Làm hßng các dÿ liáu bán hàng: thāc tÁ, không ít nhân viên bán hàng
sau khi thāc hián nhiÃu lÁn gian lÃn thì đã cá tình làm hßng sá sách hoặc máy tính l°u trÿ dÿ liáu bán hàng để các chÿ quÁn lý không phát hián ĐiÃu này s¿ gây hÃu quÁ nghiêm trọng bçi không chß là sá liáu bán hàng, mà họ còn đang làm hßng cÁ nhÿng kÁ ho¿ch t°¢ng lai, nhÿng thông tin dÿ liáu khách hàng, các báo cáo tháng kê tình hình bán hàng cũng nh° sá l°ÿng hàng hóa, thu chi công nÿ,& mà b¿n ghi chép trong sá sách hoặc l°u trên file máy tính
1.2.2 Gian l¿n thông qua chính sách thành viên
Ng°åi bán nhÃn đ°ÿc khoÁn bßi hoàn vì chÿ thẻ tă chái nhÃn đ¢n đặt hàng nh°ng thāc tÁ hàng hoá đã đ°ÿc thanh toán Tình tr¿ng này có thể bÅt gặp các cửa hàng có kinh doanh trāc tuyÁn trên các trang th°¢ng m¿i đián tử Lÿi dāng chính sách hoàn tiÃn cÿa các sàn th°¢ng m¿i đián tử hß trÿ cửa hàng trong tr°ång hÿp khách trÁ hàng hoàn tiÃn Cửa hàng đã thoÁ thuÃn vãi ng°åi dùng hoặc t¿o tài khoÁn tā mua bán để chuác lÿi tă chính sách này
Ngoài nhÿng lÿi ích cÿa các ch°¢ng trình khách hàng thân thiÁt th°ång đ°ÿc mọi ng°åi đánh giá cao, cho dù nhÿng lÿi ích đó đ°ÿc đ°a ra d°ãi d¿ng điểm, giÁm giá, tiÃn th°çng, quà tặng hoặc dặm bay Các doanh nghiáp đã nhÃn ra rằng lòng trung thành cÿa khách hàng là r¿t quan trọng để duy trì và tăng thá phÁn, và các ch°¢ng trình khách hàng thân thiÁt đ°ÿc thiÁt kÁ để thiÁt lÃp mái quan há lâu dài và có lÿi vãi khách hàng
Tă quan điểm kinh doanh, các ch°¢ng trình khách hàng thân thiÁt giúp tăng tỷ lá giÿ chân khách hàng, giÁm chi phí tiÁp thá để có đ°ÿc khách hàng mãi, tác đáng đÁn viác mua hàng cÿa khách hàng đái vãi th°¢ng hiáu và xác
Trang 16đánh mái liên há giÿa lÿi ích cÿa khách hàng thân thiÁt và hành đáng cÿa khách hàng (nh° nghiên cāu tiÁp thá mát phÁn) Tă quan điểm cÿa khách hàng, viác đăng ký tham gia các ch°¢ng trình khách hàng thân thiÁt mang l¿i cÁm giác có đi có l¿i (nhÃn đ°ÿc nhiÃu thā h¢n so vãi lÁn mua ban đÁu), sā công nhÃn đặc biát, sā tin t°çng và cam kÁt cÿa tá chāc bên c¿nh các lÿi ích nh° giÁm giá
Nh°ng có mát v¿n đà ít đ°ÿc nhÃn ra liên quan đÁn giá trá cÿa các ch°¢ng trình khách hàng thân thiÁt: gian lÃn Trong khi 81% ng°åi Mỹ đánh đßng điểm th°çng tích lũy cÿa họ vãi tiÃn mặt, hÁu hÁt ng°åi tiêu dùng không th°ång xuyên kiểm tra sá d° tài khoÁn khách hàng thân thiÁt cÿa họ H¢n nÿa, khoÁng 20% thành viên nhÃn th°çng ch°a bao giå đái b¿t kỳ điểm tích lũy nào cÿa họ Nhÿng điểm không đ°ÿc sử dāng và không đ°ÿc giám sát này đã trç thành māc tiêu chính cho nhÿng kẻ lăa đÁo đánh cÅp để sử dāng cho riêng chúng hoặc bán trên dark web Có nhiÃu ph°¢ng pháp khác nhau để thāc hián hành vi gian lÃn trong các ch°¢ng trình khách hàng thân thiÁt và viác bÁo vá ch°¢ng trình cÿa b¿n cháng l¿i chúng cũng đòi hßi nhiÃu cách tiÁp cÃn và nß lāc khác nhau
Trong nhiÃu năm, nhÿng ch°¢ng trình khách hàng thân thiÁt dành cho các doanh nghiáp nhß h¢n đã dāa vào thẻ gi¿y đ°ÿc đāc lß hoặc đóng d¿u khi mua hàng đ°ÿc thāc hián.Các ch°¢ng trình khách hàng thân thiÁt này r¿t đ¢n giÁn để bÅt đÁu, không tán kém để sÁn xu¿t và dß học Nh°ng thẻ r¿t dß bá làm giÁ, có thể gian lÃn thông qua các hành vi không hÿp lá và không cung c¿p cho nhà phát hành b¿t kỳ dÿ liáu khách hàng nào có thể sử dāng đ°ÿc Nhÿng thay đái công nghá đ¢n giÁn, chẳng h¿n nh° máy quét khiÁn gian lÃn ch°¢ng trình dß dàng thāc hián để nhÃn phÁn th°çng NhiÃu ch°¢ng trình khác đang chuyển tă các đái t°ÿng vÃt lý sang c¢ sç kỹ thuÃt sá bằng cách kÁt hÿp viác sử dāng các āng dāng đián tho¿i thông minh mang l¿i lÿi ích cho cÁ khách hàng và doanh nghiáp Các āng dāng dành cho thiÁt bá di đáng giúp giÁm sā lán xán trong ví cÿa khách hàng và chußi khóa, giÁm thiểu khÁ năng xÁy ra các ho¿t
Trang 17đáng trái phép và cung c¿p các phân tích có giá trá không khÁ dāng vãi thẻ khách hàng thân thiÁt Các āng dāng này cũng có thể giúp doanh nghiáp cá nhân hóa thông tin và ng°åi bÁo trÿ để thiÁt kÁ các phÁn th°çng hoặc dách vā khác biát Ngày nay, ch°¢ng trình khách hàng thân thiÁt điển hình cho phép các thành viên cÿa mình tích lũy điểm khi mua hàng cÿa khách hàng trong tài khoÁn cá nhân trāc tuyÁn Điểm có thể đ°ÿc đái l¿y phÁn th°çng nh° thẻ quà tặng, du lách và bÿa ăn Mặc dù chúng không phÁi là tiÃn mặt nh°ng các điểm này có giá trá tiÃn tá trong thÁ giãi thāc Ví dā chß riêng ç Hoa Kỳ °ãc tính có khoÁng 48 tỷ đô la dành cho khách hàng thân thiÁt
Các ch°¢ng trình khách hàng thân thiÁt cung c¿p mát mß vàng thông tin cho các doanh nghiáp, nh°ng chúng cũng có thể cho phép nhÿng kẻ lăa đÁo truy cÃp vào kho thông tin này vãi nß lāc tái thiểu Thông tin có trong các trang web cÿa ch°¢ng trình phÁn th°çng, chẳng h¿n nh° thông tin nhÃn d¿ng cá nhân (PII) thể dß dàng đ°ÿc sử dāng để thāc hián hành vi trám cÅp danh tính PII th°ång bao gßm các chi tiÁt nh° tên, ngày sinh, đáa chß email và gửi th°, sá đián tho¿i, sá thẻ tín dāng, tình tr¿ng hôn nhân, quy mô há gia đình và thu nhÃp hàng năm
Mát sá tháng kê chß ra rằng gian lÃn đã Ánh h°çng đÁn h¢n 70% các ch°¢ng trình khách hàng thân thiÁt Trong các ch°¢ng trình này, hành vi gian lÃn cũng có thể xÁy ra thông qua hành vi trám cÅp điểm tích lũy, thông tin hoặc thông qua hành vi đánh lăa há tháng để t¿o ra điểm HÁu hÁt ng°åi tiêu dùng th°ång không xem l¿i điểm tích lũy cÿa họ và không nhÃn th¿y khi nhÿng điểm đó bá xâm ph¿m Chß khi khách hàng muán sử dāng điểm cÿa mình, họ mãi th¿y sá điểm đó không còn nÿa
Quy tÅc cÿa các ch°¢ng trình khách hàng thân thiÁt th°ång yêu cÁu cá nhân có tên trên tài khoÁn phÁi là ng°åi t¿o ra điểm Đánh lăa há tháng trong các ch°¢ng trình khách hàng thân thiÁt th°ång có ngh*a là thành viên ch°¢ng
Trang 18trình cho phép ng°åi khác sử dāng thẻ khách hàng thân thiÁt hoặc sá cÿa mình để t¿o điểm tích lũy cho thành viên Nhÿng kỹ thuÃt nh° vÃy r¿t khó nÁu cÁn phÁi nhÃn d¿ng để truy cÃp vào tài khoÁn khách hàng thân thiÁt, nh°ng có thể cāc kỳ dß dàng khi điểm đ°ÿc mua trāc tuyÁn hoặc thông qua mát āng dāng
Thÿ ph¿m gian lÃn ch°¢ng trình khách hàng trung thành th°ång có thể đ°ÿc phân chia thành ba lo¿i chính: Tin tặc (hacker), ng°åi trong cuác và thành viên
Tin tặc
Tin tặc là nhÿng ng°åi bên ngoài (bao gßm cÁ các thành viên cÿa m¿ng l°ãi tái ph¿m có tá chāc), nhÿng kẻ khai thác lß háng bÁo mÃt cÿa ch°¢ng trình và mÃt kh¿u yÁu cÿa khách hàng để đánh cÅp điểm th°çng tích lũy Nhÿng cá nhân này sử dāng các ph°¢ng pháp nh° kÁ ho¿ch lăa đÁo hoặc các hình thāc kỹ nghá xã hái khác để thu thÃp thông tin nhằm xâm nhÃp vào tài khoÁn cÿa thành viên TiÃn cÿa ch°¢ng trình khách hàng thân thiÁt đ°ÿc coi là mát māc tiêu dß dàng chiÁm đo¿t, chÿ yÁu là do nhÃn thāc cÿa ng°åi tiêu dùng th¿p liên quan đÁn viác giám sát Ngoài ra bÁo mÃt xung quanh các ch°¢ng trình khách hàng thân thiÁt gÁn nh° không m¿nh bằng các tài khoÁn ho¿t đáng bằng tiÃn thÃt Điểm bá đánh cÅp có thể đ°ÿc tin tặc sử dāng để nhÃn phÁn th°çng mißn phí
Ví dā nh° sau mát vā t¿n công vào ch°¢ng trình Hilton Honors năm 2014, tài khoÁn cÿa mát thành viên đã đ°ÿc sử dāng để thanh toán cho sáu lÁn l°u trú khách s¿n t¿i các c¢ sç kinh doanh cÿa Hilton.Thẻ tín dāng cÿa công ty đ°ÿc liên kÁt vãi tài khoÁn sau đó đã đ°ÿc sử dāng để mua thêm điểm th°çng cho tin tặc Điểm bá hack cũng có thể trç thành mát phÁn cÿa gian lÃn tam giác, liên quan đÁn khách hàng thân thiÁt, tin tặc và bên thā ba (th°ång là trang web hÿp pháp hoặc "chÿ dành cho tin tặc") Trong vā hack Hilton Honors, nhiÃu
Trang 19điểm rút khßi tài khoÁn sau đó đ°ÿc rao bán trāc tuyÁn vãi giá r¿t rẻ so vãi giá trá thÃt
Người trong cuộc
Ng°åi trong cuác là nhân viên cÿa doanh nghiáp cung c¿p các ch°¢ng trình khách hàng thân thiÁt hoặc nhÿng ng°åi có quyÃn truy cÃp vào há tháng
Ví dā: nÁu thẻ b¿m lß đ°ÿc sử dāng trong các ch°¢ng trình khách hàng thân thiÁt và nhÿng ng°åi trong cuác có thể dß dàng b¿m thêm vào thẻ cÿa b¿n bè họ Ngay cÁ vãi sā ra đåi cÿa các thiÁt bá ch°¢ng trình tinh vi h¢n thì nhân viên vÁn có thể thao túng há tháng điểm trung thành NÁu khách hàng không phÁi là thành viên cÿa ch°¢ng trình khách hàng thân thiÁt hoặc quên sử dāng liên kÁt khách hàng thân thiÁt cÿa mình khi mua hàng, nhân viên (chẳng h¿n nh° đ¿i lý trung tâm cuác gọi, tiÁp viên hàng không và nhân viên quÁy làm thÿ tāc) có thể ghi có giao dách mua cho họ Tài khoÁn cá nhân cÿa mình hoặc cÿa các thành viên gia đình hoặc b¿n bè Tùy thuác vào māc đá làm viác cÿa họ, nhân viên cũng có thể có quyÃn điÃu chßnh hoặc thêm điểm vào tài khoÁn khách hàng nh° mát bián pháp hß trÿ trong tr°ång hÿp có v¿n đà vãi thẻ hoặc thiÁt bá đÁu cuái t¿i điểm bán hàng ĐiÃu này có thể bá l¿m dāng bằng cách đ°a ra các khoÁn tín dāng không chính đáng và khÁ năng chuyển điểm tă thẻ này sang thẻ khác cũng có thể bá l¿m dāng Đó có thể là mát ho¿t đáng cÁn thiÁt và hÿp pháp cÿa nhân viên khi thẻ cÿa khách hàng bá m¿t hoặc bá đánh cÅp, nh°ng đó không phÁi là điểm đ°ÿc chuyển tă thẻ không ho¿t đáng
Các thành viên
Các thành viên là nhÿng khách hàng tham gia ch°¢ng trình thāc hián hành vi gian lÃn khi họ cá gÅng <đánh lăa há tháng= để có lÿi cho họ Mát thành viên ch°¢ng trình cá gÅng đái điểm đßng thåi qua đián tho¿i vãi đ¿i dián công ty và thông qua tài khoÁn trāc tuyÁn cÿa họ Hoặc thay vì đái điểm các thành viên có thể cá gÅng tích lũy điểm mát cách gian lÃn thông qua viác đính kèm
Trang 20sá tài khoÁn phÁn th°çng cÿa họ vãi giao dách mua mà họ không thāc hián HÁu hÁt các ch°¢ng trình cho phép các thành viên tặng điểm hoặc phÁn th°çng cÿa họ cho ng°åi khác, nh°ng viác bán điểm th°ång bá c¿m theo chính sách cÿa ch°¢ng trình khách hàng thân thiÁt Do đó, các thành viên bán hoặc trao đái điểm cÿa họ đang vi ph¿m gian lÃn ch°¢ng trình Các thành viên cũng đ°ÿc biÁt là thāc hián các giao dách mua t¿o ra sá l°ÿng lãn điểm th°çng và sau đó hÿy giao dách mua nh°ng không phÁi tr°ãc khi điểm đ°ÿc đái để nhÃn giÁi th°çng tiÃn mặt Mát sá ch°¢ng trình khách hàng thân thiÁt cho phép kiÁm điểm cho các t°¢ng tác trên m¿ng xã hái nh° chuyển tiÁp tin nhÅn, đánh giá và giãi thiáu Để đ¿t đ°ÿc điểm, các thành viên có thể <chia sẻ quá nhiÃu=, đăng các bài đánh giá không đáng kể hoặc giãi thiáu mát sá l°ÿng lãn các cá nhân không có khÁ năng trç thành thành viên cÿa ch°¢ng trình khách hàng thân thiÁt Trong nhÿng tình huáng này, các thành viên đang thu đ°ÿc giá trá tă ch°¢ng trình khách hàng thân thiÁt bằng cách tham gia vào các ho¿t đáng không t¿o ra giá trá gia tăng cho doanh nghiáp
1.2.3 GiÁ m¿o danh tính
Kẻ x¿u có thể mua thông tin tă các ngußn thông tin bá rò rß hoặc đánh cÅp thông tin cÿa ng°åi khác để thāc hián hành vi lăa đÁo, chiÁm đo¿t tài sÁn Ngoài ra nhân viên có thể tham gia gian lÃn bằng cách sử dāng trái phép thông tin khách hàng khi có quyÃn truy cÃp vào há tháng Mát trong nhÿng d¿u hiáu tài khoÁn bá đánh cÅp có nhiÃu lÁn chuyển điểm th°çng, chuyển tiÃn trong mát khoÁng thåi gian ngÅn đặc biát là cho ng°åi không có tên trên tài khoÁn, vào nhÿng cung giå khác biát cũng có thể cho th¿y ho¿t đáng đáng ngå Hàng hóa trên các kênh mua sÅm trāc tuyÁn đ°ÿc vÃn chuyển đÁn mát đáa chß không đ°ÿc liên kÁt vãi tài khoÁn cÿa thành viên cũng có thể cho th¿y khÁ năng gian lÃn
Trang 21Ngoài ra vãi sā phát triển cÿa các công nghá giÁ m¿o danh tính do AI t¿o ra cũng dÁn đÁn tình tr¿ng giÁ m¿o danh tính cÿa các tá chāc c¢ quan chāc năng nhằm đánh vào tâm lý sÿ hãi cÿa ng°åi dùng để yêu cÁu ng°åi dùng thāc hián các hành vi theo chß đánh cÿa chúng nhằm lăa đÁo chiÁm đo¿t tài khoÁn và tài sÁn cÿa bá h¿i Các tr°ång hÿp khác kẻ x¿u s¿ sử dāng thông tin thu thÃp đ°ÿc tă m¿ng xã hái và công cā AI giÁ m¿o danh tính b¿n bè, ng°åi thân cÿa ng°åi dùng để lăa ng°åi dùng chuyển khoÁn, thanh toán há để chiÁm đo¿t tài sÁn
Công nghá đánh danh khách hàng đián tử (electronic Know Your Customer - eKYC) là viác thiÁt lÃp mái quan há và đánh danh khách hàng bằng các ph°¢ng tián đián tử, bao gßm kênh trāc tuyÁn và kênh di đáng, mà không cÁn phÁi gặp mặt trāc tiÁp đã mang đÁn sā tián lÿi cho cÁ khách hàng và nhÿng công ty/tá chāc sử dāng công nghá này Nhå viác áp dāng công nghá eKYC, các tá chāc có thể đánh danh khách hàng tă xa để thể thu thÃp thông tin và đặc điểm sinh trÅc học cÿa khách hàng và xác thāc vãi các ngußn dÿ liáu c¢ sç nh° thông tin trên gi¿y tå tùy thân, c¢ sç dÿ liáu dân c°, c¢ sç nhÃn d¿ng Do đó, trong quy trình đánh danh đián tử có hai yÁu tá đặc biát quan trọng là: ngußn dÿ liáu tin cÃy làm c¢ sç đái chiÁu và đá chính xác cÿa nÃn tÁng công nghá áp dāng để thu thÃp các thông tin sinh trÅc học cÿa khách hàng Để đÁm bÁo an toàn và hiáu quÁ khi đánh danh đián tử, nhà n°ãc đã đ°a ra khung pháp lý để các doanh nghiáp, tá chāc tuân thÿ nh°: (Thông t° sá 16/2020/TT-NHNN ngày 04/12/2020 cÿa Tháng đác Ngân hàng Nhà n°ãc (NHNN) sửa đái, bá sung mát sá điÃu cÿa Thông t° sá 23/2014/TT-NHNN ngày 19/8/2014 cÿa Tháng đác NHNN h°ãng dÁn viác mç và sử dāng tài khoÁn thanh toán t¿i tá chāc cung āng dách vā thanh toán), ngành Ngân hàng đã lÁn l°ÿt āng dāng eKYC vào quy trình nhÃn biÁt khách hàng và cung c¿p các sÁn ph¿m, dách vā tài chính Chß trong năm 2020, hàng lo¿t ngân hàng liên tiÁp công bá đã hoàn thián quy trình
Trang 22công nghá, sẵn sàng thāc hián mç tài khoÁn không gặp mặt trāc tiÁp khách hàng
ĐÁn cuái năm 2021, đã có 24 tá chāc tín dāng chính thāc triển khai mç tài khoÁn thanh toán eKYC, vãi khoÁng 3,37 triáu tài khoÁn thanh toán mç bằng ph°¢ng thāc này đang ho¿t đáng, đây đ°ÿc coi là mát trong nhÿng giÁi pháp đát phá giúp thúc đ¿y tài chính toàn dián, đ°a ngân hàng đÁn gÁn h¢n vãi khách hàng, đßng thåi góp phÁn thāc hián quá trình chuyển đái sá cÿa ngân hàng Đặc biát trong bái cÁnh dách bánh Covid-19, viác ban hành káp thåi chính sách này đã giúp khách hàng tiÁp cÃn, sử dāng dách vā thanh toán mà không phÁi đÁn quÁy giao dách cÿa ngân hàng
Mặc dù nhà n°ãc đã đ°a ra thông t° và có nhÿng khung hình ph¿t vãi tái danh và chiÁm đo¿t tài sÁn tuy nhiên vÁn có nhiÃu kẻ x¿u lÿi dāng viác áp dāng ráng rãi công nghá eKYC để giÁ m¿o danh tính cÿa ng°åi khác Tiêu biểu nh° hành vi mát ng°åi giÁ m¿o danh tính cÿa mát ng°åi thÃt khác bằng cách sử dāng tài liáu bá đánh cÅp, kÁt hÿp vãi thông tin đ°ÿc làm giÁ, thay thÁ thông tin giÁ m¿o đó lên trên các gi¿y tå cÿa mát ng°åi bằng hình Ánh cÿa kẻ m¿o danh tă đóng đánh lăa há tháng eKYC Trong quy trình đánh danh đián tử, bằng các thÿ thuÃt tinh vi đái t°ÿng m¿o nhÃn danh tính cÿa mát ng°åi để mç tài khoÁn hoặc đánh cÅp mÃt kh¿u, thông tin cÿa ng°åi dùng nhằm thāc hián giao dách đián tử Hián nay, ch¿t l°ÿng hình Ánh và māc đá chân thāc tă hình Ánh đ°ÿc t¿o ra bçi các công nghá nh° công nghá <deepfake= đang có nhÿng b°ãc tiÁn lãn t¿o điÃu kián cho kẻ x¿u có thể sử dāng để sử dāng các hình Ánh giÁ m¿o, chßnh sửa để v°ÿt qua các b°ãc xác thāc và sinh trÅc học cÿa há tháng eKYC, đã trç thành mái đe dọa lãn Khác vãi viác gặp mặt khách hàng trāc tiÁp thuÃn lÿi để đánh giá ch¿t l°ÿng cÿa bÁn gác gi¿y tå tùy thân cũng nh° nhÃn dián trāc tiÁp cử chß, đặc điểm sinh trÅc và chÿ ký cÿa khách hàng thì eKYC l¿i nhÃn d¿ng các gi¿y tå qua các hình Ánh ghi l¿i trong quá trình đánh
Trang 23danh dß bá làm giÁ hoặc sử dāng công nghá cÅt ghép Ánh h¢n nÿa đá phân giÁi camera cÿa các thiÁt bá đ°ÿc sử dāng để eKYC cũng Ánh h°çng lãn đÁn viác xác thāc māc đá tin cÃy và hình Ánh do khách hàng cung c¿p Theo đó, rÿi ro là không thể tránh khßi khi áp dāng nÃn tÁng công nghá mãi nh° eKYC viác không phÁi khách hàng nào cũng có kiÁn thāc và công nghá để tā thāc hián đ°ÿc viác đánh danh đián tử cá nhân mà phÁi nhå sā hß trÿ cÿa ng°åi khác cũng là khó khăn và rÿi ro lãn Ngoài ra khách hàng cùng cÁn có ý thāc và bÁo vá thông tin cá nhân h¿n chÁ chia sẻ các thông tin nh¿y cÁm và cá nhân nh° thông tin và gi¿y tå tùy thân và đặc điểm sinh trÅc học cho ng°åi khác và lên m¿ng xã hái để kẻ x¿u có thể lÿi dāng
1.2.4 Đánh cÁp tài khoÁn
Hián nay, tình tr¿ng tin tặc (hacker) đánh cÅp tài khoÁn ngân hàng vÁn đang dißn ra phá biÁn trên toàn cÁu Các tin tặc th°ång sử dāng các kỹ thuÃt phÁn mÃm đác h¿i, m¿o danh và lăa đÁo để truy cÃp vào tài khoÁn ngân hàng cÿa ng°åi dùng và đánh cÅp thông tin cá nhân, thông tin tài khoÁn, mÃt kh¿u và sá tiÃn trong tài khoÁn
Mát sá kỹ thuÃt phá biÁn đ°ÿc sử dāng bçi các hacker bao gßm: •Phishing: là mát kỹ thuÃt lăa đÁo trāc tuyÁn, mà kẻ t¿n công sử dāng các
email giÁ m¿o, tin nhÅn văn bÁn, trang web giÁ m¿o hoặc các tin nhÅn trên m¿ng xã hái để lăa đÁo ng°åi dùng cung c¿p thông tin cá nhân, thông tin tài khoÁn, mÃt kh¿u hoặc sá tiÃn trong tài khoÁn cÿa họ Tình tr¿ng phishing chiÁm đo¿t tài khoÁn vÁn là mát v¿n đà lãn trên toàn cÁu, vãi hàng nghìn ng°åi bá lăa đÁo và m¿t tiÃn mßi năm Các kẻ t¿n công th°ång sử dāng các email giÁ m¿o cÿa các tá chāc, ngân hàng, hoặc các nhà cung c¿p dách vā để t¿o ra mát cÁm giác tin cÃy và đáng tin cÃy cho ng°åi nhÃn Sau đó, họ yêu cÁu ng°åi dùng truy cÃp vào mát trang web
Trang 24giÁ m¿o hoặc nhÃp thông tin cá nhân, thông tin tài khoÁn, hoặc mÃt kh¿u cÿa họ Vãi hình thāc t¿n công Phishing giÁ m¿o email tin tặc s¿ gửi email cho ng°åi dùng d°ãi danh ngh*a mát đ¢n vá/tá chāc uy tín, dā ng°åi dùng click vào đ°ång link dÁn tãi mát website giÁ m¿o Nhÿng email giÁ m¿o th°ång r¿t giáng vãi email chính chÿ, chß khác mát vài chi tiÁt nhß, khiÁn cho nhiÃu ng°åi dùng nhÁm lÁn và trç thành n¿n nhân cÿa cuác t¿n công Để làm cho nái dung email giáng thÃt nh¿t có thể, kẻ t¿n công luôn cá gÅng <ngāy trang= bằng nhiÃu yÁu tá nh°: đáa chß ng°åi
gửi (VD: đáa chß đúng là congtyABC@gmail.com thì đáa chß giÁ m¿o
này có thể gÁn t°¢ng tā nh° congtyABC1@gmail.com), chèn Logo
chính thāc cÿa tá chāc để tăng đá tin cÃy, thiÁt kÁ các cửa sá pop-up giáng y hát bÁn gác (cÁ và màu sÅc, font chÿ,&), sử dāng k* thuÃt giÁ m¿o đ°ång dÁn (link) để lăa ng°åi dùng (VD: text là vietcombank.com.vn nh°ng khi click vào l¿i điÃu h°ãng tãi vietconbank.com.vn) Ngoài ra hình thāc giÁ m¿o Website cũng xu¿t hián khá phá biÁn BÁn ch¿t cÿa viác giÁ m¿o website trong t¿n công Phishing chß là làm giÁ mát landing page chā không phÁi toàn bá website Trang đ°ÿc làm giÁ th°ång là trang đăng nhÃp để c°ãp thông tin cÿa n¿n nhân Kỹ thuÃt làm giÁ website có mát sá đặc điểm sau: ThiÁt kÁ giáng tãi 99% so vãi website gác, đ°ång link (url) chß khác mát ký tā duy nh¿t Luôn có nhÿng thông điáp khuyÁn khích ng°åi dùng nhÃp thông tin cá nhân vào website (call-to-action) Hián nay, các nhà cung c¿p dách vā email nh° Google hay Microsoft đÃu có nhÿng bá lọc email spam/phishing để bÁo vá ng°åi dùng Tuy nhiên nhÿng bá lọc này ho¿t đáng dāa trên viác kiểm tra văn bÁn (text) trong email để phát hián xem email đó có phÁi phishing hay không Hiểu đ°ÿc điÃu này, nhÿng kẻ t¿n công đã cÁi tiÁn các hình thāc t¿n công Phishing lên mát tÁm cao mãi
Trang 25Chúng th°ång sử dāng Ánh hoặc video để truyÃn tÁi thông điáp lăa đÁo thay vì dùng text nh° tr°ãc đây để v°ÿt quá các bá lọc này.
•Keylogging: là mát ph°¢ng thāc t¿n công mà kẻ t¿n công sử dāng phÁn mÃm đác h¿i để ghi l¿i các ký tā đ°ÿc nhÃp tă bàn phím cÿa ng°åi dùng Khi ng°åi dùng nhÃp thông tin cá nhân nh° tên đăng nhÃp, mÃt kh¿u hoặc thông tin tài khoÁn ngân hàng, các thông tin này s¿ đ°ÿc l°u l¿i trong bá nhã cÿa máy tính cÿa kẻ t¿n công Tă đó, họ có thể sử dāng các thông tin này để truy cÃp vào các tài khoÁn cÿa ng°åi dùng và chiÁm đo¿t tiÃn trong tài khoÁn Tình tr¿ng keylogging chiÁm đo¿t tài khoÁn vÁn đang dißn ra trên toàn cÁu và đã gây ra nhiÃu thiát h¿i cho các cá nhân và tá chāc Các kẻ t¿n công th°ång sử dāng phÁn mÃm đác h¿i nh° Trojan hoặc spyware để cài đặt keylogger trên máy tính cÿa n¿n nhân mà không bá phát hián Kỹ thuÃt đánh cÅp tài khoÁn dùng keylog th°ång đ°ÿc nhiÃu hacker sử dāng vì văa đ¢n giÁn văa hiáu quÁ Tùy vào các lo¿i keylogger khác nhau thì nó s¿ có khÁ năng thu thÃp thông tin khác nhau, nh°ng th°ång thì các phÁn mÃm theo dõi máy tính này đÃu có thể khai thác các thông tin nh°: Ghi l¿i mÃt kh¿u b¿n đã đăng nhÃp trên thiÁt bá, Gửi bÁn báo cáo đã ghi thông qua email đÁn đáa chß email, FTP, HTTP, Chāp Ánh màn hình thiÁt bá vãi chu kì cá đánh, Các āng dāng đang ch¿y trên thiÁt bá đÃu đ°ÿc ghi l¿i, Chāp các website b¿n đã truy cÃp, ghi l¿i URL b¿n đã vào bằng trình duyát, Chāp bÁn sao email b¿n đã gửi, Chāp bÁn ghi màn hình cÿa t¿t cÁ tin nhÅn tă Zalo, What's app, Facebook Messenger, Viber,& Keylogger ghi l¿i t¿t cÁ thao tác phím và còn chāp màn hình tă thiÁt bá Khi đã l¿y đ°ÿc thông tin, phÁn mÃm Keylogger có thể l°u trÿ dÿ liáu trên á cāng hoặc chuyển thông tin và mát máy đ°ÿc chß đánh tr°ãc (hoặc server khác) keylogger đ°ÿc viÁt ra vãi chß có mát lo¿i duy nh¿t là giúp các b¿n giám sát con cái, ng°åi thân xem họ làm gì vãi máy
Trang 26tính, vãi internet, khi chat vãi ng°åi l¿ nh°ng cách sử dāng và chāc năng cÿa keylogger hián t¿i trên thÁ giãi khiÁn ng°åi ta th°ång hay phân lo¿i keylogger theo māc đá nguy hiểm phā thuác vào nhÿng điểm ng°åi dùng gặp phÁi nh°: nhißm vào máy không qua cài đặt/Cài đặt vào máy cāc nhanh (quick install), Có thuác tính ¿n/gi¿u trên trình quÁn lý tiÁn trình (process manager) và trình cài đặt và gỡ bß ch°¢ng trình (Add or Remove Program), Có thêm chāc năng Capturescreen hoặc ghi l¿i thao tác chuát, khó gỡ cài đặt, Có khÁ năng lây nhißm, cháng tÅt (kill process) Cā mßi câu trÁ låi "có", cho mát điểm Điểm càng cao, keylogger càng v°ÿt khßi māc đích giám sát (monitoring) đÁn vãi māc đích theo dõi gián điáp (spying) và tính nguy hiểm nó càng cao Keylogger có thể đ°ÿc phân lo¿i theo sá điểm: ch¿y công khai thông báo cho ng°åi bá giám sát đúng vãi māc đích giám sát, ch¿y ngÁm h°ãng đÁn māc đích theo dõi gián điáp h¢n là giám sát (nguy h¿i đÁn các thông tin cá nhân nh° là tài khoÁn cá nhân, mÃt kh¿u, thẻ tín dāng vì ng°åi dùng không biÁt), ¿n gi¿u hoàn toàn theo dõi trên mát ph¿m vi ráng vãi māc đích do thám rõ ràng(lo¿i r¿t nguy hiểm), th°ång đ°ÿc mang theo bçi các trojan-virus cāc kỳ khó tháo gỡ là lo¿i keylogger nguy hiểm nh¿t Thông th°ång, mát ch°¢ng trình keylogger s¿ gßm có ba phÁn chính PhÁn mát là ch°¢ng trình điÃu khiển (Control Program) dùng để theo điÃu phái ho¿t đáng, tinh chßnh các thiÁt lÃp, xem các tÃp tin nhÃt ký cho keylogger PhÁn này là phÁn đ°ÿc gi¿u kỹ nh¿t cÿa keylogger, thông th°ång chß có thể gọi ra bằng mát tá hÿp phím tÅt đặc biát PhÁn 2 là tÃp tin hook, hoặc là mát ch°¢ng trình monitor dùng để ghi nhÃn l¿i các thao tác bàn phím, capture screen (đây là phÁn quan trọng nh¿t) PhÁn thā ba là tÃp tin nhÃt ký (log), n¢i chāa đāng/ghi l¿i toàn bá nhÿng gì hook ghi nhÃn đ°ÿc Các lo¿i keylogger thông th°ång khi cài đặt vào máy cũng giáng nh°
Trang 27mọi ch°¢ng trình máy tính khác, đÃu phÁi qua b°ãc cài đặt ĐÁu tiên nó
phāc t¿p), sau đó đăng ký cách thāc ho¿t đáng rßi đÿi ng°åi dùng thiÁt lÃp thêm các āng dāng Sau đó nó bÅt đÁu ho¿t đáng nh°ng đặc biát vãi lo¿i keylogger theo virus có thể vào thẳng máy cÿa ng°åi dùng bß qua
lo¿i tā thÁ (drop) vào các ch°¢ng trình khác, để ng°åi dùng sử dāng các ch°¢ng trình này keylogger s¿ tā đáng ch¿y theo
● Brute force: là mát kỹ thuÃt t¿n công mÃt kh¿u mà kẻ t¿n công sử dāng các phÁn mÃm đác h¿i để đoán các mÃt kh¿u bằng cách thử nhiÃu mÃt kh¿u khác nhau cho đÁn khi tìm ra mÃt kh¿u đúng Kỹ thuÃt này th°ång đ°ÿc sử dāng để t¿n công các tài khoÁn đăng nhÃp bằng mÃt kh¿u, bao gßm cÁ tài khoÁn ngân hàng, email và các dách vā trāc tuyÁn khác.Tình tr¿ng Brute force chiÁm đo¿t tài khoÁn vÁn r¿t phá biÁn trên toàn thÁ giãi, và các kẻ t¿n công th°ång sử dāng các danh sách mÃt kh¿u phá biÁn để t¿n công các tài khoÁn Họ có thể sử dāng các công cā tā đáng để thử hàng ngàn mÃt kh¿u khác nhau mßi giây Vì vÃy nó là mát cách hiáu quÁ để đánh cÅp tài khoÁn cÿa ng°åi dùng Māc đích chính cÿa hình thāc t¿n công Brute Force là để tìm ra mÃt kh¿u và tài khoÁn có giá trá cao Các lo¿i Brute Force phá biÁn hián nay là: Simple Brute Force Attack(sử dāng cách tiÁp cÃn có há tháng để <đoán= username hay password mà không cÁn dāa vào external logic), Hybrid Brute Force Attack(dāa vào external logic nó có thể xác đánh các tá hÿp password có khÁ năng thành công cao nh¿t kÁt hÿp vãi Simple Brute Force Attack để thử nhiÃu tá hÿp nh¿t có thể), Dictionary Attack(sử dāng mát tă điển các xâu hay cām tă khÁ thi để đoán username và password cÿa ng°åi dùng), Rainbow Table Attack(là mát bÁng đ°ÿc
Trang 28tính toán tr°ãc để so khãp vãi kÁt quÁ cÿa các hàm hash có thể dùng để đoán mát hàm có đá dài xác đánh và chāa mát tÃp hÿp các kí tā cā thể), Reverse Brute Force Attack (sử dāng mát password chung hay mát tÃp hÿp các password để thử vãi nhiÃu username khÁ thi nhÅm vào mát m¿ng ng°åi dùng mà các hacker đã đánh cÅp đ°ÿc dÿ liáu tr°ãc đó), Credential Snuffing(sử dāng các cặp password và username đã biÁt tr°ãc và thử chúng trên nhiÃu trang web khác nhau vì có không ít ng°åi dùng có thói quen sử dāng cùng mát cặp password và username trên nhiÃu há tháng trang web khác nhau)
● Social engineering: là kÁt hÿp giÿa 2 tă Social (xã hái) và Engineering (kỹ thuÃt), thể hián bÁn ch¿t cÿa kiểu t¿n công này: các mánh khóe, kỹ thuÃt t¿n công nhÅm vào bÁn tính xã hái cÿa con ng°åi, thā mà không hà tßn t¿i trong máy móc Social Engineering Attack còn đ°ÿc biÁt đÁn vãi cái tên T¿n công phi kỹ thuÃt, nhằm lăa đÁo ng°åi dùng bằng cách t¿o ra mát tình huáng giÁ m¿o để kích ho¿t hành đáng cÿa ng°åi dùng và chiÁm đo¿t thông tin cá nhân hoặc tiÃn cÿa họ Social engineering th°ång đ°ÿc sử dāng để t¿n công các tài khoÁn ngân hàng, email và các dách vā trāc tuyÁn khác Tình tr¿ng Social engineering chiÁm đo¿t tài khoÁn đang ngày càng phá biÁn và phāc t¿p h¢n Các kẻ t¿n công sử dāng các chiêu lăa đÁo tinh vi để kích ho¿t hành đáng cÿa ng°åi dùng, bao gßm gửi email giÁ m¿o tă các tá chāc tài chính hoặc các dách vā trāc tuyÁn phá biÁn, gọi đián tho¿i giÁ m¿o tă các tá chāc tài chính hoặc tá chāc chính phÿ, hoặc t¿o ra các trang web giÁ m¿o để lăa đÁo ng°åi dùng Qua đó, kẻ t¿n công có thể đ¿t đ°ÿc các māc đích cÿa mình nh° xâm nhÃp vào há tháng thông qua thông tin đ°ÿc khai thác, truy cÃp thông tin quan trọng,& mà không cÁn phÁi thāc hián nhÿng kỹ thuÃt t¿n công quá phāc t¿p Có thể th¿y đ°ÿc t¿n công phi kỹ thuÃt không
Trang 29giãi h¿n hình thāc, ph°¢ng thāc, n¿n nhân và thÿ ph¿m B¿t kỳ ai đÃu có thể là tái ph¿m và b¿t kỳ ai đÃu có thể là n¿n nhân Chúng có thể t¿n công bằng viác giao tiÁp trāc tiÁp vãi con ng°åi hoặc giao tiÁp gián tiÁp vãi con ng°åi thông qua các thiÁt bá kỹ thuÃt, đián tử và ngày càng sử dāng cách thāc tinh vi h¢n Mát vài cách thāc t¿n công phá biÁn nh°: phishing, baiting(là hình thāc t¿n công phi kỹ thuÃt th°ång xÁy ra giÿa nhÿng ng°åi có mái liên há xã hái, ng°åi quen Khi có đ°ÿc sā tín nhiám cÿa n¿n nhân, kẻ t¿n công tiÁn hành gửi/ m°ÿn usb hoặc các thiÁt bá công nghá có chāa mã đác khiÁn ng°åi dùng sử dāng thiÁt bá đó để đăng nhÃp vào há tháng công ty ), vishing (là hình thāc lăa đÁo m¿o danh thông qua đián tho¿i Kẻ t¿n công gọi đián cho con n¿n nhân, đóng giÁ làm mát tá chāc hoặc cá nhân uy tín để có đ°ÿc lòng tin cÿa n¿n nhân Bằng cách đó,n¿n nhân s¿ không mÁy may nghi ngå và cung c¿p cho chúng các thông tin nh¿y cÁm nh° sá tài khoÁn ngân hàng, mÃt kh¿u quan trọng&), piggybacking( là hình thāc Social Engineering mà kẻ t¿n công lăa ng°åi có th¿m quyÃn để đát nhÃp vào công ty Trong hình thāc này, kẻ t¿n công đóng giÁ là nhân viên chính thāc/ ng°åi thân/ thÿ sửa chÿa/ ng°åi có th¿m quyÃn, yêu cÁu thông tin quan trọng hoặc các thông tin cÁn thiÁt để đăng nhÃp há tháng, gÅn các thiÁt bá theo dõi hoặc trāc tiÁp t¿n công há tháng/ chiÁm đo¿t tài sÁn), sử dāng các thiÁt bá nghe lén và camera để theo dõi các hành vi cÿa đái t°ÿng mà chúng muán khai thác thông tin
1.2.5 Gian l¿n thẻ tín dÿng
Gian lÃn thẻ tín dāng là hành vi lăa đÁo nhằm sử dāng trái phép thông tin thẻ tín dāng cÿa ng°åi khác để chi tiêu hoặc rút tiÃn mà không đ°ÿc sā cho phép cÿa chÿ sç hÿu thẻ Thông th°ång, các kẻ gian lÃn s¿ sao chép thông tin
Trang 30tă thẻ tín dāng cÿa n¿n nhân bằng cách sử dāng các thiÁt bá đọc thẻ hoặc phÁn mÃm đác h¿i trên các thiÁt bá đián tử và sau đó sử dāng thông tin này để mua sÅm trāc tuyÁn hoặc t¿i các cửa hàng.Các hình thāc gian lÃn thẻ tín dāng bao gßm cÁ viác sao chép thông tin thẻ tín dāng tă các máy ATM hoặc các thiÁt bá thanh toán đián tử, giÁ m¿o thẻ tín dāng bằng cách t¿o ra các thẻ giÁ m¿o hoặc sử dāng các thẻ tín dāng đã bá m¿t hoặc bá đánh cÅp Ngoài ra, các kẻ lăa đÁo còn có thể tìm cách l¿y thông tin thẻ tín dāng cÿa n¿n nhân thông qua các cuác gọi đián tho¿i giÁ m¿o hoặc các email lăa đÁo
Mát sá cách phá biÁn nhÿng kẻ lăa đÁo có thể có đ°ÿc sá thẻ tín dāng: ● Mát ng°åi phāc vā đánh cÅp sá thẻ và sử dāng nó Hacker hay nhÿng
kẻ lăa đÁo s¿ cá gÅng đánh cÅp thông tin và danh tính bằng cách thu hút ng°åi dùng đÁn mát trang web giÁ m¿o n¢i ng°åi bá lăa cung c¿p sá thẻ cÿa mình Kẻ trám sau đó sử dāng thông tin thẻ tín dāng cÿa b¿n thanh toán hoặc rút tiÃn
● Sử dāng thẻ t¿i ATM Ai đó có thể đã cài đặt skimmer thẻ tín dāng để đánh cÅp thông tin tài khoÁn cÿa ng°åi dùng Skimmer thẻ tín dāng là mát thiÁt bá nhß mà kẻ trám có thể cài đặt ç b¿t cā n¢i nào ng°åi sử dāng có thể quẹt thẻ Skimming đã đ°ÿc chāng minh là mát cách hiáu quÁ để nhÿng tên trám đánh cÅp thông tin thẻ tín dāng
● Đôi khi thông tin thẻ tín dāng cÿa ng°åi dùng bá đánh cÅp không có lßi cÿa họ Sá thẻ tín dāng cÿa ng°åi dùng có thể bá đánh cÅp do dÿ liáu cÿa các đ¢n vá thanh toán mà ng°åi dùng hay sử dāng bá đánh cÅp mua bán hoặc chia sẻ Kẻ x¿u sau đó có thể sử dāng thông tin này để trÁ các khoÁn phí trāc tuyÁn vãi sá tài khoÁn thẻ tín dāng đã chiÁm đo¿t đ°ÿc
● Kẻ t¿n công th°ång mua sá thẻ tín dāng bá đánh cÅp trên web đen, mát phÁn cÿa web mà chß truy cÃp thông qua phÁn mÃm đặc biát Sá thẻ
Trang 31tín dāng có giá trá đái vãi kẻ t¿n công và chúng sử dāng các web đen b¿t hÿp pháp để có che gi¿u hành vi ph¿m tái và rửa tiÃn sau khi chiÁm đo¿t đ°ÿc tiÃn tă thẻ tín dāng
● Thông tin bá chiÁm đo¿t do ng°åi quen cÿa ng°åi sử dāng có thể truy cÃp hoặc kỹ thuÃt viên dách vā - có thể quÁn lý để truy cÃp thẻ tín dāng cÿa khách hàng và sử dāng thông tin thẻ tín dāng cÿa ng°åi dùng mát cách b¿t hÿp pháp mà ch°a có sā đßng ý tă chÿ sç hÿu
1.3 Hß thßng gian l¿n tài chính 1.3.1 Táng quan hß thßng
Há tháng phát hián b¿t th°ång trên há sinh thái ngân hàng dāa trên nÃn tÁng là các service ch¿m điểm rÿi ro, phân tích dÿ liáu tă thông tin giao dách cÿa khách hàng để đ°a ra cÁnh báo và giao dách đáng ngå, phát hián tài khoÁn bá đánh cÅp (Hình 1.1)
Hình 1 1 Há tháng phát hián giao dách b¿t th°ång cÿa ngân hàngViác phát hián nhÁm giao dách gian lÃn xÁy ra khi há tháng phát hián gian lÃn đọc sai các giao dách thāc và gÅn cå chúng là gian lÃn, giao dách bá tă
Trang 32chái ĐiÃu này có thể dÁn đÁn làm tán h¿i đÁn mái quan há giÿa khách hàng chÿ tài khoÁn và ngân hàng Có thể dÁn đÁn viác ng°åi bán bá m¿t doanh sá do giao dách bá tă chái NÁu há tháng không đ°ÿc hiáu chßnh để giÁm thiểu thông tin sai lách, ngân hàng có nguy c¢ m¿t khách hàng khi phân lo¿i sai các giao dách hÿp pháp là gian lÃn NÁu ngân hàng hÿy thẻ tín dāng trong tr°ång hÿp nh° vÃy, thì ngân hàng phÁi tā trÁ chi phí ho¿t đáng nh° in thẻ mãi và gửi chúng cho khách hàng ĐiÃu này có thể dÁn đÁn m¿t lòng tin và gia tăng sā råi bß cÿa khách hàng Do đó, các ngân hàng phÁi càng chính xác càng tát trong viác phân biát giÿa giao dách thÃt và giao dách gian lÃn
1.3.2 Hß thßng phát hißn gian l¿n cÿa Alipay
Theo sá liáu tháng kê năm 2017, sá l°ÿng và khái l°ÿng giao dách trāc tuyÁn lÁn l°ÿt đ¿t 48 tỷ giao dách và 2,075 nghìn tỷ nhân dân tá [1] Công ty con Ant Financial hay còn đ°ÿc gọi là Alipay, chiÁm khoÁng 58% Giao dách thanh toán trāc tuyÁn bên thā ba cÿa Trung Quác Để thu thÃp và phân tích sá l°ÿng giao dách nh° vÃy yêu cÁu mát c¢ sç dÿ liáu m¿nh m¿ để l°u trÿ và quÁn lý H¢n nÿa, yêu cÁu há tháng tính toán phân tán quy mô lãn để ch¿y các thuÃt toán Để đáp āng các yêu cÁu và đá trß th¿p cho phāc vā trāc tuyÁn, dā đoán trāc tuyÁn vãi truy cÃp dÿ liáu hiáu quÁ có ý ngh*a r¿t quan trọng Các ph°¢ng pháp dāa trên quy luÃt đã đ°ÿc nghiên cāu ráng rãi cho v¿n đà phát hián gian lÃn Tuy nhiên, các cách thāc gian lÃn thay đái nhanh chóng theo thåi gian, làm giÁm đáng kể đá chính xác cÿa viác sử dāng luÃt Sau đó, nhiÃu ph°¢ng pháp dāa trên khai thác dÿ liáu đã đ°ÿc nghiên cāu
Dÿ liáu giao dách th°ång có hai đặc điểm: ● M¿t cân bằng nhãn tāc là phÁn lãn các giao dách là giao dách bình
th°ång chß sá l°ÿng nhß là giao dách gian lÃn
Trang 33● So vãi phân tích cá nhân hß s¢ giao dách, dÿ liáu táng hÿp th°ång cung c¿p nhiÃu thông tin phong phú h¢n để xác đánh các mô hình gian lÃn
Để giÁi quyÁt v¿n đà này có nhiÃu h°ãng giÁi quyÁt nh° mát sá ph°¢ng pháp học không giám sát đ°ÿc đà xu¿t hoặc mát sá chiÁn l°ÿc táng hÿp dÿ liáu hián có đ°ÿc áp dāng để phát hián gian lÃn tuy nhiên hÁu hÁt các ph°¢ng pháp tr°ãc đây khó có thể nÅm bÅt đ°ÿc sā phāc t¿p cách thāc gian lÃn cÿa các giao dách trāc tuyÁn Các gian lÃn giao dách trāc tuyÁn có thể đ°ÿc phân lo¿i thành hai lo¿i khác nhau là: rõ ràng trong viác nhÃn biÁt các hành vi b¿t th°ång và ng°ÿc l¿i là không rõ ràng Tr°ång hÿp, ng°åi dùng nhÃn thāc đ°ÿc gian lÃn sau khi giao dách hoàn t¿t có thể gửi báo cáo gian lÃn và tÁi lên các bằng chāng và viác đó Dāa trên các chi tiÁt giao dách, hß s¢ và bằng chāng, tính xác thāc cÿa giao dách gian lÃn s¿ bá xác thāc NÁu ng°åi dùng này thāc sā gian lÃn, nhÿng kẻ gian lÃn s¿ bá xử lý bằng viác đái mặt vãi luÃt pháp hoặc các chÁ tài xử lý cÿa tá chāc, chẳng h¿n nh° h¿n chÁ hành đáng hoặc khóa tài khoÁn nh°ng nó có thể thu hßi thiát h¿i theo quy đánh cÿa pháp luÃt Đó là tr°ång hÿp lo¿i hình gian lÃn rõ ràng, còn trong mát tr°ång giao dách gian lÃn không rõ ràng, điÃu chúng ta quan tâm là l¿y hành đáng chÿ đáng để ngăn chặn sā kián gian lÃn tiÃm ¿n giao dách, tāc là chÿ đáng phát hián gian lÃn giao dách trāc tuyÁn và thāc hián các b°ãc ngay lÃp tāc để ngăn chặn các giao dách đáng ngå Trái ng°ÿc vãi gian lÃn rõ ràng, giao dách gian lÃn không rõ ràng tiÁt lá ít h¢n thông tin và yêu cÁu dā đoán thåi gian thāc cÿa há tháng Há tháng Alipay có khoÁng 50 đặc tr°ng đ°ÿc thiÁt kÁ Các đặc tr°ng đó là các đặc tr°ng c¢ bÁn cũng đ°ÿc coi là quy tÅc hoặc thuác tính Đái vãi mßi ng°åi dùng s¿ có các đặc tr°ng táng hÿp d°ãi d¿ng thông tin bá sung tă các bÁn ghi giao dách táng hÿp Các đặc tr°ng c¢ bÁn và các đặc tr°ng táng hÿp sau đó đ°ÿc nái vãi nhau Các nhãn đ°ÿc thu thÃp tă các báo cáo gian lÃn cÿa ng°åi dùng do đó không thể l¿y đ°ÿc
Trang 34trong thåi gian thāc Để tìm ra gian lÃn mát cách chính xác cÁn điÃu tra ráng rãi và xác thāc các ph°¢ng pháp dāa trên quy tÅc, ph°¢ng pháp phát hián b¿t th°ång và mô hình phân lo¿i
Các ph°¢ng pháp dāa trên quy tÅc đ°ÿc sử dāng ráng rãi trong nhiÃu āng dāng phát hián gian lÃn Trong đó Iterative Dichotomiser là mát cách tiÁp cÃn truyÃn tháng dāa trên học cây quyÁt đánh trong khi là phiên bÁn sửa đái để trích xu¿t các mÁu thông tin tă dÿ liáu vãi đá chính xác cao h¢n Các đặc tr°ng đ°ÿc coi nh° quy tÅc và thông tin nhãn đ°ÿc sử dāng để tinh chßnh Còn Isolation Forest (IF) là mát công cā phát hián b¿t th°ång cá điển, trong đó ph°¢ng pháp này đ°ÿc sử dāng ráng rãi do tính hiáu quÁ cÿa nó Chúng ta coi các đặc tr°ng là thuác tính và dā đoán trāc tiÁp các giao dách gian lÃn vì nó không yêu cÁu b¿t kỳ thông tin nhãn nào Phát hián gian lÃn giao dách t°¢ng tā nh° viác tìm ra các giao dách b¿t th°ång, tāc là tìm ra các ngo¿i lá có nhÿng đặc điểm r¿t khác so vãi các dÿ liáu bình th°ång Công ty Alipay sử dāng há tháng phát hián gian lÃn TitAnt có kiÁn trúc nh° hình 1.2
Hình 1 2 Há tháng phát hián giao dách b¿t th°ång cÿa Alipay(TitAnt)
Trang 35Hệ thống TitAnt
Để đÁm bÁo phÁn hßi káp thåi đái vãi các yêu cÁu phát hián gian lÃn, công cā dā đoán đá trß th¿p, nÃn tÁng l°u trÿ c¢ sç dÿ liáu m¿nh m¿ và các thuÃt toán phân tán phÁi đ°ÿc thiÁt kÁ c¿n thÃn Viác hu¿n luyán AI ngo¿i tuyÁn n¢i các mô hình đ°ÿc đào t¿o trên c¢ sç thåi gian cá đánh và các táp mô hình đ°ÿc tÁi lên công cā dā đoán trāc tuyÁn để theo dõi giao dách theo thåi gian thāc Sau khi ng°åi dùng bÅt đÁu yêu cÁu giao dách trong Alipay, nhÃt ký giao dách s¿ đ°ÿc gửi đánh kỳ tãi MaxCompute cho tính toán MaxCompute hß trÿ SQL và MapReduce để trích xu¿t các tính năng/nhãn c¢ bÁn và xây dāng m¿ng giao dách Đßng thåi KunPeng hß trÿ hu¿n luyán mô hình phân lo¿i phân tán quy mô lãn Các mô hình phân lo¿i và node embedding ng°åi dùng đã học s¿ đ°ÿc l°u trÿ trong MaxCompute Dā đoán trāc tuyÁn đ°ÿc thāc thi t¿i Model Server (MS) n¢i các táp mô hình đ°ÿc cÃp nhÃt đánh kỳ Khi mát giao dách đ°ÿc t¿o bçi ng°åi dùng trong āng dāng Alipay, máy chÿ Alipay ngay lÃp tāc gửi yêu cÁu tãi máy chÿ Model Server (MS), MS sau đó l¿y dÿ liáu liên quan tă Ali-HBase và đ°a ra dā đoán theo thåi gian thāc NÁu giao dách bá phát hián là gian lÃn giao dách đang dißn ra s¿ bá gián đo¿n và ng°åi chuyển tiÃn s¿ đ°ÿc thông báo Các thành phÁn trong há tháng TitAnt s¿ đ°ÿc trình bày chi tiÁt nh° sau:
MaxCompute
MaxCompute dùng để quÁn lý tác vā tính toán cho há tháng TitAnt Tr°ãc đây MaxCompute đ°ÿc gọi là dách vā xử lý dÿ liáu mç, mát nÃn tÁng quÁn lý và l°u trÿ c¢ sç dÿ liáu Nó có ba lãp logic: lãp máy khách, lãp máy chÿ và lãp l°u trÿ & tính toán Nhà phát triển có thể đăng nhÃp bằng tài khoÁn
Trang 36cloud cÿa họ và gửi công viác bằng bÁng điÃu khiển web ç lãp máy khách, n¢i máy chÿ HTTP nhÃn lánh và gửi thông báo đÁn lãp tiÁp theo
Hình 1 3 KiÁn trúc MaxCompute Lãp máy chÿ (Server layer) bao gßm worker (chāa các nhiám vā cÁn thāc thi), executor (làm nhiám vā thāc thi lánh) và Scheduler (chāa lách theo dõi executor) Ngoài ra, còn có các xử lý b¿t đßng nh¿t, chẳng h¿n nh° mapreduce, SQL, v.v., có thể đ°ÿc nhÃn d¿ng và vÃn hành trong lãp l°u trÿ và tính toán dāa trên Pangu và Fuxi, trong đó Pangu là mô-đun l°u trÿ và Fuxi là mô-đun lÃp lách tài nguyên Khi mát lánh SQL đ°ÿc gửi bçi bÁng điÃu khiển web thông báo s¿ đ°ÿc gửi đÁn máy chÿ HTTP yêu cÁu xác minh thông tin tài khoÁn cloud NÁu xác thāc thành công, công viác s¿ đ°ÿc giao cho worker và các công viác t°¢ng āng s¿ đ°ÿc gửi đÁn bá lÃp lách Sau đó bá lÃp lách đăng ký phiên bÁn trong Open Table Service (OTS) thông qua công cā lÃp kÁ ho¿ch SQL và tr¿ng thái cÿa nó đ°ÿc đặt đßng thåi là "đang ch¿y" OTS duy trì tr¿ng thái cÿa t¿t cÁ các phiên bÁn Cuái cùng, bá lÃp lách thêm phiên bÁn vào hàng đÿi và ID phiên bÁn t°¢ng āng s¿ đ°ÿc t¿o Sau đó, bá lÃp lách s¿ chia nhiám
Trang 37vā cÿa thể hián công viác thành nhiÃu nhiám vā con, các nhiám vā này đ°ÿc sÅp xÁp thành nhiám vā nhóm theo thā tā °u tiên Sau đó, lách trình tiÁp tāc chå đÿi cho các tài nguyên có sẵn cho máy tính Ngay sau khi điÃu kián tài nguyên đ°ÿc thßa mãn các nhiám vā con đ°ÿc gửi thāc thi yêu cÁu Fuxi kích ho¿t tài nguyên máy tính trong lãp tính toán Khi t¿t cÁ các nhiám vā con đ°ÿc kÁt thúc, ng°åi thi hành cÃp nhÃt tr¿ng thái riêng biát nh° "ch¿m dāt" trong OTS
KunPeng
Hình 1 4 KiÁn trúc há tháng cÿa KunPeng Trên thāc tÁ có r¿t nhiÃu giao dách cÁn phân tích mßi ngày, do đó đòi hßi có mát nÃn tÁng tính toán phân tán Các tiêu chu¿n truyÃn tháng nh° MPI không có khÁ năng cháu lßi tát Máy chÿ hß trÿ lßi trong tr°ång hÿp lßi có thể đ°ÿc tā đáng khçi đáng l¿i và khôi phāc và tr¿ng thái tr°ãc đó trong khi các phiên bÁn khác không bá Ánh h°çng Cân bằng há tháng phát triển dāa trên Máy chÿ tham sá framework n¢i có nhiÃu thuÃt toán học máy khác nhau ch¿y đßng thåi KunPeng hß trÿ song song thāc hián cÁ dÿ liáu và mô hình
Nh° minh họa trong hình 1.4 gßm các nút đ¿i dián máy chÿ l°u trÿ các tham sá mô hình trong khi các nút chāa nhiám vā (worker) cháu trách nhiám đào t¿o Dāa trên KunPeng ta thiÁt kÁ l¿i NLR(Nonlinear Logistic Regression) và phân lo¿i thuÃt toán Chẳng h¿n nh° DW(Deep Walk), S2V(Structure2Vec),
Trang 38LR(Logistic Regression) và GBDT(Gradient Boosting Decision Tree) Tă mát node nhÃn đ°ÿc chußi đ°¢ng đi node đó đÁn các node khác bằng thuÃt toán Random walk Đái vãi mßi lÁn lặp l¿i, tr°ãc tiên mßi node đọc mát lo¿t dÿ liáu trình tā và t¿o danh sách các node Các nút embedding sau đó đ°ÿc kéo tă các nút máy chÿ và đ°ÿc cÃp nhÃt theo đá dác cÿa hàm tái °u gác Sau đó chúng đ°ÿc embedding và cÃp nhÃt đ°ÿc tÁi lên máy chÿ Mặt khác, các nút máy chÿ cháu trách nhiám cho giao tiÁp vãi các nút nhiám vā con để trao đái dÿ liáu embedding ĐÁu tiên, các node máy chÿ khçi t¿o ngÁu nhiên các phÁn embedding và chå các yêu cÁu đ¿y tă các node nhiám vā Sau khi nhÃn đ°ÿc yêu cÁu đ¿y các thông tin t°¢ng āng s¿ đ°ÿc gửi Sau khi cÃp nhÃt tăng nút các máy chÿ s¿ nhÃn các phÁn nút embedding mãi và táng hÿp chúng bằng cách thāc thi ho¿t đáng trung bình cÿa mô hình
MS and Ali-HBase
Hình 1 5 KiÁn trúc há tháng cÿa Ali-HBase Khi phÁn hu¿n luyán ngo¿i tuyÁn kÁt thúc, dā đoán thåi gian thāc trāc tuyÁn s¿ ho¿t đáng Hình 1.5 cho th¿y mát ví dā minh họa và toàn bá quá trình dā đoán thåi gian thāc Khi ng°åi dùng chuyển tiÃn trong āng dāng Alipay yêu cÁu chuyển khoÁn đ°ÿc gửi đÁn máy chÿ Alipay sau đó MS giám sát gian lÃn MS đ°ÿc phân phái để đáp āng đá trß th¿p và dách vā tÁi tác đá cao Nh° thể hián trong Hình 1.5, giao dách TID=2 có thể là gian lÃn vãi xác su¿t gian lÃn dā đoán là 99%, do đó MS gửi cÁnh báo đÁn máy chÿ Alipay điÃu này s¿ tiÁp
Trang 39tāc làm gián đo¿n giao dách đang dißn ra t°¢ng āng Ali-HBase dāa trên HBase HBase đÁu tiên đ°ÿc đà xu¿t là Bigtable mát giÁi pháp phân tán có thể mç ráng kho dÿ liáu, phù hÿp vãi viác truy cÃp dÿ liáu thåi gian thāc Nh° đ°ÿc hiển thá trong hình 1.5, Column Family (CF) đÁu tiên là các thông tin c¢ bÁn bao gßm tuái, giãi tính và thành phá là đặc tr°ng c¢ bÁn Column Family (CF) tiÁp theo là thông tin ng°åi dùng sau khi đã đ°ÿc sá hóa thành node embedding
Hình 1 6 KiÁn trúc há tháng cÿa MS và sā t°¢ng tác vãi các thành phÁn khác
Trong hình 1.6, ng°åi dùng nh° Zoe, Sam và Liam là các hàng để lÃp chß māc dÿ liáu t°¢ng āng Mßi lÁn hu¿n luyán mô hình ngo¿i tuyÁn hoàn thành dÿ liáu đ°ÿc tÁi lên Ali-HBase theo phiên bÁn đ°ÿc đánh d¿ng bçi thåi gian là ngày giå
Các vấn đề triển khai và xây dựng mạng lưới giao dịch
ĐÁu tiên, há tháng có các yêu cÁu phāc vā khÅt khe nh° thåi gian ngÅn chß tính bằng mili giây để phát hián trāc tuyÁn bao gßm cÁ chi phí tính toán và liên l¿c Tuy nhiên, viác đánh nhãn th°ång bá trß vì chúng đ°ÿc thu thÃp thông qua phÁn hßi cÿa ng°åi dùng Trong đó hu¿n luyán mô hình trāc tuyÁn là không thāc tÁ Vì vÃy áp dāng đánh kỳ đào t¿o ngo¿i tuyÁn và dā đoán thåi gian thāc trong há tháng là ph°¢ng án hÿp lý đ°ÿc đà xu¿t
Trang 40Thā hai,trong há tháng chß chāng minh tính hÿu ích cÿa viác embedding nút ng°åi dùng học đ°ÿc tă giao dách m¿ng Ta có thể có đ°ÿc thông tin táng hÿp khác, chẳng h¿n nh° thông tin và thiÁt bá và IP Đó là mát câu hßi thú vá để xây dāng mát m¿ng không đßng nh¿t Để trÁ låi câu hßi nh° vÃy tă dÿ liáu ng°åi dùng s¿ đ°ÿc bá sung để đ°a ra nhÿng h°ãng đi trong t°¢ng lai
Thiết lập thử nghiệm
Há tháng áp dāng chÁ đá <T+1= để cÃp nhÃt mô hình, điÃu đó có ngh*a là mát mô hình s¿ đ°ÿc đào t¿o và triển khai theo cách ngo¿i tuyÁn hàng ngày và s¿ đ°ÿc sử dāng để dā đoán cho ngày hôm sau trên c¢ sç thåi gian thāc Để chāng minh hiáu quÁ cÿa há tháng Alipay đã tiÁn hành mát sá thử nghiám và báo cáo hiáu su¿t cÿa mßi ngày trong mát tuÁn liên tāc Táng cáng có bÁy bá dÿ liáu Trong đó mßi cái đ°ÿc cÅt thành ba tÃp hÿp con: mßi ng°åi đ¿i dián cho 1 node, mát node khác để hu¿n luyán mô hình phân lo¿i và cuái cùng để thử nghiám Thu thÃp hß s¢ giao dách trong 90 ngày để xây dāng m¿ng l°ãi giao dách 14 ngày tiÁp theo, các bÁn ghi đ°ÿc dán nhãn đ°ÿc coi là tÃp hu¿n luyán và ngày cuái cùng cÿa các bÁn ghi đ°ÿc dán nhãn đ°ÿc sử dāng cho bá kiểm tra
Hình 1 7 Chia dataset hu¿n luyán và thử nghiám mô hình dā báo