1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận dữ liệu lớn trong kinh tế và kinh doanh chủ Đề big data và Ứng dụng của big data trong lĩnh vực ngân hàng

23 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Big Data và ứng dụng của Big Data trong lĩnh vực ngân hàng
Tác giả Nguyễn Thị Thanh Huyền, Phạm Thị Diệp Linh, Lương Tường Vy
Người hướng dẫn TS Đặng Xuân Thọ
Trường học Học viện Chính sách và Phát triển
Chuyên ngành Dữ liệu lớn trong kinh tế và kinh doanh
Thể loại Tiểu luận
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 23
Dung lượng 2,1 MB

Nội dung

Dữ liệu khổng lồ về khách hàng có thể có từcác thông tin mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm,tương tác hay mua sắm trên website của mình.. Hơn thếnữa, ở tầm ngành

Trang 2

LỜI CẢM ƠN

Chúng em xin trân trọng cảm ơn tới Thầy Đặng Xuân Thọ - Học việnChính sách và Phát triển đã tận tình hướng dẫn, giúp đỡ chúng em hoànthành tiểu luận Những kiến thức và kinh nghiệm mà thầy truyền đạt đãgiúp chúng em có được một bài tiểu luận hoàn thiện và chất lượng Nhữnglời khuyên, định hướng và sự hỗ trợ của thầy đã giúp chúng em có đượcnhững ý tưởng mới, cách tiếp cận khác biệt, từ đó giúp chúng em viết bàitốt hơn

Chúng em cảm thấy rất may mắn khi có được sự giúp đỡ tận tình của thầy.Những bài giảng, tài liệu và phương pháp mà thầy truyền đạt không chỉgiúp chúng em hoàn thành bài tiểu luận, mà còn giúp em có thêm nhiềukiến thức và kỹ năng mới trong lĩnh vực của mình

Do chưa có nhiều kinh nghiệm làm để tài cũng như những hạn chế vềkiến thức, trong bài tiểu luận chắc chắn sẽ không tránh khỏi những thiếusót Rất mong nhận được sự nhận xét, ý kiến đóng góp, phê bình từ phíathầy để bài tiểu luận của chúng em được hoàn thiện hơn

Trang 3

MỤC LỤC

MỤC LỤC 1

MỞ ĐẦU 2

CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA 3

1.1 Khái niệm về Big Data 3

1.2 Nguồn gốc và sự phát triển của Big Data 3

1.3 Đặc trưng của Big Data 4

1.4 Cơ sở hạ tầng IT cần thiết để hỗ trợ Big Data và các công nghệ dữ liệu đặc biệt dành cho Big Data 5

1.4.1 Cơ sở hạ tầng IT cần thiết để hỗ trợ Big Data 5

1.4.2 Các công nghệ dữ liệu đặc biệt dành cho Big Data 6

1.4.3 Các ứng dụng của Big Data 7

CHƯƠNG 2: CÁC ỨNG DỤNG CỦA BIG DATA TRONG HOẠT ĐỘNG NGÂN HÀNG 9

2.1 Phân tích các thói quen chi tiêu của khách hàng 9

2.2 Phân khúc khách hàng và thẩm định hồ sơ 10

2.3 Bán chéo thêm các dịch vụ khác 10

2.4 Nâng cao chất lượng dịch vụ thông qua xây dựng hệ thống thu thập các phản hồi khách hàng và phân tích chúng 11

2.5 Marketing theo hướng cá nhân hóa 11

2.6 Thay đổi cách thức cung cấp dịch vụ đến khách hàng 12

2.7 Phát hiện và ngăn chặn hành vi lừa đảo, vi phạm pháp luật 12

2.8 Kiểm soát rủi ro, tuân thủ luật pháp và minh bạch trong báo cáo tài chính .13

2.9 Tham gia vào việc kiểm soát đánh giá và nâng cao hiệu quả làm việc của nhân viên 13

CHƯƠNG 3: HẠN CHẾ VÀ GIẢI PHÁP KHI ỨNG DỤNG BIG DATA Ở TRONG NGÂN HÀNG 14

3.1 Các hệ thống kế thừa đang gặp khó khăn trong việc theo kịp 14

3.2 Dữ liệu càng nhiều thì rủi ro càng lớn 15

3.3 Dữ liệu lớn đang trở nên không thể quản lý 16

3.4 Thay đổi tư duy về dữ liệu và các phương pháp xử lý các dữ liệu hiện đại của đội ngũ ngân hàng 17

3.5 Cần xây dựng được quy trình liên quan đến dữ liệu từ khâu thu nhập đến sử dụng kết quả xử lý dữ liệu 18

3.6 Xây dựng một đội ngũ chuyên viên khoa học dữ liệu 19

TÀI LIỆU THAM KHẢO 21

1

Trang 4

MỞ ĐẦU

Bí ẩn đằng sau các trang web thông minh là mọi sự chào mời sản phẩm đềudựa trên các nghiên cứu về sở thích, thói quen của khách hàng cũng nhưphân loại được nhóm khách hàng khác nhau… Vậy những thông tin đểphân tích này có được từ đầu và nó có tác động thế nào đến việc sản xuấtkinh doanh của doanh nghiệp? Dữ liệu khổng lồ về khách hàng có thể có từcác thông tin mà các doanh nghiệp thu thập trong lúc khách hàng ghé thăm,tương tác hay mua sắm trên website của mình Dữ liệu này cũng có thểđược mua lại từ các công ty chuyên cung cấp dữ liệu khách hàng Hơn thếnữa, ở tầm ngành và vĩ mô, ứng dụng dữ liệu lớn có thể giúp các tổ chức vàchính phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tươnglai để đầu tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thíchtăng trưởng kinh tế…

Là một tổ chức cung ứng dịch vụ tài chính cho hầu hết các chủ thể trongnền kinh tế, ngành Ngân hàng không thể đứng ngoài xu thế ứng dụng dữliệu lớn giống như các doanh nghiệp bán lẻ khác Đặc thù của hoạt độngngân hàng cho phép mỗi ngân hàng xây dựng một cơ sở dữ liệu khổng lồ,

từ dữ liệu có cấu trúc (lịch sử giao dịch, hồ sơ khách hàng) tới những dữliệu phi cấu trúc (hoạt động của khách hàng trên website, ứng dụng mobilebanking hay trên mạng xã hội) Ứng dụng Big Data nếu được khai tháchiệu quả sẽ đem lại những lợi thế cạnh tranh và hiệu quả to lớn trong lĩnhvực ngân hàng đặc biệt trong bối cảnh thị trường dịch vụ tài chính đangbão hòa Bài tiểu luận này của chúng em sẽ hệ thống lại những vấn đề cơbản về Big Data, trên cơ sở đó phân tích những ứng dụng của Big Data vàcác điều kiện nhằm ứng dụng Big Data ở lĩnh vực ngân hàng trong bố cảnhcách mạng công nghệ 4.0

2

Trang 5

NỘI DUNG CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA

1.1 Khái niệm về Big Data

Big Data hay được gọi là Dữ liệu lớn là một thuật ngữ cho việc xử lý mộthợp dữ liệu rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thôngkhông xử lý được Dữ liệu lớn bao gồm các thách thức như phân tích, thuthập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan,truy vấn và tính riêng tư Dữ liệu lớn chứa nhiều thông tin quý giá mà nếutrích xuất thành công, nó sẽ giúp ích rất nhiều cho việc kinh doanh, sảnxuất, y tế, giao thông, nghiên cứu khoa học,…

1.2 Nguồn gốc và sự phát triển của Big Data

Đối với nhiều người hiện nay thì thuyết trình về Big Data là một thuật ngữcòn khá mới mẻ nhưng thực ra, nguồn gốc của Big Data đã bắt đầu từnhững năm 1960 đến 1970 Đó là thời điểm mà thế giới dữ liệu chỉ mới bắtđầu với các trung tâm dữ liệu đầu tiên cùng với đó là sự phát triển của cơ

sở dữ liệu SQL

Năm 1984, Tập đoàn Teradata đã cho ra thị trường hệ thống xử lý dữ liệusong song DBC 1012 Đây chính là những hệ thống đầu tiên phân tích vàlưu trữ 1 terabyte dữ liệu Cho đến năm 2017, có hàng chục cơ sở dữ liệudựa trên hệ thống Teradata với dung lượng lên đến perabyte Trong đó dữliệu lớn nhất đã vượt ngưỡng 50 perabytes Năm 2000, Seisint Inc (nay làtập đoàn LexisNexis) đã phát triển thành công khung chia sẻ dữ liệu dựatheo cấu trúc C++ để truy vấn và lưu trữ dữ liệu Năm 2004, Google cho rabài báo về quá trình có tên gọi MapReduce thông qua mã nguồn mởApache Hadoop

Năm 2005, con người bắt đầu nhận ra rằng số lượng người dùng được tạo

ra thông qua Youtube, Facebook và các dịch vụ trực tuyến khác là cực kỳlớn Cùng năm đó, Hadoop đã được phát triển Cũng trong khoảng thờigian này, NoSQL cũng bắt đầu trở nên phổ biến Sự phát triển của

3

Trang 6

Framework ví dụ như Hadoop hoặc Spark là cần thiết cho sự phát triển củaBig Data Lý do là vì chúng khiến cho Big Data hoặt động dễ dàng hơn vàlưu trữ rẻ hơn

Hiện nay thì khối lượng Big Data đã tăng một cách nhanh chóng, nhữngngười sử dụng vẫn đang hàng ngày tạo ra một lượng dữ liệu vô cùng lớn.Tuy nhiên, có một điều thú vị là lượng dữ liệu đó không chỉ của con người

mà còn do máy móc tạo ra, thậm chí còn là chủ yếu Sự ra đời của IoT(Internet of Things), nhiều thiết bị và đối tượng được kết nối với Internet,

từ đó thu thập dữ liệu về mô hình sử dụng của người dùng và hiệu suất củasản phẩm Chính sự có mặt của IoT đã tạo ra nhiều dữ liệu hơn

1.3 Đặc trưng của Big Data

Đặc trưng của Big data bao gồm 3 yếu tố chính, được gọi là "3V": lượng

dữ liệu lớn (volume), tốc độ xử lý nhanh (velocity) và tính đa dạng, linhhoạt (variety)

a) Volume - Khối lượng dữ liệu

Big data là thuật ngữ nói về khối lượng dữ liệu lớn, kích thước lớn Xácđịnh giá trị của dữ liệu và kích thước dữ liệu là rất quan trọng và cần thiết,nếu khối lượng lớn, đó chính là Big data

Volume là khối lượng dữ liệu được các doanh nghiệp thu thập từ các nguồnkhác nhau, như IoT (Internet of Things), video, giao dịch kinh doanh, cácphương tiện truyền thông xã hội,

Khi công nghệ chưa có sự phát triển vượt bậc, việc lưu trữ lượng lớn dữliệu là một thách thức lớn Tuy nhiên ngày nay, các nền tảng lưu trữ giáthành rẻ như Hadoop và Data lake xuất hiện, việc lưu trữ đã trở nên dễdàng hơn nhiều

b) Velocity - Tốc độ xử lý

Dựa vào tốc độ xử lý của luồng dữ liệu để xác định đó có phải là Big datahay không Thường thì tốc độ của luồng dữ liệu trực tiếp vào bộ nhớ cao

4

Trang 7

hơn so với khi được ghi vào đĩa Đặc biệt là ngày nay, với sự phát triển củaIoT, các luồng dữ liệu truyền tải với tốc độ cực nhanh và chúng phải được

xử lý kịp thời

Ví dụ: Trên mạng xã hội Facebook, các thông báo như status, tweet, đã

cũ sẽ không được người dùng quan tâm và bị quên lãng nhanh chóng Dữliệu giờ đây được tính gần như vào thời gian thực và tốc độ cập nhật thôngtin dường như giảm xuống đơn vị mili giây

c) Variety - Tính đa dạng, linh hoạt

Đặc trưng tiếp theo của Big data chính là tính đa dạng, linh hoạt, ở dạngcấu trúc và phi cấu trúc, bao gồm dữ liệu số, Email, Video, âm thanh, giaodịch tài chính, Tính đa dạng ảnh hưởng đến hiệu suất, đây là một trongnhững vấn đề chính mà lĩnh vực Big data cần phải giải quyết

Ngoài 3 đặc trưng chính trên của Doug Laney, thì còn có thêm rất nhiềutiêu chí khác xác định đặc trưng của Big data, bao gồm: Veracity (Xácthực), Value (Giá trị), Relationality (Mối quan hệ),

1.4 Cơ sở hạ tầng IT cần thiết để hỗ trợ Big Data và các công nghệ dữ liệu đặc biệt dành cho Big Data

1.4.1 Cơ sở hạ tầng IT cần thiết để hỗ trợ Big Data

Đối với khái niệm Big Data để có thể làm việc, các tổ chức cần phải xâydựng được cơ sở hạ tầng để thu thập và chứa dữ liệu, cung caaos quyềntruy cập và đảm bảo thông tin trong khi chuyển tiếp và lưu trữ Cấp độ caohơn, bao gồm hệ thống lưu trữ và máy chủ được thiết kế cho Big Data, tíchhợp dữ liệu và phần mềm quản lý, phần mềm phân tích dữ liệu, thông tinkinh doanh và các ứng dụng Big Data Phần lớn các cơ sở hạ tầng này sẽtập trung một chỗ vì các công ty muốn tiếp tục tận dụng những khoản đầu

tư vào trung tâm dữ liệu của mình Tuy nhiên ngày càng có nhiều những tổchức dựa vào các dịch vụ điện toán đám mây để xử lý nhiều yêu cầu BigData của họ Thu thập dữ liệu đòi hỏi bắt buộc là phải có nguồn Một số

5

Trang 8

ứng dụng như các ứng dụng web, ứng dụng di động, các kênh truyền thông

xã hội và lưu trữ email đã được cài đặt sẵn Tuy nhiên, khi mà IoT trở nênphổ biến, các công ty có thể cần phải triển khai cảm biến trên tất cả các loạithiết bị, sản phẩm và phương thức để có thể thu thập dữ liệu, cũng nhưnhững ứng dụng mới tạp ra dữ liệu người dùng Tất nhiên, phân tích dữ liệutheo định hướng IoT có những kỹ thuật và công cụ chuyên biệt của riêng

nó Để lưu giữ được tất cả những dữ liệu trên, các tổ chức bắt buộc phải có

đủ dung lượng lưu trữ tại chỗ Những tùy chọn lưu trữ bao gồm kho dữ liệutruyển thống, lưu trữ trên đám mây và data lakes Những công cụ cơ sở hạtầng bảo mật bao gồm việc mã hóa dữ liệu, hệ thống giám sát, tường lửa,xác thực người dùng và những điều khiển truy cập khác để có thể bảo vệđược hệ thống và dữ liệu

1.4.2 Các công nghệ dữ liệu đặc biệt dành cho Big Data

a) Hệ sinh thái Hadoop

Hadoop là một trong những công nghệ được coi là phổ biến và liên quanmật thiết nhất với Big Data Đây là một dự án mã nguồn mở của Apache,cho phép và phát triển các ứng dụng phân tán để lưu trữ và quản lý các tập

dữ liệu lớn, xử lý và làm việc với khối lượng dữ liệu khổng lồ tính bằngPetabyte, xử lý trong môi trường phân tán, dữ liệu lưu trữ ở nhiều phầncứng khác nhau, yêu cầu xử lý đồng bộ

b) Apache Spark

Apache Spark là một hệ thống mã nguồn mở cho lập trình xử lý dữ liệu lớnđược đề xuất vào năm 2009 bởi AMPLab tại đại học California ApacheSpark là một phần của hệ sinh thái Hadoop, một khuôn mẫu tính toán cụmnguồn mở được sử dụng để làm công cụ xử lý Big Data trong Hadoop.Apache Spark hiện nay đã trở thành một trong những khuôn mẫu xử lý BigData vô cùng quan trọng và nó hoàn toàn có thể triển khai theo rất nhiềucách khác nhau

c) In-memory databases

6

Trang 9

IMDB (cơ sở dữ liệu trong bộ nhớ) là một hệ thống quản lý cơ sở dữ liệuchủ yếu dựa vào Ram thay vì HDD để lưu trữ dữ liệu Các cơ sở dữ liệuđược tối ưu hóa trong đĩa không thể nào nhanh bằng cơ sở dữ liệu trong bộnhớ Đó là một điểm vô cùng quan trọng để sử dụng phân tích Big Data vàtạo ra các kho dữ liệu, các siêu dữ liệu

d) NoSQL Databases

Những cơ sở dữ liệu SQL thông thường sẽ được thiết kế cho các truy vấnngẫu nhiên và các transactin đáng tin cậy Tuy nhiên, chúng vẫn có nhữnghạn chế như giản đồ cứng nhắc, không phù hợp với một số loại ứng dụng

Cơ sỡ dữ liệu NoSQL đã nêu ra được những hạn chế, lưu trữ và quản lý dữliệu theo những cách cho phép tốc độ hoạt động cao và có được sự linhhoạt tuyệt vời Rất nhiều các cơ sở dữ liệu đã được phát triển bởi các doanhnghiệp để tìm ra cách tốt hơn lưu trữ nội dung hoặc xử lý dữ liệu cho cáctrang web lớn Khác với cơ sở dữ liệu SQL Nhiều cơ sở dữ liệu NoSQL cóthể được mở tộng theo chiều ngang trên hàng ngàn máy chủ

1.4.3 Các ứng dụng của Big Data

Trước xu thế đang lên của công nghệ dữ liệu lớn, các ứng dụng của BigData cũng được thể hiện hết sức phong phú và hữu ích trong khắp các hoạtđộng kinh tế - văn hóa – xã hội hàng ngày

a) Lĩnh vực kinh tế

Để tạo các chiến dịch marketing và cung cấp dịch vụ cho khách hàng tốthơn, các công ty đã sử dụng Big data Ngoài ra nó còn giúp doanh nghiệpđưa ra những quyết định, chiến lược kinh doanh đúng đắn, nhanh chóng.Như vậy có thể thấy dữ liệu lớn là một phần không thể thiếu để các doanhnghiệp tăng doanh thu, lợi nhuận và cạnh tranh với những đơn vị khác.Hơn nữa, Big Data và những ứng dụng của nó đã tạo ra tác động tích cực

và mạnh mẽ đến quá trình phát triển cũa lĩnh vực Tài chính – Ngân hàng

b) Lĩnh vực y tế

7

Trang 10

Các nhà nghiên cứu y tế dùng Big data để xác định các dấu hiệu bệnh vàcác yếu tố nguy cơ Big data còn giúp bác sĩ chẩn đoán được tình trạng củabệnh nhân để từ đó đưa ra phác đồ điều trị hợp lý Đặc biệt những thông tin

có ở Big data như hồ sơ sức khỏe điện tủ, web, mạng xã hội…sẽ cập nhậttình hình mới nhất về dịch bệnh hay các mối đe dọa khác cho chính phủ và

tổ chức chăm sóc sức khỏe

c) Lĩnh vực năng lượng

Trong những năm trở lại đây Big data đã “ghi điểm” cho ngành năng lượngnhất là dầu khí và điện Với dầu khí Big data giúp các công ty giám sáthoạt động của đường ống và đưa ra dự đoán chính xác về vị trí khoan tiềmnăng Riêng ngành điện những tiện ích có ở Big data được dùng để theo dõilưới điện

8

Trang 11

CHƯƠNG 2: CÁC ỨNG DỤNG CỦA BIG DATA TRONG HOẠT

2.1 Phân tích các thói quen chi tiêu của khách hàng

Thông qua Big data các ngân hàng thể nắm được thông tin liên quan tớithói quen, hành vi chi tiêu, nguồn thu chủ yếu của khách hàng trong năm,hay những dịch vụ mà khách hàng đang sử dụng Điều này cung cấp cơ sở,

cơ hội để các ngân hàng tiếp cận và phân tích dữ liệu sâu hơn Áp dụng cácchức năng sàng lọc thông tin, ví dụ như, khi lọc ra thời điểm dịp lễ haymùa lễ và điều kiện vĩ mô (lạm phát, tỷ lệ thất nghiệp…) mà nhân viênngân hàng có thể hiểu được nguyên nhân của biến động trong thu nhập haychi tiêu của ngân hàng

Đây là một trong các yếu tố quan trọng trong quá trình đánh giá rủi ro,thẩm định hồ sơ cho vay, mở rộng dịch vụ cung cấp hay bán chéo sảnphẩm đến khách hàng Bên cạnh đó, nhờ nắm được thông tin về nguồn tiền

9

Trang 12

nhàn rỗi của khách hàng, ngân hàng có thể tận dụng thu hút tiền gửi đểthực hiện các hoạt động đầu tư.

2.2 Phân khúc khách hàng và thẩm định hồ sơ.

Phân khúc khách hàng là một trong những yếu tố quan trọng trong xâydựng và phát triển chiến lược marketing của mỗi ngân hàng Một khi cácphân tích ban đầu về thói quen chi tiêu của khách hàng cùng với xác địnhcác loại hình dịch vụ, kênh giao dịch được khách hàng ưu tiên (ví dụ kháchhàng muốn gửi tiết kiệm hay muốn đầu tư các khoản vay) được hoàn tất thìcác ngân hàng sẽ có được một cơ sở dữ liệu phục vụ cho quá trình phânkhúc, phân loại khách hàng một cách phù hợp dựa vào thông tin và hồ sơkhách hàng cung cấp Đặc biệt, trong lĩnh vực tín dụng, Big Data cung cấpcho các ngân hàng những kiến thức chuyên môn về nhu cầu tiềm ẩn rủi robên trong của khách hàng, thói quen và xu hướng chi tiêu của khách hàng,trợ giúp cho nhiệm vụ xác định nhu cầu mong muốn của khách hàng.Bên cạnh đó, biết được hồ sơ cá nhân của tất cả các khách hàng giúp ngânhàng đánh giá chi tiêu và thu nhập dự kiến trong tháng tới và lập kế hoạchchi tiết để đảm bảo lợi nhuận cho chính tổ chức và lợi ích cho chính kháchhàng

10

Ngày đăng: 13/11/2024, 14:06

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w