Khai phá dữ liệu (Data Mining)

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế trường hợp của ngân hàng TMCP sài gòn (SCB) (Trang 29 - 30)

CHƯƠNG 2 : CƠ SỞ LÝ LUẬN

2.3. Khai phá dữ liệu (Data Mining)

Theo báo cáo của Markets and Markets thị trường Data Mining dự báo sẽ tăng từ 591,2 triệu USD năm 2018 lên 1.039 triệu USD trong năm 2023. Đây chính là minh chứng cho thấy xu hướng tiếp cận Data mining phục vụ cho khai thác giá trị từ dữ liệu ở các cơng ty trên tồn cầu ngày càng mạnh mẽ.

Khai phá dữ liệu là một tập hợp, một hệ thống các phương pháp tính tốn, thuật tốn được áp dụng cho các cơ sở dữ liệu lớn và phức tạp, mục đích loại bỏ các chi tiết ngẫu nhiên, chi tiết ngoại lệ, khám phá các mẫu, mơ hình, quy luật tìm ẩn, các thơng tin có giá trị trong bộ dữ liệu. Khai phá dữ liệu là thành quả công nghệ tiên tiến ngày ngay, là q trình khám phá các kiến thức vơ giá bằng cách phân tích khối lượng lớn dữ liệu đồng thời lưu trữ chúng ở nhiều cơ sở dữ liệu khác nhau (Data-Flair).

Qui trình khai phá dữ liệu sẽ được thực hiện qua 2 quá trình: chuẩn bị dữ liệu (data preparation) và khai phá dữ liệu (data mining) và 7 bước được mô tả chi tiết trong bảng 2.1.

Bảng 2.1. Các bước trong quá trình khai phá dữ liệu

Bước Chức năng Diễn giải

1 Làm sạch dữ liệu (Cleaning)

Loại bỏ các dữ liệu nhiễu và dữ liệu không liên quan, không đầy đủ thơng tin

2 Tích hợp dữ liệu (Integration)

Tổng hợp và lưu trữ dữ liệu từ nhiều nguồn khác nhau trong một hệ cơ sở dữ liệu

3 Lựa chọn dữ liệu (Selection)

Chọn ra những dữ liệu liên quan, có giá trị phân tích

4 Chuyển đổi dữ liệu (Transformation)

Chuyển đổi và hợp nhất dữ liệu theo các loại biến, định dạng khác nhau để phù hợp và dễ dàng cho việc phân tích.

5 Khai phá dữ liệu (Data mining)

Xây dựng các thuật toán, phương pháp, các model phân tích khác nhau nhằm mục đích phát hiện, trích

xuất các thơng tin hữu ích, giá trị tiềm năng từ những mẫu dữ liệu.

6 Đánh giá mẫu dữ liệu (Evaluation)

Xác định mức độ chính xác, khả năng đem lại giá trị thực sự và triển khai thực tế khơng.

7 Trình bày kết quả thu được

(Knowledge)

Thể hiện kết quả bằng các cơng cụ trực quan hóa, sử dụng đồ thị, bảng, biểu đồ để diễn giải kết quả đến người xem

Khai phá dữ liệu là một trong những lợi thế các công ty trong ngành sản xuất, kinh doanh, marketing nếu họ biết cách ứng dụng hợp lý để tăng cường hiệu quả hoạt động. Các lợi ích cơ bản của khai phá dữ liệu như sau: hỗ trợ ra quyết định tự động, hỗ trợ đưa ra dự báo chính xác, hỗ trợ giảm thiểu chi phí và hỗ trợ khả năng thấu hiểu khách hàng. Đồng thời việc khai phá dữ liệu cũng được ứng dụng rộng rãi trong nhiều lĩnh vực kinh doanh và ngành nghề và được phân theo từng chức năng nhiệm vụ.

Một phần của tài liệu (LUẬN văn THẠC sĩ) ứng dụng big data phân tích lỗ hổng tín dụng cho vay và giải pháp hạn chế trường hợp của ngân hàng TMCP sài gòn (SCB) (Trang 29 - 30)

Tải bản đầy đủ (PDF)

(69 trang)