1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận dữ liệu lớn trong kinh tế và kinh doanh đề tài ứng dụng của bigdata trong chuỗi cung ứng

17 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

 Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quânsự, Y tế - Sức khỏe như hiện nay phần lớn được xử lý real-time.được lưu trữ vào cơ sở dữ liệu.3 Đa

Trang 1

HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂNKHOA KINH TẾ QUỐC TẾ

HỌ VÀ TÊN MSV

Trần Thị Kim Anh 7133106005Nguyễn Thị Hương Giang 7133106018Nguyễn Thu Thảo 7133106069

Trang 2

HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂNKHOA KINH TẾ QUỐC TẾ

HỌ VÀ TÊN MSV

Trần Thị Kim Anh 7133106005

Nguyễn Thị Hương Giang 7133106018

Nguyễn Thu Thảo 7133106069

HÀ NỘI - 2024HÀ NỘI - 2022HÀ NỘI - 2022 HÀ NỘI - 2022HÀ NỘI - 2021

HÀ NỘI - 2017

ContentsLời mở đầu 3

CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA 4

1.1 Khái niệm, nguồn hình thành và đặc trưng của Big Data 4

1.1.1.Khái niệm về dữ liệu lớn 4

1.1.2.Nguồn hình thành và phương pháp khai thác, quản lý dữ liệu lớn 4

1.1.3.Đặc trưng 5V của dữ liệu lớn 4

1.1.4.Sự khác biệt giữa dữ liệu lớn với dữ liệu truyền thông 5

1.2 Bức tranh tổng thể ứng dụng dữ liệu lớn 5

1.2.1.Ứng dụng dữ liệu lớn trong lĩnh vực ngân hàng, tài chính 5

1.2.2.Ứng dụng trong lĩnh vực Y tế, chăm sóc sức khỏe 6

1.2.3 Ứng dụng trong Thương mại điện tử 6

1.2.4 Ứng dụng trong ngành bán lẻ 6

1.2.5 Ứng dụng trong giáo dục 6

1.2.6 Ứng dụng trên nền tảng Cloud (Điện toán đám mây) 7

CHƯƠNG 2: ỨNG DỤNG CỦA BIG DATA TRONG LOGISTICS 7

2.1 Logistics là việc kinh doanh theo định hướng dữ liệu 7

2.1.1 Lợi ích và cơ hội khi ứng dụng Big Data vào Logistics 7

2.1.2 Thách thức khi ứng dụng Big Data vào Logistics 10

CHƯƠNG 3: THỰC TIỄN CƠ SỞ HẠ TẦNG BIG DATA PHỤC VỤ LOGISTICS TẠI VIỆT NAM 11

3.1 Khai hải quan điện tử 12

3.2 Theo dõi và truy xuất (Track & Trace) 12

3.3 hệ thống quản lý kho hàng (WMS) 12

3.4 Hệ thống quản lý vận tải (TMS) 13

3.5 Hệ thống quản lý cảng/bến thủy (TOS) 13

3.6 Hệ thống quản lý nguồn lực doanh nghiệp (ERP) 14

3.7 Sàn giao dịch Logistics 14

Kết luận 16

Tài liệu tham khảo 18

Trang 3

HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂNKHOA KINH TẾ QUỐC TẾ

HỌ VÀ TÊN MSV

Trần Thị Kim Anh 7133106005Nguyễn Thị Hương Giang 7133106018Nguyễn Thu Thảo 7133106069

doanh nghiệp muốn trụ vững và phát triển thì họ phải không ngừng nghiên cứu và phát triển kỹ thuật cũng cơ sở hạ tầng về công nghệ Đặc biệt, trong thời đại số như hiện nay việc ứng dụng công nghệ số vào trong cơ sở hạ tầng đang được chú trọng ở mọi lĩnh vực

Ngành Logistics cũng không nằm ngoài xu thế đó Để quản lý tốt và hiệu quả hệ thống cơ sở hạ tầng Logistics vốn bao gồm cơ sở hạ tầng vật lý và cơ sở hạ tầng mềm thì việc ứng dụng công nghệ thông tin càng trở nên cấp thiết

Trong việc triển và áp dụng các cơ sở hệ thống thông tin, Big Data đang là một xu hướng mới và được triển khai bởi các doanh nghiệp Logistics trên toàn thế giới Tuy nhiên ở Việt Nam thì độphủ sóng của xu hướng này vẫn chưa cao với phần lớn các doanh nghiệp vẫn chưa triển khai hoặcmới chỉ triển khai ở mức cơ bản nhất Theo VIFAS, trình độ công nghệ trong Logistics của Việt Nam còn thấp với chủ yếu vẫn còn làm việc qua giấy tờ Dù đã có mốc đột phá trong vấn đề thủ tục khai báo Hải quan vào năm 2011 và đạt thành tựu vào năm 2022 nhưng với các hạng mục khác thì tỷ lệ tham gia của các doanh nghiệp còn thấp.

Trước thực tiễn đó cùng những kiến thức đã được học pẻ trên giảng đường, nhóm 4 chúng em đã lựa chọn chủ đề “Ứng dụng Big Data vào trong Logistics” làm đề tài nghiên cứu Từ đó có thểmang lại một cái nhìn tổng quan cũng như thực tiễn trong việc ứng dụng Big Data vào Logistics của Việt Nam.

Trang 4

CHƯƠNG 1: TỔNG QUAN VỀ BIG DATA

1.1 Khái niệm, nguồn hình thành và đặc trưng của Big Data1.1.1 Khái niệm về dữ liệu lớn

tập mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được.

chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư.

nhiều cho việc kinh doanh, sản xuất, y tế, giao thông, nghiên cứu khoa học

1.1.2 Nguồn hình thành và phương pháp khai thác, quản lý dữ liệu lớn

Qua thống kê và tổng hợp, dữ liệu lớn được hình thành chủ yếu từ 6 nguồn:

phi chính phủ) Ví dụ, hồ sơ y tế điện tử ở bệnh viện, hồ sơ bảo hiểm, hồ sơ ngân hàng

giao dịch thẻ tín dụng, giao dịch trên mạng, bao gồm cả các giao dịch từ các thiết bị diđộng.

biến khí hậu.

thông tin khác), đọc các trang mạng trực tuyến

tiện thông tin xã hội.

Phương pháp khai thác và quản lý dữ liệu lớn hiện nay được thiết kế phù hợpdựa theo các nguồn hình thành dữ liệu lớn Mỗi nguồn dữ liệu lớn khác nhausẽ có phương pháp khai thác và quản lý dữ liệu lớn khác nhau Tuy nhiên,hiện nay phần lớn các tổ chức trên thế giới đều dùng Hadoop ecosystem làgiải pháp tối ưu để khai thác và quản lý dữ liệu lớn.

1.1.3 Đặc trưng 5V của dữ liệu lớn

Dữ liệu lớn có 5 đặc trưng cơ bản như sau:1) Kích thước dữ liệu (Volume)

terabyte) chỉ cho một tập hợp dữ liệu.

lớn phải sử dụng công nghệ “đám mây” mới đáp ứng khả năng lưu trữ được.2) Tốc độ (Velocity) – Vận tốc

tức thời ngay sau khi chúng phát sinh (tính đến bằng mili giây).

Trang 5

 Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quânsự, Y tế - Sức khỏe như hiện nay phần lớn được xử lý real-time.

được lưu trữ vào cơ sở dữ liệu.3) Đa dạng (Variety)

hát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe )

người mua hàng trên trang thương mại điện tử, thông tin video được chia sẻ từ Youtubevà Twitter

4) Độ tin cậy / chính xác (Veracity)

đôi khi có thể lộn xộn, chất lượng và độ chính xác rất khó kiểm soát.

mạnh mẽ tính tương tác và chia sẻ của người dùng Mobile làm cho bức tranh xác định vềđộ tin cậy và chính xác của dữ liệu ngày một khó khăn hơn.

của Big Data.5) Giá trị (Value)

được giá trị của thông tin hữu ích mang lại như thế nào, khi đó mới có quyết định nêntriển khai dữ liệu lớn hay không

liệu lớn.

khỏe được chính xác hơn, sẽ giảm được chi phí điều trị và các chi phí liên quan đến y tế.

1.1.4 Sự khác biệt giữa dữ liệu lớn với dữ liệu truyền thông

1 Dữ liệu đadạng hơn

2 Lưu trữ dữliệu lớn hơn

Lưu trữ công nghệ hiện đại:

Công nghệ đám mây→liên kết

các máy chủ

Chủ yếu lưu trữ và khai thác trên cácmáy chủ cố định, thường độc lâp.3 Truy vấn dữ

liệu nhanh hơn

Lưu trữ trên các máy chủ có tốc

độ xử lý cao (ram 16gb)→truy

xuất nhanh.

Lưu trên các máy chủ truyền thống

(ram<16gb)→truy xuất dữ liệu trên.

4 Độ chính xáccao hơn

Dữ liệu thường xuyên được cập

1.2 Bức tranh tổng thể ứng dụng dữ liệu lớn

Big Data ứng dụng trong nhiều lĩnh vực: ngân hàng, y tế, giáo dục, thươngmại điện tử, điện toán đám may, truyền thông, giải trí

Trang 6

1.2.1 Ứng dụng dữ liệu lớn trong lĩnh vực ngân hàng, tài chính.

của khách hàng tiềm năng => lập chi nhánh mới.

1.2.2 Ứng dụng trong lĩnh vực Y tế, chăm sóc sức khỏe

phí tiền bạc và thời gian.

trạng bệnh nhân, gửi báo cáo cho các bác sĩ.

1.2.3 Ứng dụng trong Thương mại điện tử

thị của các trang sản phẩm này.

hàng, từ đó tạo ra doanh thu cao hơn.

Data có thể tự động gửi code khuyến mại cho khách hàng cụ thể đó.

1.2.4 Ứng dụng trong ngành bán lẻ

cầu và có thể tránh tiếp tục tung ra thị trường các sản phẩm không được hầu hết kháchhàng đón nhận.

nhu cầu của khách hàng và đưa ra các chiến lược kinh doanh mới để cải thiện.

thống xã hội, dự báo thời tiết để xác định chính xác nhất sản phẩm phù hợp để luôn sẵnsàng cung ứng cho khách hàng.

1.2.5 Ứng dụng trong giáo dục

học mới.

viên hay người điều hành tổ chức.

Trang 7

 Big Data có thể đánh giá biểu cảm khuôn mặt và di chuyển của học sinh trong lớp từ đógiáo viên có thể đánh giá được chất lượng giảng dạy bằng máy ảnh độ phân giải cao, cảnhquay video và xử lý hình ảnh.

1.2.6 Ứng dụng trên nền tảng Cloud (Điện toán đám mây)

tầng cần thiết cho việc tính toán dữ liệu lớn.

doanh của mình

thì mục tiêu và các quyết định của kinh doanh được xác định.

phần mềm và phần cứng.

CHƯƠNG 2: ỨNG DỤNG CỦA BIG DATA TRONG LOGISTICS

2.1 Logistics là việc kinh doanh theo định hướng dữ liệu

2.1.1 Lợi ích và cơ hội khi ứng dụng Big Data vào Logistics

1) Tối ưu hóa vận chuyển hàng hóa đến điểm đến cuối cùng

Một hạn chế trong việc đạt được hiệu quả hoạt động cao trong một mạng lưới phân phối diễn ratại "dặm cuối cùng" Hai mươi bốn giờ cuối cùng trong một chuỗi cung ứng thường là thứ tốnkém nhất, chi phí lên đến 28% tổng chi phí giao hàng của một gói hàng Có rất nhiều trở ngại dẫnđến điều này, có thể là: Thách thức đối với các xe tải giao hàng lớn đến công viên gần điểm đếncủa họ ở khu vực thành thị Người lái xe thường phải đậu xe khá lâu, và sau đó đi bộ đến địa chỉcuối cùng Sau đó, họ có thể phải đi lên nhiều chuyến cầu thang hoặc đợi thang máy ở tòa nhàcao tầng Một số mặt hàng phải được ký kết và nếu khách hàng không ở nhà thì không thể giaohàng Nhân viên giao hàng phải cẩn thận để không làm hỏng gói hàng trong chân cuối cùng này,và họ phải cung cấp cho mình một cách chuyên nghiệp đến người nhận Thêm vào những tháchthức này, có thể rất khó để biết chính xác những gì đang xảy ra trong đợt giao hàng cuối cùng Tuy nhiên, dữ liệu lớn có thể giải quyết những thách thức này dễ dàng Trong một cuộc phỏngvấn với Wall Street Journal, Matthias Winkenbach, giám đốc Phòng thí nghiệm Hoá chấtMegacity của MIT, đã mô tả chi tiết cách các phân tích dữ liệu cuối cùng đang mang lại nhữngdữ liệu hữu ích Do chi phí thấp và tính phổ biến của internet di động nhanh và điện thoại thôngminh hỗ trợ GPS, cũng như sự lan truyền của Internet thông qua cảm biến và máy quét, các chủhàng có thể thấy quá trình phân phối từ đầu đến dặm cuối như thế nào.

Ví dụ, một chiếc xe tải giao hàng UPS có gắn một cảm biến GPS đi giao hàng ở trung tâm thànhphố Chicago Sau khi đỗ xe gần đó, điện thoại của người đàn ông này sẽ phát tín hiệu GPS vàtiếp tục truyền dữ liệu đến trung tâm UPS, cho tài khoản của khách hàng biết về thời gian giaohàng Điều này không chỉ có giá trị đối với khách hàng - nó cho phép các công ty Logistics nhìnthấy các mô hình và có thể sử dụng để tối ưu hóa các chiến lược phân phối của họ.

Trang 8

2)Tăng độ tin cậy

Khi các thiết bị cảm biến ngày càng trở nên phổ biến trong các phương tiện giao thông, vậnchuyển và trong suốt chuỗi cung ứng, chúng có thể cung cấp dữ liệu cho phép minh bạch cao hơnbao giờ hết Tính minh bạch này có giá trị đối với các chủ hàng, người vận chuyển và kháchhàng Nếu một lô hàng sẽ đến muộn, hãng tàu muốn biết càng sớm càng tốt để họ có thể ngănchặn tắc nghẽn trong chuỗi cung ứng Và các công ty vận chuyển có thể sử dụng dữ liệu này tổnghợp để đàm phán với các chủ hàng bằng cách cho biết họ thường xuyên phân phối đúng thời hạnnhư thế nào.

Hãy tưởng tượng điều này: các công ty Logistics đã gắn cảm biến trong tất cả các phương tiệnphân phối của họ, với điện thoại thông minh hỗ trợ GPS bao phủ bất kỳ khoảng trống Một bênthứ ba hợp lệ hóa các cảm biến này với độ chính xác, và sau đó các dữ liệu độ tin cậy và thời giantừ các cảm biến này được sử dụng khi các công ty Logistics đang đấu thầu cho các hợp đồngmới.

Loại nguồn mở, thông tin minh bạch hoàn toàn có thể thay đổi cách kinh doanh được tiến hànhtrong khâu hậu cần.

3) Tuyến đường sẽ được tối ưu hoá

Trong cuộc khảo sát 3PL được trích dẫn ở đầu bài viết này, 70% người được hỏi cho rằng "cảithiện tối ưu hóa Logistics" là việc sử dụng tốt nhất các dữ liệu lớn trong Logistics Rõ ràng, tốiưu hóa là suy nghĩ của mọi người.

Tại sao các công ty Logistics quan tâm đến việc tối ưu hóa? Vì lý do nó giúp họ tiết kiệm tiền vàtránh các lô hàng bị giao muộn Khi bạn đang quản lý một hệ thống phân phối hoặc chuỗi cungứng, bạn phải kết nối một đường dây giữa tài nguyên và xe và sự thiếu sót giữa chúng Nếu bạnđặt quá nhiều xe cộ và tài nguyên trên một tuyến đường phân phối, thì bạn đang tiêu tốn nhiềutiền hơn, và có thể sử dụng các tài sản tốt hơn ở những nơi khác.

Tuy nhiên, nếu bạn ước tính thấp số lượng xe mà một tuyến đường hoặc giao hàng cụ thể sẽ yêucầu, thì bạn sẽ gặp rủi ro cho khách hàng gửi hàng muộn, ảnh hưởng tiêu cực đến các mối quanhệ khách hàng và hình ảnh thương hiệu của bạn.

Để thêm vào những thách thức của việc tối ưu hoá, các yếu tố liên quan đến phân bổ nguồn lựchiệu quả đang liên tục thay đổi Ví dụ:

thể được xây dựng

Big Data và phân tích tiên đoán cho phép các công ty Logistics có thêm sức cạnh tranh mà họcần để vượt qua những trở ngại Các bộ cảm biến về xe tải, dữ liệu thời tiết, dữ liệu bảo trì đườngbộ, lịch trình bảo dưỡng đội tàu, chỉ báo tình trạng hạm đội thời gian thực và lịch trình nhân sựcó thể được tích hợp vào một hệ thống nhìn vào các xu hướng lịch sử trong quá khứ và đưa ra lờikhuyên phù hợp.

UPS là một ví dụ thực tế của Big Data Logistics dẫn đầu về sự tiết kiệm Sau khi kiểm tra dữ liệucủa họ, UPS phát hiện ra rằng các xe tải rẽ trái đã khiến họ phải trả rất nhiều tiền Nói cách khác,

Trang 9

UPS thấy rằng việc chuyển hướng trong giao thông đang gây ra rất nhiều sự chậm trễ, lãng phínhiên liệu, và nguy cơ an toàn.

Theo một bài báo từ Cuộc hội thoại có tiêu đề "Tại sao các trình điều khiển của UPS không rẽ tráivà bạn cũng không nên vậy", UPS "tuyên bố nó sử dụng ít hơn 10 triệu gallon nhiên liệu, phátthải ít hơn 20.000 tấn CO2 và cung cấp 350.000 gói mỗi năm" (sau khi thực hiện thay đổi) 10triệu galon khí là rất nhiều tiền - đó là một số lợi ích đáng kể và một ví dụ dữ liệu lớn trong chuỗicung ứng Các lái xe của UPS bây giờ chỉ được rẽ trái khoảng 10%, thay vào đó là chọn đi thẳnghoặc rẽ phải Do chiến lược chỉ rẽ trái khi cần thiết, UPS đã giảm số lượng xe tải nó sử dụng đi1.110 và giảm tổng quãng đường đội tàu công ty di chuyển 28,5 triệu dặm.

4) Hàng dễ hỏng được vận chuyển với chất lượng cao hơn

Giữ cho các sản phẩm dễ hư hỏng là một thách thức không ngừng của các công ty Logistics Tuynhiên, Big Data và Internet of Things (Mạng lưới thiết bị kết nối Internet) có thể giúp các nhàquản lý và người giao hàng hiểu rõ hơn về cách họ có thể ngăn ngừa chi phí do hàng hoá bị hưhỏng Chẳng hạn, giả sử một chiếc xe tải đang vận chuyển một lô hàng kem và đồ tráng miệng.Bạn có thể cài đặt một cảm biến nhiệt độ bên trong xe tải để theo dõi trạng thái của hàng hoá bêntrong và đưa dữ liệu này cùng với dữ liệu giao thông và đường xá cho một máy tính định tuyếntrung tâm Máy tính này có thể cảnh báo người lái xe nếu tuyến đường ban đầu đã chọn sẽ dẫnđến việc kem tan chảy và thay vào đó là các tuyến thay thế.

5) Tự động hóa kho và chuỗi cung ứng

Chẳng bao lâu, Big Data kết hợp với công nghệ tự động hoá và Internet of Things có thể làm choLogistics hoạt động hoàn toàn tự động Big Data cho phép các hệ thống tự động hoạt động thôngqua việc định tuyến thông minh nhiều bộ dữ liệu và luồng dữ liệu khác nhau Ví dụ, Amazon đãcó tự động hóa trong các trung tâm thực hiện của họ, sử dụng nhiều robot KIVA màu da cam đểlấy đồ vật từ kệ.

Ngoài ra, Amazon còn có các máy điện toán tự động có thể phân phối đồ vật cho bạn nếu bạn ởtrong vòng 30 phút của trung tâm Amazon Hay khi nhìn thấy Uber và các công ty khác đangchạy thử nghiệm các phương tiện tự lái, không khó để tưởng tượng rằng trong tương lai toàn bộchuỗi cung ứng có thể được tự động hóa, từ việc xếp dỡ, lái xe, đến việc giao hàng cuối cùng.

6) Duy trì trải nghiệm tốt của khách hàng

Phân tích dữ liệu lớn cung cấp nhiều dữ liệu về khách hàng và từ đó đưa ra các cách thức phục vụđể thu hút, duy trì và cải thiện trải nghiệm của khách hàng với những quyết định về sự thay đổi.Big Data cũng cho phép một hệ thống hiệu quả và lớn hơn để nắm bắt dữ liệu về khách hàng vàđối tượng Big Data có thể giúp xác định cung và cầu địa phương và được sử dụng để hiểu đượcsự hài lòng và nhu cầu của khách hàng Chi phí để thu hút một khách hàng mới luôn cao hơn chiphí duy trì sự trung thành của khách hàng cũ, vì vậy các doanh nghiệp Logistics luôn cần chútrọng vào sự trải nghiệm của khách hàng

Hồ sơ về các điểm tiếp xúc của khách hàng, dữ liệu về các yếu tố hoạt động của chất lượng dịchvụ, cũng như dữ liệu bên ngoài kết hợp để cung cấp cái nhìn toàn diện về theo dõi khách hàng, đểdoanh nghiệp có thể đưa ra các quyết định tập trung nỗ lực kinh doanh khi thích hợp nhất Vàmột trải nghiệm tốt của khách hàng sẽ cung cấp cho các nhà quản lý những quyết định về hoạtđộng và phát triển sản phẩm hơn nữa và đo lường để thiết kế các sản phẩm và dịch vụ có thể đápứng và vượt qua mong đợi của khách hàng.

Trang 10

Ví dụ UPS nhận thấy từ lịch sử cung cấp cho thấy rằng khách hàng nhận được hai lô hàng bị trìhoãn Điều này có nghĩa là UPS phải triển khai một biện pháp giữ chân khách hàng ngay lập tức.Nhưng khi nói đến các điểm tiếp xúc của khách hàng, có vô số những thông tin có sẵn thông quasự ra đời của các diễn đàn trực tuyến Trước đây, các hệ thống CRM (Customer RelationshipManagement) đã lưu trữ dữ liệu đó và thu thập thêm được thực hiện bằng các cuộc điều tra.Nhưng với các công cụ và kỹ thuật Big Data bao gồm khả năng tự động thu hồi cảm xúc củakhách hàng hiện diện trên các cơ sở dữ liệu như văn bản và âm thanh sau đó phân tích ngữ nghĩavà khai thác văn bản, điều này sẽ phản ánh tốt hơn cảm xúc của khách hàng so với các hình thứckhảo sát truyền thống

Tóm lại, Big Data đã đang trên công cuộc chuyển đổi bản chất của Logistics Big Data trongLogistics có thể được sử dụng để giảm sự thiếu hiệu quả trong việc phân phối dặm cuối cùng,cung cấp tính minh bạch cho chuỗi cung ứng, tối ưu hóa việc phân phối, bảo vệ hàng hoá dễ bịhư hỏng và tự động hoá toàn bộ chuỗi cung ứng hay làm tăng trai nghiệm tốt cho khách hàng.Các công ty Logistics nhận thức được những khả năng này, và đang phấn đấu đưa ra nhiều quyếtđịnh dựa trên dữ liệu hơn Sử dụng dữ liệu lớn, bộ cảm biến và Internet of Things, kết hợp vớiphần mềm kinh doanh thông minh, các công ty có tư duy theo đó đã giảm chi phí và tăng sự hàilòng của khách hàng.

2.1.2 Thách thức khi ứng dụng Big Data vào Logistics

Việc sử dụng hiệu quả các kỹ thuật Big Data đã đem lại nhiều lợi ích cho việc chuyển đổi nềnkinh tế nhưng cũng gây ra nhiều thách thức, bao gồm những khó khăn trong việc thu thập dữliệu, lưu trữ, tìm kiếm, cắt xén, phân tích và vận dụng Những thách thức này cần phải vượt quađể có thể khai thác cao nhất khả năng của Dữ liệu lớn

1) Kiến trúc máy tính để xử lý dữ liệu

Kiến trúc máy tính là một trong những thách thức lớn nhất Theo Philip Chen và Zhang (2014),hiệu suất của bộ xử lý trung tâm (CPU) đang tăng gấp đôi mỗi 18 tháng Hiệu năng của các ổ đĩacũng tăng gấp đôi với cùng tốc độ, nhưng tốc độ quay của đĩa đã cải thiện một chút Ngoài ra,lượng thông tin tăng theo cấp số nhân Điều này có ảnh hưởng lớn đến giới hạn của việc khámphá các giá trị thời gian thực từ Big Data

2) Dữ liệu không thống nhất

Một thách thức quan trọng khác liên quan đến phân tích dữ liệu lớn bao gồm sự không thống nhấtvề dữ liệu và khả năng mở rộng, tính kịp thời và bảo mật dữ liệu không đầy đủ Do đó, dữ liệuphải được xây dựng phù hợp và một số tiền xử lý kỹ thuật, chẳng hạn như làm sạch dữ liệu, tíchhợp dữ liệu, chuyển đổi dữ liệu và giảm thời gian cần được áp dụng để làm giảm tiếng ồn và sửalỗi không chính xác Big Data đã thay đổi đáng kể việc thu thập và lưu trữ dữ liệu, bao gồm thiếtbị lưu trữ dữ liệu, kiến trúc lưu trữ dữ liệu, cơ chế truy cập dữ liệu Quy trình khám phá kiến thứcđặt ưu tiên cao nhất vào khả năng tiếp cận của Dữ liệu lớn Theo nghĩa đó, dữ liệu lớn nên đượctruy cập hiệu quả và cho phép phá vỡ hoàn toàn hoặc một phần hạn chế của kiến trúc máy tính.Lưu trữ trực tiếp (DAS), lưu trữ mạng (NAS), và mạng lưu trữ (SAN) thường được sử dụng kiếntrúc lưu trữ Tuy nhiên, chúng có những hạn chế và hạn chế nghiêm trọng trong các hệ thốngphân phối quy mô lớn Tối ưu hóa truy cập dữ liệu là cách phổ biến để cải thiện hiệu suất củamáy tính dữ liệu chuyên sâu Điều này bao gồm sao chép dữ liệu, di chuyển, phân phối và truycập song song Khi khối lượng dữ liệu là rất lớn, dung lượng băng thông mạng là nút cổ chaitrong đám mây và các hệ thống phân tán

Ngày đăng: 28/06/2024, 15:28

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w