1. Trang chủ
  2. » Luận Văn - Báo Cáo

khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở việt nam trường hợp thành phố hồ chí minh

282 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai thác dữ liệu lớn trong việc tính chỉ số giá tiêu dùng ở Việt Nam
Tác giả Nguyễn Thanh Bình
Người hướng dẫn TS. Hà Văn Sơn, TS. Lờ Thị Thanh Loan
Trường học Trường Đại Học Kinh Tế Tp. Hồ Chí Minh
Chuyên ngành Kinh tế
Thể loại Luận án tiến sĩ
Năm xuất bản 2023
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 282
Dung lượng 2,72 MB

Nội dung

TOM TAT Luận án khai thác đữ liệu lớn trong việc tính chỉ số giá tiêu ding CPT str dụng nguồn thông tín giả thu thập được từ các trang web trực tuyến đề tính toán chỉ số giá tiêu đùng ch

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRUONG DAI HOC KINH TE TP HO CHI MINH

NGUYEN THANH BINH

KHAI THÁC DU LIEU LON TRONG VIEC TINH

CHI SO GIA TIEU DUNG O VIET NAM

(TRUONG HOP THANH PHO HO CHI MINA)

LUAN AN TIEN SI KINH TE

Tp Hồ Chí Minh - Năm 2023

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRUONG DAI HOC KINH TE TP HO CHI MINH

NGUYEN THANH BINH

KHAI THAC DU LIEU LON TRONG VIEC TINH

CHI SO GIA TIEU DUNG O VIET NAM

(TRUONG HOP THANH PHO HO CHI MINH)

Chuyén nganh: THONG KE

Mã số: 9460201 LUẬN ÁN TIỀN SĨ KINH TẾ

NGƯỜI HƯỜNG ĐÀN KHOA HỌC:

1.TS Hà Văn Sơn 2 TS, Lê Thị Thanh Loan

Tp Hỗ Chí Minh - Năm 2023

Trang 3

LỜI CÁM BOAN

Tôi cam đoạn về sự trung thực vá chuân mực đạo đức của toán bộ nghiền cứu này,

Thanh phố Hà Chí Minh, tháng 12 năm 2023

Tác giả

Nguyễn Thanh Bình

Trang 4

Trang phụ bìa Lời cam đoan

Mục lục Danh mục các chữ viết tất Đanh mục bằng

Đanh mục hình Danh mục phụ lục

Tóm tất

Abstract

Chuong 1 Gidi thiéu dé ti nghién cir 1.1 Ly do chon dé tai

h3 Mục tiêu nghiên cửu

— .4, Câu hỏi nghiên cứu Sanat

{.4, Đôi tượng và phạm vị nghiên cửu

frank 3, Phương pháp nghiền cứu A

1,6, Nguồn đữ liệu

.? Nhitng déng gdp mdi của luận an

1.8 Kêt cầu của nghiên cứu

Trang 5

liến quan

» ~

2.1 Cơ sở lý thuyết về giá vá chỉ số giá

2.1.1, Khải niệm về giá và chì số giả

2.1.2, Chỉ số giá tiêu đủng

3.1.3 Ứng dụng của chỉ số giá tiêu ding

2.1.4 Phuong pháp tính chỉ số giá tiêu đùng truyền thống tại

một sô quốc gia trên thê giới

2,1.5 Phương pháp tính chỉ số giá tiêu dùng truyền thông tại Viet Nam

2,2 Cơ sở lý thuyết về đữ liệu lớn

2.2.1, Đính nghĩa về đữ Hiệu tae

2.3.2, Cae img dung dit liéu lon

2.2.3 Các loại đữ liệu lớn

2.2.4 Các công nghệ thu thập dữ liệu lớn

2.2.5 Lợi ích, hạn chế của đữ liệu lớn 2.2.6 Sự khác biệt giữa dữ liệu truyền thông và đỡ liệu lớn

2.3, Cơ sở lý thuyết mô hình hỏi quy Hedonie

3.3.1, Điều chỉnh chải lượng hàng hóa trong chỉ số giá tiêu

Trang 6

2.4.1, Nghiên cứu quốc tế sử dụng đỡữ liệu lớn tĩnh chỉ số gia tiêu đẳng

2.4.2, Nghiên cửu trong nước có hiện quan đến chỉ sô giá

3.4.3 Nghiên cửu quốc tế về điều chính chất lượng máy tinh

trong chỉ số giá tiêu dùng

2.5 Khoảng trắng trong nghiên cứu Tóm tắt chương 2

Chương 3, Phương pháp nghiên cứu và quy trình nghiên cửu

3,1 Quay trinh nghién cửu

3,2 Nehiéa otra dink tính

3.2.1 Thu thap ¥ kiều chuyền giề đữù phiếu khảo sát 3.3.2 Phóng vẫn trực diện

3.3.3 Hội thảo chuyên gia 3.3 Phương pháp khai thác dữ hệu lớn

3,4, Phương pháp tỉnh chỉ số giá tiêu dùng từ đữ liệu lớn

4.5, Xây dựng mô hình Hedomic; Trường hợp gii máy tỉnh xách tay 3.5.1 Tông hợp các yêu tô tác động đến giá máy tỉnh xách tay từ các nghiên cứu trước

Trang 7

4,5, Ung dung két qua md hink hoi quy Hedonic cho san pham máy

tinh xach tay vao wide tinh chi 86 gia tiểu đùng

4.6 Kết quả tỉnh toán chỉ số 918 tiéu ding 4.7, Thảo luận kết quả nghiên cấu — —UO 4.8 Phân tích những thách thức khi triên khai tính chỉ số giá tiêu dùng tử khai thắc đữ liệu lớn

Danh mục các công trình khoa học đã công bộ Đanh mục tái hiệu tham khảo

Trang tis

184 184

Trang 8

ABS

ARIMA

Big data BLS CAPI

CNTT COICOP Cis STAT CTR

EC

Eurostat

GDP GRDP

ĐANH MỤC CÁC CHỮ VIỆT TẤT

Cơ quan Thông kế quác gia Ức Phương pháp trung bmh trượt kết hợp tự hồi quy (Autoregressive Integrated Moving Average}

Dữ liệu lớn

Cục Théng ké lao dang Hoa Ky (Bureau of laber statistics)

Phỏng văn cả nhân với sự trợ giúp của roáy tinh (Computer Assisted Personal Interviewing}

Céne oehé théng tin

Phần loai hang héa tiéu dong ca nhan theo muc dich su dung Uy ban Thong ké lign baie tha Cong ding cde Quéc gia Dds lập Cục Thông kê

Công ty

Chỉ sồ giá tiêu dùng (Consumer Price mdex)

Bd xu ly trung tam (Central Processing Unit}

Điều tra viên Uy Ban Chau Au (European Commission)

Cơ quan Thông kế của Cộng dòng Châu Au Statistical

Office of the European Communities} Téng san pham trong nude (Grass Domestic Product) Tổng sản phẩm trên dia ban (Gross Regional Domestic Product)

Trang 9

HDD

ICLS ILO IMF

KHTK

NAB OECD

OLS

PPCĐ RAM

RPI

TCTK

TMT

TP.HCM UN

UNECE

WB WLS

© ctmg may tinh (Hard Disk Drive)

Hội nghị quốc tế về các nhà thống kế lao động

Tô chức lao động Quốc tế Quỹ Tiên lệ Quốc tế (InteroaHonal Monetary Pund)

Khoa học Thông kẻ

Nhà xuất bản Tổ chức Hợp tác vá Phát triển Kinh tế (Organizaton for Econonne Co-operation and Development)

Bính phương bé nhất thông thường (Ordinary Least Squares)

Phương pháp chế độ

Bộ nhớ truy cập ngấu nhiên (Random Access Memory)

Chỉ số pid ban Ie (Retail price index)

Trang 10

tơ Spe pi aa hs bh

Bang 2.7

Bang 2.9 Bang 2.10

ˆ 4 Ề

Bang 2.11 Bang 3.1 Bang 3.2

DANH MUC BANG

Tén bang

Tổng hợp đánh giả chỉ số giá tiêu đúng ở các nước

Tổng quan về số liệu thẳng kê dựa trên dữ liệu lớn

So sinh cdc phan mém web scraping

Cơ hội, thách thức và rủi rò của đữ liệu lồn cho thông

Tông hợp nghiên cứu Việt Nam liên quan dén CPT va

~ð Ia

OO lu

Trang 11

Bang 3.3

Bang 3.4 Bang 3.4 Bang 4.1 Bang

Bang 4.4

Bang 4.9 Bang 4.10 Bang 4.1] Bang 4.12

Danh sach các trang web chia theo nhóm ngành

Tổng sản phẩm trên địa bàn theo giả so sánh 2010 phản

theo kha vue kinh tê Tong mic bán lẻ hàng hóa và doanh thu dịch vụ tiêu dùng theo giá hiện hành phần theo ngành kmh tê

Chỉ số giá tiêu dùng các tháng rong nằm

Một số kết quá chủ yếu về hoạt déng TMDT tai TP.HCM

Số lượng trang web và số lượng mặt hàng thu thập Kết quả thông kế mô tả giá im các biên của mô hình Các nhân tô tây động đèn giá máy tỉnh xách tay Các nhân tô tác dộng đến giá máy tỉnh xách tay (sau khi

114 119

Trang 12

Hình

Hình 3.1

Hình 3.2

Hình 3.3 Hioh 4.1

Hinh 4.2 Hinh 4.3

Quy trình thu thập thông tứn từ khai thác dữ liệu lớn Quy trính sử dụng đữ liệu lớn trong tinh toan CPI Cơ cầu tổng sản nhằm trên địa bản của TP.HCM

nam 2018-2022

Hình thức đặt hàng và dối tượng bản hàng Sơ đô câu tric ctia mat hang may tỉnh xách tay rong CPI

tình từ để hến lớn sơ tháng lrước Chỉ số giá tiêu dùng truyền thông và chỉ số giá dược

~*~ £

i

tỉnh tử dữ liệu lớn so tháng 9 năm 201

Trang 82 9

Trang 13

DANH MỤC PHỤ LỤC

Phụ lục 1 Kết quá mô hình hồi quy Hedonic cho máy tính xách tay Phụ lục 2 Danh sách chuyên gia

Phụ lục 3 Phiêu kháo sát chuyên gia

Phụ lục 4 Kết quả tông hợp các ý kiến của chuyên gia Phụ lục 5 Bién ban héi thao

Phụ lục 6 Một số hình ảnh và các đoạn chương trình khai thác dữ liệu giá

Phụ lục 7 Kết quả tỉnh chỉ số giá tiêu đùng khai thác từ đữ liệu lớn (7 biếu)

Trang 14

TOM TAT

Luận án khai thác đữ liệu lớn trong việc tính chỉ số giá tiêu ding (CPT) str

dụng nguồn thông tín giả thu thập được từ các trang web trực tuyến đề tính toán chỉ số giá tiêu đùng cho Thành phỏ Hồ Chỉ Minh, Nguồn đữ liệu này không những giải quyết được một sé thách thức trong phương pháp thu thập giá truyền thông (như độ

tré trong việc công bỏ số liệu, khó khăn trong việc thu thập thông tin tại địa bán, sai

số phi chọn mẫu, chỉ phi thu thập) mà còn chờ phép chúng ta mở rộng cỡ mẫu, tần

suất thu thập cao hơn, phân ảnh chính xác hơn việc sử dụng các mặt háng thay thể của người tiêu dùng, thông tín thu thập kịp thời hơa Kết quả tính toáa chỉ số giả tiêu dùng dựa trên dữ liệu lớn thu thập được từ các trang web trực tuyỂn so với chỉ số giả tiêu dùng được tính theo phương pháp truyền thông cũng khá tương đẳng, thé hiện dúng xu hướng Từ nguồn đữ liệu lớn thu thập được, luận án cũng đã xây dung được mỗố hình hỏi quy Hedomiec (nh cho trường hợp máy lính xách tay) nhằm điều

yak * ae ` CÁ ` gi Thì ye x ` * « > a

chính sự thay đôi của chất hượng, quy cach hang hoa trong rõ hàng hỏa tinh chi so giá tiêu dùng, đâm bảo tỉnh so sánh của chỉ số giá Qua đó cho thấy mô hình hỏi quy

Hedonie phù hợp trong việc điều chính sự thay đối của chất lượng háng hóa, lã một nội dụng quan trọng trong kỹ thuật tỉnh toán chỉ số giá tiêu đùng Nghiễn cứu nây đã bố sung phương pháp mới trong việc thu thập đữ liệu phục vụ công tác thông kẻ, đặc biệt là thông kê nhá nước cũng như xây dựng được phương pháp tính chỉ số gid

tiêu đúng tử nguồn dit héu lon

Từ khóa: Dữ liệu lớn, chỉ số giả tiêu dùng, mô hình hồi quy Hedonic

Trang 15

ABSTRACT The thesis exploits big date m calculating the consumer price index for Ho Chi

Minh City usmg price information collected from online websites This data source nat only solves some challenges in traditional price collection methods (such as delay in data publication, difficulty in collecting data at sampling zone/ difficulty in

offline data collection, non-sampling error, callection casts} but also allows us to

expand sample sizes and frequency which helps better reflect consumer substitution

patterns and get real-time data The consumer price index caleulated based on large

enline data is showing similar trend compared with the consumer price index

calculated by the traditional method From the big data callected, the thesis has also built a Hedonic regression model (applied for the case of laptop category) to adjust the change m quality and spectfications of goods m the basket to calculate the consumer price index and ensure the comparability Thereby, it shows that the Hedonic regression model is approriate od

which is an important content in consumer price index calculating technique This

study has added a new method of collecting data for statistics, especially official

statistics, a8 well as developing a method to calculate the consumer price index

from abigz data source,

Keyword: Big data, consumer price index, Hedonic regression model.

Trang 16

CHƯƠNG 1 GIỚI THIẾU ĐỀ TÀI NGHIÊN CỨU

Trong chương Ù| tác giả luận dn wink bay idm quan (one cia chi sé gia téu dùng và đựa ra những lý do mà tác giả luận án lựa chọn vẫn độ nghiên cứu, Thàng chương nảy, lúc giá Cũng iriah bay dwoc muec tiéu aghién cin lone quai, qua độ lắc giả luận ân đưa ra từng PHậc liêu cụ thể cần đạt được tong nghiên cu, Chương

ngàn hàng, điều chỉnh tý giá, ban hành các chính sách phát triển kinh tế xã hội theo

vùng miền, các chỉnh sách tiền lương, qua đó góp phần phát triển hoạt động sản

xuất kinh doanh và trao đôi thương mại quấc tế, Trong đó chỉ số giá tiêu dùng được xem là một trong những chỉ số kinh tế quan trọng nhất do các cơ quan thông kê quốc gia công bé (Berry et ai, 2019) Chỉ số giá tiêu đùng có lịch sử rất lâu đời, được thu thập và tính toán ở phần lớn các quốc gia trên thể giới Phương pháp tỉnh chỉ số giả tiêu dùng biện nay cũng khác biệt nhiều so với trước đây, hàng hóa đã được mở rồng phạm vị thủ thập, nguồn đữ liệu được sử dụng để xác định quyên số

cũng có nhiều bước phái triên Mặc dủ vậy, tính toán chỉ số giá tiêu dùng van dua

trên mẫu chứ không phải tất cá mọi mức giá của từng loại hàng hếa hoặc địch vụ

mà người đản chỉ tiêu đồng cuỗi cùng đều được thu thập, Các cơ quan thông kê quốc gia thưởng chon mau các hàng hóa và dịch vụ đại điện má người dân tiêu dùng nhiều nhất, Ngoài ra, do không thể quan sát giá của hàng hóa và địch vụ được lựa

chọn tại tất cả các cửa hàng bản lẻ bản trên toàn quốc, nên mội lần nữa, các cơ quan

Trang 17

te

thống kê quốc gia lại sử dụng phương pháp chọn mẫu chọn đại điện các cửa hàng

đề thu thập giá Điều này đẫn đến khả năng phát sinh sai số chọn mẫu cao, Việc thu

thập thông tin giá theo phương pháp truyền thông thông qua các cuộc điều tra như

hiện nay cũng có một số bất cập như chỉ phí thực hiện điều tra và việc tiến hành ngay cảng trở lên khó khăn hơn, việc gia tăng số lượng chuối cửa hàng làm cho thời gan tha thập kéo dài hơn, tý lệ trả lởi ngày cảng giảm (Crystal et a1, 2619), Ngoài ra việc tỉnh toán chí số giá tiểu dùng theo phương nhảp tuyền thông cũng phát sinh thêm một số bất cập như có độ trễ trong việc công bỏ số liệu, còn tốn tại sai số phí chọa mẫu, khỏ khăn trong việc xừ lỹ các mặt háng thay thê của người tiêu dùng, các mặt hàng mới xuất hiện, các mặt hàng có vòng đối sản phẩm ngắn

Ngành thông kế Việt Nam tiến hành điều tra, thu thập thông tin, tinh chi sé

`

a +, `.uâ ` ` ^ A *+ * ` * ` Ke * ^ * & ^

giá tiểu dùng và công bỗ hàng tháng vao các ngày cuối tháng, Thông tì thông kệ về chỉ số piá tiên dùng được thu thập từ cuộc điều tra giả tiểu dùng do Tông cục Thông

Â^ ` & ` x om ` ` vài > * A mà Ẩ a + a ”

kề triển khai và được thực hiện ở cả 63 tinh, thanh pho Hé thong thong tin thong ké

es

về giả tiêu dùng của ngành Thông kê dã được xây dựng vá ngày cảng hoán thiện với # sre

một số các nghiên cứu điển hình như nghiên cứu về phương pháp xác định hệ thông

quyền số tinh chi sé gid tiga dng (Văn Thị Loan, 1998); Chỉ số giá tiêu dùng Việt

Nam và các yếu tô tác động phương pháp tiếp cần định lượng (Trương Văn Phước và Chu Hoàng Long, 2005k Hoàn thiện phương pháp tính chỉ số giá nhóm nhà ở trong chỉ số giá tiêu đẳng ở Việt Nam (Đồ Thị Ngọc, 201 4a}; Giới thiệu về phương pháp tính chỉ số giá tiêu dùng mới và một số khuyến nghị (Đỗ Thị Ngọc, 2014hh

Hệ thông thông lin giá và các cuộc điều tra thống kế giá (Vũ Thị Thu Thủy, 2015): Nghiên cứu vá dễ xuất mô hình dự báo chỉ số giá tiêu đùng áp dụng cho Tổng cục Thống kê (Vũ Thị Thu Thủy, 2018) Tuy nhiên, cũng tương tự như thực trạng tỉnh chỉ số giá tiểu đàng trên thể giới, phương pháp tính chỉ số giá tiêu dùng ở Việt Nam

cũng còn miột số bắt cập như công tác thu thập tại địa bản ngày một khó khăn hơn;

sai số phi chọn mẫu vẫn còn cao do chất lượng thông tia thủ thập dược phụ thuộc

vào kỹ năng thu thập thông tín cũng như tỉnh trung thực của điều tra viên; chi phi

cho cuộc điều ira cao vị phải huy động lực lượng lớn điều tra viên lớn,

Trang 18

G2

Cùng với xu hướng ngày cảng phát triên của nền kinh tê số trên thể giới, các

giao địch mua bản, giới thiệu sản phẩm trực tiếp trên internet ở Việt Nam ngày càng

phế biến Theo sách trắng thương mại điện tử Việt Nam năm 26022, thị trường

thương mại điện từ Việt Nam đạt nhiều kết quả ấn tượng Nếu như năm 2017, thương mại điện từ bán lệ Việt Nam mới chỉ dat 6,2 ty OSD, thi đến năm 2027 đã đạt mức ¡6,4 tỳ USD (Cục Thương mại điện tử và Kinh tế số (Bộ Công Thương),

3022) Việc người dân quan tâm vá phát triển mua bán trên mạng ngày cắng nhiễu sẽ tạo ra nguồn đữ liệu vô cùng lớn Nghiên cứu về đữ liệu lớn ở Việt Nam được phát triển trong thời gian gân đấy trong một số lĩnh vực như kinh tệ, thông tín - thư

viện, kiểm toán báo cáo tải chỉnh, ngắn hàng, bất động sản, giáo dục và đảo tạo

Tuy nhiên, các nghiên cứu về đỡ liệu lớn ứng dụng trong thông kê chính thức ở Việt

Nam còn hạn chế, phần lòn đang trong giải đoạn nghiên cứu tổng quan, Năm 201Ấ,

Tổng cục Thông kệ thực hiện một nghiên cứu thí điệm việc lông ghép các dữ liệu

thu thập trực tuyến trong việc sán xuất chỉ số giá tiên đùng, Kết quá không được

công bổ và nguồn đữ liệu chưa đượctích hợp vào quy trình nghiệp vụ thống kê

(Thuy Nguyen Van and Hoan Nguyen Cong, 2618),

Hơn hai mươi năm trước, cuộc cách mạng công nghệ thông tín và truyền

thông tại các quốc gia phát triển đã lắm thay đối hành vì tiêu đúng của người đán dũng như hành vì phản phi hàng hóa của đoanh nghiệp Sự phát triển vượt bậc nảy giúp lạo ra một nguồn di liệu lớn chưa từng có ở những khu vực mà các kỹ thuật thu thập đữ liệu truyền thông không thể tiếp căn được Ngoài ra, cùng VỚI sự gia

tăng của các hình thức cửa hàng hiện đại là sự gia tăng của các nến tâng bản hàng trực tuyến, điều này tạo điều kiện cho việc thu thập giá trực tuyển trong rất nhiều lĩnh vực khác nhau Xuất phát từ thực tế trên, cơ quan thông kế của các quốc gia đã xắc định nguồn đữ liệu mới nây lâ cơ hội tốt giúp họ giải quyết nhiều thách thừc má điều tra giá tiếu dùng đang gặp phái Nguồn đữ liệu giá thu thập từ các trang web bán hàng trực tuyên có thể đo lường chỉnh xác hơn sự thay đổi giá, giúp mờ rộng cở

mẫu, phan ảnh chỉnh xác hơn việc sử dụng các mặt hàng thay thể của người tiêu

đùng, giám hoặc loại bô áp lực của người cụng cấp thông Em và trong mội số trường

Trang 19

hợp sẽ giúp giảm chị phí thu thập thông tin, Ngoài ra nguồn dữ liệu lớn nảy có thê

giúp thu thập thông tia giả km thời hơn, mặt hàng da dạng hơn, tần số thủ thập cao

hon (Crystal et al., 2019)

Một trong những dự án đi dầu và tiểu biếu cho việc sử dụng tỉnh năng thu thập dữ liệu giả trực tuyển trên web để tính toán và dự bảo chỉ số giá tiêu dùng là dự

an ty gid do Vién Công nghệ Massachusetts nghiên cứu và phát triển, Kết quả

nghiên cửu dã chứng rninh rằng đữ liệu chí tiết về giá bản lẻ có thể được thu thập từ

xã với chỉ phí thấp hơn đáng kệ so với thu thập bằng phương pháp truyền thống

{Cavallo and Rigobon, 2016) Dự ăn nảy đã làm thay đổi đáng kế mô hình hoạt

động truyền thông của các cơ quan thông kê quốc gia là thu thập thông tia giá trực tiếp, điều tra viên dến các điểm bán lẻ đề thu thập thông tin (Harchaoui and Janssen, 2018) Mặc dù chỉ số giá tiêu dùng tính theo phương pháp trực tuyến vấn dang trong giai đoạn đâu của quá trình phát triển, nhưng có rất nhiêu bằng chúng cho thấy nó cung cấp cho các nhà hoạch định chính sách một bức tranh hợp lý, phản ảnh

g về chỉ số giá tiếu đúng theo thời gian thực Một băng chứng chắc

ta!

đằng xu hướn

chân và cụ thê hơn lì trường hợp của Areenltina, trong dó chỉ số giá tiêu đúng của

dự án tỷ giá được chứng mình là một sự thay thể tốt hơn cho chỉ số giá tiêu ding

chính thức sau khi né bị mất uy tín do can thiếp chinh tri (Cavallo, 2013) Ngodi ra Cavallo nhận xét các chỉ số được xây dựng tử giá trực tuyển này đã cụng cấp một ước tỉnh hợp lý tốt về cá mức độ và điễn biển của tỷ lệ lạm phái chính thức cho phần lớn các quốc gia được xem xét (Brazil, Chile, Columbia va Venezuela) Tiép

tục các nghiên trước, Dubey và OGennari (2014) đã nghiễn cửu sử đụng dữ liệu lớn trong lĩnh vực giá vớt nhóm hàng cụ thẻ là lương thực, từ việc dưa ra các số liệu thông kê chính thức dến các dự báo, cảnh bảo sớm về an nĩnh lương thực, Trong bỗi cành trên, một số quốc gia cũng đã và dang tích cực chuẩn bị dễ chuyển sang sử dung dit lidu Ion dé tinh toan chi sé gid tigu ding nhu Na Uy (Manik and Albarda,

2015), Anh (Naynor et al, 2015), Bi (Van Loon and Roels, 2018), Pháp, Thụy Điển va Ha Lan (lens, 2019}, Hoa Ky (Crystal et al., 2019) Dt Hén én dé thing ké gid

cũng dược các cơ quan thông kê quốc gia ở Châu À và Thái Bình Dương tích cực

Trang 20

at

khai thác, tuy nhiên công việc này cũng mới đang từng bước tim hiểu (Bernal et al,

20211, cụ thể như Ue (ESCAP, 2020), New Zealand (Statistics New Zealand, 2017), Nhật Ban (Statistics Bureau of Japan, 2019), Malaysia (Mustapa, 2020},

Philippines, Indonesia (Bemal et al, 2021)

“ ^

Nhận thức dược tắm quan trọng của công nghệ thông tin - truyện thông vá

đặc biệt lá dit héu lon, ngay 10 thane § nam 2018 Thủ tưởng Chính phủ ban hành Quyết định số S0LQĐ-TTe phê duyệt Đề án ứng dụng công nghệ thông tín - truyền

thông trong Hệ thống thống kế nhà nước giai đoạn 2017-2025, tầm nhin đến năm

2030 đề ra mục tiêu: “Ứng dụng công nghệ đữ liệu lớn đề hiện dại hỏa, giảm chi

phí, nàng cao chất lượng và tổng cường khá năng dự báo đổi với miột số chí tiêu thông kế trong các lĩnh vực thông kẻ giá” (Thủ tưởng Chính phả, 2018) Đánh giả được tiềm năng to lớn của dữ liệu lớn, Tổng cục Thống kế đã có một số định hướng hoạt động như thành lập tổ công tác về đữ liệu lớn, bố sung thêm nội dụng “Nghiên cứu ứng dụng đỡ liệu lớn vào chương trình phát triển ứng dụng công nghệ thông tín của Tổng cục Thông kế”, xây dime dé an ung dune đữ liệu lớn trong thống kê nhá

nước (Nguyên Bích Lâm, 2616)

Nghiền cứu giải pháp sử đụng nguồn đữ liệu lớn đề tỉnh chỉ số giả tiêu ding

ở Việt Nam là một việc rất can thiết và phù hợp với xu hướng của thể giới nên tác giả chọn chủ đề: “Khai thác đữ liệu lớn trong việc tỉnh chỉ số giá tiêu đồng ở Việt

Nam (trưởng hợp Thành phố Hồ Chí Mimh)? lâm nghiên cứu cho luận án này, Đề tài triển khai thu thập thông tin giả từ các trang web trực tuyển và tiễn hánh tính toán chỉ số giá tiêu đùng dựa trên nguồn thông tín thu thập được Những hàm ý chính sách, những giải pháp dược đề xuất trong nghiên cửu nảy sẽ giủp cho việc triển khai thành công công tác thu thập giá trực tuyển phục vụ việc tính toán chỉ số

giả tiêu đúng ở Việt Nam

1.2 Mục tiêu nghiên cửu

Trang 21

Mục tiêu cụ thế:

Mục tiêu 1: Xây dựng quy trình khai thác thông tín giá từ đữ liệu lớn,

Mục tiêu 2: Xây đựng quy trính và kỹ thuật tính toán chỉ số giá tiêu đừng từ

khai thác đữ liệu lờn

Mục tiêu 3: Nghiên cửu ứng dụng mô hình hải quy Hedonlc đề điều chỉnh

sự thay đổi chất lượng hàng hóa hoặc trường hợp hàng hóa không còn xuất hiện trên thị trưởng phục vụ cho việc tỉnh chỉ sô giả tiêu dùng,

Mục tiên 4: Phân tích tỉnh phù hợp của ứng dụng mê hình Hedonic đề điệu chỉnh sự thay đôi chỉ số giá tiều đùng bằng mồ hình Hedonic

sé gid tiéu ding tử khai thắc dữ liệu lớn 1.3 Cầu hỏi nghiên cứu

Với các mục tiêu nghiên cửu trên, để lỗi sẽ từng bước trả lời các câu hỏi nghiên cửu sau đây:

Câu hỏi nghiên cứu 1: Quy trình thu thập giả từ các trang web trực tuyến

như thể náo?

Câu hỏi nghiên cứu 2: Quy trính và kỹ thuật tính toán chỉ số ghi tiếu dùng

từ khai thác dữ liệu lờn ra sao?

Cầu bởi nghiên cứu 3: Có thê ứng dụng mô hình hi quy Hedonic dựa trên đữ Hiệu lớn để điểu chính sự thay đổi của chất lượng hàng hóa hoặc trướng hợp hàng hóa không còn xuất hiển trên thị trướng không?

Câu hỏi nghiên cứu 4: Tone hop chi sé gia tiéu dùng từ nguồn dữ liệu lớn

đã thu thập với sự ứng đụng mỡ hình hội quy Hedonic dựa trên đữ liệu lớn có phù hợp không?

Trang 22

Câu hải nghiễn cứu 5: Các hảm ý nghiên cứu nào để có thể triên khai thành cộng công tác thu thập giá trực luyên phục vụ việc tỉnh toán chỉ số giả tiêu dùng ở

Về hàng hóa ứng dụng mỗ hình hối quy Hedomic dựa trên đữ liệu lớn được thực hiện dội với máy lính wach taye co bean vate

a w Xf * ee aA x tp 4h a » A — ge » na

Về mặt thời gian: Số liệu vẻ giá được thu thập và tông hợn trong năm 3017 xả năm 2018

1.4, Phương pháp nghiên cứu

Đề thực hiền mục tiểu nghiền cứu, luận án được tác giá triên khai theo hướng sử

đụng phương pháp hôn hop, sử dụng đông thời nghiên cứu định tính và nghiên cứu

định lượng

1.3 Ì Phuong phap ughtén cru dink tink Phuong phap dinh tỉnh được triên khai thực hiện qua các hình thức thảo luận nhỏm,

phông vẫn trực điện, hội thảo khoa học, Đôi tượng tham gia thảo luận là các nhà

khoa học, các chuyên gia trong lĩnh vực giả tiêu dùng, nh vực máy tỉnh nhằm điều chỉnh, bố sung các yếu tô lên quan đến vẫn đề nghiền cứu, Việc thực hiện nghiên

cửu định tỉnh nhằm mục đích xác định:

Trang 23

Ô) Sự cân thiết sử dụng đữ liệu lớn trong công tác thông kế (trong dé tinh toán chí

sô giá tiêu đùng thông qua đữ liệu lớn là một trong các chỉ tiêu có thể được áp dụng sớm) và các giải pháp đề có thể triển khai dược việc thu thập đữ liệu lên phục vụ

tính toàn chỉ sô giá tiên dùng, (2) Việc giải quyết văn để thay đối chất lượng sản phẩm trong quá trình thu thập

thống la về giá va tinh loán chỉ số giả tiếu dùng, cụ thê hì sử dụng mô hình hồi quy Heđoniec đề điêu chinh chật lượng hãng hóa và địch vụ áp dụng cho máy tính xách

tay Các yêu tô tác động đến giá của máy tính xách tay ! 35.2 Phương nháp nghiên CM địHh lưng

Xây dựng mô hình nghiên củu các yếu tổ tác động đến giá máy tinh xách tay Nghiên củu của Haan và Diewert (2013) chơ rằng đổi với các sản phẩm như hang vông nghệ cao, mô hình tuyến tính logarH thướng được ta thích hơn với những mô

hính khác Theo Griliches (1971), dang hàm bản logarit thường được coi là "tốt nhất" trong các kiếm tra đánh giá về đang hắm trong các nghiên cửu về hàm hồi quy

Hedome Một số nghiên cứu sử dụng dạng hàm nảy nhu Baker (1997); Chwelos

(003); Byrne, Olmer va Sichel (2016); Zafar va Himpens (2019) McCormack

(2013) đã sử đụng mô hình hỗi quy Hedonic tuyển tính logarrt (LogLin) đề xác định các đặc điểm ảnh hướng đến giá ô tô mới Bulut và Zaman (2018) đã phân tích các yếu tố ảnh hướng đến giá với các mô hình như mê hình tuyển tính (imEim), mô hình số học logarit (LogLog), mô hình lopartt tuyến tính (Lml.og) và mô hình tuyển tỉnh logarf (LogLin) Kết quá của nghiên cứu cho thấy răng mô hình tuyển tính logarit (LogLin) mang lại hiệu quả nhất, Selnm (2008) sử dựng mô bình tuyến tính

logari (.ogLin) để xác định các đặc điển của ngôi nhá và các ước tính được thực

hiện bằng phương pháp bình phương tôi thiểu thông thường (OLS) Phương pháp

bính phương tôi thiểu thông thường được sử dụng rộng rãi trong phân tích hồi quy Từ các phân tích trên, tác giả chọn sử dụng mô hình tuyến tính lagarft (LogLin) cho nghiên cứu này và ước tính được thực hiện bằng phương pháp bình phương tdi

thiêu thông thưởng Đề đâm bảo tính vững, tỉnh hiệu quả và tỉnh không chệch của

Trang 24

mô hình, ta thực hiện các kiểm định sự phủ hợp với lý thuyết (kiếm định về hệ số

hỏi quy), mức độ phà hợp của mô hình (R) và các giả thuyết của mô hình có điển,

Các kiếm định được thực hiện cho mô hình là kiểm định mô hình băng kiếm định 4,

kiếm định F, sử đụng hệ số xác định R” để đánh giá sự phù hợp của mô hình, sử đụng nhần tứ phóng đại phương sai (Variance Inflation Facter - VIF} dé kiém dinh hiện tượng đa cộng tuyén, kiém định White để kiểm định hiện tượng phương sai thay dai

1.6 Nguồn dữ liệu

Về đữ liệu sơ cấp, luận án sử dụng nguôn thông tìn về giá của tất cả các mặt

hàng được thu thập từ 29 trang web chỉnh thức có giấy phép của Bộ Thông tin va Truyền thông, đây lá những trang web bán hàng lớn và có uy tín ở Việt Nam, tấn suất thu thập ba lần trong một tháng, thới gian thu thập bắt đầu tù tháng 10 nam 2017 đến tháng ¡2 năm 2018 Tổng số mặt hãng thu thập giả là 246.069 mặt háng, đây lá nguồn dit Hiệu được sử dụng đề tỉnh toán chỉ số eHí tiêu đừng,

Đữ liệu thứ cấp la thông na về giá vá chỉ số giá tiêu đúng của Cục Thông kế Thành phô Hỗ Chỉ Mimh qua các năm 2617, 2618 và 23619; Niễn giảm Thông kê

Thành phô Hồ Chí Minh qua các nấm 2017, 2018, 2019 va 2022

1.7 Những đóng góp mốt của luận án

Về mặt lý thayéi:

Xây đụng phương pháp Hiếp cần mới trong việc thu thập thông tin thong kệ, ruột trong những bước quan trọng nhất trong quả trinh báy Đước sản xuất thong tin thông kê

Về mặt thực tiên:

Phương nhấp thu thập thông tim theo đữ liệu lớn sẽ giúp cải thiện chất hượng đữ liệu đầu vào do giám các sai số chọn mẫu và nhỉ chọn mẫu, giảm công sức và chị phí thu thập thông mm, tiệt kiệm thời gian;

Trang 25

Xây dựng dược mô hình hội quy Hedomie đề điệu chỉnh su thay déi cla chat

lượng bang hòa dựa trên đữ liệu lòn 1.8 Kết cầu của nghiên cửu

Luận án gồm 5 chương như sau: Chương 1 Gidi thiệu về đề tài: LÝ do nghiên cứu và tính cấp thiết của dé tan

Mục tiêu nghiên cứu của luận án và cấu hỏi nghiên cứu; Đôi tượng, phạm vị,

phương pháp và nguôn đỡ liệu nghiên cứu; Y nghĩa của đê tài,

Chương 2, Cơ sử lý thuyết và tông quan các nghiên cứu trước có liên quan

đến để tài: Tổng quan các lý thuyết Về chỉ số giá, đữ liệu lớn, mô hình hỏi quy Hedonic, tong quan cic nghiên cửu trong và ngoài nước có Hiên quan đến đề tải,

Chương 3 Phương pháp nghiền cứu và quy frinh nghiên cửu: Quy trimh nghiền cửu, nghiên cứu đụth tính, aghiên cứu mh lượng, mô hình hồi quy Hedonic

Chương 4 Kết quả và thảo luận: Tổng quan về Thánh phố Hồ Chí Minh, các yếu tô tác động đến giá máy tính xách tay, phần tìch các kết quá tính toán chỉ số giá tiêu dùng

Chương Ã, Kết luận và hàm ý chính sách: Kết luận, khuyên nehị, bạn chế của đề tái, hướng nghiên cửu tiếp theo

Danh mục tài liệu tham khảo Phụ lục

Trang 26

2.1 Cơ sở lý thuyết về giá và chỉ số giá

3.1.1 Khải niệm về giả và chỉ số giá

Một quan hệ trao đối khi tiền tệ đã phát sinh sẽ tạo nên sự ra đời của giá cả hàng hóa Như vậy giá cà xuất hiện ngay tử khi khoa kinh tế học ra đới, má bạn đầu

được gợi là kinh tế chính tri học Phạm tra gid cả xuất hiện và phát triển gần hiện

với sự phát triển của nên kinh tế hàng hòa vá cùng với đó là sự hoàn thiện của nhà nước, Đề giải quyết vẫn đề mà nhà kinh tế học David Ricsrdo đưa ra là xem đối tượng nghiên cúủu của kinh tế chỉnh trị học là sự tạo nên và phân phối tổng sản

phẩm quốc gia giữa các nhỏm hay các giai cấp trong xã hội, các nhà lý thuyết tại

thời điểm đó đều phải nghiên cửu để giải quyết việc xác định giá cả (hay giá tr

của các nguồn lực và sản phẩm trên thị tường VỀ sau, các thế hệ nghiên cửu tiếp

theo lại ngày cảng quan tâm đến vẫn đề giá trị và giá cả Những nễ lực nghiên cứu

liên tue va rit da dang bắt đầu từ tư trưởng của Karl Marx đến Leon Walras, Đến cuối thể kỳ XIN, kính tế học ngày càng đi sấu vào phát triển các kỹ thuật và tập trưng các lý luận để phân tích các thị trường cụ thể nhằm tim kiếm lời giải cho nguồn gốc của giá cả, Đỏ là lý đo kinh tế học đã phát triển theo chiêu hướng mà

trgày nay chùng †a gọi lá kmh tế học vĩ mỗ (vì vậy trước đây kinh tế học vị mô cô

một tên gợi khác, cũ hơn là lý thuyết giá cả), Theo quan điềm của các nhà kinh tế

H xẻ 4 ‘ ` 4, * + ¿ * ` 2 “Á x

hee cd dien do Adam Smith (1937) khai smh va doe David Ricardo, phát triển thì

Trang 27

Pewee t2

giá cá là biếu hiện bang tiên của miá tri hang hoa David Ricardo (1973) thi cho

ring gid dựa trên số lượng lao động cần thiết để tạo ra hàng hóa bao gồm cả các

khoản chi phi bộ sung như chỉ phí phân phối

Kinh tế học tân cỗ điển là một trưởng nhải kinh tế học có trọng tầm nghiên cứu là cơ chế quyết định giá cả Đình cao trong các nghiên cứu về giá của giai đoạn này được tập hợp lại trong các công trinh cla Afred Marshall Alfred Marshall tiép thu các lý hiện của Ricardo, bd sung thém bằng các lỷ luận về thỏa đụng và tinh thôa dụng cân biên được phát triển trước đó bởi John Stuart MIH, WiHam Sualey

Jevons, Carl Menger va Leon Walras Marshall (1920) dinh nehia gia ca ma neue

mua sẵn sàng trả để có được hàng hóa phụ thuộc đồng thời vào ước muốn sở hữu

hàng hóa đó của họ vá chỉ tiêu mà họ đành cho việc đó Ông đã giải thích cơ chế

quyết định giá cả bởi sự giao nhau của bai đường cùng cấp và đường nhụ cầu, Ông đã đen: kỹ thuật phân tích cân bằng bệ phận vào kinh tế học tân cổ điển, Theo

Marshall: cần phân biệt việc xác định giá ở ngăn hạn va dai han O ngắn hạn, cầu

thị trường có tác động rất mạnh đền giả trong khí ở dài hạn, giá cả được điều chỉnh chủ yêu đựa váo chí phí sản xuất với giả thiết về cạnh tranh Đề nghiên cứu giá cà, cân phải sứ dụng một công cụ cơ bản là khái niệm về độ co giãn,

Lý thuyết giá cả là thuật ngữ được Stigler vã các nhà kính tế học khác sử

dụng vào giữa thê kỷ trước để biểu thị sự cải tiên của hợ đối với lý thuyết giá trị như lý thuyết xác định giá khai thác (SHgler and Boulding, 1952; SHgler, 1946;

Baim, 1972} Một đặc điểm nội bất của lý thuyết giả là thừa nhận sự đa dạng của các loại cạnh tranh hoặc thiếu cạnh tranh, ảnh hưởng đến việc xác định mia, cling

với việc tập trung vào các yếu tô xác định loại cạnh tranh áp dụng ở các thị trường

cụ thẻ

Theo quan điểm của các nhà kính tế thị trưởng biện đại thì giá cả là sự biểu

hiện bằng tiên của giá trị và giá trị sử đụng của hàng hóa, động thời cũng biểu thị

một cách tông hợp các môi quan hệ trong nến kính tế quốc dan.

Trang 28

Chỉ số giá là thước đo mức độ thay đối tương đổi của giá cả, bao gỗm một

đấy số được sắp xếp để so sánh các giả trị giữa hai thời kỳ hoặc giữa bai địa điểm

bàt kỳ Chỉ số giá giúp chúng ta thấy được mức thay đối bình quân về giá giữa các

thời kỳ hoặc mức chênh lệch bình quần về giá giữa các địa phương Các chỉ số giá lần đầu tiên được sử dụng để đo lường những thay đổi trong chỉ phi sinh hoạt, qua đó xác định được mức tăng lương cần thiết để duy trí mức sống không đối khi giả cả háng hóa tăng lên Sau đó, chỉ số giả tiếp tục được sử dụng rộng rãi để ước tỉnh sự thay đối của giá cả theo thời gian và cũng được sứ dụng để đo lường sự khác biệt về chỉ phí sinh hoạt giữa các khu vực hoặc giữa các quốc gia khác nhau trên thể giới Vũ Thị Thu Thủy (2015) đã phân tổ giá theo 3 nhóm chính là giá sản xuất, giá hãng hóa giao dịch với nước ngoài và giá tiêu dùng,

Khi tính toán các chỉ tiểu chú yếu của hệ thông tải khoàn quéc gia (SNA),

giả, Cần cử vào quá trmh hoạt động sản

_

một thuật ngữ thường được để cận đến lá xuất và phần phối sản phầm vật chất và sán phẩm địch vụ, yếu tổ chí phi, thuế, trợ cấp sản xuất, phí lưu thông, giả được phản ra các loại: giả cơ bản, giá sán xuất và

giá sử dụng Theo Tổng cục Thông kế (20181, nội dung chỉ tiết các loại giá như Sau:

Giả cơ bàn là số tiền người sản xuất nhận được đo bản hoặc cung cấp một

đơn vị sản phầm vặt chất hoặc sản phẩm dich va san xuất ra thị trường, cộng (†) trợ

cấp sàn xuất, trừ (-) thuế sản phẩm Giá cơ bàn không bao gồm phí vận tải được

người sản xuất chí hóa đơa riêng, Giá cơ bản không bao gồm bất kỳ loại thuế náo

đánh vào sân nhậm, nhưng bao gém các loại trợ cấp sản xuất (ượ cấp sản phẩm và

trợ cấp sâu xuất khác) Giả cơ bân đo lưỡng khoán tiền người sân xuất được lưởng

và là mức giá sát thực nhật Hiến quan đến quyết định của người sân xuất,

Giả sản xuất là số tiễn người sản xuất nhận được do bản hoặc cung cap mot

đơn vị sán phẩm vật chất hoặc địch vụ sản xuất ra thị trưởng trừ thuê giá trị gia

~~ v * A ` ut es ` "xẻ ` ` hn 2 , x

tăng (VÀ TT} được khâu trừ người inua phải trả, Giá sản xuất không bao gõm chi phi

Trang 29

+

^ `

Giá sử dụng bao gêm thuê sản phẩm, phí lưu thông (phí thương mại và vận (ải) do

nyo mua phat tra 2.4.2 Chi sé gid téu ding

Chỉ số giả tiêu dúng là một chỉ tiêu tương đối phản anh xu hướng vả đo lưỡng mức độ biển động giá hãng hóa tiêu đùng cuỗi cùng thời kỹ nảy so với thời kỳ khác, địa phương nảy so với địa phương khác và đặc biệt, quốc gia này số với quốc gia khác Nhóm nảy bao gồm các chỉ số giá như chỉ số giá tiếu đùng (CPD,

chí số giá sinh hoại theo không gian (SCOLD, chỉ số giả so sánh quốc tế (CE}, lạm

phát cơ bản

* `

"Chỉ số giá tiêu đùng là chỉ tiêu tương đối (tính bằng 9%) phân ánh xu hướng và mức độ biển động gia theo thới pian của các mặt hãng trong rô hàng hóa vá địch vụ tiêu đùng đại diện" (Tổng cục Thông kế, 2018), “Quyền số để tỉnh chỉ số giả tiêu dúng là cơ cầu chỉ tiêu các nhóm mặt hàng trong tông chỉ Hêu của hộ gia đình được tổng hợp từ kết quả điều tra mức sống dân cư vá dùng có định khoảng 5 năm?” (Tông cuc Thông kẽ, 2018), Chỉ số giá tiêu đùng do lường tốc độ thay đồi giá của

một rò hảng hóa và địch vụ cụ thể từ một khoảng thời gian náy sang khoảng thời gian khác, có thể là tháng, quí, 6 tháng, năm Như vậy, để tình chí số giá tiêu dùng,

các cơ quan thông kê quốc gia phải thu thấp đữ liệu giả cá và số lượng cho nhiều

loại hàng hóa và dịch vụ Hiện nay hấu như tất cả các cơ quan thông kê quốc gia

trên thể giới đều triển khai các chương trình thu thập đữ liệu giá tiêu dùng hãng thăng đều đặn, tạo cơ sớ cho việc tính toán chỉ số giá tiêu đùng Ngoài ra, đề ước tinh su thay đối giá so với thời kỳ gốc (có sử đựng quyền số hay còn gọi là trong

`

*

số), các cơ quan thông kệ quốc gia phải thu thập được đữ liệu về cơ cầu chỉ tiêu của

Trang 30

hộ gia đình, Thông thường dữ liệu nảy được thực hiện bởi cuốc điều tra khảo sắt

mức sống đân cư mà hậu hết các cơ quan thông kế quốc gia đều thực hiện trong các khoảng thốt gian không đêu đặn (Beeple et ai, 2016}

Hầu hết các cơ quan thống kẻ quốc øía sử dụng chỉ số Laspeyres cơ sở cỗ

định và cách tiếp cận tổng hợp theo nhiều giai đoạn để tính chỉ số giá tiêu dùng (United Nabons, 2009) Chỉ số Laspevres lính toán sự thay đối giữa hai thời kỳ trong tổng số tiên rnua một rô hãng hóa vả địch vụ tiêu dùng phố biến, Theo LÒ, sử đụng chỉ số Laspevres có thể có các u điểm là để hiểu và để giải thích cho mọi

người: được thu thập từ kết quá khảo sắt hộ gia đỉnh hoặc nguồn đỡ liệu hành chính

tại kỳ góc, phương pháp sử dụng chỉ số này được đùng trong mội thời gian đãi thay

vi phas cap nhật đữ liệu mới hãng tháng (HO, 2004)

Ngoài ra, ILO cũng nhận dịnh thếm: một lợi thể đáng chủ ý khác là

L.aspeyres nhất quán trong việc tổng hợp số liên, từ mức trên cũng xuống mức tổng

hợp thắp nhất Chỉ số có thể dược chia thành các tập hợp cơn có liên quan đến nhau một cách don giản Tuy khải niềm Laspeytes khá đơn giản, nhưng đẻ triển khai

trong thực tế cho việc tính toán một chỉ số Laspeyres thích hợp cũng có nhiều khó

khăn (ILO, 2064) Do đề, có một số nội dụng, các cơ quan thông kê phải tính toán một cách tương đổi, thay vì phải thu thập tất cả mọi mức gid giao dich cho time nhóm hàng hóa, thông thường các cơ quan thông kế chỉ thu thập giá cá của một mầu đại diện ở các cửa hàng Chỉ số tổng hợp cơ bán được tính toán dựa trên công thức không có quyền số và các chỉ số nảy sẽ đại diện cho mỗi nhóm 100.000 sản phẩm khi tỉnh toán chỉ số Laspeyres ở mức cao hơn Mặc dú quy trình hai giai đoạn này không thật sự hoàn toàn phú hợp với phương pháp Laspeyres (trong từng gia đoạn tích hợp đều đòi hồi phải có trọng số), Mitchell (1927) và Knibbs (1924) la

Trang 31

A

đáng tin cây và chính xác Khi mới ra đời, chí số giá tiêu dùng chủ yếu dùng để

tính toán việc tăng lương do có sự thay đôi về chí phi siah hoạt của người lao động, tuy nhiên theo thời gian, mục địch sử đụng của chỉ số giá tiêu dùng đã được mở

rộng ra rất nhiền, Chính phê sử dụng chỉ số giá tiểu dùng như lá một công cụ để

thực hiện các chỉnh sách tiền tệ và tài khỏa, ngành thống kê sử đụng chỉ số giả tiêu

dimg lam công cụ giảm phát trong tài khoàn quốc gia để ước tính tốt hơn những thay đối vẻ tăng trường kinh tế trong thực tế (LO, 2013; Phạm Thị Hằng và Nguyễn Phương Anh, 2020) Ngoài ra, chỉ số giả tiên đúng được sử đựng rộng rãi như một chỉ bảo kính tế vĩ mô về lạm phát Ngày nay, với quả trình toàn cầu hóa vá tự đo hóa thị trưởng, chính phủ các quốc gia, các ngân hàng trung ương, các tổ chức quốc fÊ và người dùng tia rất chú trọng đến chỉ số giá tiêu dùng và đánh giá

chất lượng của chỉ số giá tiêu dùng ở ba khía cạnh chính: chất lượng, độ chính xác

tế mới nội và đang phát triển, chiếm tỷ trọng $1% (Berry et al, 2019) Nghién cứu

của Berry và cộng sự cho thấy chỉ sẽ giá tiếu dùng được tổng hợp một cách phố biển, thường xuyên, kịp thời và khá phủ hợp với các tiêu chuân quốc tế Tuy nhiễn,

kinh tế và có nhạm vị bao phủ quốc gia 1A 76%

Năm 2012 tổ chức TLO đã tiên hành khảo sát 169 quốc ee (ILO, 2013) ver

một số kết quá chính sau: Vẻ mục địch sử đụng chính của chỉ số giá tiêu đùng, 96%

các nước sừ dụng chỉ số giá tiêu dùng đề tính toán tỷ lệ lạm phát phục vụ cho việc ban hành các chính sách tiến tệ; 2196 các nước sử đựng chỉ số giá tiêu dùng để phục vụ cho việc tính toán chỉ số tiến hrơng, lương hưu và chỉ trả an sinh xã hội: ŠS%% các nước sử đụng chỉ số giá tiêu dùng đẻ phục vụ cho việc tính chỉ số tiên thuê, hợp

w

đồng và các khoán thanh toàn khác Ngoài ra các nước cùng sử dụng chỉ số giá tiểu

Trang 32

17

dùng để tính toán giấm phát chỉ tiêu hệ gia đình trong tài khoán quốc gbg tỉnh toắn

sức mua của các hệ gia đính và xáy đựng các mô hình kính tế vĩ mô, các ứng dụng phân tích khác Berry và công sự (2019) đã tiến hành một nghiên cửu thu thập và

tổng hợp thông tín thông kế giá cho 196 nên kinh tế, Nghiên cửu đã đưa ra một sỐ kết luận như khoảng thời gian tham chiếu sử đụng các quyền số chỉ số giá tiếu đùng là một chỉ số về độ tin cậy vá độ chính xác của đữ liệu Các nên kinh tễ có quyền số chỉ số giá tiêu dùng được cập nhật trong vòng à năm chiếm tỷ lệ 43% trong tất cá các nền kinh tế; 35% các nên kinh tế cập nhật quyền số trong khoảng thời gian từ 6-10 năm; 14% các nền kính tế cập nhật quyền số trong khoảng thời

gian từ 11-15 năm; còn hạ 3% là trên lŠ năm Vẻ việc phế biến thông tin thông kê,

tinh kip thời rất quan trọng đối với tất cả số liệu thông kê, đặc biệt là chỉ số giá liêu

dùng, nó là chia khóa cho tính hữu ích và mức độ hên quan của đữ liệu, Trong thời

gian qua, hầu hết các quốc gia dêu cô gắng rút ngắn thời gian phê biển số liệu về

chỉ số giả tiêu dùng Khoảng 861% (169/196) các nên kính tế biến soạn và phê biến

chí số giá tiêu dùng hàng tháng và công bố trong vòng bến tuần sau khoảng thời gian tham chiêu,

Bảng 2.1 Tông hợp đánh giá chí sô giá tiêu dùng ở các nước

181 nên kinh tế 15 nên kinh tế Tính kịp thời của | Chậm hơn Í Sớm hơn! — Chậm hơn Í — Sớm hơn Í

tế

148 nên kinh tế 48 niên kinh tế

(Trọng số chỉ 149 nên kinh te 28 nên kinh tế 18 nên kính tế

tiêu)

quyền số R§ nên kinh tế 75 nên kmh — 27 nên kinh — 6 nên kinh tế

N gudn: Tính toán của chuyên ee IMP; cdc khu vie t6 mau lam nội bật các thông

lệ quốc té tét nhat (Berry et al., 2019)

Trang 33

Đề có được bức tranh cụ thể và chỉ tiết hơn về công tác thu thập, tỉnh toán

và phố biên chỉ số giá tiêu dùng tại các quốc giai trên thể giới, nghiên cứu sẽ trình bảy chỉ tiết các giai đoạn sản xuất thông tin giá tại các quốc gia: Hoa Kỳ, Anh, Úc,

Nhật Bản và Nam Phi, là những nước đại diện cho các Châu lục và cô công tác thông kế chỉnh thức phát triền, ôn định,

2.1.4.1 Việc áp dụng phương pháp tính chỉ số giả tiện đùng truyền thông tại Hoa

Ky Ở Hoa Kỳ, chí số giá tiêu đồng được định nghĩa là thước đo sự thay đổi

trung bình theo thời gian của giả cả được người tiêu dùng khu vực thành thị trả tiền

cho một rô hàng hóa vá địch vụ tiêu đúng cô định trến thị trường và cơ quan chịu trách nhiệm tính toán và công bé 14 Cue Théng kề Lao động, Chỉ số giá tiêu ding

được công bổ theo địh kỳ hàng tháng vá thời gian tham chiều của chỉ số lâ giai

đoạn 192-1984, Chỉ số giả tiểu dùng ở Hoa Kỷ được sử dụng cho các mục dịch

như tính chỉ số tiên lượng, lương ¿ hưu, các khoản chi trả an sinh xã hội, tính chí số tiền thuê nhà, chỉ trả hợp đồng, các khoản thanh toán khác Phạm ví địa lý của quyền số chỉ tiêu vá thu thập giả tập trung ở khu vực thành thị Kết quả điều tra chỉ tiêu hộ gia đình được sử đụng đề tính quyền số chỉ số giá tiêu dùng và được cặp

nhật hai năm một lần Chỉ số giá tiêu đùng ở Hoa Ký được thu thập và công bố

hàng tháng, một số hàng hóa đặc biệt như may mặc và bảo dưỡng, chăm sóc v tế,

đỗ đạc và hoạt động gia dinh thu thập hai tháng một lấn Dữ liệu chỉ số giá tiểu

dùng được công bỏ khoảng hai tuân sau thắng tham chiều, Về việc xử lý sự khác biệt về chất lượng, Cục Thông kế Lao động sử dụng phiêu phương phap dé tinh dén

sự thay đổi chất lượn g, xác định giả triển cơ sở đơn vi (tinh đến sự thay đổi về kích

thước, số lượng), các điều chỉnh dược cung cấp bời nhà sản xuất và phân tích hếi quy Hedoníc được sử dụng dễ điều chỉnh chất lượng cho các mặt hàng như quân

áo, điện từ và thiết bị gia dung (LLO, 2012).

Trang 34

19

2.14.2, Vide ap dụng phương pháp tính chỉ số giả tiêu dùng truyền thông lạt Ảnh

° NN

G Anh, Van phong Thang ké quic gia Khong sử đụng khái niệm chỉ sò giá tiêu dùng má khái niệm này dược gọi là chí sô giá bán lẻ (RPD, là thước do lạm phát lâu dời nhất ờ Anh Tổ chức chịu trách nhiệm công bố RPI là Văn phòng Thông kẽ quốc gia Thông thường chỉ số giá tiêu dùng ở Anh dược sử dụng để tinh chỉ số tiền lương, lương hưu, chỉ trả an sinh xã hội, lập chí số tiễn thuê nhà, các

khoán thanh toán hợp động và các khoản thanh toáa khác, tính toán sức mua của

các hộ gia đình, lập mô hình kinh tế vĩ mỗ và cho các mục dích phán lích khác

> <,

Phạm ví địa lý của quyền số chỉ tiêu vá thu thập giá ở Anh là như nhau, trải đều

trong toàn quốc Vệ báng phần loại, chỉ số giá tiêu dùng ở Anh sử dụng bảng phan

loại riêng là bảng phản loại theo RPI, Về nguồn của quyền số chỉ số giả tiểu dùng,

Ảnh cũng sử dụng kết quá điều tra chỉ tiên hệ gia đình dễ tính quyên số Quyền số và mẫu được cập nhật hàng năm Hầu hết các mặt háng được thu thập hàng thẳng: những mặt hàng mà người ta biết răng giá chỉ thỉnh thoảng thay dối được thu thập hàng quý Sự khác biệt về chất hrong dược xử lý qua một loạt các phương pháp điều chỉnh chất lượng được sử dụng bao gồm điều chỉnh chỉ phí tùy chọn, điều chỉnh một biến số và điều chinh chat hrong bang héi gay Hedonic (ILO, 2012)

2.1.43 Viée ap dung phuong phap tính chỉ số giá héu dine truyén thong tu Ue

Chi sé gid tiéu dimg Lc la mét thude do chung về lạm phát giá cá cho toán bộ khu vực hộ gia đình, Chí số giá tiêu dùng do lường sự thay dối trung bình theo thời gian của giả phải trả cho mội giỏ hàng hóa và dịch vụ cổ định Chỉ số giá tiêu dùng ở Úc dược công bộ định kỳ hảng quý Quyền số chỉ số giá tiêu dùng được tỉnh ở các thánh phê chỉnh, các khu vực đồ thị Đề phân tổ chỉ số giá tiêu dùng, Úc sử dựng bảng phân loại coilcop Nguễn đề tỉnh quyền số chỉ số giá tiểu dùng ở Ức là

từ điều tra chỉ tiêu hộ gia đình, tải khoán quốc gia, diều tra đân số và ngành, đữ liệu

của chính phủ, tổ chức tải chính và đữ liện hành chỉnh với tần suất cập nhi là trên 5 năm Giá của hầu hết hàng hóa và địch vụ được thủ thập một lần mỗi quý với số lượng quan sát khoảng 100.000 mặt háng Sự khác biệt vẻ chất lượng giữa sản

Trang 35

phẩm mới và sản phẩm thay thê được xử lý bởi các nhà phần tích và thu thập giá tại

trụ sở chính băng nhiều phương pháp, Hỏi quy Hedomec được sử dụng trong tường hợp máy lính cá nhân ULO, 2012)

3.1.4.4 Việc áp dụng phương pháp tính chỉ số giá tiêu dùng truyền thông tại Nhật

Ban Chỉ số giá tiêu đúng của Nhi Bắn được tỉnh toàn đề đo hưởng một cách toan

thiên sự biên son giá cả của hãng hóa vả địch vụ mã các hộ chị tiêu trên loàn quốc

theo chuối thời gian, Tổ chức chịu trách nhiệm tính toán và công bê chỉ số giá tiêu

đùng là Văn phòng Thông kê Nhật Bán Định kỳ thu thập và công bộ chỉ số giá tiêu dùng ở Nhi Bán lá hàng thẳng với thời kỳ tham chiều của chi sd: 2010 = 100 Chi

số giả tiêu dùng được công bỏ vào lúc § giờ 30 sáng thứ sáu của tuần và vào ngảy 6 hàng

ty nợ tháng Số liệu công bổ là chỉ số của tháng trước chờ cá nước, Về báng

phần loại, Nhật Hán sử dụng báng nhần loại coicop và tính toán quyền số dựa trên

kết quá điều tra chỉ tiều hệ giá đình, với tan suat cập nhật lá 2-Ã năm, Đề xử lý những khác nhau về chất lượng phương pháp chí phỉ tủy chọn được áp dụng cho 8

tô, điều chỉnh số lượng nêu có, và các chỉ số mô hình hồi quy Hedonic cho mấy

anh ky thuật số và máy tính cá nhân LÔ, 2012)

tiên cho địch vụ Tổ chức chịu trách nhiệm thu thập, tinh toán và công bộ chỉ số giá

tiêu đùng ở Nam Phi là Cục Thông kẽ Nam Phi Nam Phí công bỏ chỉ số giá tiếu

dùng định kỳ háng tháng và sử dụng phản loại coicop Nguồn sẽ liệu dé tính quyền số chỉ số giá tiêu dùng là dựa vào khảo sat chỉ tiêu hộ gia đình với tân suất cập nhật quyền số là 3-5 năm một lần, Ở Nam Phi, không xử lý điền chỉnh chất lượng khi có

sự khác biệt về chất luong CLO, 2012).

Trang 36

3.1.5 Phương nhán tính chỉ số giả tiên dùng truyện thông tại Việt Äum

Ở Việt Nam, đề có thè tỉnh và công bố được chỉ số giá tiêu dùng hàng thang, qui, năm như hiển nay, ngành thông kê thực hiện cuộc điều tra giả tiêu dimg (Tong cục Thông kế, 2015) với những nội dụng chính trong phương an điểu tra như sau:

Đơn vị điều tra là các sạp, quảy hàng tại các chợ, điểm bản hàng (chuyên

bán lẻ), cdc co sé kinh đoanh địch vụ có địa điểm kinh đoanh ôn định trong những

khu vực điều tra đã được chọn mẫu Về phạm vị điều tra, cuộc điều tra được tiễn

hành tại tất cả các tỉnh, thành phế trực thuộc Trung ương, Thời điểm diéu tra giá

tiêu đùng được chia ra làm 2 nhóm mặt hàng Nhỏm thử nhất chỉ điều tra một lần

trong tháng và sẽ điều tra vào ngày 10 hang thang; Nhém thứ hai sẽ diễu tra ba lần

trong tháng vào các ngày Ì, 10, 26 bảng tháng Tổng số mặt hàng lấy giá lá 654 mặt hàng, Số lượng cụ thể các mặt hàng theo từng kỳ và từng điểm điều tra như

sau: có 126 mặt hàng lay giá tại một đến ba nơi điều tra trong mỗi khu vực điều tra

rà lây 3 lầnkháng; có 30 mặt hàng lay g gia tại một điên ba nơi điều tra trong mỗi khu

vục điều tra và lây một lầm thang: cỗ 18 mặt hàng lấy giá tại một nơi điều tra trong môi khu vực điều ra vá lấy ba lầntháng: có 453 mặt hàng lây gHí tại một nơi điều

tra trong mỗi khu vực điều tra và lây một lãnthàng: có năm mặt hàng lây giá tại một nơi điều tra trong mỗi khu vực điều tra và lấy theo số lần phát sink trong thang

Về loại diễu tra, đầy là cuộc điều tra chọn mâu, được thực hiện theo các bước sau:

Xây dựng dân mẫu điều tra là đanh mục mặt hàng đại diện, dựa vào đanh mục điều tra giá tiêu dùng chung của cả nước, các tính, thành ph trực thuộc Trung

wong tiên hãnh rà soát và xác dinh danh muc diéu tra cu thể cho dia phương của

mình vá đanh mục này được dùng làm cơ sở để Thu thập giá Danh mục điều tra giá gửa địa nhương phải đấm bào hai tiêu chí sau một là phải có trong danh muc chung

của cả nước; hai lá phải đâm bảo hang hóa và dịch vụ phố biến tiêu dùng tại địa

phương, Mội yêu cầu bắt buộc để thu thập được giá lá phải mô tả chỉ tiết nhần mác,

chất lượng, quy cách, cụ thể các loại hàng hóa và dich va trong danh muc diéu tra

Ngoại trừ trong danh mục chuẩn, các hàng hóa và dịch vụ phải thông nhàt nhấn

Trang 37

mắc, chải lượng, quy cách trên phạm vị cả nước, các mật hàng và dịch vụ còn lại CÔ

thê được chọn theo đặc điểm tiểu đừng của từng lĩnh, thành phô do môi địa phương

có mức sống, đặc điểm vùng miễn và tập quần tiêu đừng khác nhau

Thu thấp giá kỳ gốc, sau khi tiên hánh rả soát vá xác định được danh mục

hàng hóa và địch vụ đại điện của tình, thành phô; các tình, thành phê sẽ tiên hành

lập bang gid ky gộc, tne

Quyền số tĩnh chỉ số giá tiểu dùng là cơ câu chị tiếu các nhóm hang hoa va

*

“ *

dich vụ trong tông chỉ tiêu của hộ gia đình Quyền số đề tính chỉ số giá tiều dang của Việt Nam là cơ câu chị tiếu của từng vùng so với tông chị liệu của cả quốc gia chia theo từng nhôm hàng, Cầu trúc của chỉ số giá tiểu dùng được Tông cục Thông kế xây dựng luôn đám bảo hai yêu câu, một là dam bao tinh liên tục của chuối chỉ

số gia tiéu dùng qua thời gian, hai là phải phủ hợp với cơ câu Hiệu dang cha hộ gia

bình quàn nhân đề tính chí số giá tiêu dùng thời kỳ 2014-2019

Từ phương án triển khai điều tra của Tổng cục Thông kè vá thực tiễn thủ thập thong tm giá tại địa phương, dựa vào nghiên cứu của Rerry và cộng sự (2019) đưa ra các tiêu chí để đánh giá tính hợp lý của chỉ số giá tiêu dùng, có thể thấy

phương pháp tình chỉ số giá tiêu đủng của Việt Nam phủ hợp với thông lệ quốc tế

Ne - ha x ~ % + & a a ‹ me ~ R &

năm 2005, Tháng TÔ năm 2069, Tổng cục Thông kê tiến hành cập nhật quyền số,

Trang 38

tne ws

lây năm 2009 lâm năm góc so sánh Quyên số dùng để tính chí số giá tiêu dùng cho

thời kỳ 2008-2014 được xảy dựng từ kết quả của khảo sát mức sống hộ gia dình vá

điều tra quyền số chỉ số giá tiêu đẳng năm 2008 Đề tính quyền số phục vụ tinh chi

SỐ giá tiêu dùng thời kỳ 3015-2020, Tông cục Thống kế đã thực hiện thu thập thông tia tính quyền số chỉ số giá tiêu dùng từ cuộc ““kháo sát mức sống đấn cụ và điều tra quyền số chỉ số giá tiêu dùng năm 2014”, Quyên số được thu thập về tính toán cho cả khu vực thánh thị vá nồng thôn phủ hợp với phạm vì địa lý thu thập thông tia

giả

Và tỉnh kịp thới của việc công bỏ số liệu, chỉ số giá tiêu đúng của Việt Nam

được công bố vào ngày 29 hàng tháng, Chí số giá tiêu đồng được công bố bao gồm chỉ số giá tiêu dùng của cả nước, Š vùng kinh té va cdc tính, thành phô trực thuộc Trung ương Về chỉ tiết, chí số giả tiêu dùng công bố bao gồm chi sé gid chung, chỉ số giá 11 nhóm hàng cấp một và chia theo khu vực thành thị, nông thôn

Về việc sử dụng các phần loại quốc tê, hiện nay Việt Nam dang sử dụng bang phần loại coicop cho wide thu thập, tính toán và công bộ chỉ số giả tiều dùng,

Bảng phần loại này phù hợp theo khuyên cáo của các tổ chức quốc tế,

+

2.3, Cơ sử lý thuyết về đữ liệu lớn 2.3.L Định nghĩa về đề liệu lÚn

Có rất nhiều định nghĩa khác nhau về đữ liệu lớn, Kabd và công sự (2013)

cho răng đữ liệu lớn là mội tập hợp đữ liệu đa đạng đòi hỏi công nghệ và kỹ thuật

mới để có thể nắm bắt, trich xuất gii trị xử lý và phản tích Đesouza vá Suuth

(2014) định nghĩa dit héu lớn là các tập để liệu mở rộng hơn các kho dữ Hiệu dơn

lẻ, quả lớn và phức tạp để dược xử lý bằng các công cụ xứ lý vả quân lý cơ sở đữ

liệu truyền thống, bao gồm théng tị như giao địch, mạng xã hội, các thông lin trong doanh nghiệp, cám biến và thiết bị di động, Daas và cộng sự (2023) thì cho

ring dữ liệu lớn thường là các tập đỡ liệu (cực kỹ lớn) có thể chứa cà dữ liệu có cầu

trúc vá phi câu trúc, Khi dược phần tích băng máy tính, có thể khám phả các mô

Trang 39

hình, xu hướng, môi liên hệ liên quan đên hành vị và tương tac của các đơn vị được

bao gồm

Vào năm 2061, nhà phân tich Doug Laney (céng ty nghién cia Gartner, tai thời điểm nay 2001 la hang Meta} di phat biểu răng việc đữ liệu ngày càng gia tăng

với tốc độ nhanh đã tạo ra những cơ hội, thách thức mới cho những nhá phân Hch

dữ liệu, né có thể được điển tả sự gia Bững ở ba khía cạnh là dung lượng thông im,

vận tốc vá ching loat (Laney, 2001) BHén nim 2614, Gartner b4 sung thém bai đặc trưng của đữ liệu lớn đề hoàn chính hơn khải mềm về đữ liệu và được sử ở ng phô biên khi định nghia về đữ diệu lớn, cụ thê là khôi lượng đữ liệu (Volume); tốc độ

au ly (Velocity); da dang (Variety); dé tin cây, độ chính xác (VecracHy); giá fỊ thông từi (Vah) Dữ liệu lớn với những đặc trưng được thể hiện bởi năm chữ “V” ớ trên đã mở ra một hướng mới giúp cho dữ liệu kịp thới, thưởng xuyên, chí tiết và hiệu quả hơn Điều này cho phép các nhá hoạch định chính sách có được đánh giả,

đự bảo về các hiện tượng kmh tế quan trọng, chẳng hạn như tăng trưởng GP, ty lệ

thất nghiệp, tông mức ban lẻ, lạm phát) qua d6 sẽ góp phần cùng cấp thông tin tốt hơn về chỉnh sách tải khóa vá tiền tệ, đồng thời cũng cung cấp những cành báo sớm về những vấn đề có khả năng phát simh trong nên kinh tế (Armiaah, 2013; Askitas

and Znmnmemman, 2009: Banbura et nÌ, 2Ú1Ô; Chơi and Vananm, 320093 and 2009b; Galbraith and Tkacs, 2013; Khan, 2012; McLaren and Shanbhoeue, 2011; Wu and

Brynioflsson, 2099) Dữ liệu lớn cũng giúp giải quyết hạn chế lả số liệu thông kê

chính thửc được sứ dụng cho nhiều quyết định chính sách chỉ có sẵn với độ trễ thời

gian đồng kế, thiểu tính chỉ tiết và phân tách can thiét (Manik and Albarda,

2015) Từ khi các quốc gia Hến hãnh nghiên cứu sử dụng dữ liệu lớn trong việc dự

bảo số liệu thông kê chính thức, các cơ quan thống kế quốc gia và quốc tế có rất nhiều tranh luận xoay quanh các nội dung như vai trỏ của đữ liệu lớn trong công

tác thông kế chính thức; khí sử đụng dữ liệu lớn vào công tác thống kẻ chỉnh thức, thi các nhà sản xuất đã liệu lớn ở khu vực ngoài nhà nước sẽ xuất hiện, như vậy vai trô của họ đối với số liệu thông kẻ chính thức như thể náo? (Karlbeg and Skaliotis, 2013: Pierson, 2013; United Nations Global Pulse, 2012, 6/2013, 10/2013; UNSC,

Trang 40

t4 on

2014), Dữ liệu lớn mang lại những thách thức và thay đối lớn cho số liệu thông kế

chính thức (anun and linineg, 2014) Mariyah (2014) đã xác định những thách

thức về đữ liệu lớn đến từ các bước của phương pháp thông kẻ Những thách thức

về dữ liệu lớn cũng dến tử luật pháp, báo mật, quyền riêng từ, lưu trữ, xử lý vá truy

vận đữ hiệu, yêu cầu kỹ năng vá tài chỉnh (MlanIk and Albarda, 2015) Bên cạnh đỏ,

nhôm ủng hệ đữ liệu lớn cũng dưa ra nhiều lợi ích của việc thu thập thông tin từ đữ liệu lớn như chí phí thấp, gián áp lực cung cấp thông tín, dữ liệu kịp thời vá chí tiết, đồng thời nhóm ủng hộ cũng dưa ra nhiều giải pháp để giải quyết các rùi ro mà nhỏm phản đối nêu ra theo hướng sử dụng đỡ liệu quán trị

Mặc dù cũng còn nhiều thách thức nhưng đữ hiệu lớn vẫn được ứng dụng

rộng rãi trong hầu hết các ngành, các lĩnh vực trên thế giới Các tổ chức trong bất

kỳ ngành nào có dữ liệu lớn đều có thể hướng lợi tử việc phân tích cần thận đữ liệu lớn để có dược những hiểu biết theo chiều sâu để giải quyết các vẫn đề thực tế

(Entel ỨF Center, 2012), Manviks và cộng sự (3011) đã xác dinh tiềm nang cua dir

liệu lờn nằm trong năm chủ để chỉnh) tội là ý tế (hệ thống hỗ trợ quyết định lâm sáng, nhân tích cá nhần áp dựng đối với hề sơ bệnh nhân, phân tích mô hình bệnh tật, cải thiện súc khỏe cộng đồng); hai lá lĩnh vực công (tạo ra sự mình bạch bằng dữ liệu lên quan có thể truy cập, khám phá nhụ cầu, cái thiện hiệu suất, túy chỉnh

hành động cho các sản phẩm và địch vụ phủ hợp, ra quyết định với các hệ thông tự

động để giảm rủi ro, đổi mới sản phẩm và dịch vụ mới; ba lá bán lệ (phân tích

hành vị khách hàng, đa dạng và tôi ưu hóa giả cá, thiết kế vị trí sắn phẩm, cải thiện

hiệu suất, tôi ưu hóa đầu vào lao động, thị trưởng): bốn là sản xuất (cải thiện du bao nim câu, lập kế hoạch chuối cung ứng, hề trợ bán hàng, phát triển hoại động

sản xuất, Ứng đụng đựa vào việc tìn kiểm trên web}; và năm là đữ liệu vị trí cá nhân (định tuyên thông mìmh, các mô bình kinh doanh mới)

53.2 Các ứng dựng đữ liệu lon

Tử phản ảmh nghfa và những đặc điển của dữ Hiệu lớn được trúnh bày ở trên, có thê thây rễ dữ liệu lớn là một chủ dé rat da dang va rộng rãi để nghiên cửu

Ngày đăng: 10/09/2024, 20:04

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w