GIỚI THIỆU ĐỀ TÀI
Mục đích
Phân tích dữ liệu đang trở thành xu hướng quan trọng trong thời đại mới, không chỉ giúp hiểu bản chất dữ liệu mà còn hỗ trợ quyết định Kỹ năng này hiện được tích hợp vào chương trình giảng dạy tại nhiều trường đại học, đặc biệt trong các lĩnh vực khác nhau Môn Kỹ thuật dự báo trang bị cho sinh viên kiến thức cơ bản về thống kê và dự báo, từ đó giúp họ phát triển kỹ năng phân tích dữ liệu cần thiết.
Báo cáo này nhằm mục đích phân tích dữ liệu chỉ số vận tải container qua hai phương thức đường sắt và đường thuỷ tại các nước như Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ, Hungary, Lithuania và Romania trong khoảng thời gian từ 1970 đến 2019 Qua việc phân tích dữ liệu, nhóm đã áp dụng kiến thức từ môn Kỹ thuật dự báo để nghiên cứu một vấn đề thực tiễn, đồng thời tìm hiểu đặc tính vận tải hàng hoá bằng container của các quốc gia này, từ đó nâng cao kiến thức trong lĩnh vực Logistics quốc tế.
Nhiệm vụ
Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:
− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải container) của 5 nước có giao thương nhiều nhất với Việt Nam.
Kỹ thuật EDA (Phân tích dữ liệu khám phá) được áp dụng để phân tích và xác định các đặc trưng cơ bản của dữ liệu Quá trình này bao gồm việc xem xét các thống kê mô tả như trung bình, trung vị, phương sai và độ lệch chuẩn, cùng với việc tính toán các tứ phân vị và khoảng tin cậy cho trung bình và độ lệch chuẩn Bên cạnh đó, việc đánh giá mức biến động và sự tương quan cũng giúp rút ra được những đặc tính quan trọng của dữ liệu.
− Từ đặc tính của dữ liệu, đưa ra mô hình dự báo phù hợp cho chỉ số vận tải container của các nước.
Bố cục
Bố cục bài báo cáo gồm 5 chương, cụ thể:
− Chương 1: Giới thiệu đề tài
− Chương 2: Cơ sở lý thuyết và Phương pháp luận
− Chương 3: Giới thiệu vấn đề
− Chương 4: Thống kê mô tả
− Chương 5: Trả lời câu hỏi
Phạm vi báo cáo
− Chỉ tiến hành dự báo đối với dữ liệu có data pattern là stationary, trend và seasonal.
− Các phương pháp dự báo sử dụng bao gồm: Nạve, Simple averages, Moving averages, Exponential smoothing, Growth curves, Linear exponential smoothing, Quadratic exponential smoothing, Holt’s method. vi
CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN
Cơ sở lý thuyết
Phân tích dữ liệu khám phá (EDA) là phương pháp phân tích dữ liệu chủ yếu dựa vào kỹ thuật biểu đồ và hình vẽ EDA bao gồm việc xem xét và nghiên cứu các dữ liệu cùng với các biểu đồ khác nhau, đồng thời áp dụng các phương pháp thống kê mô tả nhằm tìm ra kết quả cần thiết cho các câu hỏi nghiên cứu Phương pháp này cũng cung cấp cơ sở vững chắc để lựa chọn mô hình trong các bước phân tích tiếp theo.
Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm một vài kỹ thuật sau:
− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots,
− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots, box plots,
− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của con người.
Bảng 2.1 Lựa chọn phương pháp dự báo
Time horizon Type of Model Data
Pattern of the data: ST, stationary; T, trending; S, seasonal.
Time horizon: S, short term; I, intermediate term; L, long term.
Type of model: TS, time series.
Phương pháp luận
Hình 2.1 Phương pháp luận thực hiện báo cáo
GIỚI THIỆU VẤN ĐỀ
Vấn đề
Trong phân tích dự báo, việc nắm bắt thông tin chi tiết về lĩnh vực dự báo là vô cùng quan trọng Thông tin này bao gồm số liệu quá khứ, diễn biến hiện tại và xu hướng phát triển của lĩnh vực Đồng thời, cần đánh giá đầy đủ các yếu tố ảnh hưởng, cả định lượng lẫn định tính, để có cái nhìn toàn diện và chính xác nhất.
Bài báo cáo này phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu thông qua kỹ thuật Khám Phá Dữ Liệu (EDA) và phương pháp chuỗi thời gian EDA giúp xác định các mối quan hệ, xu hướng và quan sát có ảnh hưởng, từ đó tóm tắt và mô tả dữ liệu một cách trực quan, hỗ trợ nhà phân tích khai thác dữ liệu hiệu quả Phương pháp chuỗi thời gian tập trung vào việc phân tích chuỗi quan sát của một biến theo biến số độc lập là thời gian Dữ liệu được sử dụng là chỉ số vận tải hàng hóa bằng container từ 5 quốc gia mà Việt Nam xuất khẩu nhiều nhất, bao gồm hai loại hình vận tải là đường sắt và đường thủy, với đơn vị đo lường là TEU (Đơn vị tương đương 20 feet) Dữ liệu được thu thập từ Bộ cơ sở dữ liệu OECD, có thể truy cập tại: https://www.oecd-ilibrary.org/transport.
Công cụ
− Kỹ thuật EDA bao gồm:
▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị.
▪ Các thông số đo lường sự phân tán: Khoảng biến thiên, Tứ phân vị, IQR, Phương sai, Độ lệch chuẩn.
▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan.
▪ Hệ số biến thiên (CV), Khoảng tứ phân vị, Biểu đồ Box Plot, Hệ số tương quan Pearson.
Thu thập dữ liệu
3.3.1 Cách thức thu thập dữ liệu
Dữ liệu xuất khẩu container được thu thập từ OECD iLibrary, bao gồm 5 quốc gia đường sắt: Hà Lan, Hungary, Romania, Đức và Lithuania, cùng với 5 quốc gia đường biển: Hà Lan, Đức, Ý, Tây Ban Nha và Bỉ.
Sau khi thu thập dữ liệu về chỉ số vận tải container của các quốc gia, một số nước thiếu dữ liệu trong một số năm Để khắc phục tình trạng này, nhóm nghiên cứu đã áp dụng phương pháp trung bình dịch chuyển (MA) nhằm làm đầy các khoảng trống trong dữ liệu thô.
Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003.
Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan
Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu cho giai đoạn 1995 – 2003 cho Hà Lan.
Hình 3.2 Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5
Dựa vào các loại sai số như MAD, MSE, và MAPE khi dự báo dữ liệu với 3, 4 và 5 thời đoạn, chúng ta nhận thấy rằng khi số thời đoạn dự báo tăng lên, các giá trị sai số cũng gia tăng Do đó, phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn (k = 3) được lựa chọn để dự báo dữ liệu cho các năm còn thiếu.
Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A.
KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ
Thống kê mô tả
4.1.1 Các thông số của thống kê mô tả
Sử dụng công cụ Thống kê mô tả trong phần mềm Minitab (Stat → Basic Statistics → Display Descriptive Statistics ) để tính toán các thông số thống kê mô tả, kết quả thu được như hình 4.1 bên dưới.
Hình 4.1 Các thông số của thống kê mô tả
Nhóm đã sử dụng công cụ Graphical Summary (Stat → Basic Statistics → Graphical Summary) để khai thác biểu đồ Histogram và Boxplot của dữ liệu, nhằm tính toán các thông số cơ bản của thống kê mô tả Các biểu đồ Histogram và Box Plot cho từng nước được vẽ, trong đó Hình 4.2 minh họa dữ liệu của Hà Lan, và kết quả cho tất cả các nước được trình bày trong phần phụ lục B.
Anderson-Darling Normality Test A-Squared
P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean
Netherlands 4.1.2 Nhận xét các thông số của thống kê mô tả
Chỉ số xuất khẩu container qua đường sắt của Đức dao động từ 365.243 TEU đến 7.138.556 TEU, với khoảng IQR nằm trong khoảng 1.013.776 đến 5.209.543 TEU Trung vị của dữ liệu là 2.206.628 TEU, thấp hơn giá trị trung bình 2.857.355 TEU, cho thấy sự chênh lệch trong chỉ số vận tải.
5 container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung bình 2 857 355 TEU.
Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ
Dữ liệu về vận tải container qua đường sắt của Hungary cho thấy khối lượng container dao động từ 8687 TEU đến 736 798 TEU, với khoảng IQR từ 132 127 đến 441 856 TEU Trung vị của dữ liệu là 2 204 713 TEU, thấp hơn giá trị trung bình 266 232 TEU, cho thấy xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình này.
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88
Số liệu về vận tải container qua đường sắt của Hà Lan cho thấy tổng lượng hàng hóa dao động từ 000 TEU đến 1.686.000 TEU, với khoảng IQR nằm trong khoảng từ 200.044 đến 930.458 TEU Trung vị của dữ liệu là 216.784 TEU, thấp hơn giá trị trung bình 517.214 TEU, cho thấy xu hướng lệch phải của chỉ số này, nghĩa là phần lớn dữ liệu có giá trị thấp hơn mức trung bình.
Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10
Số liệu vận tải container qua đường sắt của Lithuania dao động từ 554 TEU đến 305.686 TEU, với khoảng IQR từ 38.670 đến 187.983 TEU Trung vị của dữ liệu là 103.125 TEU, nhỏ hơn giá trị trung bình 123.127 TEU, cho thấy sự phân bố lệch phải, tức là phần lớn dữ liệu có giá trị thấp hơn mức trung bình.
Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54
Số liệu vận tải container qua đường sắt của Romania dao động từ 995 TEU đến 2.468.750 TEU, với khoảng IQR từ 108.364 đến 1.436.772 TEU Trung vị của dữ liệu là 220.074 TEU, thấp hơn giá trị trung bình 750.837 TEU, cho thấy xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.
❖ Đối với các nhóm nước xuất khẩu container bằng đường biển :
Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000
Chỉ số vận tải container qua đường sắt của Hà Lan đạt tối đa 1.686.000 TEU, với khoảng IQR từ 200.044 đến 930.458 TEU Trung vị của dữ liệu là 216.784 TEU, thấp hơn giá trị trung bình 517.214 TEU, cho thấy sự phân bố dữ liệu lệch phải Trong khi đó, chỉ số xuất khẩu container qua đường biển của Đức ghi nhận giá trị từ 279.376 TEU.
Trong lĩnh vực vận tải container qua đường biển, chỉ số TEU đã đạt tới 15 905 000 TEU, với khoảng IQR phân bố từ 1 771 453 TEU đến 13 272 393 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container của Đức có xu hướng lệch phải, với phần lớn dữ liệu nằm dưới giá trị trung bình là 6 803 993 TEU Đồng thời, chỉ số xuất khẩu container qua đường biển của Ý dao động từ 49 937 TEU.
Số liệu vận tải container qua đường biển của Ý đạt 12.758.529 TEU, với khoảng IQR phân bố từ 792.015 TEU đến 7.943.429 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy chỉ số Transportation có xu hướng lệch phải, nghĩa là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình là 4.557 TEU.
Chỉ số xuất khẩu container qua đường biển của Tây Ban Nha dao động từ 137,483 TEU đến 17,435,718 TEU, với khoảng IQR phân bố từ 1,335,867 TEU đến 17,435 TEU.
718 Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải
6 container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 6 374 367 TEU.
Chỉ số xuất khẩu container qua đường biển của Bỉ dao động từ 316,354 TEU đến 11,527,000 TEU, với khoảng IQR phân bố từ 1,033,084 TEU đến 8,658,750 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy rằng chỉ số Transportation cho vận tải container qua đường biển của Bỉ có xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.
Xác định độ lệch của chuỗi dữ liệu: dựa vào dữ liệu thu được ở trên cùng biểu đồ
Biểu đồ histogram (phụ lục B) cho thấy rằng, đối với cả 10 dữ liệu, độ lệch đều dương và giá trị trung bình lớn hơn giá trị trung vị Điều này chỉ ra rằng phân bố dữ liệu của cả năm nước đều có xu hướng lệch về phía bên phải.
Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat
Biểu đồ chuỗi thời gian (Time Series Plot) được sử dụng để xác định hình dạng có thể có của chuỗi dữ liệu Ví dụ, đối với dữ liệu xuất khẩu container của Bỉ, biểu đồ này giúp phân tích và hiểu rõ hơn về xu hướng và biến động trong xuất khẩu.
Time Series Plot of Belgium
Hình 4.3 Biểu đồ chuỗi thời gian
Nhìn vào biểu đồ chuỗi thời gian, có thể nhận thấy rằng dữ liệu có khả năng xuất hiện xu hướng Để phân tích sâu hơn, cần sử dụng công cụ Autocorrelation trong Minitab (Stat → Time Series →).
AutoCorrelation) để vẽ biểu đồ ACF mới xác định được chính xác Ví dụ ACF của nước Bỉ trong hình 4.4.
Autocorrelation Function for Belgium (with 5% significance limits for the autocorrelations)
Hình 4.4 ACF của dữ liệu nước Bỉ
Hệ số biến thiên
Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive Statistics ) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình 4.7.
Kết quả phân tích chỉ số CV của dữ liệu vận tải container qua đường biển cho thấy tất cả các nước đều có chỉ số CV nhỏ hơn 1, cho thấy mức biến động thấp Hà Lan có chỉ số TEU ổn định nhất (73.12%), trong khi Tây Ban Nha có mức biến động cao nhất (90.76%) Đối với vận tải đường sắt, Đức, Hungary và Lithuania cũng có chỉ số CV dưới 1, cho thấy sự ổn định Lithuania có mức biến động thấp nhất (72.51%), trong khi Romania có chỉ số TEU biến động mạnh nhất (106.28%), cho thấy sự không ổn định trong dữ liệu vận tải container của nước này.
Phân tích khoảng tin cậy
Khoảng tin cậy là dải giá trị có khả năng bao gồm tham số tổng thể chưa xác định, với mức độ tin cậy thể hiện xác suất mà khoảng tin cậy sẽ chứa tham số thực tế khi thực hiện nhiều lần lấy mẫu ngẫu nhiên Điều này cũng áp dụng cho khoảng tin cậy về giá trị trung bình và độ lệch chuẩn trong dữ liệu vận tải container của các quốc gia.
Ví dụ với dữ liệu chỉ số xuất khẩu container theo đường sắt của Hà Lan:
Sử dụng Minitab để tính toán khoảng tin cậy (trích từ mục thống kê mô tả), ta được kết quả như sau.
Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab
Khoảng tin cậy 95% cho giá trị trung bình của chỉ số vận tải container qua đường sắt ở Hà Lan được xác định là (370 251; 664 177) TEU Điều này có nghĩa là khi lấy ngẫu nhiên dữ liệu vận tải trong các năm, 95% giá trị trung bình của chỉ số vận tải sẽ nằm trong khoảng này.
Khoảng tin cậy 95% cho giá trị độ lệch chuẩn của chỉ số vận tải container qua đường sắt tại Hà Lan là (426,674 ; 639,202) TEU Điều này có nghĩa là khi lấy ngẫu nhiên dữ liệu vận tải từ các năm, 95% giá trị độ lệch chuẩn của chỉ số này sẽ nằm trong khoảng tin cậy đã xác định.
Phân tích hệ số tương quan
Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt
Nước Đức Hungary Lithuania Hà Lan Romania Đức 1 0.903 -0.430 0.939 -0.639
Ba nước Đức, Hungary và Hà Lan có sự tương đồng trong tăng trưởng chỉ số vận tải container theo đường sắt, với hệ số tương quan cao (thấp nhất là 0.882) nhờ vào xu hướng tăng trưởng theo hàm bậc 2.
Lithuania và Romania có đặc điểm dữ liệu tăng trưởng ổn định từ năm 1970, nhưng đã trải qua sự sụt giảm đột ngột vào các năm 1987 và 1988 Hệ số tương quan giữa hai nước này đạt giá trị cao, gần 0.912.
Hệ số tương quan giữa Lithuania và Romania với Đức, Hà Lan và Hungary cho thấy sự khác biệt trong xu hướng tăng trưởng chỉ số vận tải Hai nhóm nước này có ít sự tương quan trong vận tải container bằng đường sắt Giá trị âm của hệ số cho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều, chỉ số vận tải của Lithuania và Romania lại không theo cùng xu hướng.
Sau giai đoạn giảm đột ngột vào năm 1987 và 1988, 10 của 2 nước còn lại đã tiếp tục tăng trưởng, nhưng giá trị tăng trưởng này thấp hơn rất nhiều so với mức trước khi giảm.
Bảng 4.3 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển
Nước Hà Lan Đức Ý Tây Ban Nha Bỉ
Hệ số tương quan giữa các nước đường biển trong bảng 4.3 cho thấy mối liên hệ rất cao, với giá trị thấp nhất đạt 0.967 Chỉ số Transportation cho vận tải container bằng đường biển của 5 nước này có sự liên kết chặt chẽ, phản ánh đặc tính xu hướng dữ liệu vận tải.
5 nước này, (tăng dần theo thời gian, từ 1970 đến 2019, theo hàm xu hướng bậc 2), đã được trình bày ở phần trên.
4.4.2 Kiểm định hệ số tương quan
Các giá trị p-value được xác định từ phần mềm Minitab với độ tin cậy 95% cho thấy rằng trong nhóm các nước đường sắt, Hà Lan, Đức và Hungary, cũng như giữa Lithuania và Romania, p-value tiến gần về 0, chứng tỏ các hệ số tương quan có ý nghĩa thống kê Đối với các hệ số tương quan giữa các nước thuộc hai nhóm khác nhau như Hungary và Romania, Hà Lan và Lithuania, p-value lần lượt là 0.002 và 0.008, vẫn nhỏ hơn 0.05, cho thấy các hệ số này cũng có giá trị thống kê.
Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077
> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại. Đối với nhóm các nước đường biển:
Giá trị p-value kiểm định của các hệ số tương quan trong bảng 4.3 được xuất ra từ phần mềm Minitab đều tiến gần đến 0, cho thấy các hệ số này có ý nghĩa thống kê.
TRẢ LỜI CÂU HỎI
Câu 2A
Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông qua phân tích EDA ở câu 1?
− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm.
Chỉ số vận tải container qua đường sắt và đường biển giữa các quốc gia có sự phân bố không đồng đều, chủ yếu lệch về phía giá trị thấp hơn trung bình Tuy nhiên, sự chênh lệch này không quá lớn so với giá trị trung bình.
Trong số các nước xuất khẩu container bằng đường sắt, Đức dẫn đầu với giá trị xuất khẩu trung bình cao nhất đạt 2,875,355 TEU, trong khi Lithuania có giá trị xuất khẩu trung bình thấp nhất chỉ đạt 123,127 TEU.
Trong số các nước xuất khẩu container bằng đường biển, Đức dẫn đầu với giá trị xuất khẩu trung bình đạt 6,803,993 TEU, trong khi Bỉ có giá trị xuất khẩu trung bình thấp nhất, chỉ đạt 4,533,168 TEU.
− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều hơn đáng kể so với đường sắt.
Câu 2B
Chuỗi dữ liệu sử dụng của các đối tượng nghiên cứu có tuân theo phân bố Normal không? Tại sao?
Dựa vào giá trị p – value của kiểm định Anderson – Darling Normality Test được thực hiện trên Minitab 18 ta thu được kết quả dưới bảng sau.
Bảng 5.1 Kết quả kiểm định phân bố Normal
Dữ liệu Giá trị kiểm định Nhận xét
Netherlands p < 0.05 Không tuân theo phân bố Normal Germany p < 0.05 Không tuân theo phân bố Normal Đường biển Italy p < 0.05 Không tuân theo phân bố Normal
Tại các quốc gia như Tây Ban Nha, Bỉ, Đức, Hungary và Litva, kết quả thống kê cho thấy giá trị p đều nhỏ hơn 0.05, cho thấy rằng dữ liệu không tuân theo phân bố chuẩn.
Netherlands p < 0.05 Không tuân theo phân bố NormalRomania p < 0.05 Không tuân theo phân bố Normal
Câu 3C
Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy không?
− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được.
Dữ liệu trong mẫu cần phải ngẫu nhiên, nhưng do một số quốc gia có dữ liệu không đầy đủ, nên cần áp dụng phương pháp dự báo để tính toán chính xác hơn.
Dữ liệu mất đi tính ngẫu nhiên và độc lập.
Câu 3D
Chủ đề mà nhóm quan tâm là liệu giá trị vận chuyển hàng hóa của Đức có tương đương với giá trị vận chuyển hàng hóa của Hà Lan hay không Việc so sánh này giúp xác định sự tương đồng trong các lĩnh vực kinh tế và logistics giữa hai quốc gia.
Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean).
To perform the analysis in Minitab 18, navigate to Stat → Paired t for the mean Here, the average value for Germany is represented as 1, while the average for the Netherlands is denoted as 2, with the difference calculated as 1 − 2 The results obtained are as follows:
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt
Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn hơn Hà Lan.
Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các năm
Câu 3E
Có sự khác nhau giữa các bộ dữ liệu được phân tích từ các nước hay không? (One-way ANOVA và Tukey test, Interval Plots và Boxplot of Data )
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển
Interval Plot of Netherlands, Germany,
Netherlands Germany Italy Spain Belgium
The pooled standard deviation is used to calculate the intervals
Netherlands Germany Italy Spain Belgium
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển
Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium. Đường sắt
Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt
Interval Plot of Germany (Rai, Hungary,
Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
The pooled standard deviation is used to calculate the intervals
Boxplot of Germany (Rai, Hungary,
10000 00 0 Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania
Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt
Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước Tiến hành kiểm định sâu ANOVA (Turkey Test).
Hình 5.8 Kết quả kiểm định Turkey
Kết quả kiểm định Turkey cho thấy rằng các cặp nước Hungary – Đức, Lithuania – Đức, Hà Lan – Đức, Romania – Đức và Romania – Lithuania có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container với p-value < 0.05 Ngược lại, các cặp nước còn lại không có sự khác biệt khi p-value > 0.05.
Câu 3F 15 TÀI LIỆU THAM KHẢO
Dựa vào dữ liệu thu thập từ các đối tượng nghiên cứu đã chọn, có thể tiến hành dự báo cho năm tiếp theo Nếu khả thi, cần thực hiện các phép tính để xác định giá trị dự báo Ngược lại, nếu không thể dự báo, cần đưa ra lập luận rõ ràng để giải thích lý do.
Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng sau Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian
Dữ liệu Data Time Type of Phương pháp dự báo đề pattern horizon model xuất
Hà Lan Trend Short time TS − Linear exponential Đức Trend Short time TS
− smoothing Đường Ý Trend Short time TS Quadratic exponential smoothing
Tây Ban Nha Trend Short time TS biển − Exponential trend
Bỉ Trend Short time TS
− models Holt’s method Đường Đức Trend Short time TS sắt Hungary Trend Short time TS
Hà Lan Trend Short time TS smoothing
Short time TS Không tiến hành dự báo stationary với dữ liệu non stationary
Short time TS Không tiến hành dự báo stationary với dữ liệu non stationary
Bảng 5.3 So sánh sai số của các phương án lựa chọn
Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo → dụng phương pháp Holt’s method Sử
Sau khi phân tích và đánh giá các quốc gia còn lại, chúng tôi đã thu được kết quả dự báo như thể hiện trong bảng 5.4 Dữ liệu dự báo cho các quốc gia được thực hiện bằng phần mềm Minitab và được trình bày chi tiết trong phụ lục C.
Bảng 5.4 Kết quả dự báo
Dữ liệu Phương pháp dự báo Giá trị dự báo
Hà Lan Holt’s method 16,067,404 Đức Holt’s method 15,229,009 Đường biển Ý Holt’s method 11,511,375
Tây Ban Nha Holt’s method 17,584,252
Bỉ Exponential trend models 19,002,833 Đức Holt’s Method 7,323,485 Đường sắt Hungary Holt’s Method 389,454
Phương pháp Holt của Hà Lan đã được đánh giá với 1.754.952 lượt đánh giá, nhằm kiểm tra sự phù hợp của phương pháp dự báo thông qua việc phân tích hệ số tương quan residual để xác định tính ngẫu nhiên.
Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau.
Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:
(with 5% significance limits for the autocorrelations)
Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức
Do LBQ < 2 0.05 (5) = 11.07 nên residual là ngẫu nhiên → Dự báo bằng phương pháp Holt’s method là phù hợp đối với dữ liệu này.
Trường hợp khác, đối với nước Bỉ của vận tải đường biển, ta có kết quả sau:
(with 5% significance limits for the autocorrelations)
Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức
Do LBQ > 2 0.05 (5) = 11.07 nên residual là tương quan → Dự báo bằng phương pháp Exponential trend models chưa phù hợp trong trường hợp này mặc dù giá trị sai số tốt →
Chuyển sang phương pháp Holt’s method để dự báo, cho ra kết quả phù hợp.
Kết luận: Phương pháp Holt’s Method là công cụ phù hợp để dự báo vận tải biển cho các quốc gia như Hà Lan, Đức, Ý và Tây Ban Nha, đồng thời cũng hiệu quả cho việc dự báo vận tải sắt tại Đức và Hà Lan.
[1] John E Hanke, Dean W Wichern, 2008 Business Forecasting, 9 th edition Published by Pearson Education Limited 2014.
[2] Nguyễn Vạng Phúc Nguyên, 2020 Bài giảng môn Kỹ thuật dự báo Thành phố Hồ Chí Minh, NXB Đại học Quốc gia Thành phố Hồ Chí Minh.
PHỤ LỤC A DỮ LIỆU THU THẬP
Bảng A1 Dữ liệu xuất khẩu container bằng đường sắt của các nước
Năm Hà Lan Đức Hungary Lithuania Romania
Bảng A2 Dữ liệu xuất khẩu container bằng đường biển của các nước
Năm Hà Lan Đức Ý Tây Ban Nha Bỉ
PHỤ LỤC B KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB
P-Value