1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT

52 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề GOODS TRANSPORT: CONTAINER TRANSPORT
Tác giả Nguyễn Anh Nhật Minh, Nguyễn Thành Minh, Nguyễn Hoàng Yến Nhi, Ngô Trần Thu Thảo, Ngô Minh Vũ
Người hướng dẫn TS. Nguyễn Vạng Phúc Nguyên
Trường học ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
Chuyên ngành KỸ THUẬT DỰ BÁO
Thể loại BÁO CÁO BÀI TẬP LỚN
Năm xuất bản 2020
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 52
Dung lượng 3,6 MB

Cấu trúc

  • CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI (7)
    • 1.1. Mục đích (7)
    • 1.2. Nhiệm vụ (7)
    • 1.3. Bố cục (7)
    • 1.4. Phạm vi báo cáo (7)
  • CHƯƠNG 2. CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN (8)
    • 2.1. Cơ sở lý thuyết (8)
      • 2.1.1. Kỹ thuật EDA (8)
      • 2.1.2. Phương pháp dự báo (8)
    • 2.2. Phương pháp luận (10)
  • CHƯƠNG 3. GIỚI THIỆU VẤN ĐỀ (11)
    • 3.1. Vấn đề (11)
    • 3.2. Công cụ (11)
    • 3.3. Thu thập dữ liệu (11)
      • 3.3.1. Cách thức thu thập dữ liệu (11)
      • 3.3.2. Điều chỉnh dữ liệu (11)
  • CHƯƠNG 4. KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ (13)
    • 4.1. Thống kê mô tả (13)
      • 4.1.1. Các thông số của thống kê mô tả (13)
      • 4.1.2. Nhận xét các thông số của thống kê mô tả (0)
      • 4.1.3. Dạng dữ liệu (15)
    • 4.2. Hệ số biến thiên (18)
    • 4.3. Phân tích khoảng tin cậy (18)
    • 4.4. Phân tích hệ số tương quan (19)
      • 4.4.1. Ma trận tương quan (19)
      • 4.4.2. Kiểm định hệ số tương quan (20)
  • CHƯƠNG 5. TRẢ LỜI CÂU HỎI (21)
    • 5.1. Câu 2A (21)
    • 5.2. Câu 2B (21)
    • 5.3. Câu 3C (21)
    • 5.4. Câu 3D (22)
    • 5.5. Câu 3E (22)
    • 5.6. Câu 3F........................................................................................................................ 15 TÀI LIỆU THAM KHẢO (25)

Nội dung

GIỚI THIỆU ĐỀ TÀI

Mục đích

Phân tích dữ liệu đang trở thành xu hướng quan trọng trong thời đại mới, không chỉ giúp hiểu bản chất dữ liệu mà còn hỗ trợ quyết định Kỹ năng này hiện được tích hợp vào chương trình giảng dạy tại nhiều trường đại học, đặc biệt trong các lĩnh vực khác nhau Môn Kỹ thuật dự báo trang bị cho sinh viên kiến thức cơ bản về thống kê và dự báo, từ đó giúp họ phát triển kỹ năng phân tích dữ liệu cần thiết.

Báo cáo này nhằm mục đích phân tích dữ liệu chỉ số vận tải container qua hai phương thức đường sắt và đường thuỷ tại các nước như Hà Lan, Đức, Ý, Tây Ban Nha, Bỉ, Hungary, Lithuania và Romania trong khoảng thời gian từ 1970 đến 2019 Qua việc phân tích dữ liệu, nhóm đã áp dụng kiến thức từ môn Kỹ thuật dự báo để nghiên cứu một vấn đề thực tiễn, đồng thời tìm hiểu đặc tính vận tải hàng hoá bằng container của các quốc gia này, từ đó nâng cao kiến thức trong lĩnh vực Logistics quốc tế.

Nhiệm vụ

Nhiệm vụ chính liên quan đến thống kê và phân tích dữ liệu của báo cáo bao gồm:

− Chọn lọc, thu thập dữ liệu cho chỉ số Container transportation (chỉ số vận tải container) của 5 nước có giao thương nhiều nhất với Việt Nam.

Kỹ thuật EDA (Phân tích dữ liệu khám phá) được áp dụng để phân tích và xác định các đặc trưng cơ bản của dữ liệu Quá trình này bao gồm việc xem xét các thống kê mô tả như trung bình, trung vị, phương sai và độ lệch chuẩn, cùng với việc tính toán các tứ phân vị và khoảng tin cậy cho trung bình và độ lệch chuẩn Bên cạnh đó, việc đánh giá mức biến động và sự tương quan cũng giúp rút ra được những đặc tính quan trọng của dữ liệu.

− Từ đặc tính của dữ liệu, đưa ra mô hình dự báo phù hợp cho chỉ số vận tải container của các nước.

Bố cục

Bố cục bài báo cáo gồm 5 chương, cụ thể:

− Chương 1: Giới thiệu đề tài

− Chương 2: Cơ sở lý thuyết và Phương pháp luận

− Chương 3: Giới thiệu vấn đề

− Chương 4: Thống kê mô tả

− Chương 5: Trả lời câu hỏi

Phạm vi báo cáo

− Chỉ tiến hành dự báo đối với dữ liệu có data pattern là stationary, trend và seasonal.

− Các phương pháp dự báo sử dụng bao gồm: Nạve, Simple averages, Moving averages, Exponential smoothing, Growth curves, Linear exponential smoothing, Quadratic exponential smoothing, Holt’s method. vi

CƠ SỞ LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN

Cơ sở lý thuyết

Phân tích dữ liệu khám phá (EDA) là phương pháp phân tích dữ liệu chủ yếu dựa vào kỹ thuật biểu đồ và hình vẽ EDA bao gồm việc xem xét và nghiên cứu các dữ liệu cùng với các biểu đồ khác nhau, đồng thời áp dụng các phương pháp thống kê mô tả nhằm tìm ra kết quả cần thiết cho các câu hỏi nghiên cứu Phương pháp này cũng cung cấp cơ sở vững chắc để lựa chọn mô hình trong các bước phân tích tiếp theo.

Những kỹ thuật biểu đồ được sử dụng trong EDA thường khá đơn giản, bao gồm một vài kỹ thuật sau:

− Vẽ dữ liệu nguyên bản sử dụng data traces, histograms, block plots,

− Vẽ phân bố của dữ liệu nguyên bản sử dụng mean plots, standard deviation plots, box plots,

− Sắp xếp các biểu đồ giúp tối đa hoá khả năng tự nhiên về nhận biết mô hình của con người.

Bảng 2.1 Lựa chọn phương pháp dự báo

Time horizon Type of Model Data

Pattern of the data: ST, stationary; T, trending; S, seasonal.

Time horizon: S, short term; I, intermediate term; L, long term.

Type of model: TS, time series.

Phương pháp luận

Hình 2.1 Phương pháp luận thực hiện báo cáo

GIỚI THIỆU VẤN ĐỀ

Vấn đề

Trong phân tích dự báo, việc nắm bắt thông tin chi tiết về lĩnh vực dự báo là vô cùng quan trọng Thông tin này bao gồm số liệu quá khứ, diễn biến hiện tại và xu hướng phát triển của lĩnh vực Đồng thời, cần đánh giá đầy đủ các yếu tố ảnh hưởng, cả định lượng lẫn định tính, để có cái nhìn toàn diện và chính xác nhất.

Bài báo cáo này phân tích các chỉ số thống kê mô tả cho chuỗi dữ liệu thông qua kỹ thuật Khám Phá Dữ Liệu (EDA) và phương pháp chuỗi thời gian EDA giúp xác định các mối quan hệ, xu hướng và quan sát có ảnh hưởng, từ đó tóm tắt và mô tả dữ liệu một cách trực quan, hỗ trợ nhà phân tích khai thác dữ liệu hiệu quả Phương pháp chuỗi thời gian tập trung vào việc phân tích chuỗi quan sát của một biến theo biến số độc lập là thời gian Dữ liệu được sử dụng là chỉ số vận tải hàng hóa bằng container từ 5 quốc gia mà Việt Nam xuất khẩu nhiều nhất, bao gồm hai loại hình vận tải là đường sắt và đường thủy, với đơn vị đo lường là TEU (Đơn vị tương đương 20 feet) Dữ liệu được thu thập từ Bộ cơ sở dữ liệu OECD, có thể truy cập tại: https://www.oecd-ilibrary.org/transport.

Công cụ

− Kỹ thuật EDA bao gồm:

▪ Các thông số đo lường sự tập trung: Trung bình, Trung vị, Yếu vị.

▪ Các thông số đo lường sự phân tán: Khoảng biến thiên, Tứ phân vị, IQR, Phương sai, Độ lệch chuẩn.

▪ Biểu đồ Biểu đồ Histogram, Biểu đồ hệ số tương quan.

▪ Hệ số biến thiên (CV), Khoảng tứ phân vị, Biểu đồ Box Plot, Hệ số tương quan Pearson.

Thu thập dữ liệu

3.3.1 Cách thức thu thập dữ liệu

Dữ liệu xuất khẩu container được thu thập từ OECD iLibrary, bao gồm 5 quốc gia đường sắt: Hà Lan, Hungary, Romania, Đức và Lithuania, cùng với 5 quốc gia đường biển: Hà Lan, Đức, Ý, Tây Ban Nha và Bỉ.

Sau khi thu thập dữ liệu về chỉ số vận tải container của các quốc gia, một số nước thiếu dữ liệu trong một số năm Để khắc phục tình trạng này, nhóm nghiên cứu đã áp dụng phương pháp trung bình dịch chuyển (MA) nhằm làm đầy các khoảng trống trong dữ liệu thô.

Ví dụ: nước Hà Lan không có dữ liệu về vận tải container từ năm 1995 – 2003.

Hình 3.1 Chuỗi dữ liệu bị thiếu của Hà Lan

Ta sử dụng phương pháp trung bình dịch chuyển với k = 3, 4, 5 để dự báo dữ liệu cho giai đoạn 1995 – 2003 cho Hà Lan.

Hình 3.2 Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k = 3,4,5

Dựa vào các loại sai số như MAD, MSE, và MAPE khi dự báo dữ liệu với 3, 4 và 5 thời đoạn, chúng ta nhận thấy rằng khi số thời đoạn dự báo tăng lên, các giá trị sai số cũng gia tăng Do đó, phương pháp dự báo Trung bình dịch chuyển với 3 thời đoạn (k = 3) được lựa chọn để dự báo dữ liệu cho các năm còn thiếu.

Dữ liệu chỉ số xuất khẩu container của các nước được trình bày đầy đủ ở phần phụ lục A.

KỸ THUẬT EDA VÀ THỐNG KÊ MÔ TẢ

Thống kê mô tả

4.1.1 Các thông số của thống kê mô tả

Sử dụng công cụ Thống kê mô tả trong phần mềm Minitab (Stat → Basic Statistics → Display Descriptive Statistics ) để tính toán các thông số thống kê mô tả, kết quả thu được như hình 4.1 bên dưới.

Hình 4.1 Các thông số của thống kê mô tả

Nhóm đã sử dụng công cụ Graphical Summary (Stat → Basic Statistics → Graphical Summary) để khai thác biểu đồ Histogram và Boxplot của dữ liệu, nhằm tính toán các thông số cơ bản của thống kê mô tả Các biểu đồ Histogram và Box Plot cho từng nước được vẽ, trong đó Hình 4.2 minh họa dữ liệu của Hà Lan, và kết quả cho tất cả các nước được trình bày trong phần phụ lục B.

Anderson-Darling Normality Test A-Squared

P-Value Mean StDev Variance Skewness Kurtosis N Minimum 1st Quartile Median 3rd Quartile Maximum 95% Confidence Interval for Mean

Netherlands 4.1.2 Nhận xét các thông số của thống kê mô tả

Chỉ số xuất khẩu container qua đường sắt của Đức dao động từ 365.243 TEU đến 7.138.556 TEU, với khoảng IQR nằm trong khoảng 1.013.776 đến 5.209.543 TEU Trung vị của dữ liệu là 2.206.628 TEU, thấp hơn giá trị trung bình 2.857.355 TEU, cho thấy sự chênh lệch trong chỉ số vận tải.

5 container qua đường sắt của Đức có xu hướng lệch phải, tức là đa phần dữ liệu có giá trị bé hơn giá trị trung bình 2 857 355 TEU.

Hungary: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hungary có giá trị từ

Dữ liệu về vận tải container qua đường sắt của Hungary cho thấy khối lượng container dao động từ 8687 TEU đến 736 798 TEU, với khoảng IQR từ 132 127 đến 441 856 TEU Trung vị của dữ liệu là 2 204 713 TEU, thấp hơn giá trị trung bình 266 232 TEU, cho thấy xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình này.

Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88

Số liệu về vận tải container qua đường sắt của Hà Lan cho thấy tổng lượng hàng hóa dao động từ 000 TEU đến 1.686.000 TEU, với khoảng IQR nằm trong khoảng từ 200.044 đến 930.458 TEU Trung vị của dữ liệu là 216.784 TEU, thấp hơn giá trị trung bình 517.214 TEU, cho thấy xu hướng lệch phải của chỉ số này, nghĩa là phần lớn dữ liệu có giá trị thấp hơn mức trung bình.

Lithuania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Lithuania có giá trị từ 10

Số liệu vận tải container qua đường sắt của Lithuania dao động từ 554 TEU đến 305.686 TEU, với khoảng IQR từ 38.670 đến 187.983 TEU Trung vị của dữ liệu là 103.125 TEU, nhỏ hơn giá trị trung bình 123.127 TEU, cho thấy sự phân bố lệch phải, tức là phần lớn dữ liệu có giá trị thấp hơn mức trung bình.

Romania: Ta thấy chỉ số xuất khẩu container qua đường sắt của Romania có giá trị từ 54

Số liệu vận tải container qua đường sắt của Romania dao động từ 995 TEU đến 2.468.750 TEU, với khoảng IQR từ 108.364 đến 1.436.772 TEU Trung vị của dữ liệu là 220.074 TEU, thấp hơn giá trị trung bình 750.837 TEU, cho thấy xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.

❖ Đối với các nhóm nước xuất khẩu container bằng đường biển :

Hà Lan: Ta thấy chỉ số xuất khẩu container qua đường sắt của Hà Lan có giá trị từ 88 000

Chỉ số vận tải container qua đường sắt của Hà Lan đạt tối đa 1.686.000 TEU, với khoảng IQR từ 200.044 đến 930.458 TEU Trung vị của dữ liệu là 216.784 TEU, thấp hơn giá trị trung bình 517.214 TEU, cho thấy sự phân bố dữ liệu lệch phải Trong khi đó, chỉ số xuất khẩu container qua đường biển của Đức ghi nhận giá trị từ 279.376 TEU.

Trong lĩnh vực vận tải container qua đường biển, chỉ số TEU đã đạt tới 15 905 000 TEU, với khoảng IQR phân bố từ 1 771 453 TEU đến 13 272 393 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải container của Đức có xu hướng lệch phải, với phần lớn dữ liệu nằm dưới giá trị trung bình là 6 803 993 TEU Đồng thời, chỉ số xuất khẩu container qua đường biển của Ý dao động từ 49 937 TEU.

Số liệu vận tải container qua đường biển của Ý đạt 12.758.529 TEU, với khoảng IQR phân bố từ 792.015 TEU đến 7.943.429 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy chỉ số Transportation có xu hướng lệch phải, nghĩa là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình là 4.557 TEU.

Chỉ số xuất khẩu container qua đường biển của Tây Ban Nha dao động từ 137,483 TEU đến 17,435,718 TEU, với khoảng IQR phân bố từ 1,335,867 TEU đến 17,435 TEU.

718 Trung vị của dữ liệu bé hơn giá trị trung bình, cho thấy chỉ số Transportation cho vận tải

6 container qua đường biển của Bỉ có xu hướng lệch phải, tức là đa phần dữ liệu có gia trị bé hơn giá trị trung bình 6 374 367 TEU.

Chỉ số xuất khẩu container qua đường biển của Bỉ dao động từ 316,354 TEU đến 11,527,000 TEU, với khoảng IQR phân bố từ 1,033,084 TEU đến 8,658,750 TEU Trung vị của dữ liệu thấp hơn giá trị trung bình, cho thấy rằng chỉ số Transportation cho vận tải container qua đường biển của Bỉ có xu hướng lệch phải, tức là phần lớn dữ liệu có giá trị nhỏ hơn giá trị trung bình.

Xác định độ lệch của chuỗi dữ liệu: dựa vào dữ liệu thu được ở trên cùng biểu đồ

Biểu đồ histogram (phụ lục B) cho thấy rằng, đối với cả 10 dữ liệu, độ lệch đều dương và giá trị trung bình lớn hơn giá trị trung vị Điều này chỉ ra rằng phân bố dữ liệu của cả năm nước đều có xu hướng lệch về phía bên phải.

Xác định dạng của chuỗi dữ liệu: Đầu tiên, sử dụng công cụ vẽ Time Series Plot (Stat

Biểu đồ chuỗi thời gian (Time Series Plot) được sử dụng để xác định hình dạng có thể có của chuỗi dữ liệu Ví dụ, đối với dữ liệu xuất khẩu container của Bỉ, biểu đồ này giúp phân tích và hiểu rõ hơn về xu hướng và biến động trong xuất khẩu.

Time Series Plot of Belgium

Hình 4.3 Biểu đồ chuỗi thời gian

Nhìn vào biểu đồ chuỗi thời gian, có thể nhận thấy rằng dữ liệu có khả năng xuất hiện xu hướng Để phân tích sâu hơn, cần sử dụng công cụ Autocorrelation trong Minitab (Stat → Time Series →).

AutoCorrelation) để vẽ biểu đồ ACF mới xác định được chính xác Ví dụ ACF của nước Bỉ trong hình 4.4.

Autocorrelation Function for Belgium (with 5% significance limits for the autocorrelations)

Hình 4.4 ACF của dữ liệu nước Bỉ

Hệ số biến thiên

Sử dụng công cụ Descriptive Statistics (Stat → Basic Statistics → Display Descriptive Statistics ) của phần mềm Minitab để tính toán hệ số biến thiên, thu được kết quả như hình 4.7.

Kết quả phân tích chỉ số CV của dữ liệu vận tải container qua đường biển cho thấy tất cả các nước đều có chỉ số CV nhỏ hơn 1, cho thấy mức biến động thấp Hà Lan có chỉ số TEU ổn định nhất (73.12%), trong khi Tây Ban Nha có mức biến động cao nhất (90.76%) Đối với vận tải đường sắt, Đức, Hungary và Lithuania cũng có chỉ số CV dưới 1, cho thấy sự ổn định Lithuania có mức biến động thấp nhất (72.51%), trong khi Romania có chỉ số TEU biến động mạnh nhất (106.28%), cho thấy sự không ổn định trong dữ liệu vận tải container của nước này.

Phân tích khoảng tin cậy

Khoảng tin cậy là dải giá trị có khả năng bao gồm tham số tổng thể chưa xác định, với mức độ tin cậy thể hiện xác suất mà khoảng tin cậy sẽ chứa tham số thực tế khi thực hiện nhiều lần lấy mẫu ngẫu nhiên Điều này cũng áp dụng cho khoảng tin cậy về giá trị trung bình và độ lệch chuẩn trong dữ liệu vận tải container của các quốc gia.

Ví dụ với dữ liệu chỉ số xuất khẩu container theo đường sắt của Hà Lan:

Sử dụng Minitab để tính toán khoảng tin cậy (trích từ mục thống kê mô tả), ta được kết quả như sau.

Hình 4.8 Kết quả tính toán khoảng tin cậy sử dụng Minitab

Khoảng tin cậy 95% cho giá trị trung bình của chỉ số vận tải container qua đường sắt ở Hà Lan được xác định là (370 251; 664 177) TEU Điều này có nghĩa là khi lấy ngẫu nhiên dữ liệu vận tải trong các năm, 95% giá trị trung bình của chỉ số vận tải sẽ nằm trong khoảng này.

Khoảng tin cậy 95% cho giá trị độ lệch chuẩn của chỉ số vận tải container qua đường sắt tại Hà Lan là (426,674 ; 639,202) TEU Điều này có nghĩa là khi lấy ngẫu nhiên dữ liệu vận tải từ các năm, 95% giá trị độ lệch chuẩn của chỉ số này sẽ nằm trong khoảng tin cậy đã xác định.

Phân tích hệ số tương quan

Bảng 4.2 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường sắt

Nước Đức Hungary Lithuania Hà Lan Romania Đức 1 0.903 -0.430 0.939 -0.639

Ba nước Đức, Hungary và Hà Lan có sự tương đồng trong tăng trưởng chỉ số vận tải container theo đường sắt, với hệ số tương quan cao (thấp nhất là 0.882) nhờ vào xu hướng tăng trưởng theo hàm bậc 2.

Lithuania và Romania có đặc điểm dữ liệu tăng trưởng ổn định từ năm 1970, nhưng đã trải qua sự sụt giảm đột ngột vào các năm 1987 và 1988 Hệ số tương quan giữa hai nước này đạt giá trị cao, gần 0.912.

Hệ số tương quan giữa Lithuania và Romania với Đức, Hà Lan và Hungary cho thấy sự khác biệt trong xu hướng tăng trưởng chỉ số vận tải Hai nhóm nước này có ít sự tương quan trong vận tải container bằng đường sắt Giá trị âm của hệ số cho thấy trong khi chỉ số vận tải của Hungary, Đức và Hà Lan tăng đều, chỉ số vận tải của Lithuania và Romania lại không theo cùng xu hướng.

Sau giai đoạn giảm đột ngột vào năm 1987 và 1988, 10 của 2 nước còn lại đã tiếp tục tăng trưởng, nhưng giá trị tăng trưởng này thấp hơn rất nhiều so với mức trước khi giảm.

Bảng 4.3 Ma trận hệ số tương quan của 5 nước vận tải container bằng đường biển

Nước Hà Lan Đức Ý Tây Ban Nha Bỉ

Hệ số tương quan giữa các nước đường biển trong bảng 4.3 cho thấy mối liên hệ rất cao, với giá trị thấp nhất đạt 0.967 Chỉ số Transportation cho vận tải container bằng đường biển của 5 nước này có sự liên kết chặt chẽ, phản ánh đặc tính xu hướng dữ liệu vận tải.

5 nước này, (tăng dần theo thời gian, từ 1970 đến 2019, theo hàm xu hướng bậc 2), đã được trình bày ở phần trên.

4.4.2 Kiểm định hệ số tương quan

Các giá trị p-value được xác định từ phần mềm Minitab với độ tin cậy 95% cho thấy rằng trong nhóm các nước đường sắt, Hà Lan, Đức và Hungary, cũng như giữa Lithuania và Romania, p-value tiến gần về 0, chứng tỏ các hệ số tương quan có ý nghĩa thống kê Đối với các hệ số tương quan giữa các nước thuộc hai nhóm khác nhau như Hungary và Romania, Hà Lan và Lithuania, p-value lần lượt là 0.002 và 0.008, vẫn nhỏ hơn 0.05, cho thấy các hệ số này cũng có giá trị thống kê.

Trị thống kê p-value cho hệ số tương quan giữa Hungary và Lithuania có giá trị 0.077

> 0.05, cho thấy mức ý nghĩa của hệ số tương quan này thấp hơn các hệ số tương quan còn lại. Đối với nhóm các nước đường biển:

Giá trị p-value kiểm định của các hệ số tương quan trong bảng 4.3 được xuất ra từ phần mềm Minitab đều tiến gần đến 0, cho thấy các hệ số này có ý nghĩa thống kê.

TRẢ LỜI CÂU HỎI

Câu 2A

Mô tả các đối tượng nghiên cứu (các nước đã chọn) bằng các đặc điểm đặc trưng nhất thông qua phân tích EDA ở câu 1?

− Đa số các nước có chỉ số vận tải container theo xu hướng tăng dần qua các năm.

Chỉ số vận tải container qua đường sắt và đường biển giữa các quốc gia có sự phân bố không đồng đều, chủ yếu lệch về phía giá trị thấp hơn trung bình Tuy nhiên, sự chênh lệch này không quá lớn so với giá trị trung bình.

Trong số các nước xuất khẩu container bằng đường sắt, Đức dẫn đầu với giá trị xuất khẩu trung bình cao nhất đạt 2,875,355 TEU, trong khi Lithuania có giá trị xuất khẩu trung bình thấp nhất chỉ đạt 123,127 TEU.

Trong số các nước xuất khẩu container bằng đường biển, Đức dẫn đầu với giá trị xuất khẩu trung bình đạt 6,803,993 TEU, trong khi Bỉ có giá trị xuất khẩu trung bình thấp nhất, chỉ đạt 4,533,168 TEU.

− Nhìn chung các nước xuất khẩu theo đường biển với trọng lượng container (TEU) nhiều hơn đáng kể so với đường sắt.

Câu 2B

Chuỗi dữ liệu sử dụng của các đối tượng nghiên cứu có tuân theo phân bố Normal không? Tại sao?

Dựa vào giá trị p – value của kiểm định Anderson – Darling Normality Test được thực hiện trên Minitab 18 ta thu được kết quả dưới bảng sau.

Bảng 5.1 Kết quả kiểm định phân bố Normal

Dữ liệu Giá trị kiểm định Nhận xét

Netherlands p < 0.05 Không tuân theo phân bố Normal Germany p < 0.05 Không tuân theo phân bố Normal Đường biển Italy p < 0.05 Không tuân theo phân bố Normal

Tại các quốc gia như Tây Ban Nha, Bỉ, Đức, Hungary và Litva, kết quả thống kê cho thấy giá trị p đều nhỏ hơn 0.05, cho thấy rằng dữ liệu không tuân theo phân bố chuẩn.

Netherlands p < 0.05 Không tuân theo phân bố NormalRomania p < 0.05 Không tuân theo phân bố Normal

Câu 3C

Ước lượng về CIs của chuỗi dữ liệu của các đối tượng nghiên cứu có đủ “tốt” để tin cậy không?

− Do dữ liệu không tuân theo phân bố Normal nên khoảng tin cậy không dùng được.

Dữ liệu trong mẫu cần phải ngẫu nhiên, nhưng do một số quốc gia có dữ liệu không đầy đủ, nên cần áp dụng phương pháp dự báo để tính toán chính xác hơn.

Dữ liệu mất đi tính ngẫu nhiên và độc lập.

Câu 3D

Chủ đề mà nhóm quan tâm là liệu giá trị vận chuyển hàng hóa của Đức có tương đương với giá trị vận chuyển hàng hóa của Hà Lan hay không Việc so sánh này giúp xác định sự tương đồng trong các lĩnh vực kinh tế và logistics giữa hai quốc gia.

Sử dụng kiểm định trung bình 2 tổng thể theo cặp (Paired t for the mean).

To perform the analysis in Minitab 18, navigate to Stat → Paired t for the mean Here, the average value for Germany is represented as 1, while the average for the Netherlands is denoted as 2, with the difference calculated as 1 − 2 The results obtained are as follows:

Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy

Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt

Kết luận: Chỉ số vận tải container cả bằng đường sắt và đường thủy của Đức đều lớn hơn Hà Lan.

Hình 5.3 Chỉ số vận tải container bằng đường thủy và đường sắt của Đức và Hà Lan qua các năm

Câu 3E

Có sự khác nhau giữa các bộ dữ liệu được phân tích từ các nước hay không? (One-way ANOVA và Tukey test, Interval Plots và Boxplot of Data )

Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển

Interval Plot of Netherlands, Germany,

Netherlands Germany Italy Spain Belgium

The pooled standard deviation is used to calculate the intervals

Netherlands Germany Italy Spain Belgium

Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển

Vì p – value = 0.05 nên kết luận rằng không có sự khác biệt giữa chỉ số vận tải container bằng đường biển giữa 5 nước Netherlands, Germany, Italy, Spain, Belgium. Đường sắt

Hình 5.6 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường sắt

Interval Plot of Germany (Rai, Hungary,

Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania

The pooled standard deviation is used to calculate the intervals

Boxplot of Germany (Rai, Hungary,

10000 00 0 Germany (Rail) Hungary Lithuania Netherlands (Rail) Romania

Hình 5.7 Interval Plot và Boxplot các chỉ số vận tải container bằng đường sắt

Vì p-value < 0.05 nên có sự khác biệt giữa giá trị trung bình của các nước Tiến hành kiểm định sâu ANOVA (Turkey Test).

Hình 5.8 Kết quả kiểm định Turkey

Kết quả kiểm định Turkey cho thấy rằng các cặp nước Hungary – Đức, Lithuania – Đức, Hà Lan – Đức, Romania – Đức và Romania – Lithuania có sự khác biệt có ý nghĩa thống kê về chỉ số xuất khẩu container với p-value < 0.05 Ngược lại, các cặp nước còn lại không có sự khác biệt khi p-value > 0.05.

Câu 3F 15 TÀI LIỆU THAM KHẢO

Dựa vào dữ liệu thu thập từ các đối tượng nghiên cứu đã chọn, có thể tiến hành dự báo cho năm tiếp theo Nếu khả thi, cần thực hiện các phép tính để xác định giá trị dự báo Ngược lại, nếu không thể dự báo, cần đưa ra lập luận rõ ràng để giải thích lý do.

Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mô tả, thu được bảng sau Bảng 5.2 Phân tích các yếu tố của chuỗi thời gian

Dữ liệu Data Time Type of Phương pháp dự báo đề pattern horizon model xuất

Hà Lan Trend Short time TS − Linear exponential Đức Trend Short time TS

− smoothing Đường Ý Trend Short time TS Quadratic exponential smoothing

Tây Ban Nha Trend Short time TS biển − Exponential trend

Bỉ Trend Short time TS

− models Holt’s method Đường Đức Trend Short time TS sắt Hungary Trend Short time TS

Hà Lan Trend Short time TS smoothing

Short time TS Không tiến hành dự báo stationary với dữ liệu non stationary

Short time TS Không tiến hành dự báo stationary với dữ liệu non stationary

Bảng 5.3 So sánh sai số của các phương án lựa chọn

Vì giá trị thực rất lớn nên sử dụng sai số MAPE để đánh giá lựa chọn phương pháp dự báo → dụng phương pháp Holt’s method Sử

Sau khi phân tích và đánh giá các quốc gia còn lại, chúng tôi đã thu được kết quả dự báo như thể hiện trong bảng 5.4 Dữ liệu dự báo cho các quốc gia được thực hiện bằng phần mềm Minitab và được trình bày chi tiết trong phụ lục C.

Bảng 5.4 Kết quả dự báo

Dữ liệu Phương pháp dự báo Giá trị dự báo

Hà Lan Holt’s method 16,067,404 Đức Holt’s method 15,229,009 Đường biển Ý Holt’s method 11,511,375

Tây Ban Nha Holt’s method 17,584,252

Bỉ Exponential trend models 19,002,833 Đức Holt’s Method 7,323,485 Đường sắt Hungary Holt’s Method 389,454

Phương pháp Holt của Hà Lan đã được đánh giá với 1.754.952 lượt đánh giá, nhằm kiểm tra sự phù hợp của phương pháp dự báo thông qua việc phân tích hệ số tương quan residual để xác định tính ngẫu nhiên.

Dựa vào LBQ test để kiểm tra sự tương quan giữa time lags với data thu được kết quả sau.

Ví dụ đối với nước Đức của vận tải đường sắt, ta có kết quả sau:

(with 5% significance limits for the autocorrelations)

Hình 5.9 Kiểm tra sự tương quan của Residual đối với nước Đức

Do LBQ < 2 0.05 (5) = 11.07 nên residual là ngẫu nhiên → Dự báo bằng phương pháp Holt’s method là phù hợp đối với dữ liệu này.

Trường hợp khác, đối với nước Bỉ của vận tải đường biển, ta có kết quả sau:

(with 5% significance limits for the autocorrelations)

Hình 5.10 Kiểm tra sự tương quan của Residual đối với nước Đức

Do LBQ > 2 0.05 (5) = 11.07 nên residual là tương quan → Dự báo bằng phương pháp Exponential trend models chưa phù hợp trong trường hợp này mặc dù giá trị sai số tốt →

Chuyển sang phương pháp Holt’s method để dự báo, cho ra kết quả phù hợp.

Kết luận: Phương pháp Holt’s Method là công cụ phù hợp để dự báo vận tải biển cho các quốc gia như Hà Lan, Đức, Ý và Tây Ban Nha, đồng thời cũng hiệu quả cho việc dự báo vận tải sắt tại Đức và Hà Lan.

[1] John E Hanke, Dean W Wichern, 2008 Business Forecasting, 9 th edition Published by Pearson Education Limited 2014.

[2] Nguyễn Vạng Phúc Nguyên, 2020 Bài giảng môn Kỹ thuật dự báo Thành phố Hồ Chí Minh, NXB Đại học Quốc gia Thành phố Hồ Chí Minh.

PHỤ LỤC A DỮ LIỆU THU THẬP

Bảng A1 Dữ liệu xuất khẩu container bằng đường sắt của các nước

Năm Hà Lan Đức Hungary Lithuania Romania

Bảng A2 Dữ liệu xuất khẩu container bằng đường biển của các nước

Năm Hà Lan Đức Ý Tây Ban Nha Bỉ

PHỤ LỤC B KẾT QUẢ THỐNG KÊ MÔ TẢ SỬ DỤNG MINITAB

P-Value

Ngày đăng: 01/12/2022, 09:37

HÌNH ẢNH LIÊN QUAN

Hình 2.1 Phương pháp luận thực hiện báo cáo - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 2.1 Phương pháp luận thực hiện báo cáo (Trang 10)
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k= 3,4,5 - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 3.2. Kết quả dự báo bằng phương pháp Trung bình dịch chuyển với k= 3,4,5 (Trang 12)
Hình 4.1 Các thơng số của thống kê mơ tả - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 4.1 Các thơng số của thống kê mơ tả (Trang 13)
Hình 4.2 Summary Report for Netherlands 4.1.2. Nhận xét các thơng số của thống kê mơ tả - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 4.2 Summary Report for Netherlands 4.1.2. Nhận xét các thơng số của thống kê mơ tả (Trang 13)
→ Time Series → Time Series Plot) để xác định hình dạng cĩ thể cĩ của chuỗi dữ liệu. Ví dụ - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
ime Series → Time Series Plot) để xác định hình dạng cĩ thể cĩ của chuỗi dữ liệu. Ví dụ (Trang 15)
đối với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3. - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
i với dữ liệu xuất khẩu container của nước Bỉ trong hình 4.3 (Trang 15)
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 4.5 Kết quả phân tích autocorrelation và biểu đồ time series của dữ liệu Lithuania (Trang 16)
Bảng 4.1 Data pattern của các nước - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Bảng 4.1 Data pattern của các nước (Trang 16)
Hình 4.7 Kết quả CV của các dữ liệu - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 4.7 Kết quả CV của các dữ liệu (Trang 18)
Hình 4.8 Kết quả tính tốn khoảng tin cậy sử dụng Minitab - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 4.8 Kết quả tính tốn khoảng tin cậy sử dụng Minitab (Trang 19)
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 5.2 Kết quả kiểm định đối với vận tải đường sắt (Trang 23)
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 5.1 Kết quả kiểm định đối với vận tải đường thủy (Trang 23)
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 5.5 Interval Plot và Boxplot các chỉ số vận tải container bằng đường biển (Trang 24)
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
Hình 5.4 Phân tích One-way ANOVA các chỉ số vận tải container bằng đường biển (Trang 24)
Dựa vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mơ tả, thu được bảng sau. - (TIỂU LUẬN) báo cáo bài tập lớn 1 môn học kỹ THUẬT dự báo GOODS TRANSPORT CONTAINER TRANSPORT
a vào phân tích hình dạng chuỗi dữ liệu ở phần Thống kê mơ tả, thu được bảng sau (Trang 26)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w