IV. XÂY DỰNG MÔ HÌNH DỰ ĐOÁN XU HƢỚNG THAY ĐỔI CỦA
1. Xây dựng mô hình dự đoántheo thời gian:
1.3 Dự đoántheo thời gian sử dụng công thức hồi quytuyến tính:
Hình 18 : Đồ thị dự đoán tài khoản XX1 theo thời gian sử dụng hồi quy tuyến tính
Ta có bảng tính sai số : Điểm
dữ liệu
Giá trị tại điểm dữ liệu
Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường hồi quytuyến tính
3 18964789 49595903 ΔH3 = |18964789 – 49595903| = 30631114 5 37796559 50714052 ΔH5 = |37796559– 50714052| = 12917493 7 54912035 51832202 ΔH7 = |54912035– 51832202| = 3079833 14 13036192 55745723 ΔH14 = |13036192– 55745723| = 42709531 16 35834100 56863872 ΔH16 = |35834100– 56863872| = 21029772 18 35098717 57982021 ΔH18 = |35098717– 57982021| = 22883304 28 38690033 63572766 ΔH28 = |38690033– 63572766| = 24882733
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 63 30 48601183 64690915 ΔH30 = |48601183– 64690915| = 16089732 32 69975844 65809064 ΔH32 = |69975844–65809064| = 4166780 38 25068079 69163511 ΔH38 = |25068079– 69163511| = 44095432 42 115691588 69163511 ΔH42 = |115691588– 69163511| = 46528077 45 150707584 73077033 ΔH45 = |150707584– 73077033| = 77630551 53 22350965 77549628 ΔH53 = |22350965– 77549628| = 55198663 55 886261 78667778 ΔH55 = |886261– 78667778| = 77781517 59 251392 80904076 ΔH59 = |251392– 80904076| = 80652684
Tính khoảng sai số trung bình của đường hồi quy tuyến tính(ΔH) giữa đồ thị với các điểm dữ liệu:
Giá trị sai số trung bình ΔH =(ΔH3 + ΔH5 + ΔH7 + ΔH14+ ΔH16+ ΔH18+ ΔH28+ ΔH30+ ΔH32+ ΔH38+ ΔH42+ ΔH45+ ΔH53+ ΔH55+ ΔH59)/15 = 37351814
1.4 Dự đoán theo thời gian sử dụng đƣờng cong khớp bậc cao:
Hình 19 : Đồ thị dự đoán tài khoản XX1 theo thời gian sử dụng nội sử dụng đường cong khớp bậc cao
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 64 Ta có bảng tính sai số : Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong khớp bậc cao
3 18964789 14408052 ΔC3 = |18964789 – 14408052| = 4556739 5 37796559 23484750 ΔC5 = |37796559– 23484750| = 14311809 7 54912035 31962527 ΔC7 = |54912035– 31962527| = 22949508 14 13036192 56918247 ΔC14 = |13036192– 56918247| = 43882055 16 35834100 62700881 ΔC16 = |35834100– 62700881| = 26866781 18 35098717 67884595 ΔC18 = |35098717– 67884595| = 32785878 28 38690033 84819351 ΔC28 = |38690033– 84819351| = 46129318 30 48601183 86409541 ΔC30 = |48601183– 86409541| = 37808358 32 69975844 87400809 ΔC32 = |69975844–87400809| = 17424965 38 25068079 86781091 ΔC38 = |25068079– 86781091| = 61713012 42 115691588 83373342 ΔC42 = |115691588– 83373342| = 32318246 45 150707584 79245363 ΔC45 = |150707584– 79245363| = 71462221 53 22350965 61649293 ΔC53 = |22350965– 61649293| = 39298328 55 886261 55752973 ΔC55 = |886261– 55752973| = 54866712 59 251392 42163572 ΔC59 = |251392– 42163572| = 41912180
Tính khoảng sai số trung bình của đường cong khớp bậc cao(ΔC)giữa đồ thị với các điểm dữ liệu:
Giá trị sai số trung bình ΔC =(ΔC3 + ΔC5 + ΔC7 + ΔC14+ ΔC16+ ΔC18+ ΔC28+ ΔC30+ ΔC32+ ΔC38+ ΔC42+ ΔC45+ ΔC53+ ΔC55+ ΔC59)/15 = 36552407
2. Xây dựng mô hình dự đoán theo đơn vị:
Để xây dựng mô hình dự đoán ta sẽ bỏ bớt 3 điểm bất kỳ trong năm 2012 trong bảng số liệu tài khoản Y21 tại KBNN A, KBNN B. Ta cóbảng số liệu của KBNN A sau khi bỏ số liệu tại tháng 2,8,10:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 65 Bảng 5: Bảng số liệu KBNN A bỏ số liệu tháng 2,8,10 Đơn vị: triệu đồng Năm Tháng Số thu 2012 1 11817 2 1418 3 9454 4 4143 5 5492 6 7004 7 759 8 26772 9 19217 10 10751 11 12000 12 43728
Ta có bảng số liệu của KBNN B sau khi bỏ số liệu tại tháng:4,7,11
Bảng 6: Bảng số liệu KBNN B bỏ số liệu tháng 4,7,11 Đơn vị: triệu đồng Năm Tháng Số thu 2012 1 28439 2 38325 3 79426 4 157837 5 133834 6 171202 7 197962 8 205653 9 221068 10 289357 11 301498 12 361699
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 66
2.1 Dự đoán theo đơn vị sử dụng công thức nội suy Lagrange
2.1.1 Dự đoán tài khoản Y21 tại KBNN A sử dụng đường cong nội suyLagrange suyLagrange
Hình 20 : Đồ thị dự đoán tài khoản Y21 tại KBNN A sử dụng nội suy Lagrange
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong nội suy Lagrange
2 1418 3339 ΔBV_L2 = |1418– 3339| = 1921
8 26772 -534 ΔBV_L8 = |26772+ 534| = 27306
10 10751 39527 ΔBV_L10 = |10751– 39527| = 28776
Tính khoảng sai số trung bình của đường cong nội suy Lagrange (ΔBV_L)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 67
2.1.2 Dự đoán tài khoản Y21 tại KBNN B sử dụng đường cong nội suy Lagrange:
Hình 21 : Đồ thị dự đoán tài khoản Y21 tại KBNN B sử dụng nội suy Lagrange
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong nội suy Lagrange
4 157837 104086 ΔHK_L4 = |157837– 104086| = 53751
7 197962 197762 ΔHK_L7 = |197962+ 197762| = 200 11 301498 402601 ΔHK_L11 = |301498– 402601| = 101103
Tính khoảng sai số trung bình của đường cong nội suy Lagrange (ΔHK_L)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 68
2.2 Dự đoán theo đơn vị sử dụng đƣờng cong nội suy Spline bậc 3
2.2.1 Dự đoán tài khoản Y21 tại KBNN A sử dụng đường cong nội suy Spline bậc 3:
Hình 22 : Đồ thị dự đoán tài khoản Y21 tại KBNN A sử dụng nội suy Spline bậc 3
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong nội suy Spline bậc 3
2 1418 14979 ΔBV_S2 = |1418– 14979| = 13561
8 26772 9377 ΔBV_S8 = |26772 - 9377| = 17395
10 10751 13294 ΔBV_S10 = |10751– 13294| = 2543
Tính khoảng sai số trung bình của đường cong nội suy Spline bậc 3 (ΔBV_S)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 69
2.2.2 Dự đoán tài khoản Y21 tại KBNN B sử dụng đường cong nội suy Spline bậc 3:
Hình 23 : Đồ thị dự đoán tài khoản Y21 tại KBNN B sử dụng nội suy Spline bậc 3
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong nội suy Spline bậc 3
4 157837 107450 ΔHK_S4 = |157837– 107450| = 50387
7 197962 196226 ΔHK_S7 = |197962 - 196226| = 1736 11 301498 361052 ΔHK_S11 = |301498– 361052| = 59554
Tính khoảng sai số trung bình của đường cong nội suy Spline bậc 3 (ΔHK_S)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 70
2.3 Dự đoán theo đơn vị sử dụng hồi quy tuyến tính
2.3.1 Dự đoán tài khoản Y21 tại KBNN A sử dụng hồi quy tuyến tính:
Hình 24 : Đồ thị dự đoán tài khoản Y21 tại KBNN A sử dụng hồi quy tuyến tính
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường hồi quy tuyến tính
2 1418 3217 ΔBV_H2 = |1418 – 3217| = 1799
8 26772 15916 ΔBV_H8 = |26772 - 15916| = 10856
10 10751 20149 ΔBV_H10 = |10751 – 20149| = 9398
Tính khoảng sai số trung bình của đường hồi quy tuyến tính (ΔBV_H)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 71
2.3.2 Dự đoán tài khoản Y21 tại KBNN B sử dụng hồi quy tuyến tính:
Hình 25 : Đồ thị dự đoán tài khoản Y21 tại KBNN B sử dụng hồi quy tuyến tính
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong nội suy Spline bậc 3
4 157837 104605 ΔHK_H4 = |157837– 104605| = 53232
7 197962 192738 ΔHK_H7 = |197962 - 192738| = 5224 11 301498 310249 ΔHK_H11 = |301498– 310249| = 8751
Tính khoảng sai số trung bình của đường hồi quy tuyến tính (ΔHK_H)giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 72
2.4 Dự đoán theo đơn vị sử dụng đƣờng cong khớp bậc cao
2.4.1 Dự đoán tài khoản Y21 tại KBNN A sử dụng đường cong khớp bậc cao:
Hình 26 : Đồ thị dự đoán tài khoản Y21 tại KBNN A sử dụng đường cong khớp bậc cao
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong khớp bậc cao
2 1418 9732 ΔBV_C2 = |1418 – 9732| = 8314
8 26772 9276 ΔBV_C8 = |26772 - 9276| = 17496
10 10751 19233 ΔBV_C10 = |10751 – 19233| = 8482
Tính khoảng sai số trung bình của đường cong khớp bậc cao (ΔBV_C) giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 73
2.4.2 Dự đoán tài khoản Y21 tại KBNN B sử dụng đường cong khớp bậc cao:
Hình 27 : Đồ thị dự đoán tài khoản Y21 tại KBNN B sử dụng đường cong khớp bậc cao
Ta có bảng sai số sau: Điểm dữ liệu Giá trị tại điểm dữ liệu Giá trị tại đường cong
Sai số giữa giá trị điểm dữ liệu và giá trị tại đường cong khớp bậc cao
4 157837 98957 ΔHK_C4 = |157837– 98957| = 58880
7 197962 183419 ΔHK_C7 = |197962 - 183419| = 14543 11 301498 317120 ΔHK_C11 = |301498– 317120| = 15622
Tính khoảng sai số trung bình của đường cong khớp bậc cao (ΔHK_C) giữa đồ thị với các điểm dữ liệu:
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 74
V. NHẬN XÉT :
1. Với bảng số liệu tài khoản XX1trong 5 năm từ 2008 đến năm 2012: + Sai số khi dùng đường cong khớp sử dụng công thức nội suy Larange:
Giá trị ΔLrất lớn
+ Sai số khi dùng đường cong khớp sử dụng công thức nội suy Spline bậc 3:
ΔS = 6245949
+ Sai số khi dùng đường hồi quy tuyến tính:
ΔH = 37351814
+ Sai số khi dùng đường cong khớp sử dụng đường cong khớp bậc cao:
ΔC = 36552407
Ta có thể thấy sai số bé nhất khi bớt đi 15 điểm dữ liệu trong 5 năm là khi sử dụng đường cong khớp nội suy Spline bậc 3. Với việc theo dõi số liệu trong một thời gian dài ta có thể thấy được việc sử dụng phương pháp nội suy Spline bậc 3 đem lại kết quả tốt hơn. Đường cong sử dụng thuật toán Spline bậc 3 với những trường hợp có thay đổi lớn so với quy luật chung có sai số tốt nhất trong cả 4 phương pháp. Có thể thấy với việc theo dõi những tài khoản trong một thời gian dài với điều kiện số liệu không đảm bảo, phương pháp nội suy Spline bậc 3 là lựa chọn tốt nhất trong 4 phương pháp xây dựng đường cong khớp.
2. Với bảng số liệu tài khoản Y21 trong năm 2012 đối với 2 đơn vị KBNN A, KBNN B:
+ Sai số khi dùng đường cong khớp sử dụng công thức nội suy Larange:
ΔBV_L = 19334
ΔHK_L = 51684
+ Sai số khi dùng đường cong khớp sử dụng công thức nội suy Spline bậc 3:
ΔBV_S = 11166
ΔHK_S = 37225
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 75
ΔBV_H = 7351
ΔHK_H = 22402
+ Sai số khi dùng đường cong khớp sử dụng đường cong khớp bậc cao:
ΔBV_C = 11430
ΔHK_C = 29681
Ta có thể thấy sai số bé nhất khi bớt đi 3 điểm dữ liệu trong năm tại KBNN A, KBNN B là khi sử dụng phương pháp hồi quy tuyến tính. Trong trường hợp khi ta theo dõi một tài khoản trong một khoảng thời gian dài ta nhận thấy phương pháp nội suy Spline bậc 3 là lựa chọn tốt nhất. Nhưng khi ta cần theo dõi trong một khoảng thời gian ngắn trong điều kiện những dao động về số liệu không quá lớn như tại các đơn vị cơ sở, ta nhận thấy đường cong khớp hồi quy tuyến tính lại đem lại sai số nhỏ nhất.
Như vậy ta nhận thấy với những tài khoản có thời gian theo dõi dài, quy luật không ổn định ta thấy phương pháp nội suy Spline bậc 3 là lựa chọn tốt nhất trong việc xây dựng đường cong khớp. Với những tài khoản có tính quy luật tốt hơn, ít biến động hơn, có thời gian cần dự đoán trong thời ngắn như các tài khoản tại cấp cơ sở quận, huyện thì việc sử dụng phương pháp hồi quy tuyến tính là lựa chọn tốt nhất.
3. Đề xuất
Sau khi xây dựng mô hình dự đoán sự thay đổi của tài khoản NSNN ta có thể nhận thấy một số vấn đề sau:
- Đối với các tài khoản thu được biểu diễn trên đồ thị về mặt thời gian ta nhận thấy số thu trong các năm là theo quy luật tăng dần vào cuối năm và tăng mạnh vào tháng 12 do các cá nhân, tổ chức nộp các khoản thu vào NSNN dịp cuối năm. Điều này đồng nghĩa với việc lượng giao dịch với Kho bạc và các cơ quan liên quan tới thu NSNN sẽ tăng vọt. Các đơn vị cần tổ chức cán bộ, chương trình, vật chất đáp ứng tốt nhu cầu nộp các khoản thu vào ngân sách nhà nước. Đảm bảo thông tin trên toàn hệ thống
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 76
thông suốt, tránh tắc nghẽn vào nhưng dịp cao điểm như đã từng xảy ra năm 2010( Năm 2010 hiệu năng hệ thống khi mới đưa vào sử dụng không đáp ứng được lượng giao dịch lớn trong nhưng tháng cuối năm, gây dồn ứ ảnh hưởng tới những người đến giao dịch).
- Việc có các nguồn thu đáp ứng được nhu cầu chi của NSNN cũng góp phần đẩy nhanh việc giải ngân các dự án đầu tư. Vì vậy đối với các khoản chi, các đơn vị cũng cần chuẩn bị nguồn vốn bằng nguồn địa phương và nguồn điều chuyển. Mặc dù các giao dịch được thực hiện chủ yếu qua chuyển khoản nhưng không vì thế mà việc chuẩn bị lượng tiền mặt để chi đối với các nghiệp vụ đặc thù như an ninh, quốc phòng … được xem nhẹ. Đã có nhiều đơn vị gặp trường hợp không chuẩn bị đủ lượng tiền mặt kịp thời khi cần chi cho khách hàng. Gây ảnh hưởng không tốt đến các đơn vị giao dịch trong quá trình thanh toán.
- Đối với những biến động bất thường của nền kinh tế, cũng cần chuẩn bị những phương án sẵn sàng khi gặp biến động. Như trong năm 2012 kinh tế đình trệ cùng với việc nhiều doanh nghiệp, tổ chức, cá nhân giải thể đã khiến cho NSNN mất đi một nguồn thu không nhỏ. Mà điển hình là KBNN phải phân bổ nguồn về cho KBNN Hà Nội để việc thanh toán chi thường xuyên và giải ngân các dự án đầu tư không bị đình trệ.
- Bên cạch những giải pháp trung toàn hệ thống cũng cần có nhưng giải pháp riêng lẻ mang tính chất đặc thù đối với từng đơn vị. Như KBNN B với số thu không phải là lớn nhất toán địa bàn Hà Nội nhưng lại có lượng giao dịch lớn nhất toàn hệ thống. Có những đợt cao điểm lượng chứng từ trong một ngày giao dịch thu thuế lên đến gần 10000 chứng từ thuế. Việc này dẫn đến tình trạng KBNN B quá tải trong việc thu thuế trên địa bàn quận vào những ngày cao điểm. KBNN B phải tiến hành thu từ sớm đến tối muộn, cán bộ phải làm thêm nhiều giờ để giải quyết. Việc ủy nhiệm chi cho ngân hàng thương mại cũng đã giải quyết phần nào bài toán thu thuế của KBNN B nhưng cũng chưa hiệu quả. Nên chăng cần có giải pháp
HV: NGUYỄN ĐĂNG ĐỨC CNTT 2012 -2014 77
giúp người dân, đơn vị có thể giao dich trực tuyến với các đơn vị thu NSNN.
- Ngoài ra đối với những đơn vị có nhu cầu sử dụng tiền mặt lớn cũng cần lựa chọn nhưng ngân hàng thương mại đủ điều kiện để mở tài khoản. Trong quá khứ việc lựa chọn những ngân hàng thương mại không đáp ứng