Đề án môn học Khoa Thống kê Phn m u Thống kê học khoa học nghiên cứu hệ thống phương pháp thu thập xử lý phân tích số (mặt lượng)của tượng số lớn để tìm hiểu chất tính quy luật vốn có chúng (mặt chất)trong điều kiện, địa điểm thời gian cụ thể Có nhiều phương pháp để phân tích số liệu thống kê như: số, hồi quy tương quan, dãy số thời gian, … để phát xu hướng biến biến động tượng kinh tế, xã hội Du lịch ngành quan trọng ngành đóng góp lớn vào GDP đất nước Với nhiều danh lam thắng cảnh ,nhiều di sản văn hóa hết nước hịa bình, ổn định ngành du lịch Việt nam ngày phát triển Trong đề án môn học này, em sử dụng phương pháp dãy số thời gian để phân tích xu hướng biến động số lượt khách du lịch quốc tế đến Việt nam thời kì 1995 – 2004 dự đốn cho năm 2005 2006.Trong trình thực đề án này, em khơng tránh khỏi sai sót.Kính mong giúp đỡ, bảo tận tình, chu đáo giáo viên hướng dn, em xin chõn thnh cm n Đề án môn học Khoa Thống kê Phần II: Nội dung I Lý luận phơng pháp dÃy số thời gian 1.Khái niệm m D·y sè thêi gian lµ dÃy trị số tiêu thống kê đợc xếp theo thứ tự thời gian Có tài liệu số khách quốc tế du lịch đến Việt Nam nh sau: Năm Số khách(nghìn lợt ngời) 1995 1351, 1996 1607, 1997 1715, 1998 1520, 1999 1781, 2000 2140, 2001 2330, 2002 2628, 2003 2429, 2004 2927, (sè liÖu lÊy tõ wepsite: http://www.gso.gov.vn.) Qua d·y sè thêi gian, cã thÓ nghiên cứu đặc điểm biến động tợng vạch rõ xu hớng tính quy luật phát triển đồng thời để dự đoán mức độ tợng tơng lai Mỗi dÃy số thời gian đợc cấu tạo hai thành phần thời gian tiêu tợng đợc nghiên cứu Thời gian ngày, tháng, quý, năm Độ dài hai thời gian liền đợc gọi khoảng cách thời gian Chỉ tiêu tợng đợc nghiên cứu số tuyệt đối, số tơng đối, số bình quân Trị số tiêu gọi mức độ dÃy số 2.Cỏc loi dãy số thời gian D·y sè thêi kú biĨu hiƯn quy mô (khối lợng) tợngtrong khoảng thời gian định Trong dÃy số thời kỳ mức độ số tuyệt đối thời kỳ, độ dài khoảng cách thời gian ảnh hởng trực tiếp đến trị số tiêu cộng trị số tiêu để phản ánh quy mô tợng nhng khoảng thời gian dài DÃy số thời điểm biểu quy mô (khối lợng) tợng thời điểm định Mức độ tợng thời điểm sau thờng bao gồm toàn phận mức độ tợng thời điểm trớc Vì việc cộng trị số tiêu không phản ánh quy mô tợng Đề án môn học Khoa Thống kê 3.Yờu cu xõy dng dóy s thi gian Yêu cầu xây dựng dÃy số thời gian phải đảm bảo tính chất so sánh đợc mức độ dÃy số, muốn nội dung phơng pháp tính toán tiêu qua thời gian phải thống nhất, phạm vi tợng nghiên cứu trớc sau phải trí, khoảng cách thời gian dÃy số nên nhau(nhất đối dÃy số thời kỳ) Trong thực tế nguyên nhân khác yêu cầu thể bị vi phạm đòi hỏi phải có chỉnh lý thích hợp để tiến hành phân tích II Các tiêu phân tÝch d·y sè thêi gian Møc độ trung b×nh qua thời gian Chỉ tiêu phản ánh mức độ đại biểu mức độ tuyệt đối d·y sè thêi gian Tuú theo d·y sè thêi kú dÃy số thời điểm mà có công thức tính toán khác - Đối với dÃy số thời kỳ : mức độ trung bình theo thời gian đợc tÝnh theo c«ng thøc sau: n y = y + y + + y n n ∑ yi i=1 n = Trong ®ã yi (i =1, 2, , n)là mức độ dÃy số thời kỳ Từ b¶ng sè liƯu ta cã: y = 1351 ,3+1607 ,2+1715 , 6+1520 , 1+1781,8+2140 ,1+2330 , 8+2628 , 2+2429,2+2927 , 10 y 20432 ,7 = 10 = 2043, 27(nghìn lt ngi) - Đối với dÃy số thời điểm : TH1 : Có khoảng cách thời gian đợc tính theo công thức sau: y = y1 y + y + + y n−1 + n 2 n1 Trong yi (i=1, 2, , n) mức độ dÃy số thời điểm có khoảng cách thời gian Đề án môn học Khoa Thống kê TH2 : Có khoảng cách thời gian không mức độ trung bình theo thời gian đợc tính công thức sau: n yi t i y = y t + y t2 + + y n t n t +t + .+t n i=1 n ∑ ti = i=1 Trong ®ã : ti (i = 1, 2, , n) độ dài thời gian có mức độ yi y i (i=1, 2, , n) mức độ dÃy số thời điểm có khoảng cách thời gian khụng Lợng tăng (hoặc giảm)tuyệt đối a.Khỏi nim: Lng tng gim tuyt i phản ánh thay đổi mức độ tuyệt đối hai thời gian nghiên cứu.Nếu mức độ tợng tăng lên trị số tiêu mang dấu dơng (+) ngợc lại mang dấu âm (-) b.Phõn loi: Tuỳ theo mục đích nghiên cứu ta có lợng tăng giảm khỏc nhau: b1 : Lợng tăng (hoặc giảm)tuyệt đối liên hoàn (hay kỳ)là hiệu số mức độ kỳ nghiên cứu (yi)và mức độ kỳ đứng liền trớc (yi-1) Chỉ tiêu phản ánh mức tăng(hoặc giảm)tuyệt đối hai thời gian liền nhau(thời gian i-1và thời gian i), công thức tính sau: i = yi – yi-1 (i = 1, 2, , n) Trong i lợng tăng (hoặc giảm) tuyệt đối liên hoàn Từ bảng số liệu ta có: năm số khách(nghìn i(nghìn lượt người) 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 lượt người) 1351,3 1607,2 1715,6 1520,1 1781,8 2140,1 2330,8 2628,2 2429,7 2927,9 255,9 108,4 -195,5 261,7 358,3 190,7 297,4 -198,5 498,3 Đề án môn học Khoa Thống kê Từ kết tính toán ta thấy số lợng khách quốc tế du lịch đến Việt Nam qua năm biến động không lúc tăng lúc giảm cụ thể năm 1996 tăng lên so với năm 1995 255, 9(nghìn lợt ngời), năm 1997 tăng lên so với năm 1996 108, 4(nghìn lợt ngời), năm 1998 giảm so với năm 1997 195, 5(nghìn lợt ngời) Năm 2001 tăng lên so với năm 2000 190, 7(nghìn lợt ngời), năm 2002 tăng lên so với năm 2001 297, 4(nghìn lợt ngời), năm 2003 giảm so với năm 2002 198, 5(nghìn lợt ngời)và năm 2004 tăng so với năm 2003 498, 3(nghìn lợt ngời).Sự sụt giảm số lợng khách quốc tế du lịch đến Việt Nam năm 2003 so với năm trớc nguyên nh©n sau: Thø nhÊt sù bÊt ỉn vỊ chÝch trị xà hội giới (chiến tranh Irac) làm cho số lợng khách du lịch lo ngại du lịch hàng loạt vụ đánh bom, bắt cóc tin diễn Nguyên nhân thứ hai bệnh sars lây lan nhanh giới mà cha có thuốc cứu chữa.Nhng nguyên nhân làm sụt giảm số lợt khách du lịch đến Việt nam nói riêng giới nói chung năm 2003 b2 : Lợng tăng (hoặc giảm)tuyệt đối định gốc(hay tính dồn) hiệu số mức độ kỳ nghiên cứu (yi)và mức độ kỳ đợc chọn làm gốc( thờng mức độ dÃy số (y 1)) Chỉ tiêu phản ánh mức tăng (hoặc giảm)tuyệt đối khoảng thời gian dài Nếu kí hiệu i lợng tăng(hoặc giảm) tuyệt đối định gốc ta có: i = yi – y1 (i = 2, 3, …, n) Tõ b¶ng sè liƯu ta cã: năm số khách(nghìn i (nghìn lượt lượt người) 1351,3 1607,2 1715,6 1520,1 1781,8 2140,1 2330,8 2628,2 2429,7 2927,9 người) 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 255,9 364,3 168,8 430,5 788,8 979,5 1276,9 1078,4 1576,6 Đề án môn học Khoa Thống kê - Mối quan hệ: DƠ dµng nhËn thÊy r»ng: n ∑ δi = i (i = 2, 3, …, n) Tức tổng lợng tăng(hoặc giảm)tuyệt đối liên hoàn lợng tăng(hoặc giảm)tuyệt đối định gốc Từ bảng số liÖu ta cã: 255, 9+108, 4-195, 5+261, +358, 3+190, 7+297, -198, 5+498, = 1576, (nghìn lợt ngời) i=2 b3: Lợng tăng (hoặc giảm)tuyệt đối bình quõn mức trung bình lợng tăng (hoặc giảm)tuyệt đối liên hoàn Nếu kí hiệu lợng tăng(hoặc giảm)tuyệt đối bình quõn ta có: n = ∑ δi Δn n−1 = n−1 = i=2 y n− y1 n1 Từ kết tính toán ta cã: y 10 − y 2927 , 9−1351, = =175 ,18 = 10−1 (nghìn lượt người) 3.Tốc độ phát triển a.Khỏi nim Tốc độ phát triển số tơng đối (đợc biểu lần %)phản ánh tốc độ xu hớng biến động cđa hiƯn tỵng qua thêi gian b.Phân loại T theo mục đích nghiên cứu ta có loại tốc độ phát triển sau đây: b1 : Tốc độ phát triển liên hoàn phản ánh biến động tợng hai thời gian liền nhau.Công thức tính nh sau: yi ti = y i−1 Trong ®ã: ti :tèc ®é phát triển liên hoàn thời gian i so với thời gian i-1 yi-1: mức độ tợng thời gian i-1 yi : mức độ tợng ë thêi gian i Tõ b¶ng sè liƯu ta tÝnh đợc : Đề án môn học Khoa Thống kê số khách(nghìn năm lượt người) 1995 1351,3 1996 1607,2 1997 1715,6 1998 1520,1 1999 1781,8 2000 2140,1 2001 2330,8 2002 2628,2 2003 2429,7 2004 2927,9 b2 : Tốc độ phát triển định gốc phản ánh khoảng thời gian dài, c«ng thøc tÝnh nh sau: ti (lần) 1,189 1,067 0,886 1,172 1,201 1,089 1,127 0,924 1,205 sù biÕn ®éng cđa tợng yi y1 Ti = Trong Ti: tốc độ phát triển định gốc yi: mức độ tợng thời gian i y1: mức độ dÃy số Từ bảng số liệu ta tính đợc: số khách(nghìn năm 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 lượt người) 1351,3 1607,2 1715,6 1520,1 1781,8 2140,1 2330,8 2628,2 2429,7 2927,9 Ti (lần) 1,189 1,269 1,125 1,318 1,584 1,725 1,945 1,798 2,167 Mối quan hệ : Giữa tốc độ phát triển liên hoàn tốc độ phát triển định gốc có mối liên hệ sau đây: - Thứ nhất: Tích tốc độ phát triển liên hoàn tốc độ phát triển định gốc.tức là: t2.t3tn = Tn hay: ti = Ti (i = 2, 3, , n) Đề án môn học Khoa Thống kê Tõ b¶ng sè liƯu ta cã: 1, 189.1, 067.0, 886.1, 172.1, 201.1, 089.1, 127.0, 924.1, 205 = 2, 167 (lần) - Thứ hai: Thơng hai tốc độ phát triển định gốc liền tốc độ phát triển liên hoàn hai thời gian đó.tức là: Ti Ti1 T3 T2 (i=2, 3, …, n) = ti 1.269 = 1.189 = 1.067 = t3 b3 : Tốc độ phát triển trung bình trị số đại biểu tốc độ phát triển liên hoàn Vì tốc độ phát triển liên hoàn có quan hệ tích nên để tính tốc độ phát triển bình quân, ngời ta sử dụng công thức số trung bình nhân Nếu kí hiệu t tốc độ phát triển trung bình công thøc tÝnh nh sau: √ n−1 n−1 √t t .t n t = = n ∏ ti i=2 √ n−1 = yn y1 t : tốc độ phát trin trung bỡnh Từ bảng số liệu kết tính toán ta có: t = 101 1,189.1,067.0,886.1,172.1,201.1,089.1,127.0,924.1,205 = 1, 029(lÇn) hay 102, 9(%) √ 10−1 t = y 10 y1 2927 , = √ 1351 = 1.029 (lần) hay 102, 9(%) Ưu nhược điểm: Vì t phụ thuộc vào mức độ đầu mức độ cuối dãy số thời gian nên chØ tính tiêu tốc độ phát triển trung bình tợng biến động theo xu hớng định 4.Tốc độ tăng (hoặc giảm) a.Khỏi nim Chỉ tiêu phản ánh mức độ tợng hai thời gian đà tăng (+) giảm (-) lần (hoặc %) Đề án môn học Khoa Thống kê b.Phõn loi Ta có tốc độ tăng(hoặc giảm) sau đây: b1: Tốc độ tăng (hoặc giảm) liên hoàn (hay kỳ)là tỷ số lợng tăng (hoặc giảm) liên hoàn với mức độ kỳ gốc liên hoàn.Nếu kí hiệu a i (i = 1, 2, , n)là tốc độ tăng (hoặc giảm) liên hoàn thì: = δi y i −1 (i = 2, 3, …, n) Hay : y i − y i−1 y i−1 yi = = y i−1 = ti Nếu ti tính phần trăm thì: ai(%) = ti(%) 100 Từ kết đà tính ta có: y i1 y i1 Đề án môn học Khoa Thống kê nm s khỏch(nghỡn lt ngi) 1351,3 1607,2 1715,6 1520,1 1781,8 2140,1 2330,8 2628,2 2429,7 2927,9 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 (lần) 0,189 0,067 -0,114 0,172 0,201 0,089 0,127 -0,076 0,205 b2 : Tốc độ tăng (hoặc giảm) định gốc tỷ số lợng tăng (hoặc giảm)định gốc với mức độ kỳ gốc cố định.Nếu kí hiệu A i (i = 2, 3, , n) tốc độ tăng (hoặc giảm)định gốc thì: Ai = i yi (i = 2, 3, …, n) Hay : yi− y1 y1 yi y1 Ai = = Ai = Ti – Hoặc : Ai(%) = Ti(%) 100 Từ kết tính toán ta có: y1 y1 10 Đề án môn học Khoa Thống kê ú ta thy rõ xu hướng biến động bản.Trong du lịch người ta thường khơng tính phương pháp làm mt i tớnh thi v 2.Phơng pháp số trung bình trợt Số trung bình trợt (còn gọi số trung bình di động)là số trung bình cộng nhóm định mức độ dÃy số đợc tính cách lần lợt loại dần mức độ đầu đồng thời thêm vào mức độ cho tổng số lợng mức độ tham gia tính số trung bình không thay đổi Giả sử có dÃy sè thêi gian: y1, y2, …, yn -2, yn-1, yn Nếu tính trung bình trợt cho nhóm mức độ, ta sÏ cã: = y1 + y2+ y3 y 3= y + y 3+ y y … y (n-1) = y n−2 + y n−1 + y n Tõ ®ã ta cã d·y sè gồm số trung bình trợt y2, y3, yn-1 Việc lựa chọn nhóm mức độ để tính trung bình trợt đòi hỏi phải dựa vào đặc điểm biến động tợng số lợng møc ®é cđa d·y sè thêi gian NÕu sù biến động tợng tơng đối đặn số lợng mức độ dÃy số không nhiều tính trung bình trợt từ mức độ Nếu biến động tợng lớn dÃy số có nhiều mức độ tính trung bình trợt từ mức độ Trung bình trợt đợc tính từ nhiều mức độ có tác dụng san ảnh hởng nhân tố ngẫu nhiên Nhng mặt khác lại làm giảm số lợng mức độ dÃy trung bình trơt Cng giống phương pháp mở rộng khoảng cách thời gian, phương pháp khơng sử dụng phân tích biến ng du lch Phơng pháp hồi quy Trên sở dÃy số thời gian ngời ta tìm hàm hi quy tng quan (gọi phơng trình hồi quy) phản ánh biến động tợng qua thời gian có dạng tổng quát nh sau: 16 Đề án môn học Khoa Thống kê yt = f(t, a0, a1 , …, an) Trong ®ã: yt: møc ®é lý thuyÕt a0, a1, …, an : c¸c tham sè t: thứ tự thời gian Để lựa chọn đắn dạng phơng trình hồi quy đòi hỏi phải dựa vào phân tích đặc điểm biến động tợng qua thời gian đồng thời kết hợp với số phơng pháp đơn giản khác (nh dựa vào đồ thị, dựa vào độ tăng(giảm) tuyệt đối, dựa vào tốc độ ph¸t triĨn …vv) C¸c tham sè a i (i = 1, 2, 3, , n) thờng đợc xác định phơng pháp bình phơng nhỏ tức là: SSE = (yt - yt)2 Vµ SE = √ SSE n p Trong đó: n: số lợng mức độ dÃy số p: số lợng tham số hàm xu thÕ Mơ hình hồi quy theo thời gian tốt nht l mụ hỡnh cú SE Sau số dạng phơng trình hồi quy đơn giản thờng đợc sử dụng: 3.1 Mô hình hm xu thm xu dạng tuyÕn tÝnh y = a0 + a1t Mô hỡnh dng tuyn tớnh đơc sử dụng lợng tăng (giảm) tuyệt đối liên hoàn i xấp xỉ p dụng phơng pháp bình phơng nhỏ có hệ phơng trình sau để xác định giá trị cđa tham sè a0 vµ a1: {∑ y=na0+a1∑ t¿¿¿¿ Tõ bảng ta có hệ phơng trình: {20432,7=10a0+55a1 Giải ta đợc: a0 = 1133, 26 a1 = 165, 456 17 Đề án môn học Khoa Thống kê Do phơng trình đờng thẳng yt = 1133, 26 + 165, 456t Thay t vào phơng trình ta tìm đợc: SSE =(yt - yt)2 = 226007, 42 Và SSE n p SE = 3.2.Mô hình parabol = √ 226007 , 42 10−2 = 168, 08 yt = a0 + a1t + a2t2 Phơng trình parabol bậc hai đợc sử dụng sai phân bậc hai (tức sai phân sai phân bậc 1) xấp xỉ Các tham số a0, a1, a2, đợc xác định hệ phơng trình sau đây: 2 ty=a0 t+a1 t +a2 t ¿¿ ¿ {∑ y=na0+a1∑t+a2∑t ¿{∑ Từ bảng ta có hệ phơng trình: {20432,7=10a0+55a1+385a2{126030=5 a0+385a1+3025a2 Giải ta đợc: {a0=1313,65{a1=75,26 Hàm xu dạng bậc hai : yt = 1313, 65 + 75, 26t + 8, 2t2 Thay t vào phơng trình ta tìm đợc: SSE = 190501, Và SE = 190501,4 103 =164, 968 18 Đề án môn học Khoa Thống kê 3.3.Phơng trình hàm mũ yt = a0a1t Phơng trình hàm mũ đợc sủ dụng tốc độ phát triển liên hoàn xấp xỉ Các tham số a0 a1 đợc xác định hệ phơng trình sau đây: { lg y=n.lga0+lga1 t Từ bảng ta có hệ phơng trình sau đây: {32,937=10lga0+55lga1 Giải ta đợc: a0=1265, 03 va a1=1, 085 Hµm xu thÕ lµ: yt = 1265, 03.(1, 085)t Thay t vào phơng trình ta đợc: SSE = (yt - yt)2=193552, Vµ SE = √ 193552, 102 = 155, 54 Nh mô hình hồi quy mô hình hm m mô hình có SE nhỏ nhất.Vì ta chọn mô hình hm m yt Pt đờng thẳng (yt= 1133, 26 + 165, 456t) Pt parabol Pt hµm mị (yt=1313,65+75,26t+8, 2t ) 19 (yt = 1265, 03.(1, 085)t) Đề án môn häc Khoa Thèng kª (yt-yt)2 yt 2765, 08 1397, 11 2098, 556 1372, 81 462, 68 (yt-yt)2 yt (yt-yt)2 1351, yt 1298, 72 1607, 1464, 17 20457, 01 1496, 97 12150, 65 1489, 77 13788, 87 1715, 1629, 63 7391, 185 1613, 23 10479, 62 1616, 70 9780, 617 1520, 1795, 08 75616, 1745, 89 50981, 12 1754, 44 54917, 58 1781, 1960, 54 31947, 99 1894, 95 12802, 92 1903, 93 14914, 52 2140, 2125, 99 198, 923 2060, 41 6350, 496 2066, 14 5470, 23 2330, 2291, 45 1548, 265 2242, 27 7837, 561 2242, 17 7854, 568 2628, 2456, 91 29340, 95 2440, 53 35220, 03 2433, 20 38025 2429, 2622, 36 37119, 42 2655, 19 50845, 74 2640, 52 44443, 39 2927.9 2787, 82 19622, 41 2886, 25 1734, 723 2865, 49 3895, 133 226007, 42 190501, 193552, 3.4.Phơng pháp biểu biến ®éng thêi vơ Sù biÕn ®éng cđa mét sè hiƯn tỵng kinh tÕ – x· héi thêng cã tÝnh thêi vụ, nghĩa hàng năm, thời gian định biến động đợc lặp lặp lại Nguyên nhân gây biến động thời vụ ảnh hởng điều kiện tự nhiên (thời tiết, khí hậu) phong tục tập quán sinh hoạt dân c Biến động thời vụ làm cho hoạt động số ngành căng thẳng, khẩn trơng , lúc nhàn rỗi bị thu hẹp lại Nghiên cứu biến động thời vụ nhằm đề chủ tr ơng biện pháp phù hợp kịp thời hạn chế ảnh hởng biến động thời vụ sản xuất sinh hoạt xà hội Nhiệm vụ nghiên cứu thống kê dựa vào số liệu nhiêù năm (ít năm) để xác định tính chất mức độ biến động thời vụ.Phơng pháp thờng đợc sử dụng tính số thời vụ Trờng hợp biến động thời vụ qua thời gian định năm tơng đối ổn định tợng tăng (hoặc giảm) rõ rệt số thời vụ đợc tính theo công thức sau: `Ii = yi y 100 Trong ®ã : 20