1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

62 677 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai thác phần mềm Winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Tác giả Phùng Duy Ngọc
Người hướng dẫn TS. Nguyễn Trung Hoà
Trường học Trường Đại Học Vinh
Chuyên ngành Xác Suất Thống Kê Toán Học
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2009
Thành phố Vinh
Định dạng
Số trang 62
Dung lượng 2,1 MB

Nội dung

bộ giáo dục và đào tạo Trờng đại học vinh phùng duy ngọc Khai thác phần mềm Winstat để xử số liệu bằng phơng pháp phân tích hồi quy chuyên ngành: xác suất thống kê toán học chuyên ngành: xác suất thống kê toán học Mã số: 60.46.15 Mã số: 60.46.15 tóm tắt tóm tắt luận văn thạc sĩ toán học luận văn thạc sĩ toán học Vinh - 2009 2 MỞ ĐẦU Trong thời đại ngày nay, công nghệ thông tin đang trở thành nhân tố quan trọng cho sự phát triển kinh tế - xã hội. Việc khai thác và ứng dụng các phần mềm để phân tíchxử số liệu thống kê là rất bổ ích và thiết thực. Winstat là một trong những phần mềm đó. Nó là phần mềm bổ trợ cho Excel để phân tíchxử các số liệu thống kê. Phương pháp phân tích hồi quyphương pháp để xác định mức độ phụ thuộc của một lượng theo một hay nhiều đại lượng khác. Việc sử dụng phương pháp phân tích hồi quy và tương quan cho ta thấy được mối liên hệ giữa các yếu tố, thuộc tính của số liệu. Trên cơ sở đó, cùng với sự chỉ bảo và định hướng của TS. Nguyễn Trung Hoà, tác giả đã lựa chọn đề tài “Khai thác phần mềm Winstat để xử số liệu bằng phương pháp phân tích hồi quy” để nghiên cứu. Nội dung của luận văn bao gồm ba chương: Chương 1. Các kiến thức cơ sở. Chương này tác giả hệ thống những kiến thức cơ bản nhất về xác suất thống kê. Nó là công cụ để nghiên cứu tiếp chương sau. Chương 2. Phân tích hồi quy. Chương này trình bày lí thuyết mô hình phân tích Hồi quy đơn, Hồi quy đa thức, Hồi quy bội và các phương pháp phân tích và kiểm định các giả thiết thống kê. Chương 3. Phân tích hồi quy trong Winstat Chương này giới thiệu phần mềm Winstat, hướng dẫn cài đặt và sử dụng về phần mềm đó. Giới thiệu các gói lệnh phân tích hồi quy của phần mềm Winstat. Sử dụng các gói lệnh đó để phân tích ví dụ trong thực tiễn từ đó để đưa ra một số kết luận thống kê. Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn của TS. Nguyễn Trung Hoà. Tác giả xin được bày tỏ lòng biết ơn chân thành và sâu sắc nhất đến thầy - người đã đặt ra vấn đề và thường xuyên giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu. 3 Nhân dịp này, tác giả cũng xin chân thành cảm ơn các thầy cô giáo trong khoa Toán, khoa Sau đại học và các bạn học viên lớp cao học 15 - Xác suất thống kê đã thường xuyên giúp đỡ tác giả trong quá trình học tập và hoàn thành luận văn. Mặc dù có nhiều cố gắng, song luận văn không thể tránh được những thiếu sót, tác giả rất mong được những đóng góp quý báu từ các thầy cô giáo và các bạn. Vinh, tháng 12 năm 2009 Tác giả 4 Chương 1 CÁC KIẾN THỨC CƠ SỞ 1.1. Biến ngẫu nhiên và hàm phân phối 1.1.1. Biến ngẫu nhiên Giả sử ( ,Ω F, )P là một không gian xác suất. B là σ - đại số Borel trên đường thẳng thực R. Ánh xạ :X Ω → ¡ được gọi là biến ngẫu nhiên nếu với mọi B∈ B ( ) ( ) { } 1 : : .X B X B F ω ω − = ∈ ∈ Để dễ hình dung, ta hiểu một đại lượng (hay một biến) nhận các giá trị của nó với xác suất tương ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên. Các biến ngẫu nhiên được ký hiệu là , ,X Y Z hoặc 1 2 , , ., m Y Y Y ; 1 2 , , ., n X X X còn các giá trị có thể có của chúng được ký hiệu là ,x y hoặc 1 2 , , ., n x x x ; 1 2 , , ., m y y y . Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm một số hữu hạn điểm hoặc vô hạn đếm được. Khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc. Nếu tập các giá trị mà biến ngẫu nhiên lấp đầy một khoảng nào đó khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên liên tục. 1.1.2. Hàm phân phối Hàm phân phối xác suất của biến ngẫu nhiên X , ký hiệu là ( ) ,F x được xác định như sau ( ) ( ) , .F x P X x x R= < ∈ Tại một điểm x bất kỳ, giá trị của hàm ( ) F x chính là xác suất để biến ngẫu nhiên nhận giá trị nhỏ hơn x (hoặc bên trái x). 1.2. Các loại biến thường gặp trong xử thống kê Trong xử thống kê, khi xem xét một tổng thể nào đó theo các tính chất (thuộc tính của nó), người ta thường xem mỗi thuộc tính có mối liên hệ đến một hoặc 5 nhiều thuộc tính khác. Mỗi thuộc tính đó có thể được xem là một biến. Thông thường các biến được phân loại như sau. 1.2.1. Biến định lượng Thông thường các số đo đều là biến định lượng. Biến định lượng có thể chia thành các loại - Biến nhận các giá trị thực liên tục: Các biến có thể có giá trị là một số thực nào đó nằm trong một đoạn thẳng trên một trục số. Ví dụ: Cân nặng, chiều cao, nồng độ … - Biến nhận giá trị thực rời rạc: Các biến có tập giá trị là tập hữu hạn các số thực. Ví dụ: Mức lương, loại giá vé xe… Biến nhận các giá trị nguyên, như: Tuổi, số người… 1.2.2. Biến định tính Thường biến định tính xác định tính chất nào đó của đối tượng nghiên cứu, giá trị của các biến thường không phải là các số. Ví dụ: Giới tính, lí do vay mượn, quan điểm về một vấn đề…là các biến định tính. Biến định tính được chia làm hai loại. - Biến định tính có thứ tự là biến mà các giá trị của nó có khả năng được sắp xếp theo một thứ tự nào đó, biểu thị mức độ quan trọng khác nhau của các giá trị đó. Ví dụ: Nhà cửa, nguồn nước sử dụng… - Biến định tính không có thứ tự là biến mà các giá trị có thể của nó không được xếp theo thứ tự hơn kém. Ví dụ: Dân tộc, tôn giáo… 1.2.3. Biến độc lập Biến độc lập còn gọi là biến mô tả, xuất hiện trong các công thức biểu diễn của mô hình, hoặc dùng để thể hiện các đặc trưng mang tính nguyên nhân của hiện tượng, hoặc có tác động vào quá trình đang được nghiên cứu. 1.2.3. Biến phụ thuộc Biến phụ thuộc còn gọi là biến được mô tả thể hiện kết quả của hiện tượng, thường nằm ở vế phải của công thức, là đối tượng chính, mục tiêu của công việc nghiên cứu. Chú ý: * Sự phân biệt giữa các loại biến đó cũng có tính tương đối, tuỳ thuộc vào 6 mục đích của vấn đề và ý đồ của người nghiên cứu mà một biến ở chỗ này được xem là biến định lượng mà ở nơi khác có thể được cho là biến định tính. Ví dụ: “Đồ đạc tiện nghi trong gia đình” là biến định tính nếu xét dưới góc độ xem xét chất lượng đời sống sinh hoạt, song lại là một biến định lượng khi muốn xác định tài sản gia đình. Một biến định tính lúc này không được xem là có thứ tự, lúc khác lại được xem là có thứ tự. * Trong mô hình nhiều mức, một biến có thể vừa là biến phụ thuộc, vừa là biến độc lập.Ví dụ: “chi tiêu cho ăn uống hàng ngày” là biến “được mô tả” (biến phụ thuộc) nếu xét trong mối quan hệ với các yếu tố thu nhập và điều kiện sống, song lại là biến “dùng để mô tả” (biến độc lâp) khi muốn biểu diễn ảnh hưởng của nó đến sức khoẻ của các thành viên trong gia đình. * Các loại biến vừa nêu trên có thể là tất định, có thể mang yếu tố ngấu nhiên và trong luận văn này ta giới hạn việc xem xét các loại biến đó là biến ngẫu nhiên hoặc qua một phép biến đổi đơn giản chúng được quy về một biến ngẫu nhiên. 1.3. Mẫu ngẫu nhiên và mẫu quan sát 1.3.1. Khái niệm về mẫumẫu ngẫu nhiên Định nghĩa: Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n biến ngẫu nhiên 1 2 , , ., n X X X độc lập, có cùng phân phối xác suất với ,X kí hiệu là: ( ) 1 2 , , ., n W X X X= . • Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc. • Các biến ngẫu nhiên i X được gọi là các bản sao của .X • Phương pháp nghiên cứu không toàn bộ là phương pháp nghiên cứu thông qua mẫu ngẫu nhiên và mẫu quan sát. 1.3.2. Mẫu quan sát Mẫu quan sát ( ) 1 2 , , ., n W x x x= là một thể hiện cụ thể của mẫu ngẫu nhiên hay nó là tập hợp các số liệu quan sát cụ thể về một biến ngẫu nhiên gọi tắt là các số liệu thực nghiệm. 7 Bảng phân phối tần số thực nghiệm: k 1 x 2 x … i x . k x n 1 n 2 n … i n … k n • i x là giá trị phân biệt thứ i của các quan sát • i n là số lượng các quan sát nhận giá trị tương ứng • Bảng trên được gọi là bảng mẫu thu gọn. Bảng phân phối tần số ghép lớp: k 1 y 2 y i y k y n 1 n 2 n … i n … k n Trong đó: • 1i i y y h + − = (không đổi) • i n là số các giá trị quan sát thuộc nửa khoảng ; 2 2 i i h h y y   − +   . 1.4. Thống kê và một số thống kê đặc trưng của mẫu ngẫu nhiên 1.4.1. Thống kê Thống kê là một hàm ( ) 1 2 , , ., n G f X X X= của các biến ngẫu nhiên. Một thống kê cũng là một biến ngẫu nhiên. Giá trị cụ thể của hàm G tương ứng với tập giá trị quan sát ( ) 1 2 , , ., n x x x là số ( ) 1 2 , , ., n Gqs f x x x= nó là một thể hiện của thống kê G , thu được từ mẫu quan sát (số liệu) về biến ngẫu nhiên gốc X và được gọi là giá trị quan sát của thống kê G . 1.4.2. Thống kê trung bình mẫu Giả sử ( ) 1 2 , , ., n W X X X= là mẫu ngẫu nhiên, khi đó trung bình mẫu của mẫu ngẫu nhiên W là thống kê. 1 1 . n i i X X n = = ∑ 8 Vì mỗi i X là một bản sao của biến ngẫu nhiên gốc X nên chúng đều có cùng kỳ vọng và phương sai với ,X do đó thống kê trung bình mẫu X là một biến ngẫu nhiên có kỳ vọng và phương sai mẫu tương ứng là: 1 1 1 1 1 n n i i i i E X E X EX n n n n µ µ = =   = = = =  ÷   ∑ ∑ 2 2 2 2 2 1 1 1 1 1 n n i i i i DX D X DX n n n n n σ σ = =   = = = =  ÷   ∑ ∑ Với mẫu quan sát ( ) 1 2 , , ., n W X X X= và nếu: x i 1 x 2 x 3 x … x k n i 1 n 2 n 3 n … n k là bảng thu gọn thì trung bình mẫu quan sát sẽ được tính theo công thức: 1 1 k qs i i i X x n x n = = = ∑ Trung bình mẫu quan sát là số cụ thể, là một thể hiện của trung bình mẫu. 1.4.3. Phương sai mẫu 2 S và *2 S - Phương sai mẫu 2 S Là thống kê trong trường hợp kỳ vọng của X chưa biết và được xác định bởi: ( ) 2 2 1 1 1 n i i S X X n = = − − ∑ 2 S cũng là một biến ngẫu nhiên. Nếu biến ngẫu nhiên gốc X có phương sai 2 σ thì phương sai mẫu 2 S có kỳ vọng ( ) 2 2 E S σ = với mẫu quan sát tương ứng ( ) 1 2 , , ., n W X X X= và nếu chúng được thu gọn dưới dạng: x i 1 x 2 x 3 x … x k n i 1 n 2 n 3 n … n k 9 thì giá trị quan sát của phương sai mẫu được tính bởi: ( ) 2 2 1 1 1 k i i i S n x x n = = − − ∑ - Phương sai *2 S Là thống kê trong trường hợp kỳ vọng của X bằng µ đã biết và được xác định bởi: ( ) 2 2 1 1 n i i S X n µ ∗ = = − ∑ 2 S ∗ cũng là một biến ngẫu nhiên. Phương sai mẫu 2 S ∗ có kỳ vọng ( ) 2 2 E S σ ∗ = . Với mẫu quan sát tương ứng ( ) 1 2 , , ., n W x x x= và nếu chúng được thu gọn dưới dạng: i x 1 x 2 x 3 x … k x i n 1 n 2 n 3 n … k n 10

Ngày đăng: 19/12/2013, 10:40

HÌNH ẢNH LIÊN QUAN

Bảng phân phối tần số thực nghiệm: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Bảng ph ân phối tần số thực nghiệm: (Trang 8)
Bảng số liệu là điểm các môn thi tốt nghiệp của 299 học sinh (Lê Lợi có 168 học sinh, Lam kinh có 231 học sinh), năm học 2008-2009 của hai trường Lê Lợi và Lam Kinh. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy
Bảng s ố liệu là điểm các môn thi tốt nghiệp của 299 học sinh (Lê Lợi có 168 học sinh, Lam kinh có 231 học sinh), năm học 2008-2009 của hai trường Lê Lợi và Lam Kinh (Trang 52)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w