subject applied statistics for business mas202 group assignment

11 4 0
Tài liệu đã được kiểm tra trùng lặp
subject applied statistics for business mas202 group assignment

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

5.3 Phát biểu những kĩ năng học được thông qua việc làm dự án...11TOPIC: Predict Housing PricesPhần 1: Introduction1.1 Giới thiệu về dân số quan tâm populationDân số quan tâm là các căn

Trang 1

Subject: Applied Statistics For Business (MAS202)GROUP ASSIGNMENT

Giảng viên: TS Nguyễn Việt Anh

Thành viên: Nguyễn Diệp Hoài Đinh THị Hải Anh Đỗ Đức Vĩnh

Trang 2

MỤC LỤC

Phần 1: Introduction 3

1.1 Giới thiệu về dân số quan tâm (population) 3

1.2 Giới thiệu về những tham số quan tâm (parameter) 3

1.3 Giới thiệu cụ thể các bài toán, nêu lý do quan tâm đến bài toán 3

1.4 Tóm tắt kết quả 3

Phần 2: Thu thập dữ liệu mẫu 3

2.1 Nêu cách lấy dữ liệu, trích dẫn nguồn dữ liệu 3

2.2 Giải thích tại sao dữ liệu này là hợp lý cho bài toán 4

2.3 Đính kèm link file Excel chứa dữ liệu (và tính toán) 4

Phần 3: Mô tả dữ liệu mẫu 4

3.1 Tính các thống kê quan trọng: trung bình, độ lệch chuẩn, Q1, Q2, Q3 4

3.2 Vẽ các biểu đồ thích hợp để tổng kết dữ liệu mẫu: biểu đồ cột, biểu đồ hộp,… 4

Phần 4: Tính toán và kết luận 6

Bài toán 1: Tìm khoảng tin cậy 6

a) Xây dựng khoảng tin cậy 95% cho giá nhà trung bình tại King Country, Hoa Kỳ 6

b) Xây dựng khoảng tin cậy 95% cho diện tích nhà trung bình tại King Country, Hoa Kỳ 6

Bài toán 2: Kiểm định giả thuyết 7

a) Với mức ý nghĩa 5%, có bằng chứng nào cho thấy có sự khác biệt về giá nhà của căn nhàcó 2 phòng ngủ và căn nhà có 3 phòng ngủ không? 7

b) Với mức ý nghĩa 5%, có bằng chứng nào cho thấy có sự khác biệt về diện tích của căn nhà có 2 phòng ngủ và căn nhà có 3 phòng ngủ không? 8

Bài toán 3: Hồi quy tuyến tính 8

a) Xác định hai biến X và Y 9

b) Xây dựng biểu đồ phân tán 9

c) Hệ số tương quan mẫu 9

d) Phương trình hồi quy tuyến tính 10

e) Kiểm tra độ dốc trong hồi quy 10

Phần 5: Lời kết 10

5.1 Tổng kết kết quả 10

5.2 Phát biểu lại ý nghĩa của dự án 10

Trang 3

5.3 Phát biểu những kĩ năng học được thông qua việc làm dự án 11

TOPIC: Predict Housing Prices

Phần 1: Introduction

1.1 Giới thiệu về dân số quan tâm (population)

Dân số quan tâm là các căn nhà tại King Country, Hoa Kỳ

1.2 Giới thiệu về những tham số quan tâm (parameter)

 Giá nhà_Đô la Diện tích_Square Feet

1.3 Giới thiệu cụ thể các bài toán, nêu lý do quan tâm đến bài toán

 Ước lượng Giá nhà và Diện tích trung bình của nhà ở tại King Country, Hoa Kỳ. Kiểm định xem có sự khác biệt về Giá nhà và Diện tích của nhà có 2 phòng ngủ

Phần 2: Thu thập dữ liệu mẫu

2.1 Nêu cách lấy dữ liệu, trích dẫn nguồn dữ liệu

Sử dụng hàm INDEX trong Excel lấy ngẫu nhiên 400 căn nhà trong tổng số nhà của KingCountry, Hoa Kỳ.

Trang 4

Nguồn dữ liệu: Predict Housing Prices - Simple Linear Regression | KaggleTác giả: MAYANK SRIVASTAVA.

Cập nhật vào tháng 03/2017.

2.2 Giải thích tại sao dữ liệu này là hợp lý cho bài toán

Diện tích là một trong những yếu tố quan trọng ảnh hưởng đến giá nhà cùng với các yếu tố khác như vị trí, tiện ích xung quanh, chất lượng xây dựng, trạng thái thị trường bất động sản, và các yếu tố kinh tế, chính trị, xã hội Hiểu được mối quan hệ này có thể giúp nhà đầu tư, các chủ sở hữu bất động sản, các nhà phát triển bất động sản và người mua bán nhà định giá chính xác hơn, tăng tính khả thi và hiệu quả của các quyết định liên quan đến bất động sản.

2.3 Đính kèm link file Excel chứa dữ liệu (và tính toán)

Phần 3: Mô tả dữ liệu mẫu

3.1 Tính các thống kê quan trọng: trung bình, độ lệch chuẩn, Q1, Q2, Q3

Công thức:Trung bình : = =

Phương sai mẫu:

Trang 5

Biểu đồ cho thấy giá nhà của dân số tập trung nhiều nhất trong khoảng từ 153,000đến 323,000 Đô la Và tập trung ít nhất trong khoảng từ 2,703,000 đến 2,873,000Đô la.

 Diện tích

Trang 6

Biểu đồ cho thấy diện tích của dân số tập trung nhiều nhất trong khoảng từ 1400đến 1820 Sqft Và ít tập trung ít nhất trong khoảng từ 5180 đến 5600 Sqft.

Phần 4: Tính toán và kết luận

Bài toán 1: Tìm khoảng tin cậy

a) Xây dựng khoảng tin cậy 95% cho giá nhà trung bình tại King Country, Hoa Kỳ.

Dữ liệu mẫu là giá nhà của 400 căn nhà ngẫu nhiên trong tổng số căn nhà tại King Country,Hoa Kỳ.

= 519954.1275; s = 361168.9219; n = 400; df = n-1 = 400-1= 399.1- α = 0.95 => α = 0.05 => = 0.025 => = = 1.9659

Vì σ không biết, nên chúng tôi sử dụng s (độ lệch chuẩn mẫu).

Vì mẫu lớn (n = 400 > 30) Phân phối lấy mẫu của giá trị trung bình là phân phối chuẩnSử dụng Phân phối Student’s t.

Ước tính khoảng tin cậy:

Kết luận: Với độ tin cậy 95%, chúng tôi tin rằng giá nhà trung bình tại King Country, Hoa Kỳ

nằm trong khoảng từ 484453.0285 đến 555455.2265 Đô la.

Trang 7

b) Xây dựng khoảng tin cậy 95% cho diện tích nhà trung bình tại King Country, Hoa Kỳ.

Dữ liệu mẫu là giá nhà của 400 căn nhà ngẫu nhiên trong tổng số căn nhà tại King Country,Hoa Kỳ.

= 2078.035; s = 877.3833; n = 400; df = n-1 = 400-1= 399.1- α = 0.95 => α = 0.05 => = 0.025 => = = 1.9659Vì σ không biết, nên chúng tôi sử dụng s (độ lệch chuẩn mẫu).

Vì mẫu lớn (n = 400 > 30) Phân phối lấy mẫu của giá trị trung bình là phân phối chuẩnSử dụng Phân phối Student’s t.

Ước tính khoảng tin cậy:

Kết luận: Với độ tin cậy 95%, chúng tôi tin rằng diện tích nhà trung bình của tại King Country,

Hoa Kỳ nằm trong khoảng từ 1991.7926 đến 2164.2774 Sqft.

Bài toán 2: Kiểm định giả thuyết

Đặt: : = =

a) Với mức ý nghĩa 5%, có bằng chứng nào cho thấy có sự khác biệt về giá nhà của căn nhà có 2 phòng ngủ và căn nhà có 3 phòng ngủ không?

= 68592946268.631 T statistic là:

Trang 8

= = = -2.45

Critical Value = = = = 1.9659Ta có: < - ➪ Bác bỏ H0.

Kết luận: Với mức ý nghĩa 5%, có đủ bằng chứng cho thấy có sự khác biệt về giá nhà của căn

= 346646.101 T statistic là:

= = = -9.848

Critical Value = = = = 1.9659Ta có: < - ➪ Bác bỏ H0.

Kết luận: Với mức ý nghĩa 5%, có đủ bằng chứng cho thấy có sự khác biệt về diện tích của căn

nhà có 2 phòng ngủ và căn nhà có 3 phòng ngủ.

Bài toán 3: Hồi quy tuyến tính

TA CÓ: = 5.17725E+11 = 207981651

Trang 9

= 831214= 1.60188E+14= 2034442550

SSXY=- = 5.17725E+11- = 85531424894

SSX= - = 2034442550 - = 307150765.5

= = = 519954.1275 = = =

= = = 278.467

= - = 519954.1275- 278.467 = -58710.5365

a) Xác định hai biến X và Y

Biến độc lập (X) = Square feet.

Biến phụ thuộc (Y) = giá nhà tính bằng đô la.

b) Xây dựng biểu đồ phân tán

c) Hệ số tương quan mẫu

R Square = 45.76%

Trang 10

Hồi quy có mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc 45.76% sự thay đổi củagiá nhà được giải thích là do sự thay đổi của đơn vị Square Feet.

d) Phương trình hồi quy tuyến tính

Dựa trên dữ liệu từ Excel, chúng ta có phương trình hồi quy là: = + = -58710.5365 + 278.467X

Ở đây, b1 = 278.467 cho chúng ta biết rằng giá trị trung bình của một ngôi nhà tăng trung bình$278.467 khi diện tích tăng thêm một Square foot.

e) Kiểm tra độ dốc trong hồi quy

Có mối quan hệ tuyến tính giữa X và Y không? H0: β1 = 0 (không có mối quan hệ tuyến tính) H1: β1 ≠ 0 (tồn tại mối quan hệ tuyến tính)

p-value = 7.878E-55< 0,05 (mức ý nghĩa) → Bác bỏ giả thuyết H0.

Kết luận: Có đầy đủ bằng chứng cho thấy diện tích ảnh hưởng đến giá nhà Nhà có diện tích

5.2 Phát biểu lại ý nghĩa của dự án

Nghiên cứu mối quan hệ giữa giá nhà và diện tích giúp cho người mua, người bán và nhà đầu tư trong lĩnh vực bất động sản hiểu rõ hơn về tình hình thị trường bất động sản, từ đó đưa ra quyết định mua bán hoặc đầu tư thông minh hơn Đối với người mua, nghiên cứu này giúp họ đánh giá được giá trị thực của căn nhà mình đang quan tâm Đối với người bán, nghiên cứu giúp họ đưa ra quyết định về giá cả và cách thức tiếp cận thị trường bất động sản Đối với nhà đầu tư, nghiên cứugiúp họ hiểu rõ hơn về tình hình thị trường, đưa ra quyết định về đầu tư bất động sản theo hướng đúng và có lợi.

Trang 11

5.3 Phát biểu những kĩ năng học được thông qua việc làm dự án.

Ngày đăng: 08/05/2024, 12:46

Tài liệu cùng người dùng

Tài liệu liên quan