Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 46 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
46
Dung lượng
13,58 MB
Nội dung
BÀI TẬP THỰC HÀNH NHĨM THỐNG KÊ MƠ TẢ Phần mềm sử dụng: Stata STT Họ tên MSSV Mức độ đóng góp (%) Hồ Hải Âu K214071766 100 Nguyễn Hồ Ngọc Trâm K214100728 100 Phạm Thị Bích Hạnh K214100680 100 Tống Thị Diễm Trinh K214100730 100 Nguyễn An Quỳnh K214100715 100 BÀI LÀM a Tải liệu Car Sales đường link LMS b Mô tả liệu: Mô tả liệu: gồm biến? quan sát? Dữ liệu biến định tính hay định lượng? Nếu định lượng > liên tục hay rời rạc Dữ liệu biến thu thập theo thang đo nào? Các liệu thu thập theo đơn vị gì? + Số biến: 15, Số quan sát: 157 Liên tục / Thang đo Rời rạc Tên biến Tính chất Sales_in_thousands Định lượng Liên tục Tỉ lệ Chiếc Price_in_thousands Định lượng Liên tục Tỉ lệ dollar Engine_size Định lượng Liên tục Tỉ lệ Cubic Centimeters (cc) Horsepower Định lượng Rời rạc Tỉ lệ kW Wheelbase Định lượng Liên tục Tỉ lệ cm Width Định lượng Liên tục Tỉ lệ cm Length Định lượng Liên tục Tỉ lệ cm Curb_weight Định lượng Liên tục Tỉ lệ kg Fuel _ Capacity Định lượng Rời rạc Tỉ lệ liter Fuel_efficiency Định lượng Rời rạc Tỉ lệ liter Power_perf_factor Định lượng Liên tục Tỉ lệ Manufacturer Định tính Định danh Model Định tính Định danh Vehicle _ Type Định tính Định danh Latest _ Launch Định lượng Liên tục Đơn vị Tỉ lệ * Note: i Biến liên tục (continuous variable) biến số nhận giá trị ii khoảng định Biến rời rạc (discrete variable) biến số nhận giá trị nguyên Mã hóa lại thuộc tính biến định tính số (chẳng hạn: 1, 2, 3, - …) Manufacturer: • tostringManufacturerMH,gen(Manufacturerer) • Model: tostring ModelMH,gen(Modelly) - Vehicle_Type: • tostring Vehicle_typeMH,gen(Vehicle_typel) → Biểu đồ biểu thị tần suất Width, Mode biểu đồ nằm khoảng từ 70 đến 75 giá trị xuất thường xuyên rơi vào khoảng biên bên trái biểu đồ • histogram Length, frequency normal ytitle(Frequency) xtitle(Length) title(Length) (bin=12, start=149.4, width=6.2583333) → Biểu đồ biểu thị tần suất Length, Mode biểu đồ nằm khoảng từ 175 đến 195 giá trị xuất thường xuyên rơi vào khoảng biên biểu đồ • histogram Wheelbase, frequency normal ytitle(Frequency) xtitle(Wheelbase) title(Wheelbase) (bin=12, start=92.6, width=3.8416667) → Biểu đồ biểu thị tần suất Wheelbase, Mode biểu đồ nằm khoảng từ 100 đến 110 giá trị xuất rơi vào vùng biên bên phải biểu đồ Giá trị chiều dài sở thường nằm khoảng 100 đến 110 cm • • Phát Missing value (nếu có) ssc install mdesc mdesc - Xác định vị trí Missing values: Tính tốn trị thống kê mô tả đặc trưng tất biến có liệu → Từ đó, nhận xét hình dáng phân phối liệu biến trên? - Tính Mode biến: - Tính trị thống kê khác: → Nhận xét hình dáng phân phối liệu biến trên: + Price In Thousands: Dữ liệu lệch phải (Mean > Med (27,39075 > 22,799)) + Engine Size: Dữ liệu lệch phải (Mean > Med > Mode (3,060897 > > 2)) + Horsepower: Dữ liệu lệch phải (Mean > Med > Mode (185,9487 > 177,5 > 150 v 170)) + Wheelbase: Dữ liệu lệch phải + Width: Dữ liệu lệch phải ( Mean > Med (71,15 > 70,55)) + Length: Dữ liệu gần không lệch ( Mean, Med, Mode xấp xỉ nhau) + Curb Weight: Dữ liệu lệch phải (Mean > Med > Mode (3,378026 > 3,343 > 2,769 v 2,998)) + Fuel Capacity: Dữ liệu lệch phải + Fuel Efficiency: Dữ liệu lệch trái ( Mean < Med < Mode (23,84416 < 24 < 25)) + Power Perf Factor: Dữ liệu lệch phải (Mean > Med > Mode (77,04359 > 72,03092 > 52,085)) + Sales in Thousands: Dữ liệu lệch phải (Mean > Med (52,99808 > 29,45)) ... Missing values: Tính tốn trị thống kê mơ tả đặc trưng tất biến có liệu → Từ đó, nhận xét hình dáng phân phối liệu biến trên? - Tính Mode biến: - Tính trị thống kê khác: → Nhận xét hình dáng... (19) có giá thấp từ đến 20 - Giá kiểu mẫu dao động phổ biến khoảng từ đến 31 Dùng đồ thị phù hợp mô tả tất biến có liệu cho nhận xét • graph pie, over(Vehicle_typel) title(Vehicle_type) → Biểu đồ... tostring ModelMH,gen(Modelly) - Vehicle_Type: • tostring Vehicle_typeMH,gen(Vehicle_typel) c Mơ tả biến liệu Lập bảng tần số biến sau: Manufacturer; Vehicle Type; Model → Nhận xét chi tiết bảng