Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
14,72 MB
Nội dung
BÀI TẬP THỰC HÀNH NHĨM THỐNG KÊ MƠ TẢ Phần mềm sử dụng: Stata STT BÀI LÀM a Tải liệu Car Sales đường link LMS b Mô tả liệu: Mô tả liệu: gồm biến? quan sát? Dữ liệu biến định tính hay định lượng? Nếu định lượng > liên tục hay rời rạc Dữ liệu biến thu thập theo thang đo nào? Các liệu thu thập theo đơn vị gì? + Số biến: 15, Số quan sát: 157 Tên biến Sales_in_thousands Price_in_thousands Engine_size Horsepower Wheelbase Width Length Curb_weight Fuel _ Capacity Fuel_efficiency Power_perf_factor Manufacturer Model Vehicle _ Type Latest _ Launch * Note: i Biến liên tục (continuous variable) biến số nhận giá trị khoảng định ii Biến rời rạc (discrete variable) biến số nhận giá trị nguyên Mã hóa lại thuộc tính biến định tính số (chẳng hạn: 1, 2, 3,…) - Manufacturer: tostringManufacturerMH,gen(Manufacturerer) - Model: tostring ModelMH,gen(Modelly) - Vehicle_Type: • tostring Vehicle_typeMH,gen(Vehicle_typel) → Biểu đồ biểu thị tần suất Width, Mode biểu đồ nằm khoảng từ 70 đến 75 giá trị xuất thường xuyên rơi vào khoảng biên bên trái biểu đồ histogram Length, frequency normal ytitle(Frequency) xtitle(Length) title(Length) (bin=12, start=149.4, width=6.2583333) → Biểu đồ biểu thị tần suất Length, Mode biểu đồ nằm khoảng từ 175 đến 195 giá trị xuất thường xuyên rơi vào khoảng biên biểu đồ histogram Wheelbase, frequency normal ytitle(Frequency) xtitle(Wheelbase) title(Wheelbase) (bin=12, start=92.6, width=3.8416667) → Biểu đồ biểu thị tần suất Wheelbase, Mode biểu đồ nằm khoảng từ 100 đến 110 giá trị xuất rơi vào vùng biên bên phải biểu đồ Giá trị chiều dài sở thường nằm khoảng 100 đến 110 cm Phát Missing value (nếu có) ssc install mdesc mdesc - Xác định vị trí Missing values: Tính tốn trị thống kê mô tả đặc trưng tất biến có liệu → Từ đó, nhận xét hình dáng phân phối liệu biến trên? - Tính Mode biến: - Tính trị thống kê khác: → Nhận xét hình dáng phân phối liệu biến trên: + Price In Thousands: Dữ liệu lệch phải (Mean > Med (27,39075 > 22,799)) + Engine Size: Dữ liệu lệch phải (Mean > Med > Mode (3,060897 > > 2)) + Horsepower: Dữ liệu lệch phải (Mean > Med > Mode (185,9487 > 177,5 > 150 v 170)) + Wheelbase: Dữ liệu lệch phải + Width: Dữ liệu lệch phải ( Mean > Med (71,15 > 70,55)) + Length: Dữ liệu gần không lệch ( Mean, Med, Mode xấp xỉ nhau) + Curb Weight: Dữ liệu lệch phải (Mean > Med > Mode (3,378026 > 3,343 > 2,769 v 2,998)) + Fuel Capacity: Dữ liệu lệch phải + Fuel Efficiency: Dữ liệu lệch trái ( Mean < Med < Mode (23,84416 < 24 < 25)) + Power Perf Factor: Dữ liệu lệch phải (Mean > Med > Mode (77,04359 > 72,03092 > 52,085)) + Sales in Thousands: Dữ liệu lệch phải (Mean > Med (52,99808 > 29,45)) ...BÀI LÀM a Tải liệu Car Sales đường link LMS b Mô tả liệu: Mô tả liệu: gồm biến? quan sát? Dữ liệu biến định tính hay định lượng?... Missing values: Tính tốn trị thống kê mô tả đặc trưng tất biến có liệu → Từ đó, nhận xét hình dáng phân phối liệu biến trên? - Tính Mode biến: - Tính trị thống kê khác: → Nhận xét hình dáng... có giá thấp từ đến 20 - Giá kiểu mẫu dao động phổ biến khoảng từ đến 31 3 Dùng đồ thị phù hợp mô tả tất biến có liệu cho nhận xét graph pie, over(Vehicle_typel) title(Vehicle_type) → Biểu đồ