Ví dụ về giá trị trung bình, trung vị và range

Một phần của tài liệu PHÂN TÍCH DỮ LIỆU THỐNG KÊ VÀ PYTHON (Trang 50 - 56)

3. Khai phá dữ liệu trong Excel

1.2.1 Ví dụ về giá trị trung bình, trung vị và range

Sử dụng Python để tính giá trị trung bình (trung bình), trung vị, mode và range cho dữ liệu: 13, 18, 13, 14, 13, 16, 14, 21, 13.

51

Để hoàn thành nhiệm vụ này, trước tiên chúng ta cần tạo một danh sách. Chương trình 4-2: Tạo danh sách các số.

Nếu ta chạy mã trên (shift và enter), thì sẽ tạo danh sách số, với một biến được gọi là a.

Hình 4.3 đến 4.5 hiển thị ảnh chụp nhanh của 3 màn hình khác nhau trong Spyder.

Mã đã được chạy.

Nhấp vào biến để xem kết quả.

52

Chương trình 4-3. Tính toán giá trị trung bình

np.mean(a)

np, biểu thị rằng chúng ta cần sử dụng thư viện numpy, để tính giá trị trung bình.

Phần thứ hai, mean (a), nói với Python rằng chúng ta muốn giá trị trung bình của biến.

a. Chúng ta phải sử dụng các dấu khi dùng lệnh mean(a).

Thông báo lỗi không có gì đáng sợ và đôi khi có thể hữu ích. Nếu mọi người đều hoàn hảo về Python, thì sẽ không cần thông báo lỗi. Trong hình 4.6, một lỗi đã được tạo ra làm ví dụ. Sửa mã và sử dụng dấu ngoặc.

53

Sử dụng phần bảng điều khiển, chúng ta có thể xem mã đã được chạy, cùng với kết quả, 15.0, khớp với kết quả Excel của chúng ta. Trong Excel, ta đã sử dụng lệnh trung bình, giống như trong Python. Trung vị sẽ được tính tiếp theo (vì numpy không tính chế độ). Có thể thấy trong chương trình 4-4, mã rất giống với việc tính giá trị trung bình.

Chương trình 4-4: Tính giá trị trung bình.

np.mean(a)

Trung vị được hiển thị là 14. Cuối cùng, chúng ta sẽ tính toán range. Trong phần 1.3, chúng ta đã trình bày lệnh Excel dưới dạng:

= Max (range) – Min (range).

Chúng ta sửa đổi điều này một chút và viết nó trong Chương trình Python 4-5:

Tính range trong Python: np.max(a) – np.min(a).

54

Giai đoạn tiếp theo liên quan đến việc tính toán mode, độ lệch chuẩn và phương sai. Điều này liên quan đến việc sử dụng một thư viện mới, số liệu thống kê.

55

Bây giờ chúng ta đã tạo lại thống kê Excel của mình bằng Python. Lựa chọn sử dụng Python thay vì Excel cho các thống kê cơ bản chủ yếu mang tính cá nhân, cuốn sách này được thiết kế chỉ để cung cấp nền tảng của thống kê ứng dụng.

56

Một phần của tài liệu PHÂN TÍCH DỮ LIỆU THỐNG KÊ VÀ PYTHON (Trang 50 - 56)

Tải bản đầy đủ (PDF)

(147 trang)