Chương 2: Phân tích dữ liệu mô tả với các công cụ phân tích dữ liệu
2.2.3. Tổ chức và trình bày nhiều biến
Hình dung hai biến số cùng nhau có thể tiết lộ các mối liên hệ có thể giữa hai biến và làm cơ sở cho việc áp dụng các phương pháp thảo luận trong phân tích. Để hình dung ra hai biến số, bạn phải xây dựng biểu đồ phân tán. Đối với trường hợp đặc biệt, trong đó một trong hai biến tượng trưng cho sự trôi qua của thời gian, bạn sẽ xây dựng một chuỗi thời gian.
Một biểu đồ phân tán tìm hiểu mối quan hệ có thể có giữa hai biến số bằng cách vẽ các giá trị của một biến số trên trục ngang, hoặc X, và các giá trị của một biến số thứ hai trên trục dọc, hoặc Y. Ví dụ: nhà phân tích thị trường có thể nghiên cứu tính hiệu quả của quảng cáo bằng cách so sánh chi phí quảng cáo và doanh thu của 50 cửa hàng bằng cách sử dụng trục X để đại diện cho chi phí quảng cáo và trục Y đại diện cho doanh thu bán hàng.
Hình 2.2.3A
Biểu đồ một chuỗi thời gian các giá trị của một biến số trên trục Y và vẽ ra khoảng thời gian liên quan đến mỗi giá trị số trên trục X. Một chuỗi thời gian có thể giúp bạn hình dung xu hướng dữ liệu diễn ra theo thời gian.
Hình 2.2.3B
Trình bày « dữ liệu thuyết phục », nhiều người thêm vào các yếu tố hình ảnh khác với chính dữ liệu để cố gắng nâng cao khả năng hiển thị. Mặc dù việc sử dụng hợp lý các yếu tố
thị giác có thể tạo ra một hình ảnh dễ nhớ hơn hoặc chuyển tải nhanh một điểm quan trọng về dữ liệu, nhưng nhiều yếu tố bổ sung thêm vào làm các yếu tố không truyền đạt được bất kỳ thông tin hữu ích hoặc che khuất những điểm quan trọng về dữ liệu . Các yếu tố mà sau này được gọi là chartjunk.
Hình 2.2.3C
Một bảng đa chiều ngẫu nhiên đáp ứng các câu trả lời của ba biến phân loại hoặc nhiều hơn. Trong trường hợp đơn giản nhất của ba biến phân loại, mỗi ô trong bảng chứa các số liệu của biến, được tổ chức bởi các nhóm con đại diện bởi các biến hàng và cột.
Hình 2.2.3D