Biểu đồ phân tán được vẽ trên trục tọa độ nhằm biểu thị mối quan hệ giữa hai đại lượng. Công cụ này được sử dụng để đánh giá mối quan hệ nhân quả, hay mối tương quan một-một, hay mối tương quan một-nhiều giữa các đại lượng được quan tâm, dựa vào hình dạng tạo thành từ các điểm dữ liệu trên biểu đồ. Một số ví dụ có thể sử dụng biểu đồ phân tán như: số điểm ngập trong thành phố (giá trị y) so với lượng mưa (giá trị x), số lượng kem bán ra so với nhiệt độ môi trường, số lượng cảnh sát so với tỷ lệ tội
phạm, hay số lượng học sinh giỏi so với thu nhập của gia đình học sinh, v.v...
Hình 32 đến Hình 35 giới thiệu cho chúng ta một số dạng biểu đồ phân tán phổ biến và tương quan giữa các đại lượng được so sánh.
Giá trị x
Hình 32. Ví dụ về biểu đồ phân tán có tương quan thuận, x tăng thì y tăng một cách tỉ lệ, nếu kiểm sốt được x cũng kiểm sốt được y
Giá trị x
Hình 33. Ví dụ về biểu đồ phân tán có mối tương quan nghịch, x tăng thì y giảm một cách tỉ lệ, nếu kiểm soát được x cũng kiểm soát được y
Giá trị x
Hình 34. Ví dụ về biểu đồ phân tán có mối tương quan phi tuyến tính, y thay đổi so với x theo tỉ lệ phức tạp hoặc y phụ thuộc thêm một yếu tố khác ngoài x
Giá trị x
Hình 35. Ví dụ về biểu đồ phân tán khơng có mối tương quan nào giữa x và y
Các bước thực hiện biểu đồ phân tán như sau:
1. Thu thập dữ liệu theo từng cặp giá trị mà chúng ta muốn tìm hiểu về mối tương quan giữa hai đại lượng của nó. Để mối tương quan được rõ ràng thì càng nhiều cặp dữ liệu càng tốt. Nếu có thể, bạn cần 30 cặp giá trị như vậy;
2. Vẽ trục y với khoảng giá trị từ 0 đến giá trị lớn nhất của đại lượng phụ thuộc;
3. Vẽ trục x với khoảng giá trị từ 0 đến giá trị lớn nhất của đại lượng chính;
5. Bổ sung tên đồ thị, tên và đơn vị các trục, các thông tin cần thiết khác.