2 Các phân phối xác suất
2.2 Nghiên cứu và trực quan hoá
2.2.3 Các hàm vẽ biểu đồ phân phối
1. boxplot(x)Vẽ boxplot cho vectorx. Nếu xlà ma trận thì vẽ boxplot cho từng cột củax.
2. boxplot(x,g)Vẽ boxplot sử dụng 1 hoặc nhiều nhóm biến trongg, vẽ nhiều boxplot khác
nhau cho dữ liệuxchia theo nhóm trongg.
VD: Load dữ liệu mẫu:
>> load carsmall
2 CÁC PHÂN PHỐI XÁC SUẤT
>> boxplot(MPG)
>> xlabel(’All Vehicles’)
>> ylabel(’Miles per Gallon (MPG)’)
>> title(’Miles per Gallon for All Vehicles’)
Kết quả trả ra biểu đồ như sau:
Tạo boxplot của biếnMPGtừ dữ liệu mẫu, phân nhóm bởi nguồn gốc quốc gia của phương tiện, thêm vào chú thích của biểu đồ và 2 trục:
>> boxplot(MPG,Origin)
>> title(’Miles per Gallon by Vehicle Origin’)
>> xlabel(’Country of Origin’)
>> ylabel(’Miles per Gallon (MPG)’)
2 CÁC PHÂN PHỐI XÁC SUẤT
Mỗi box thể hiện dữ liệuMPGcho các quốc gia khác nhau. Italy box chỉ có 1 đường kẻ vì nó chỉ có 1 quan sát ứng với group này.
3. histfit(data,nbins)trả ra biểu đồ tần số có nbinskhoảng và fit vào một hàm mật độ của phân phối chuẩn.
4. histfit(data,nbins,dist) trả ra biểu đồ tần số cónbinskhoảng và fit vào một hàm mật độ của phân phối quy định bởidist.
VD: Tạo vector 100 giá trị ngẫu nhiên tuân theo phân phối Beta trong khoảng (3; 10):
>> rng default;
>> b = betarnd(3,10,100,1);
Tạo biểu đồ tần số với 10 khoảng và fit vào đó hàm mật độ của phân phối Beta:
>> histfit(b,10,’beta’)
2 CÁC PHÂN PHỐI XÁC SUẤT
5. normplot(x) tạo ra biểu đồ xác suất chuẩn so sánh phân bố của dữ liệu trongxvới phân bố chuẩn.
VD: Tạo ngẫu nhiên dữ liệu mẫu từ phân phối chuẩn (10, 1):
>> rng default;
>> x = normrnd(10,1,25,1);
Tạo đồ thị xác suất chuẩn cho dữ liệu trên:
2 CÁC PHÂN PHỐI XÁC SUẤT
Đồ thị trên chỉ ra rằng dữ liệu trên tuân theo một phân phối chuẩn.
6. p = normspec(specs)vẽ đồ thị hàm mật độ của phân phối chuẩn (0, 1), tô đen vùng giới hạn bởi vector 2 chiều specs và trả ra xác suất pcủa vùng đó. Nếu spec khơng có cận dưới thì đặt cận dưới là-Inf, tương tự cận trên khơng có thì thay bằngInf.
>> p = normspec([-1,1])
p =
0.6827
2 CÁC PHÂN PHỐI XÁC SUẤT
7. p = normspec(specs,mu,sigma,region)vẽ đồ thị hàm mật độ của phân phối chuẩn (mu,sigma)
vớiregion= ’outside’ sẽ tô đen vùng ngồi khoảngspecvà nếu khơng điền gì sẽ mặc định tơ đen vùng trong, và vẫn trả ra xác suất pcủa vùng được tô.
>> p = normspec([1-3/128,Inf],1,2/128,’outside’)
p =
0.0668
2 CÁC PHÂN PHỐI XÁC SUẤT
8. probplot(dist, y)tạo ra biểu đồ xác suất so sánh phân bố của dữ liệuyvới phân bố của kiểu phân bố được quy định bởidist.
VD: Tạo dữ liệu mẫux1chứa 500 giá trị ngẫu nhiên lấy từ phân bố Weibull (3, 3), dữ liệu mẫux2chứa 500 giá trị ngẫu nhiên lấy từ phân bố Rayleigh (3):
>> rng(’default’);
>> x1 = wblrnd(3,3,[500,1]); >> x2 = raylrnd(3,[500,1]);
Tạo biểu đồ xác suất để đánh giá xem dữ liệux1vàx2có đến từ phân phối Weibull hay khơng:
>> probplot(’weibull’, [x1 x2])
>> legend(’Weibull Sample’,’Rayleigh Sample’,’Location’,’best’)
2 CÁC PHÂN PHỐI XÁC SUẤT
Từ đó cho ta biếtx1đến từ phân bố Weibull,x2 thì khơng.
9. wblplot(x)) tạo ra biểu đồ xác suất so sánh phân bố của dữ liệu trong x với phân bố Weibull
VD: Tạo ngẫu nhiên dữ liệu mẫu từ phân phối Weibull (1.2, 1.5):
>> rng default;
>> r = wblrnd(1.2,1.5,50,1);
Tạo đồ thị xác suất Weibull cho dữ liệu trên:
2 CÁC PHÂN PHỐI XÁC SUẤT
Đồ thị trên chỉ ra rằng dữ liệu trên tuân theo một phân phối Weibull.