Tiếp theo, bạn nhìn vào giá nhà ở (Hình 213). Bán kính của mỗi vòng tròn biểu thị dân số của quận (tùy chọn s) và màu sắc biểu thị giá (tùy chọn c). Tại đây, bạn sử dụng bản đồ màu được xác định trước (cmap tùy chọn) được gọi là jet, có phạm vi từ xanh lam (giá trị thấp) đến đỏ (giá cao): housing.plot(kind=scatter, x=longitude, y=latitude, grid=True, s=housingpopulation 100, label=population, c=median_house_value, cmap=jet, colorbar=True, legend=True, sharex=False, figsize=(10, 7)) plt.show()
Trang 1Vẽ scatterplot cho hai biến định lượng
housing.plot(kind= "scatter" , x "longitude" , y "latitude" , grid= True )
plt.show()
Figure 2-11 A geographical scatterplot of the data
Chúng ta có thể thiết lập option alpha = 0.2 để giúp chúng ta trực quan các khu vực có mật độ điểm dữ liệu cao trong scatterplot (Figure 2-12 ):
housing.plot(kind= "scatter" , x "longitude" , y "latitude" , grid= True , alpha= 0.2 )
plt.show()
Trang 2Vẽ scatterplot cho hai biến định lượng và hai biến định lượng khác
Tiếp theo, bạn nhìn vào giá nhà ở (Hình 2-13) Bán kính của mỗi vòng tròn biểu thị dân số của quận (tùy chọn s) và màu sắc biểu thị giá (tùy chọn c) Tại đây, bạn sử dụng bản đồ màu được xác định trước (cmap tùy chọn) được gọi là jet, có phạm vi từ xanh lam (giá trị thấp) đến đỏ (giá cao):
housing.plot(kind= "scatter" , x "longitude" , y "latitude" , grid= True ,
s housing[ "population" ] / 100 , label= "population" ,
c "median_house_value" , cmap= "jet" , colorbar= True ,
legend= True , sharex= False , figsize= 10 , 7 ))
plt.show()