TRỰC QUAN HÓA DỮ LIỆU (DATA VISUALIZATION)

Một phần của tài liệu Báo cáo Đề tài dự Đoán giá nhà ở khu vực thành phố hồ chí minh (Trang 24 - 31)

I. HIỂU VÀ KHÁM PHÁ DỮ LIỆU (EXPLORATORY DATA ANALYSIS -EDA)

6. TRỰC QUAN HÓA DỮ LIỆU (DATA VISUALIZATION)

a. Khái niệm:

Trực quan hóa dữ liệu là quá trình biểu diễn dữ liệu dưới dạng đồ họa, hình ảnh, biểu đồ, hoặc bản đồ nhằm giúp người xem dễ dàng hiểu và phân tích các xu hướng, mô hình, và mối quan hệ ẩn trong dữ liệu. Thay vì chỉ nhìn vào những con số và bảng dữ liệu, việc trực quan hóa giúp truyền đạt thông tin một cách rõ ràng và trực quan hơn.

b. Mục đích:

- Dễ hiểu và dễ tiếp cận: các biểu đồ, đồ thị, và hình ảnh giúp người dùng dễ hiểu các thông tin phức tạp, ngay cả khi họ không có nền tảng về phân tích dữ liệu.

Trực quan hóa biến dữ liệu thô thành những câu chuyện dễ tiếp thu.

- Tìm ra xu hướng và mẫu dữ liệu: khi nhìn vào biểu đồ hoặc đồ thị, người phân tích có thể dễ dàng nhận thấy các xu hướng, biến động, và mối quan hệ giữa các biến.

Ví dụ, biểu đồ đường có thể giúp phát hiện sự thay đổi theo thời gian, còn biểu đồ cột có thể so sánh dữ liệu giữa các nhóm khác nhau.

- Phát hiện bất thường và sai lệch: trực quan hóa dữ liệu giúp phát hiện nhanh các giá trị ngoại lệ (outliers), sai lệch, hoặc các vấn đề tiềm ẩn trong bộ dữ liệu. Điều này rất quan trọng trong quá trình làm sạch dữ liệu (data cleaning).

- Hỗ trợ ra quyết định: các nhà quản lý và các bên liên quan thường không có thời gian để đọc qua bảng biểu dài dòng. Trực quan hóa dữ liệu cung cấp cho họ một cách tiếp cận nhanh chóng để đưa ra quyết định dựa trên những phân tích rõ ràng và cụ thể.

c. Áp dụng

- Số quận xuất hiện trong tập dữ liệu:

Figure 36. Số Quận trong tập dữ liệu -

Qua biểu đồ trên, ta có thể thấy được:

 Thủ Đức là quận xuất hiện nhiều nhất trong tập dữ liệu, cho thấy khu vực này có thể đang phát triển mạnh về bất động sản hoặc có nhiều dữ liệu liên quan đến giao dịch tại đây.

 Gò Vấp, Bình Thạnh, Tân Bình và quận 1 xuất hiện nhiều ở mức thứ hai, cho thấy những quận này có hoạt động kinh tế và bất động sản sôi động.

 Cần Giờ, Hóc Môn, và quận 4 là những quận xuất hiện ít nhất trong dữ liệu, có thể phản ánh mức độ phát triển thấp hoặc ít giao dịch tại các khu vực này.

 Các quận còn lại như quận 2, quận 3, quận 5, quận 7, quận 10, quận 12 và các quận khác có mức xuất hiện trung bình, không nổi bật như nhóm quận Thủ Đức nhưng cũng không thấp như Cần Giờ hoặc Hóc Môn. Điều này có thể cho thấy rằng các khu vực này có mức độ phát triển và giao dịch vừa phải, ổn định trong dữ liệu bất động sản.

-

Kết luận:

 Phân bố không đồng đều: các quận như Thủ Đức, Gò Vấp, và Bình Thạnh có lượng dữ liệu lớn, cho thấy sự phát triển mạnh mẽ. Trong khi đó, các quận như Cần Giờ, Hóc Môn, và quận 4 có ít dữ liệu hơn, phản ánh các khu vực ít sôi động hơn.

 Các quận còn lại: các quận như quận 2, quận 3, và quận 7 xuất hiện ở mức trung bình, có thể được xem là những khu vực có sự phát triển ổn định, không quá nổi bật nhưng cũng không bị bỏ qua. Điều này gợi ý rằng các khu vực này có mức độ quan tâm vừa phải từ các nhà đầu tư hoặc người mua.

-

Qua biểu đồ giá nhà trung bình theo từng quận, ta có thể thấy:

 Quận 1 và quận 3 có giá nhà trung bình cao nhất (gần 80 tỷ)

 Quận Phú Nhuận, quận 10, quận 5, Bình Thạnh có giá nhà trung bình (hơn 30 tỷ)

 Các quận còn lại có giá nhà thấp như Cần Giờ, Hóc Môn, Củ Chi, quận 12 - Nhận xét kết hợp từ biểu đồ số quận xuất hiện và giá nhà trung bình:

 Quận 1 và quận 3: đây là hai quận có giá nhà trung bình cao nhất (gần 80 tỷ).

Tuy nhiên, số lượng dữ liệu xuất hiện của hai quận này không nằm ở mức cao nhất, chỉ xếp thứ hai sau các quận như Thủ Đức. Điều này có thể cho thấy mặc dù số lượng giao dịch không quá nhiều, giá trị bất động sản tại đây rất cao do đây là những khu vực trung tâm với cơ sở hạ tầng phát triển, dịch vụ tiện ích tốt, và tiềm năng thương mại lớn.

 Quận Phú Nhuận, quận 10, quận 5, Bình Thạnh: Các quận này có giá nhà trung bình ở mức hơn 30 tỷ, cho thấy đây là những khu vực có sự phát triển ổn định và sôi động về bất động sản. Điều này đồng nhất với tần suất xuất hiện nhiều của

trong dữ liệu cho thấy đây là các khu vực có nhu cầu cao về nhà ở hoặc đầu tư, có thể là do vị trí thuận lợi gần trung tâm và các tiện ích.

 Cần Giờ, Hóc Môn, Củ Chi, quận 12: đây là những quận có giá nhà trung bình thấp nhất và cũng xuất hiện ít trong tập dữ liệu. Điều này phản ánh sự chênh lệch rõ rệt về mức độ phát triển và sự quan tâm của nhà đầu tư đối với các khu vực này. Các quận này chủ yếu nằm ở vùng ven, có cơ sở hạ tầng chưa phát triển bằng các khu vực trung tâm, dẫn đến nhu cầu mua bán bất động sản và giá nhà thấp hơn.

- Kết luận tổng quan:

 Sự chênh lệch giữa giá nhà và số lượng giao dịch: Nhìn chung, các quận trung tâm như quận 1, quận 3 có giá nhà cao nhất, nhưng lại không xuất hiện nhiều trong dữ liệu. Điều này có thể do số lượng giao dịch bất động sản tại các quận này thấp hơn, hoặc có thể giá trị nhà quá cao làm giảm khả năng tiếp cận của người mua trung bình.

 Các quận ngoại thành như Cần Giờ, Hóc Môn, Củ Chi có giá nhà thấp và xuất hiện ít trong dữ liệu, cho thấy đây là những khu vực có ít sự phát triển về bất động sản hoặc ít giao dịch trong giai đoạn này.

 Quận Bình Thạnh, quận 5, Phú Nhuận là những khu vực có giá nhà trung bình ổn định và xuất hiện nhiều trong dữ liệu, chứng tỏ đây là các khu vực có hoạt động bất động sản sôi động, thu hút người mua và nhà đầu tư nhờ vị trí thuận lợi và tiềm năng phát triển

Figure 37. Mối quan hệ giữa các cột của tập dữ liệu Phân tích các mối tương quan:

1. Price (Giá nhà):

 Area (diện tích) có mối tương quan cao nhất với giá nhà (0.48), cho thấy diện tích có ảnh hưởng mạnh đến giá nhà. Khi diện tích tăng, giá nhà cũng tăng.

 Num_of_bedrooms (số phòng ngủ) và num_of_bathrooms (số phòng tắm) có mối tương quan đáng kể với giá nhà (0.44 và 0.42), điều này có thể hiểu được vì số phòng ngủ và phòng tắm thường gắn liền với tiện ích và quy mô nhà ở.

 Num_of_floors (số tầng) có mức tương quan tương tự với giá nhà (0.42), điều này cho thấy số tầng cũng là một yếu tố quan trọng trong việc định giá bất động sản.

2. Mối tương quan giữa các yếu tố khác:

 Số phòng ngủ và số phòng tắm có mức tương quan rất cao (0.93), điều này cho thấy khi số lượng phòng ngủ tăng thì số phòng tắm cũng có xu hướng tăng theo, vì chúng thường đi kèm nhau trong thiết kế nhà ở.

 Số phòng ngủ và số tầng có mức tương quan vừa phải (0.45), nghĩa là các ngôi nhà có nhiều phòng ngủ cũng có thể có nhiều tầng, nhưng không phải lúc nào cũng vậy.

 Diện tích có mức tương quan thấp với các yếu tố khác (trừ giá nhà), đặc biệt với số tầng (0.13), cho thấy diện tích không nhất thiết liên quan chặt chẽ đến số tầng hoặc phòng ngủ.

Kết luận:

 Diện tích là yếu tố có ảnh hưởng lớn nhất đến giá nhà trong tập dữ liệu này.

 Các yếu tố như số phòng ngủ, số phòng tắm, và số tầng cũng có tác động tương đối mạnh đến giá nhà.

Phân tích:

 Convenience (tiện lợi) xuất hiện nhiều nhất trong tập dữ liệu với hơn 25.000 tiện ích, cho thấy tiện ích này được phổ biến rộng rãi trong khu vực khảo sát.

 School (trường học) và supermarket (siêu thị) cũng xuất hiện nhiều, với số lượng trường học gần 22.000 và siêu thị xấp xỉ 20.000. Điều này cho thấy mức độ phát triển về giáo dục và mua sắm trong khu vực.

 Hospital (bệnh viện) và cinema (rạp chiếu phim) có số lượng thấp hơn đáng kể, với bệnh viện ở mức dưới 15.000 và rạp chiếu phim thấp nhất trong biểu đồ, chỉ khoảng dưới 10.000.

Nhận xét:

 Các tiện ích cơ bản như trường học, siêu thị, và cửa hàng tiện lợi xuất hiện nhiều, cho thấy những tiện ích này là ưu tiên trong phát triển cơ sở hạ tầng.

 Bệnh viện và rạp chiếu phim xuất hiện ít hơn, có thể do nhu cầu thấp hơn hoặc việc phân bổ các tiện ích này có quy hoạch cẩn thận hơn, tập trung vào các khu vực cụ thể.

Phân tích biểu đồ:

 Cột "No Utility" (không có tiện ích): các bất động sản không có tiện ích đi kèm có giá trung bình vào khoảng 15 tỷ VND.

 Cột "Has Utility" (có tiện ích): các bất động sản có tiện ích đi kèm có giá trung bình cao hơn đáng kể, gần 30 tỷ VND.

Nhận xét:

 Giá trị bất động sản tăng khi có tiện ích: Sự khác biệt đáng kể giữa hai mức giá cho thấy rằng sự hiện diện của tiện ích xung quanh bất động sản như trường học, siêu thị, bệnh viện, rạp chiếu phim, v.v., có ảnh hưởng mạnh đến giá trị của bất động sản. Điều này có thể phản ánh sự tiện lợi và tiềm năng phát triển của khu vực có các tiện ích xung quanh.

 Yếu tố tiện ích có thể là một trong những yếu tố quyết định quan trọng khi đánh giá giá trị bất động sản, đặc biệt là trong các khu vực phát triển đô thị, nơi mà nhu cầu về các tiện ích này rất cao.

Một phần của tài liệu Báo cáo Đề tài dự Đoán giá nhà ở khu vực thành phố hồ chí minh (Trang 24 - 31)

Tải bản đầy đủ (PDF)

(70 trang)