Các phương pháp phân tích dữ liệu

Một phần của tài liệu Báo cáo Đề tài nghiên cứu khoa học Đề tài phân tích tình hình kinh doanh của doanh nghiêp (Trang 36 - 45)

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.2. Các phương pháp phân tích dữ liệu

Có 4 phương pháp phổ biến: phân tích mô tả, phân tích chuẩn đoán, phân tích dự đoán, phân tích đề xuất. Trong đó, các phương pháp sau được coi là “trưởng thành” hơn với mức độ khó và phức tạp tăng dần, càng phức tạp thì thông tin mang lại càng lớn.

Ngoài còn có 4 phương pháp khác đó là: phân tích khám phá, phân tích nhân quả, phân tích suy luận, phân tích nhận thức.

Hình 2.1. 8 phương pháp phân tích ( Nguồn: Tác giả )

2.2.1. Phân tích mô tả

Tên tiếng Anh là Descriptive Analytics. Phân tích mô tả trả lời cho câu hỏi “Điều gì đã xảy ra?”. Đây là giai đoạn phân tích thấp nhất, sử dụng phương pháp thống kê để mô tả dữ liệu từ đó giúp doanh nghiệp khám phá ra xu hướng, đặc trưng cho ứng dụng Business Intelligence và trực quan hóa dữ liệu với biểu đồ so sánh hoặc phân tích cơ bản.

Phần lớn doanh nghiệp hiện nay mới chỉ dừng lại ở cấp độ phân tích này. Mặc dù phương pháp này có thể giúp doanh nghiệp nhìn thấy các xu hường xảy ra ở trong quá khứ, nhưng doanh nghiệp không rút ra được các giải pháp để xử lý vấn đề hoặc tìm ra được vấn đề cốt lõi của sự việc, do đó cần đến giai đoạn tiếp theo là gia đoạn chuẩn đoán.

Mô tả tổng hợp thông tin và thống kê các chỉ số theo các chiều phân tích hoặc các danh mục cần so sánh.

Hình 2.2. Minh hoạ mô tả tổng hợp và thống kê

( Nguồn: Internet ) Từ đó, đưa ra câu trả lời cho các câu hỏi như:

• So sánh top 10 khách hàng theo doanh thu?

• Các nguồn tiếp thị và quảng cáo nào mang lại nhiều

• Khách hàng tiềm năng nhất?

• Vị trí của các cửa hàng nào thích hợp nhất để bán hàng và có lãi suất cao nhất?

• Số đơn hàng bán theo các khu vực và tỉnh thành?

• Theo dõi số đơn hàng theo từng sản phẩm?

Phân tích chỉ số theo thời gian hoặc so sánh theo các khoảng thời gian để từ đó đưa ra các góc nhìn về tăng trưởng, trì trệ hay suy thoái theo thời gian.

Hình 2.3. Mô tả phân tích chỉ số theo thời gian

( Nguồn : Internet )

• Doanh thu hàng tháng đang tăng lên hay giảm đi?

• So sánh cùng với thời điểm năm ngoái hoặc tháng

• Trước thì chúng ta đang làm tốt hơn hay tệ đi?

• Xu hướng doanh thu trung bình có đang phát triển?

• Tỷ phần của các sản phẩm bán ra theo thời gian?

• Tốc độ tăng trưởng qua năm qua năm (YoY) và tháng (MoM) có đang tốt lên?

2.2.2. Phân tích chuẩn đoán

Tên tiếng Anh là Diagnostic Analytics. Phân tích chuẩn đoán sẽ tập trung vào trả lời câu hỏi “Tại sao điều đó lại xảy ra?”. Phân tích chuẩn đoán cung cấp nhiều thông tin có giá trị hơn phân tích mô tả, do đó sẽ yêu cầu kỹ năng cao hơn. Phân tích chuẩn đoán sử dụng những kết quả phân tích mô tả để tìm ra nguyên nhân, những chỉ số đa lường hiệu quả được phân tích kỹ hơn, và tìm ra những điểm bất thường trong dữ liệu.

Nó được thực hiện bằng các kỹ thuật như truy vết thông tin (Drill- down), khai thác dữ liệu và phân tích mối tương quan.

Hình 2.4. Minh hoạ phân tích truy vết

(Nguồn: Internet) Phân tích truy vết thông tin theo nhiều chiều phân cấp giúp tính toán so sánh giữa nhiều chiều có liên quan hoặc phân cấp với nhau bằng nhiều cách thức.

• Doanh thu theo năm / quý / tháng phân bổ ra sao?

• Doanh thu theo các nhóm khách hàng / sản pẩm theo từng khu vực địa bàn, tỉnh thành?

• Phân bổ số khách hàng theo các thông tin Demographic như độ tuổi, hôn nhân, thu nhập, …?

• Truy vết theo cây chỉ tiêu thực hiện cùng tiến độ?

Dựa trên nhiều mô hình phân tích để đưa ra dự đoán về vòng đời hoặc chu kỳ của sản phẩm. Phân tích và đưa ra thông tin cho các câu hỏi bao gồm

• Sản phẩm hiện tại đã đến chu kỳ nào?

• Tốc độ thay đổi chu kỳ sản phẩm và lý do?

• Có nên thay thế hoặc phát triển sản phẩm mới?

• So sánh chu kỳ của các sản phẩm để biết khả năng thâm nhập thi trường của các sản phẩm nhất định

• Phân tích doanh thu theo các chu kỳ của thời gian theo các tuần / tháng / quý / năm, …

Tìm hiểu mối liên hệ giữa 2 hoặc nhiều yếu tố hoặc chỉ số dựa trên việc so sánh. Từ đó, giúp hiểu được chúng có thay đổi lẫn nhau hay cùng bị thay đổi bởi yếu tố khác.

• Quảng cáo có thúc đẩy doanh thu tăng lên không?

• Khách hàng trẻ có mua hàng nhiều qua internet?

• Khoảng cách vận chuyển lớn có làm chậm giao hàng?

• Khách thu nhập càng cao có tần suất mua liên tục?

• Trình độ học vấn của khách hàng có ảnh hưởng tới tỷ lệ từ chối hoặc yêu cầu hoàn trả đơn hàng?

2.2.3. Phân tích dự đoán

Tên tiếng Anh là Predictive Analysis. Phân tích dự đoán dung để xác định kết quả của một sự kiện nào đó sẽ xảy ra trong tương lai hoặc dự đoán về một vấn đề chưa biết. Nói theo cách khác thì phân tích dự đoán là mô hình dựa vào các sự kiện, xu hướng trong quá khứ để dự báo xác định sự kiện sẽ xảy ra trong tương lai.

Chú ý rằng, dự báo chỉ là một ước tính và những ước tính đó có thể xảy ra, nhưng không chắc chắn. Độ chính xác của nó dựa trên số lượng cũng như chất lượng của dữ liệu mà doanh nghiệp hay tổ chức đó sở hữu.

Phân tích và dự đoán giá trị tương lại dựa trên chỉ số hiện tại và quá khứ. Có thể sử dụng nhiều phương thức thống kê để dự đoán chỉ số tương lai, từ đó giúp ta:

• Dự đoán doanh thu trong các tháng tới trong năm dựa trên dữ liệu từ các năm trước?

• Dự đoán dựa trên các tình huống và ước tính tăng trưởng theo trường hợp thấp, trung bình, cao?

• Dựa trên một số mô hình thống kê áp dụng để ước tính giá trị tương lai dựa trên dữ liệu quá khứ

Dự báo phân loại đối tượng vào các nhóm cụ thể dựa trên các điều kiện hoặc phương pháp thống kê:

• Phân loại khách hàng dựa trên mô hình RFM (Recency–Frequency–

Monetary)

• Phân loại các loại hoa theo các giống dựa trên chỉ số nhận dạng như độ dài, rộng, dày của cánh hoa, …

• Phân loại các khoản vay theo độ rủi ro dựa vào các nội dung và điều khoản cho vay cùng tiến độ trả tiền

2.2.4. Phân tích đề xuất

Tên tiếng Anh là Prescriptive Analysis. Phân tích đề xuất là giai đoạn cuối cùng của mô hình phân tích dữ liệu, xác định hành động nào cần thực hiện để giải quyết một vấn đề hoặc đưa ra một quyết định, trả lời cho câu hỏi,

“chúng ta nên làm gì tiếp theo?”.

Phân tích đề xuất sẽ tính đến tất cả các giả định “cái gì-nếu”, các yếu tố có thể xảy ra trong một tình huống vè đề xuất các biện pháp có thể thực hiện được. Loại phân tích này có thể đặc biệt hữu ích khi đưa ra quyết định dựa trên dữ liệu.

Phân tích đề xuất thường được coi là bước cuối cùng trong quy trình phân tích gồm 4 loại phân tích chính trên. Đồng thời, về tính phức tạp và độ khó cũng là cao nhất vì nó cần áp dụng nhiều những mô hình thống kê, toán học, khoa học dữ liệu với nhau.

Các câu hỏi mà phân tích đề xuất thường có thể trả lời :

• Trong 3 chiến lược kinh doanh, chiến lược nào mang lại hiệu quả nhất?

• Khi nào là thời điểm tốt nhất để giao dịch cổ phiếu?

• Xác định cần quảng cáo sản phẩm nào trong quý tới.

2.2.5. Phân tích khám phá

Tên tiếng Anh là Exploratory Data Analysis. Là quá trình quan trọng thực hiện các điều tra ban đầu trên dữ liệu để phát hiện ra các mẫu thông tin, phát hiện các điểm bất thường, kiểm tra giả thuyết và kiểm tra các giả định với sự trợ giúp của thống kê tổng quan và trên biểu diễn đồ thị.

Phương pháp phân tích và tìm hiểu về dữ liệu Univariate (dữ liệu quan sát về 1 đặc tính hoặc thuộc tính duy nhất). Các biểu đồ sử dụng phổ biến:

Bảng thống kê tần suất số công việc đăng theo mức lương của một ngành nghề.

Biểu đồ Histogram thống kê số khách hàng theo độ tuổi hoặc cấp độ học vấn.

Biểu đồ Scatter Plot thống kê từng học sinh các lớp theo điểm kiểm tra giữa kỳ và cuối kỳ.

Biểu đồ Box-Plot thống kê thu nhập năm khách hàng.

Hình 2.5. Phân tích khám phá (1 thuộc tính)

(Nguồn: Internet) Phương pháp phân tích và tìm hiểu về nhiều đặc tính và thuộc tính, biến số cùng lúc. Các biểu đồ và ứng dụng phổ biến:

Biểu đồ Multiple Scatter Plot so sánh một lúc nhiều mối quan hệ giữa các thuộc tính

Biểu đồ phân tích tọa độ song song (Parallel Coordinate Plot) tìm điểm chung khách hàng quen.

Biểu đồ 3-Dimensional Plot thống kê trực quan giữa độ dài, rộng và cân nặng các gói hàng theo sản phẩm.

Hình 2.6. Phân tích khám phá (nhiều thuộc tính)

(Nguồn: Internet) 2.2.6. Phân tích nhân quả

Tên tiếng anh là Causal Analytics. Là lĩnh vực thống kê thiết lập nguyên nhân và kết quả. Phân tích trên các yếu tố: mối tương quan, trình tự thời gian (nguyên nhân có trước kết quả), cơ chế lý thuyết (các quan sát được tuân theo một nguyên nhân có thể xảy ra) và loại bỏ khả năng các nguyên nhân phổ biến và đặc biệt.

2.2.7. Phân tích suy luận

Tên tiếng Anh là Inferential Analytics. Bao gồm xem xét các lý thuyết khác nhau về để xác định các khía cạnh nhất định của tổng thể đối tượng thông

tin. Khi sử dụng phân tích suy diễn, sẽ được yêu cầu lấy một mẫu thông tin nhỏ hơn từ tổng thể và lấy đó làm cơ sở để suy ra các tham số về tập hợp lớn hơn.

Một phương pháp suy luận thống kê được sử dụng để quyết định xem dữ liệu hiện tại có hỗ trợ đầy đủ cho một giả thuyết cụ thể hay không. Việc xác nhận dựa vào 2 giả định là Null và Alternative Hypothesis. Từ đó, dựa vào tính p-value để chấp nhận hay loại bỏ Null Hypothesis.

• Xác nhận xem nam giới hợp để lãnh đạo tốt hơn nữ?

• Xác định độ tuổi trung bình chuẩn để lập gia đình

• Tìm phương pháp hiệu quả nhất để ngừng thuốc lá

• Mức độ ảnh hưởng của ăn nhiều đạm tới các bệnh lý

• Ước tính tăng trưởng thị trường dựa trên số lượng khách hàng tiềm năng và tỉ lệ thị phần có thể chiếm giữ trong thị trường đó trong quá khứ và hiện tại.

• Ước lượng doanh thu và tiềm năng lợi nhuận khi tham gia vào các thị trường mới.

• Ước lượng thị phần của thị trường mới dựa trên phân tích của các thị trường đã có tương tự.

2.2.8. Phân tích nhận thức

Tên tiếng anh là Cognitive Analytics. Là việc áp dụng trí thông minh giống con người cho các nhiệm vụ nhất định và tập hợp một số công nghệ thông minh, bao gồm phân tích ý nghĩa, thuật toán trí tuệ nhân tạo, học sâu và học máy. Từ đó ứng dụng phân tích nhận thức có thể trở nên thông minh hơn và hiệu quả hơn theo thời gian bằng cách học hỏi từ các tương tác của nó với dữ liệu và với con người.

Là những hệ thông, công nghệ, máy móc có thể nhận thức được môi trường của nó và thực hiện các hành động nhằm tối đa hóa cơ hội đạt được mục tiêu của nó. Đây là lĩnh vực nghiên cứu xây dựng công nghệ khiến máy móc có khả năng suy tính hợp lý và hành động hợp lý, điều này không hạn chế bởi cách máy móc bắt chước con người để thể hiện trí thông minh.

Hình 2.7. Phân tích nhận thức

Một phần của tài liệu Báo cáo Đề tài nghiên cứu khoa học Đề tài phân tích tình hình kinh doanh của doanh nghiêp (Trang 36 - 45)

Tải bản đầy đủ (PDF)

(79 trang)