Ứng dụng tập thô trong đánh giá công ty

Một phần của tài liệu Ứng dụng lý thuyết tập thô trong khai phá dữ liệu kinh tế - tài chính (Trang 55)

2.3.1. Giới thiệu

Trong kinh tế, tài chính, đánh giá thực trạng của các công ty là một trong những lĩnh vực rất quan trọng, đặc biệt là trong những quốc gia có thị trường vốn phát triển. Đây là một trong những lĩnh vực đã có nhiều học giả, các nhà phân tích chuyên nghiệp, các nhà khoa học đã tiến hành nghiên cứu, tìm hiểu, ít nhất trong 3-4 thập kỷ qua.

Cách tiếp cận đầu tiên để tìm kiếm quy luật và đưa ra các dự đoán( quyết định) trong kinh tế, tài chính bắt đầu với việc sử dụng những phương pháp theo lối kinh nghiệm được thống kê, đánh giá qua nhiều năm, sau đó, với những phương pháp đánh giá dựa trên các ước lượng chấp nhận được, qua việc xác định tập các thuộc tính điều kiện và tập các thuộc tính quyết định, để xác định giá trị của một công ty. Thông thường việc xác định, lựa chọn các thuộc tính phải được thực hiện thông qua tri thức của chuyên gia lĩnh vực.

Phân tích này được thực hiện trên dữ liệu của 171 công ty niêm yết tại thị trường chứng khoán Paris, với tập C- tập thuộc tính điều kiện gồm 32 thuộc tính:

Bảng 2.4 Các thuộc tính điều kiện

1 c1 Lĩnh vực hoạt động ( activity domain) 2 c2 Năm thành lập (Establishment year) 3 c3 Quy mô thị trường ( Market extent)

4 c4 Giá trị tài sản cố định ( Net Immaterial Immovables) 5 c5 Giá trị cổ phiếu ( Stock)

6 c6 Các khoản chưa trả ( Outstandings) 7 c7 Tiền mặt ( cash)

8 c8 Tổng tài sản có và nợ ( Sum of assets and Liabilities) 9 c9 Nguồn vốn chủ sở hữu( Own funds)

10 c10 Vốn pháp định ( Original Capital) 11 c11 Nợ dài hạn ( Long – term loans) 12 c12 Nợ ngắn hạn ( Short – term loans) 13 c13 Tài sản nợ (Liabilities)

14 c14 Doanh số ( Turnover)

15 c15 Dự trữ(số dư) hàng hóa ( merchandise margin)

16 c16 Giá trị sản xuất của hàng bán( manufactoring costs of sold goods)

17 c17 Giá trị gia tăng ( value Added) 18 c18 Chi phí nhân công ( man cost) 19 c19 Thuế ( tax)

20 c20 Kết quả hoạt động cơ sở ( basic activity result)

21 c21 Lãi hoặc lỗ trong một năm tài chính ( Profit or loss in an account year)

22 c22 Nguồn vốn tài chính tự có( self financing capacity) 23 c23 Vốn hoạt động ( acting capital)

24 c24 Vốn hoạt động bằng tiền mặt ( acting capital – cash) 25 c25 Đánh giá suy giảm ( Appraisal depreciation)

27 c27 Tỷ suất tính lưu động ( khả năng thanh toán) (liquidty ratio) 28 c28 Số lượng nhân công ( number of Employees)

29 c29 Tỷ lệ luân chuyển hàng hóa (Inventory Turnover)

30 c30 Vòng quay số tiền sẽ thu được ( accounts receivable turnover)

31 c31 Vòng quay số tiền phải trả ( accounts payable turnover) 32 c32 Giá trị tài sản ròng ( Net asset value)

Việc xác định giá trị của công ty thường dựa trên các phương pháp: đánh giá theo tài sản, đánh giá dựa trên dòng tiền, dựa trên khả năng sinh lời, sử dụng giá trị danh tiếng hoặc đánh giá giá trị chứng khoán. Mỗi phương pháp đánh giá đều có điểm mạnh và điểm yếu riêng tùy thuộc vào mức độ tin cậy và đầy đủ của dữ liệu được nghiên cứu.

Trong phạm vi nghiên cứu này, tập các thuộc tính quyết định – tập D gồm 3 thuộc tính:

Bảng 2.5 : Bảng các thuộc tính quyết định

1 d1 Giá trị giao dịch chứng khoán ( Stock Exchange Value) 2 d2 Giá trị danh tiếng ( Goodwill value)

3 d3 Tỷ lệ giá trên thu nhập cổ phần ( Price earning ratio)

2.3.2. Lựa chọn các thuộc tính , xây dựng bảng quyết định.

Vấn đề lựa chọn tập con các thuộc tính là một trong những vấn đề khó khăn, những thuộc tính này ảnh hưởng đến kết quả dự đoán cuối cùng trong việc đưa ra các luật. Trong thực tế để có thể thực hiện điều này cần có sự trợ giúp của các chuyên gia lĩnh vực, những người này sẽ lựa chọn các thuộc tính quan trọng để đưa vào bảng thông tin mã hoá. Việc lựa chọn này được dựa trên:

(i) Xác định sự phụ thuộc của mỗi thuộc tính quyết định với tất cả các thuộc tính điều kiện.

(ii) Xác định sự phụ thuộc của mỗi thuộc tính quyết định với tập con các điều kiện được lựa chọn từ tập các thuộc tính điều kiện ban đầu. (adsbygoogle = window.adsbygoogle || []).push({});

(iii) Xác định các thuộc tính điều kiện ảnh hưởng đến sự đánh giá, phân loại các công ty theo các thuộc tính quyết định.

(iv) Xây dựng bảng quyết định với các luật xác định được dựa trên tối thiểu các thuộc tính quyết định dùng để đánh giá, phân loại công ty khớp với những giá trị giả thiết gán cho các thuộc tính quyết định.

Sử dụng các công cụ tính toán dựa trên lý thuyết tập thô như LERS, DataLogic[DL92] để thực hiện chuyển các dạng giao thức quyết định hoặc các bảng quyết định thành các dạng cơ sở tri thức ( luật quyết định được rút gọn).

Ví dụ như với trường hợp tập con các thuộc tính điều kiện A1={c1, c2, c3}, khi xem xét sự phụ thuộc: A1 → d3, được xác định bởi: A1({d3})=0.33, điều này có nghĩa là nếu chỉ với 3 thuộc tính điều kiện có thể dẫn đến những đánh giá không chính xác khi xem xét dựa trên tỷ số giá trên thu nhập cổ phần. Khi mở rộng thêm các thuộc tính cho tập A1={c1, c2, c3, c9, c21,c32}, với A1 → d3 : A1({d3})=0.92. Với tập thuộc tính B= {c1, c2, c4, c9, c21,c32}, với B → d2 : B({d2})=0.93. Các kết quả tính toán còn lại được trình bày cụ thể trong [kraw95], tựu trung lại việc đánh giá, phân loại các công ty dựa trên các thuộc tính điều kiện (do các chuyên gia lựa chọn) thông qua các tính toán để từ đó rút gọn được đáng kể các thuộc tính điều kiện trong các luật quyết định thu được.

Một ví dụ khác khi rút gọn thập C đối với thuộc tính quyết đinh d1

thông qua tính toán thực hiện bởi DataLogic thu được tập C1 C: C1={c2, c4, c6, c7, c7,c9, c10, c11, c12, c14,c18,c19,c20,c21,c22,c23,c24,c29,c32}, các thuộc tính còn lại của C không ảnh hưởng đến việc đánh giá phân loại khi phân tích theo chỉ số giá trị chứng khoán. Cũng qua việc tính toán theo d1 này qua DataLogic thu được 88 luật quyết định, xác định được đầy đủ các phân hoạch của tập dữ liệu đầu vào, nghĩa là với mỗi một trong 171 công ty có

thể phân loại một cách tường minh vào một trong các khoảng xác định của chỉ số giá trị chứng khoán. Ví dụ: Quyết định: PRICE ==> <767.00,5000.00> 1. [c21<=1300.00] & [c24<=-1000.00] & [c11<=5500.00 OR c11>1500000.00] Quyết định PRICE ==> <5000.00,50000.00> 2. [c21<=1300.00] & [0.00<c32<=50000.00] & [10000.00<c24<=20.0000]

3. [c21<=1300.00] & [0.00<c23<=110000.00] & [c8<=70.000.00] & [- 10000.00<c24<=2000000.00]

Thông qua các tính toán tương tự với thuộc tính quyết định d2 thu được 93 luật quyết định, với d3 thu được 81 luật quyết định. Thông qua DataLogic, những phân tích theo hướng ngược lại cũng được áp dụng, nghĩa là với một luật hiện có, với giá trị của thuộc tính quyết định xác định trước ta thu được giá trị tương ứng của các thuộc tính điều kiện.

Một phần của tài liệu Ứng dụng lý thuyết tập thô trong khai phá dữ liệu kinh tế - tài chính (Trang 55)