1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(LUẬN VĂN THẠC SĨ) Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá

87 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Luật Kết Hợp Âm Dương Và Ứng Dụng Trong Công Tác Bình Ổn Giá
Tác giả Nguyễn Hữu Hoàng
Người hướng dẫn PGS.TS. Đỗ Văn Thành
Trường học Đại Học Quốc Gia Hà Nội
Chuyên ngành Công Nghệ Thông Tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2011
Thành phố Hà Nội
Định dạng
Số trang 87
Dung lượng 1,74 MB

Cấu trúc

  • MỤC LỤC

  • DANH MỤC CÁC CHỮ VIẾT TẮT

  • MỞ ĐẦU

  • Chương 1 Giới thiệu luật kết hợp, luật kết hợp mẫu âm

  • 1.1 Lời mở đầu

  • 1.2 Tổng quan về luật kết hợp

  • 1.2.1 Khái niệm luật kết hợp

  • 1.2.2 Giải thuật Apriori để sinh các luật kết hợp.

  • 1.3 Luật kết hợp mẫu âm

  • 1.3.1 Khái niệm luật kết hợp mẫu âm

  • 1.3.2 Các giai đoạn phát hiện luật kết hợp mẫu âm

  • 1.3.3 Thuật toán phát hiện luật kết hợp âm

  • 1.4 Kết luận chương

  • Chương 2 Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm.

  • 2.1 Bài toán

  • 2.2 Quá trình thu thập số liệu

  • 2.2.1 Nhóm dân sinh:

  • 2.2.2 Nhóm nhập khẩu

  • 2.2.4 Nhóm các mặt hàng cơ bản trên thế giới

  • 2.3 Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA

  • 2.3.1 Giới thiệu phần mềm CBA

  • 2.3.2 Xử lý file dữ liệu để xác định luật kết hợp trong CBA

  • 2.3.3 Xác định luật kết hợp trong CBA

  • 2.4 Kết luận chương

  • Chương 3 Phát hiện mối quan hệ về sự biến động giá của các mặt hàng dân sinh

  • 3.1 Mở đầu chương

  • 3.2 Chuyển đổi biểu diễn dữ liệu

  • 3.2.1 Bước 1: đánh ký hiệu từng mặt hàng

  • 3.2.2 Bước 2: đánh ký hiệu từng sự biến đổi giá của các mặt hàng

  • 3.2.3 Bước 3: chuyển toàn bộ dữ liệu đã đánh vào file *.tra

  • 3.3 Thực hiện chạy phần mềm CBA để phát hiện luật kết hợp

  • 3.4 Xác định mối quan hệ giá bằng phát hiện luật kết hợp.

  • 3.4.1 Luật kết hợp của 120 mặt hàng với đầy đủ các trạng thái : tăng giá, giảm giá, giữ nguyên giá.

  • 3.4.2 Luật kết hợp của 120 mặt hàng khi không tính đến trạng thái giữ nguyên giá

  • 3.4.3 Luật kết hợp theo cho nhóm mặt hàng dân sinh

  • 3.4.4 Luật kết hợp cho các mặt hàng dân sinh trong nước và các mặt hàng nhập khẩu :

  • 3.4.5 Luật kết hợp cho các mặt hàng nhập khẩu, xuất khẩu và một số mặt hàng trên thế giới

  • 3.5 Kết luận chương

  • Kết luận

  • Tài liệu tham khảo

  • Phụ lục

Nội dung

Giới thiệu luật kết hợp, luật kết hợp mẫu âm

Lời mở đầu

Trong các giao dịch mua bán, sự đa dạng về chủng loại mặt hàng và tỉ lệ giao dịch chứa nhiều mặt hàng cụ thể đang gây chú ý Tuy nhiên, việc không xác định được người mua khiến chúng ta đặt ra câu hỏi về tính ngẫu nhiên hay quy luật trong sự trùng lặp đó Điều này dẫn đến sự cần thiết của luật kết hợp để giải thích hiện tượng này.

Tổng quan về luật kết hợp

1.2.1 Khái niệm luật kết hợp

1.2.1.1 Định nghĩa Để đơn giản hóa, chúng ta có thể hiểu luật kết hợp như sau: luật kết hợp là luật chỉ ra mối quan hệ của hai hay nhiều đối tượng (đối tượng chúng ta đang xét ở đây là các mặt hàng)

Cấu trúc của luật như sau: A=>B (sup, conf) Có nghĩa là luật có A thì kéo theo B với độ hỗ trợ sup và độ tin cậy conf

- sup= support (độ hỗ trợ): là tỉ lệ giao dịch chứa cả hai mặt hàng A và B trên tổng số giao dịch

- conf= confidence (độ tin cậy): là tỉ lệ giao dịch chứa mặt hàng B trong các giao dịch chứa mặt hàng A

Nếu nhìn nhận luật kết hợp theo lý thuyết tập hợp thì chúng ta có thể định nghĩa như

Cho một tập I = { I 1 , I 2 ,…, Im } các tập m mục, một giao dịch T được định nghĩa như một tập con của các khoản mục trong I (T I)

Gọi D là CSDL của n giao dịch và mỗi giao dịch được đánh nhãn với một định danh duy nhất

Một giao dịch T D hỗ trợ tập X I nếu nó chứa tất cả các mục của tập X, ký hiệu T(X) thường được sử dụng để chỉ tập các giao dịch hỗ trợ cho X Ký hiệu support(X) (hoặc sup(X), s(X)) thể hiện tỷ lệ phần trăm của các giao dịch hỗ trợ X trên tổng số giao dịch trong D, được tính bằng công thức sup(X) = (1) Độ hỗ trợ tối thiểu minsup là giá trị do người sử dụng xác định; nếu sup(X) ≥ minsup, thì X được coi là một tập các mục phổ biến Các phần sau sẽ sử dụng các cụm từ như “X có độ hỗ trợ tối thiểu” hoặc “X không có độ hỗ trợ tối thiểu” để diễn đạt việc X có thỏa mãn điều kiện support(X) ≥ minsup hay không.

Một luật kết hợp có dạng R: X => Y, trong đó X, Y là tập các mục; X, Y I và X Y

Luật kết hợp X => Y có độ tin cậy c, được định nghĩa là khả năng giao dịch T hỗ trợ X thì cũng hỗ trợ Y Độ tin cậy c được tính bằng công thức conf(X => Y) = p(Y | X) Để khai thác luật kết hợp, quá trình cần thực hiện qua hai bước quan trọng.

Bước đầu tiên là xác định tất cả các tập mục có độ hỗ trợ vượt quá mức hỗ trợ tối thiểu mà người dùng đã chỉ định Những tập mục đáp ứng tiêu chí này được gọi là các tập mục phổ biến.

Bước 2: Sử dụng các tập mục phổ biến để tạo ra các luật mong muốn Cụ thể, nếu gọi ABCD và AB là các tập mục phổ biến, chúng ta có thể xác định luật AB => CD với tỷ lệ độ tin cậy nhất định.

Nếu conf ≥ minconf thì luật được giữ lại (luật này sẽ thoả mãn độ hỗ trợ tối thiểu vì ABCD là phổ biến)

Một ứng dụng quan trọng của luật kết hợp là phân tích thị trường, giúp hiểu rõ thói quen mua sắm của khách hàng Phân tích này tìm ra mối liên hệ giữa các sản phẩm khác nhau mà khách hàng thường mua trong cùng một giao dịch.

Khách hàng thường có xu hướng mua các sản phẩm liên quan với nhau, chẳng hạn như bánh mì và sữa, hoặc máy tính xách tay thay vì máy tính để bàn Thông tin này giúp người bán tối ưu hóa việc sắp xếp hàng hóa trên kệ, ví dụ như đặt sữa gần bánh mì để kích thích nhu cầu mua sắm Việc nhận diện các mặt hàng thường được mua chung không chỉ giúp tăng doanh thu mà còn nâng cao trải nghiệm mua sắm cho khách hàng.

Khai thác luật kết hợp giúp xác định các mối liên kết và quan hệ tương quan trong một tập hợp lớn đối tượng Trong lĩnh vực thương mại, việc khám phá những mối quan hệ này trong số lượng lớn giao dịch có thể hỗ trợ các nhà kinh doanh trong việc giải quyết các vấn đề, chẳng hạn như thiết kế catalog quảng cáo hiệu quả.

1.2.2 Giải thuật Apriori để sinh các luật kết hợp Để hình dung rõ hơn các giai đoạn trong quá trình phát hiện luật kết hợp, chúng ta sẽ xem xét giải thuật Apriori phát hiện luật kết hợp từ cơ sở dữ liệu tác vụ

1.2.2.1 Tư tưởng chính của thuật toán Apriori a Tìm tất cả các tập phổ biến (frequent itemsets):

- k-itemset (itemsets gồm k items) được dùng để tìm (k+1)- itemset

Đầu tiên, xác định 1-itemset (ký hiệu L1), từ L1 để tìm 2-itemsets (L2), tiếp tục quá trình này để tìm 3-itemsets (L3) và tiếp theo cho đến khi không còn k-itemsets nào được phát hiện Sau khi xác định tất cả các tập phổ biến, tiến hành sinh ra các luật kết hợp mạnh, những luật này phải thỏa mãn hai tham số min_sup và min_conf.

1.2.2.2 Giải thuật Apriori a Duyệt (Scan) toàn bộ cơ sở dữ liệu giao dịch để có được độ hỗ trợ (support) S của 1-itemset, so sánh S với độ hỗ trợ tối thiểu min_sup, để có được 1-itemset (L1) b Sử dụng Lk-1 nối (join) L k-1 để sinh ra candidate k-itemset Loại bỏ các itemsets không phải là tập phổ biến thu được k-itemset ( bước cắt tỉa) c Tiếp tục duyệt cơ sở dữ liệu giao dịch để có được độ hỗ trợ S của mỗi candidate k-itemset, so sánh S với min_sup để thu được tập phổ biến k –itemset (L k ) d Lặp lại từ bước 2 cho đến khi Candidate set (C) trống (không tìm thấy tập phổ biến) e Với mỗi tập phổ biến I, sinh tất cả các tập con s không rỗng của I f Với mỗi tập con s không rỗng của I, sinh ra các luật s => (I-s) nếu độ tin cậy (Confidence) của nó > =min_conf

Giả sử có cơ sở dữ liệu giao dịch bán hàng gồm 5 giao dịch như sau:

1 Beer, Diaper, Baby Powder, Bread, Umbrella

Thuật toán Apriori tìm các luật kết hợp trong giao dịch bán hàng trên như sau:

Beer, Baby Powder 0/5 Beer, Milk 2/5

Beer, Milk 2/5 Diaper, Baby Powder 2/5

Empty (Stop) Beer, Diaper, Baby Powder 1/5

Bước 4: min-sup@%, min_confp%

Kết quả ta có các luật kết hợp sau (với min_sup= 40%, min_confp%)

R4: Baby Powder => Diaper (support @%,confidence = 100%)

Dựa trên kết quả từ các luật sinh ra qua giao dịch bán hàng, chúng ta nhận thấy có những luật đáng tin cậy như mối liên hệ giữa Baby Powder và Diaper, trong khi một số luật khác như Milk cần được phân tích thêm để hiểu rõ hơn.

=>Beer và có luật có vẻ khó tin như Diaper =>Beer

Ví dụ này sinh ra các luật có thể không thực tế vì dữ liệu dùng để phân tích (transaction database) hay còn gọi là tranining data rất nhỏ.

Luật kết hợp mẫu âm

1.3.1 Khái niệm luật kết hợp mẫu âm

Trước khi xem xét khái niệm về luật kết hợp mẫu âm, chúng ta xem xét một ví dụ cụ thể dưới đây :

- Bảng dưới là thông tin về các khách hàng mua sắm phương tiện giao thông :

Theo giả thiết đầu tiên, độ hỗ trợ tối thiểu (minsup) được đặt ở mức 30% và độ tin cậy (minconf) là 70% Giả thiết thứ hai phân chia thuộc tính tuổi thành hai nhóm: trên 30 tuổi và dưới 30 tuổi.

- Với thông tin và hai giả thiết trên ta có được các tập phổ biến :

Theo bảng trên, luật "Age < 30 → Coupe" có độ tin cậy là 75% Tuy nhiên, khi xem xét từ góc độ khác, luật "Age > 30 → Not purchar Coupe" (những người trên 30 tuổi sẽ không sử dụng phương tiện Coupe) có độ tin cậy cao hơn, đạt 83.33% Luật "Age > 30 → Not purchar Coupe" sau này sẽ được gọi là luật kết hợp mẫu âm.

Qua ví dụ trên cho thấy, ý nghĩa thực tế của luật kết hợp mẫu âm cũng quan trọng không kém luật kết hợp dương

Tuy nhiên việc sinh luật kết hợp mẫu âm gặp hai vấn đề khó khăn :

Việc lựa chọn giá trị ngưỡng minsup và minconf không hề đơn giản, vì chúng cần phải đảm bảo tính phù hợp cho cả luật kết hợp âm và luật kết hợp dương.

Trong một cơ sở dữ liệu thực tế, có hàng ngàn mục khác nhau Tuy nhiên, trong các giao dịch, nhiều mục không xuất hiện hoặc chỉ xuất hiện rất ít.

1.3.1.2 Định nghĩa luật kết hợp mẫu âm

Các luật kết hợp mẫu âm được định nghĩa là những quy tắc chứa một phủ định của một mục, cho phép thiết lập nguồn gốc hoặc kết quả thông qua sự kết hợp giữa sự hiện diện và vắng mặt của các điều kiện Ví dụ về sự kết hợp này có thể được minh họa như sau:

Cụ thể hơn, chúng ta có thể xem xét khái niệm luật kết hợp mẫu âm dưới hình thức tập hợp như sau :

Giả sử I = i 1 , i 2 ,…, ij, , i n , một giao dịch T được định nghĩa như một tập con của các khoản mục trong I (T I)

CSDL D bao gồm n giao dịch, mỗi giao dịch được gán một định danh duy nhất Một giao dịch T trong D được coi là hỗ trợ cho tập X I và Y I nếu nó chứa toàn bộ các mục của cả hai tập này.

Với luật kết hợp dương có dạng R: X  Y, trong đó X, Y là tập các mục, X, Y I và

X Y = X được gọi là tiên đề và Y được gọi là hệ quả của luật

Với luật kết hợp mẫu õm sẽ cú dạng R‟: X ơY

Bây giờ chúng ta xem xét độ hỗ trợ và độ tin cậy trong luật kết hợp mẫu âm

Luật kết hợp X → Y có cú độ hỗ trợ s%, nghĩa là trong số các giao dịch có mặt X, s% không có sự hiện diện của mục Y Độ tin cậy của luật này, giả sử U là tập hợp các giao dịch có mặt của X, được xác định là c%, cho biết rằng c% trong U không có mặt mục Y.

Tương tự như cách tính độ tin cậy trong luật kết hợp dương, độ tin cậy trong luật kết hợp âm có thể được tính như sau:

Trong bài viết trước, chúng ta đã phân tích thuật toán xác định luật kết hợp dương thông qua việc tính toán các mục xuất hiện trong giao dịch Tuy nhiên, việc xác định luật kết hợp âm lại gặp khó khăn do sự phức tạp trong việc nhận diện các mục không có mặt trong các giao dịch.

Thay vì chỉ xác định các mục không có mặt trong các giao dịch, chúng ta nên tập trung vào việc tính toán các mục có mặt trong các giao dịch Điều này có nghĩa là chúng ta sẽ xác định luật kết hợp âm dựa trên luật kết hợp dương.

Đối với mỗi luật kết hợp XY, chúng ta có thể xác định độ hỗ trợ Supp(XY) và độ tin cậy Conf(XY) Tiếp theo, chúng ta sẽ tính toán độ hỗ trợ và độ tin cậy cho luật kết hợp mẫu õm (XơY) dựa trên các giá trị này.

Conf(XơY) = Supp(XơY)/ Supp(X) = (Supp(X) - Supp(XY) )/Supp(X)

1.3.2 Các giai đoạn phát hiện luật kết hợp mẫu âm

Để xác định luật kết hợp mẫu âm, cần phải thông qua luật kết hợp dương với độ hỗ trợ và độ tin cậy cao Nếu giảm độ hỗ trợ và độ tin cậy, việc tìm kiếm các luật kết hợp dương mong muốn sẽ trở nên khó khăn Do đó, cần chấp nhận các giá trị này đủ lớn để dễ dàng xác định luật kết hợp dương, trong khi các luật kết hợp âm sẽ có độ hỗ trợ và độ tin cậy thấp Chúng ta phải chấp nhận rằng một số kết quả tìm kiếm có thể không đạt yêu cầu Để loại bỏ những luật không mong muốn, cần sử dụng các miền tri thức trong kho dữ liệu nhằm dự đoán và loại bỏ chúng, từ đó tạo ra tập hợp các luật kết hợp mẫu âm khả thi.

Chúng ta xem xét sự phân loại sau:

T tập hợp các loại mặt hàng được biểu diễn dưới dạng đồ thị, trong đó mỗi đỉnh đại diện cho một lớp như Hardware, Computers, Electronics, và các đỉnh không có đỉnh con (độ sâu bằng 0) được xem là các mặt hàng Hai đỉnh được kết nối qua các cạnh, tạo thành một miền tri thức (domain Knowledge) phong phú.

Trong phân loại mối quan hệ, có hai loại chính: quan hệ theo chiều dọc và quan hệ theo chiều ngang Quan hệ theo chiều dọc thể hiện mối quan hệ cha – con, trong khi quan hệ theo chiều ngang phản ánh mối quan hệ anh – em.

Mối quan hệ anh – em được gọi là mối quan hệ địa phương (Locality Of Similarity – LOS), trong đó các mục cùng LOS có xu hướng tham gia vào cùng một luật kết hợp Chẳng hạn, trong một cơ sở dữ liệu bán lẻ, các mục cùng LOS sẽ có khả năng cao được tham gia vào các giao dịch của khách hàng Điều này cho thấy rằng nếu người bán hàng không đưa ra những tham khảo hợp lý, người mua sẽ gặp khó khăn trong việc chọn lựa sản phẩm Do đó, việc đưa ra tham khảo theo LOS sẽ giúp khách hàng dễ dàng chọn lựa những món hàng mà họ mong muốn.

Khi khách hàng tìm kiếm máy tính để bàn, họ có thể dễ dàng so sánh hai dòng sản phẩm như „IBM Aptiva‟ và „Compaq Deskpro‟, thay vì phải phân vân giữa nhiều loại thiết bị khác như Notebook hay Parks.

Kết luận chương

Qua chương đầu tiên, luận văn đã trình bày những khái niệm cơ bản về luật kết hợp và luật kết hợp mẫu âm, đồng thời nêu rõ ý nghĩa thực tiễn của việc khai thác luật kết hợp mẫu âm.

Bài viết đã phân tích các bước cơ bản để phát hiện luật kết hợp và luật kết hợp mẫu âm Đồng thời, một số thuật toán phổ biến trong khai phá luật kết hợp và luật kết hợp mẫu âm cũng được trình bày trong chương này.

Trong chương tiếp theo, luận văn sẽ phân tích bài toán cụ thể liên quan đến luật kết hợp mẫu âm, nhằm xác định sự biến động giá cả dựa trên thông tin giá hàng hóa trong vòng 2 năm qua.

Xác định bài toán ứng dụng phát hiện luật kết hợp mẫu âm

Bài toán Error! Bookmark not defined

Trong những năm gần đây, công tác điều hành thương mại cho thấy rằng khi nhà nước cho phép nhập khẩu một nhóm mặt hàng, thường phải cấm nhập khẩu nhóm mặt hàng khác Đồng thời, trong việc xây dựng các dòng thuế cho các ngành hàng, việc tăng hoặc giảm thuế cho một số mặt hàng thường đi kèm với việc không cho phép thay đổi thuế của những mặt hàng khác.

Trong y học, những tình huống mà bệnh nhân có triệu chứng của một căn bệnh thường không đồng thời xuất hiện với triệu chứng của căn bệnh khác là khá phổ biến Tương tự, sự biến động giá cả của các mặt hàng cho thấy rằng khi một nhóm mặt hàng tăng giá, có thể sẽ kéo theo sự tăng giá của nhóm khác hoặc giảm giá của một số mặt hàng khác Để xác định mối quan hệ này, việc thu thập dữ liệu chính xác và đầy đủ về giá cả của các mặt hàng là rất cần thiết, và đây sẽ là nội dung chính được đề cập trong chương 2 của luận văn.

Trong bối cảnh nền kinh tế đang đối mặt với lạm phát cao và giá cả hàng hóa liên tục biến động, việc tìm hiểu mối liên hệ giữa các mặt hàng trở nên cần thiết Luận văn sẽ tập trung phân tích sự tương quan giữa các sản phẩm và đưa ra các phương pháp để xác định mối quan hệ này.

Theo Viện Nghiên cứu giá cả thị trường Bộ Tài Chính và Trung tâm Thông tin Công nghiệp và Thương mại Bộ Công Thương, việc theo dõi biến động giá cả của hàng hóa nhập khẩu, xuất khẩu, hàng hóa dân sinh, giá một số mặt hàng toàn cầu và chỉ số giá tiêu dùng (CPI) là rất quan trọng Mặc dù thị trường có hàng nghìn mặt hàng, nhưng những mặt hàng được chọn lọc này chiếm hơn 90% tổng khối lượng lưu thông, đảm bảo tính chính xác cho nghiên cứu về biến động giá cả toàn thị trường Dữ liệu giá cả được thu thập hàng tuần trong các năm 2008, 2009 và quý 1 năm 2010, với chi tiết được trình bày trong phụ lục 1.

Giá cả các sản phẩm xuất nhập khẩu được thu thập từ Tổng cục Hải quan và tính trung bình theo tuần Đối với các sản phẩm thiết yếu phục vụ đời sống, dữ liệu được thu thập từ ngày 3/1/2008 đến 31/03/2010 tại Hà Nội vào thứ hai, thứ tư và thứ sáu, với giá trung bình của ba ngày này được sử dụng làm giá cả sản phẩm trong tuần.

Trong quá trình phân tích dữ liệu, nếu phát hiện biên độ giao động giá của một số mặt hàng rất nhỏ hoặc chỉ thay đổi vài tháng một lần (bao gồm 14 mặt hàng do Chính phủ thực hiện bình ổn giá), những mặt hàng này sẽ bị loại trừ khỏi phạm vi nghiên cứu Đối với các mặt hàng không thu thập được dữ liệu đầy đủ trong thời gian nghiên cứu từ 3/1/2008 đến 31/3/2010, sẽ có phương án xử lý thích hợp.

- Với những mặt hàng khụng thu thập được giỏ cả cho ớt nhất ắ của 120 tuần trở lên, tức là trên 90 tuần, sẽ bị loại bỏ

Đối với các mặt hàng còn lại, trong những tuần không thu thập được dữ liệu, chúng tôi sẽ áp dụng phương pháp trung bình trượt (bậc 4 hoặc bậc 5) hoặc phương pháp phân tích tương tự để bổ sung dữ liệu bị thiếu.

Quá trình thu thập số liệu

Mục tiêu của luận văn là nghiên cứu mối quan hệ giữa biến động giá cả và các yếu tố ảnh hưởng đến chúng, nhằm tạo điều kiện thuận lợi cho việc nhận diện những yếu tố này Luận văn sẽ khảo sát giá cả của các mặt hàng thiết yếu trong đời sống dân sinh cũng như các sản phẩm xuất nhập khẩu chủ đạo của nền kinh tế.

Số liệu thống kê về giá cả hàng hóa được thu thập thống nhất theo kỳ thời gian theo tuần, cụ thể như sau:

Bài viết thu thập dữ liệu về giá các mặt hàng thiết yếu như gạo tẻ thường, gạo tẻ ngon và gạo nếp tại Hà Nội trong khoảng thời gian từ ngày 3/1/2008 đến 31/3/2010 Để phân tích, số liệu được tính theo tuần, tương ứng với 120 tuần Sau khi thu thập giá theo ngày, giá trung bình theo tuần sẽ được tính toán, và thông tin chi tiết được trình bày trong phụ lục 1.

2.2.1.1 Nhóm lương thực Đây là nhóm mặt hàng quan trọng bậc nhất trong nền kinh tế của nước ta Bây giờ chúng ta sẽ đi phân tích số liệu cụ thể của các loại mặt hàng thuộc nhóm mặt hàng lương thực này

Trong giai đoạn 10 tuần đầu năm 2008, giá gạo tẻ thường và gạo tẻ ngon không có sự biến động đáng kể Tuy nhiên, trong 40 tuần tiếp theo, giá các loại gạo này liên tục tăng, mặc dù mức tăng vẫn chậm Cụ thể, giá gạo tẻ thường tăng từ 7.500đ/Kg lên 8.500đ/Kg, trong khi gạo tẻ ngon giữ nguyên ở mức 11.500đ/Kg.

Bắt đầu từ năm 2009, giá lương thực, đặc biệt là gạo tẻ thường, đã có sự biến động mạnh, từ 8.500 đ/Kg lên 11.000 đ/Kg trong 24 tuần đầu của năm, trước khi ổn định ở mức 10.000 đ/Kg Đến đầu năm 2010, giá gạo tẻ thường tiếp tục tăng lên 13.000 đ/Kg, trong khi gạo tẻ ngon tăng từ 12.500 đ/Kg lên 16.800 đ/Kg, duy trì mức giá cao trong suốt 15 tuần đầu năm Sự tăng giá này phản ánh xu hướng chung của nhóm mặt hàng lương thực như gạo, bột mì, ngô và mì ăn liền.

2.2.1.2 Nhóm mặt hàng liên quan tới thịt, trứng, cá

Sự biến động giá của nhóm mặt hàng thịt và trứng có những đặc điểm khác biệt so với lương thực Trong năm 2008, giá thịt lợn mông sấn dao động quanh mức 63.000 đ/Kg, trong khi thịt bò loại 1 tăng từ 90.000 đ/Kg trong 10 tuần đầu lên 115.000 đ/Kg vào cuối năm Sang năm 2009, giá thịt lợn giảm và ổn định ở 55.000 đ/Kg, trong khi thịt bò tăng mạnh lên 130.000 đ/Kg và 140.000 đ/Kg vào cuối quý 1/2010 Sự biến động giá của các mặt hàng như thịt, trứng, tôm, cá cũng không đồng nhất như thịt lợn và thịt bò đã được phân tích.

2.2.1.3 Nhóm mặt hàng rau, củ, quả

Trong năm 2008, giá rau bắp cải và rau muống đã có sự biến động rõ rệt Trong 25 tuần đầu, giá bắp cải giảm từ 6.000 đ/Kg xuống 4.500 đ/Kg, trong khi rau muống giảm từ 4.000 đ/mớ xuống 3.500 đ/mớ, sau đó ổn định ở mức 5.000 đ/Kg và 3.500 đ/mớ Tuy nhiên, từ tuần 44 đến tuần 46 (tháng 10 đến tháng 11), giá rau tăng đột biến do ảnh hưởng của trận mưa lụt lịch sử tại Hà Nội, với bắp cải tăng lên 15.000 đ/Kg (có tuần đạt 18.000 đ/Kg) và rau muống tăng lên 14.000 đ/mớ (có tuần đạt 18.000 đ/mớ) Sau đó, giá rau củ đã được điều chỉnh giảm, ổn định ở mức 7.000 đ/Kg cho bắp cải và 6.000 đ/Kg cho rau muống.

Năm 2009, trong hơn 20 tuần đầu, giá các mặt hàng rau, củ, quả có xu hướng giảm, với rau bắp cải giảm từ 7.000 đ/Kg xuống còn khoảng 4.000 đ/Kg và xoài từ 30.000 đ/Kg xuống còn 23.500 đ/Kg Tuy nhiên, đến cuối năm, giá rau lại tăng trở lại, cụ thể rau bắp cải tăng lên 7.000 đ/Kg, trong khi giá xoài vẫn ổn định ở mức 23.000 đ/Kg.

Sang đến quý 1/2010 tình hình giá của các mặt hàng rau, củ, quả bắt đầu có hiện tượng giảm giá và đi vào ổn định

2.2.1.4 Nhóm mặt hàng đường, sữa, cafe

Tiếp đến chúng ta đi phân tích giá các mặt hàng liên quan tới đường, sữa, café

Năm 2008, giá café giữ ổn định ở mức 76.000 đ/Kg, trong khi giá sữa 900g tăng từ 118.000 đ/Kg đầu năm lên 127.000 đ/Kg vào cuối năm Đường trắng nội có sự biến động giá không ổn định, với mức giá tăng từ 10.500 đ/Kg lên 11.000 đ/Kg trong suốt năm.

Năm 2009 chứng kiến sự biến động giá cả của café, tương tự như sự thay đổi giá đường trắng vào năm 2008 Đầu năm, giá café tăng lên 85.000 đ/Kg, sau đó giảm xuống 80.000 đ/Kg Tuy nhiên, vào cuối năm, giá café lại có xu hướng tăng dần và kết thúc ở mức 104.800 đ/Kg.

Năm 2009, giá sữa loại 900g tiếp tục tăng đều đặn từ 127.000 đ/Kg lên 142.000 đ/Kg, tương tự như năm 2008 Đường trắng nội cũng ghi nhận sự tăng giá từ 11.000 đ/Kg đến 19.600 đ/Kg vào cuối năm.

Sang đến những tuần đầu năm 2010, các loại mặt hàng này đều có sự tăng giá đều đặn

2.2.1.5 Nhóm mặt hàng rượu, bia, thuốc lá

Mặc dù được xem là hàng xa xỉ, nhưng tại các thành phố lớn như Hà Nội, nhu cầu tiêu thụ những mặt hàng này lại rất cao.

Theo số liệu từ phụ lục 1, giá cả các mặt hàng như rượu vodka và thuốc lá thường ổn định qua các năm Những sản phẩm này thường có xu hướng tăng giá vào đầu năm và hiếm khi giảm giá Đặc biệt, bia Tiger là mặt hàng duy nhất ghi nhận sự giảm giá trong một số tuần của năm 2009.

2.2.1.6 Nhóm mặt hàng vải bông, vải tổng hợp Đây cũng là nhóm mặt hàng có thế mạnh xuất khẩu của cả nước, các mặt hàng vải bông, vải tổng hợp có sự ổn định giá trong năm 2008 Cụ thể trong cả năm 2008 giá vải bông luôn là 48.000 đ/m, vải tổng hợp luôn là 30.000 đ/m Tuy nhiên sang đến năm 2009 vải bông vẫn giữ được sự ổn định giá, mặc dù cũng có vài tuần thay đổi giảm nhưng hầu hết các tuần trong năm 2009 giá cũng vẫn ở mức 48.000 đ/m, trong khi vải tổng hợp giảm giá từ 30.000 đ/m cuối năm 2008 xuống còn 20.000 đ/m vào thời điểm cuối năm 2009

Sang đến quý 1 năm 2010 thì tình hình lại ngược lại, trong khi vải tổng hợp tăng giá lên 22.000 đ/m thì vải bông lại giảm giá xuống còn 45.000 đ/m

2.2.1.7 Nhóm mặt hàng liên quan tới vật liệu xây dựng Đó là các mặt hàng như xi măng, gạch, sắt, thép,…Trong thời kỳ từ năm 2008 đến hết quý 1 năm 2010, các loại mặt hàng này có sự thay đổi giá không ổn định và không giống nhau

Phần mềm sử dụng để phát hiện luật kết hợp - phần mềm CBA

2.3.1 Giới thiệu phần mềm CBA

Hiện nay, có nhiều nhóm nghiên cứu về luật kết hợp với các phương pháp xây dựng thuật toán tìm tập phổ biến khác nhau, dẫn đến sự phát triển của nhiều phần mềm tìm luật kết hợp từ các cơ sở dữ liệu (CSDL) tác vụ khác nhau Tuy nhiên, hầu hết các phần mềm này vẫn chưa trở thành sản phẩm thương mại Luận văn này sử dụng phần mềm CBA (Classification Based on Associations) do Đại học Quốc gia Singapore phát triển, sử dụng thuật toán Apriori do R Agrawal và cộng sự sáng tạo, mở ra hướng nghiên cứu và ứng dụng luật kết hợp Thuật toán Apriori có độ phức tạp tính toán trung bình, và phần mềm CBA hỗ trợ phát hiện luật kết hợp từ các CSDL quan hệ và CSDL tác vụ, với khả năng phát hiện luật kết hợp ở nhiều mức độ hỗ trợ tối thiểu khác nhau.

Một luật kết hợp tìm được qua phần mềm CBA có dạng:

Trong bài viết này, chúng ta sẽ khám phá mối quan hệ giữa hai tập mặt hàng A và B thông qua các thông số quan trọng: Cover%, Conf%, CoverCount, SupCount và Sup% Đầu tiên, A = Y có nghĩa là tất cả các mặt hàng trong A đều xảy ra Cover% thể hiện tỷ lệ phần trăm số tuần có dữ liệu về biến động giá của các mặt hàng trong A so với tổng số tuần thu thập thông tin Độ tin cậy của luật, được gọi là Conf%, được tính bằng tỷ lệ SupCount trên CoverCount CoverCount cho biết số tuần có sự biến động giá của các mặt hàng trong A, trong khi SupCount là số tuần mà dữ liệu về biến động giá của cả hai tập A và B được thu thập Cuối cùng, Sup% là độ hỗ trợ của luật, phản ánh tỷ lệ phần trăm số tuần mà cả hai tập A và B đều có sự biến động giá.

Luật kết hợp trong nghiên cứu này không khác biệt so với luật kết hợp tổng quát được xác định từ cơ sở dữ liệu tác vụ Trong năm thông số được đề cập, hai thông số Sup% và Conf% đại diện cho độ hỗ trợ và độ tin cậy của luật kết hợp, đã được giới thiệu trong chương 1 Ba thông số còn lại chỉ nhằm làm rõ hơn về hai thông số chính này.

Phần mềm CBA cho phép trình bày các luật kết hợp dưới nhiều hình thức khác nhau, bao gồm liệt kê tuần tự, biểu diễn dạng cây, và lưu trữ dưới dạng tệp văn bản Điều này giúp người dùng dễ dàng đọc và áp dụng các luật được phát hiện.

2.3.2 Xử lý file dữ liệu để xác định luật kết hợp trong CBA

Trong CBA, dữ liệu có thể được lưu trữ dưới nhiều định dạng khác nhau, bao gồm các file *.data và *.name cho dữ liệu dạng bảng, và file *.tra cho dữ liệu dạng giao dịch Để phân tích sự biến động giá cả các mặt hàng theo tuần, luận văn này sẽ lựa chọn lưu trữ dữ liệu dưới dạng file giao dịch.

Để tạo file tra một cách đơn giản, bạn chỉ cần lưu dữ liệu dưới dạng file *.txt Sau đó, mở file *.txt và chọn "Save as" để lưu lại dưới định dạng *.tra.

Trong file dữ liệu cần có cấu trúc như sau:

- Mỗi một tuần thể hiện sự biến động giá cả của tất cả mặt hàng và lưu dữ liệu trên một dòng

- Với dữ liệu của 120 tuần (từ năm 2008 tới quý 1/2010) thì sẽ được thể hiện trên

2.3.3 Xác định luật kết hợp trong CBA

Trước hết chúng ta xem xét giao diện chung của phần mềm CBA:

Phần mềm CBA hỗ trợ hai loại khai phá dữ liệu chính là phân lớp dữ liệu và khai phá luật kết hợp Để thực hiện các loại khai phá này, CBA yêu cầu đầu vào ở hai định dạng: bảng dữ liệu quan hệ và dữ liệu giao dịch Đặc biệt, đối với phân lớp dữ liệu, có hai định dạng dữ liệu cụ thể cần được sử dụng.

- Theo bảng: dữ liệu lưu tại hai file, file *.names, file *.data

- Theo giao dịch: dữ liệu lưu ở một file , file *.trc (transaction classification) Đối với dữ liệu cho việc khai phá luật kết hợp cũng có 2 định dạng:

- Theo bảng: dữ liệu lưu tại hai file, file *.names, file *.data

- Theo giao dịch: dữ liệu lưu ở một file , file *.tra (transaction association)

Với mục tiêu phát hiện luật kết hợp trong luận văn, nên chúng ta sẽ dùng dữ liệu ở dạng giao dịch (file *.tra)

Sau khi xác định file dữ liệu đầu vào, chúng ta chọn nút “Mine: Single Sup” Trước khi bắt đầu quá trình phát hiện, hệ thống cho phép thiết lập các tham số như minSup và minConf.

Giải thích một số tham số chính của phần mềm CBA khi sử dụng thuật toán Apriori sinh luật kết hợp:

MinSupport: Cận dưới của độ hỗ trợ

Min Confidence: Cận dưới của độ tin cậy

Số lượng luật tối đa cần tìm được xác định bởi khả năng phát hiện luật kết hợp tăng theo cấp số nhân, trong khi bộ nhớ máy tính có giới hạn Do đó, việc lựa chọn số luật tối đa cần tìm phải phù hợp với phần cứng máy tính hiện có để đảm bảo hiệu quả trong quá trình xử lý dữ liệu.

Sau khi sử dụng phần mềm phân tích để tạo ra luật, bạn có thể nhấn nút "View Assoc Rules" để xem danh sách các luật đã tìm được Lưu ý rằng để có số lượng luật đủ lớn phục vụ cho việc phân tích, trong nhiều trường hợp, bạn cần chọn độ hỗ trợ và độ tin cậy với giá trị nhỏ hơn.

Kết luận chương

Trong chương này, luận văn đã phân tích chi tiết bài toán xác định mối quan hệ biến đổi giá của các mặt hàng trong đời sống dân sinh Đồng thời, dữ liệu đầy đủ và chính xác về giá các mặt hàng từ 3/1/2008 đến 31/3/2010 đã được thu thập, với giá cả được thể hiện theo tuần để phục vụ cho bài toán nghiên cứu.

Chương 2 này cũng đã giới thiệu cơ bản về phần mềm phát hiện luật kết hợp – phần mềm CBA, làm công cụ cho quá trình phát hiện môi quan hệ về sự biến đổi giá cả của các mặt hàng trong chương tiếp theo.

Phát hiện mối quan hệ về sự biến động giá của các mặt hàng dân sinh

Mở đầu chương

Trong chương này, luận văn sẽ sử dụng phần mềm CBA để phát hiện mối quan hệ giữa sự biến động giá của các mặt hàng dân sinh, tiếp nối từ việc thu thập và phân tích dữ liệu giá theo tuần từ 3/1/2008 đến 31/3/2010 ở chương trước Sau khi xác định các mối quan hệ thông qua các luật kết hợp, luận văn sẽ tiến hành phân tích các kết quả thu được để rút ra những nhận định quan trọng.

Chuyển đổi biểu diễn dữ liệu

Luận văn này phát hiện các luật kết hợp nhị phân, thể hiện mối quan hệ giữa sự tăng, giảm giá của nhóm mặt hàng này so với nhóm mặt hàng khác trong tuần trước Để thực hiện điều này, cần có tập dữ liệu nhị phân, được tạo ra từ tập dữ liệu gốc về biến động giá các mặt hàng đã trình bày trong chương 2, thông qua các bước cụ thể.

3.2.1 Bước 1: đánh ký hiệu từng mặt hàng

Mục đích của việc đánh ký hiệu cho từng mặt hàng là nhằm đơn giản hóa và tối ưu hóa quá trình nghiên cứu, phân tích mối quan hệ về biến động giá cả Danh sách các mặt hàng được trình bày trong phụ lục 1.

Quá trình đánh ký hiệu hàng hóa được thực hiện bằng 3 ký tự, chia thành các nhóm khác nhau Nhóm dân sinh được ký hiệu bằng chữ D, nhóm xuất khẩu bắt đầu bằng chữ X, nhóm nhập khẩu ký hiệu bằng chữ N, nhóm mặt hàng thế giới ký hiệu bằng chữ W, và chỉ số giá tiêu dùng được ký hiệu là CPI.

1 Hàng hoá dân sinh 1 Gạo tẻ thường (đ/kg) DA1

2 Gạo tẻ ngon (đ/kg) DA2

6 Mì ăn liền (đ/gói) DA6

7 Thịt lợn mông sấn (đ/kg) DA7

8 Thịt bò loại 1 (đ/kg) DA8

9 Gà mái ta còn sống (đ/kg) DA9

10 Thịt gà công nghiệp (đ/kg) DB1

16 Cá quả loại 2 con/kg (đ/kg) DB7

17 Tôm biển loại 20-30 con/kg (đ/kg) DB8

18 Cá thu hấp dầu loại 85g/hộp (đ/hộp) DB9

20 Lạc nhân loại 1 (đ/kg) DC2

21 Cải bắp loại 1 (đ/kg) DC3

25 Bột ngọt Ajinomoto 453g (đ/gói) DC7

27 Đường trắng nội (đ/kg) DC9

28 Rs đường cát vàng (đ/kg) DD1

42 Xi măng đen 50 kg (đ/kg) DE6

43 Thép tròn phi 6 (đ/kg) DE7

52 Đèn Điện Quang 1,2m; 36W (đ/bóng) DF7

53 Bếp ga Rinnai đôi âm (đ/cái) DF8

62 Omo loại 1kg (đ/kg) DG8

63 Kem đánh răng P/S 110g (đ/tuýp) DG9

64 Pin Con thỏ 1,5V (đ/đôi) DH1

68 Xe dream VN (đ/chiếc) DH5

69 Xăng RON 92 không chì (đ/lít) DH6

77 Phí DV Internet (đ/giờ) DK5

78 Vàng miếng SJC 99.99% (đ/chỉ) DK6

79 USD loại 50-100 đôla (đ/USD) DK7

2 Hàng hoá nhập khẩu 1 Phôi thép TQ (USD/tấn) NA1

2 Sắt TQ ỉ 6 (USD/tấn) NA2

3 Xăng RON 92 (USD/tấn) NA3

4 Dầu DO 0,05%S (USD/tấn) NA4

5 Dầu FO (USD/tấn) NA5

6 Urê bao TQ (USD/tấn) NA6

7 DAP bao TQ (USD/tấn) NA7

8 Nhựa PVC TQ (USD/tấn) NA8

9 Nhựa DOP Malaysia (USD/tấn) NA9

10 Bông Mỹ loại 1 (USD/tấn) NB1

11 Clinke loại 1 (USD/tấn) NB2

12 Sữa bột loại 1(USD/tấn) NB3

13 Bột Amoxycilline (USD/kg) NB4

14 Bột Ampicilin (USD/kg) NB5

15 Bột Vitamin B1 (USD/kg) NB6

16 Linh kiện xe máy Dream II (USD/bộ) NB7

3 Hàng hoá xuất khẩu 1 Dầu thô (USD/tấn) XA1

2 Than cục 3A (USD/tấn) XA2

3 Giày da nam (USD/đôi) XA3

4 Áo Jắc két nam (USD/chiếc) XA4

5 Gạo tẻ 5% (USD/tấn) XA5

6 Gạo tẻ 25% (USD/tấn) XA6

7 Cà phê Robusta (USD/tấn) XA7

8 Cao su SVR loại 1 (USD/tấn) XA8

9 Hạt điều nhân W320 (USD/tấn) XA9

10 Hạt tiêu đen loại 1 (USD/tấn) XB1

11 Chè POB loại 1 (USD/tấn) XB2

12 Cá thu loại 1 con/kg (USD/kg) XB3

13 Tôm thẻ loại 20-30con/kg (USD/kg) XB4

4 Giá thế giới 1 Dầu thô Brent IPE tại London (USD/thùng) WA1

2 Dầu thô nhẹ tại New York (USD/thùng) WA2

3 Gasoline, 92 RON tại Singapore (USD/thùng) WA3

4 Đồng tại New York (UScents/Lb) WA4

5 Gạo Thái Lan 5% tấm (USD/tấn) WA5

6 Lúa mỳ tại Chicago (UScents/bushel) WA6

7 Ngô tại Chicago (UScents/bushel) WA7

8 Đường thô tại Thái Lan (UScents/Lb) WA8

9 Cà phê Robusta tại London (USD/tấn) WA9

10 Cao su RSS2 tại Singapore (SGcents/kg) WB1

11 Bông New York (UScents/Lb) WB2

4 CPI CPI (tháng trước = 100) CPI

3.2.2 Bước 2: đánh ký hiệu từng sự biến đổi giá của các mặt hàng

Quá trình đánh ký hiệu biến đổi giá hàng hóa hàng tuần được thực hiện theo nguyên tắc: nếu giá tuần này cao hơn tuần trước, thêm chữ số "1" vào mã giá; nếu giá tuần này thấp hơn, thêm chữ số "2"; và nếu giá không thay đổi, thêm chữ số "0".

Chẳng hạn, như trong bảng ký hiệu với gạo tẻ thường được đánh ký hiệu là DA1

Trong tuần thứ 2, giá gạo tẻ thường giữ nguyên so với tuần đầu tiên, vì vậy ký hiệu cho sự biến đổi giá gạo tẻ trong tuần này sẽ là DA10.

Vào tuần thứ 26, giá gạo tẻ thường giảm xuống còn 9.500 đ/Kg, thấp hơn so với mức 11.500 đ/Kg của tuần thứ 25, dẫn đến ký hiệu biến đổi giá gạo tẻ thường là DA12 Đến tuần thứ 27, giá gạo tẻ thường tăng lên 10.000 đ/Kg.

26 là 9.500 đ/Kg, do vậy ký hiệu của sự biến đổi giá gạo tẻ thường ở tuần thứ 27 sẽ là DA11

3.2.3 Bước 3: chuyển toàn bộ dữ liệu đã đánh vào file *.tra

Sau khi hoàn tất việc đánh giá tất cả các ký hiệu mặt hàng và sự biến đổi giá của chúng trong 120 tuần, dữ liệu (ký hiệu) sẽ được chuyển vào file *.tra.

- Mỗi một tuần thể hiện sự biến động giá cả của tất cả mặt hàng và lưu dữ liệu trên một dòng và cách nhau bởi dấu “,”

- Với dữ liệu của 120 tuần (từ năm 2008 tới quý 1/2010) thì sẽ được thể hiện trên

Sau 3 bước này thì chúng ta sẽ có tập dữ liệu phục vụ phát hiện luật kết hợp được lưu vào file *.tra có nội dung như sau:

Thực hiện chạy phần mềm CBA để phát hiện luật kết hợp

Sau khi nhận được file dữ liệu về sự biến động giá của các mặt hàng dân sinh, chúng ta sử dụng phần mềm CBA để tải file Tiếp theo, chúng ta cần chọn các tham số như MinSupport và Min để tiến hành phân tích.

Sự tự tin, quy tắc hợp lý và việc thực hiện chương trình là những yếu tố quan trọng Sau khi hoàn tất quá trình phân tích, hệ thống sẽ cung cấp cho chúng ta danh sách các luật kết hợp đã được phát hiện.

Tiếp theo đây chúng ta sẽ đi phân tích các luật kết hợp được theo các tiêu chí.

Xác định mối quan hệ giá bằng phát hiện luật kết hợp

Phần mềm CBA sử dụng dữ liệu gốc để phát hiện các luật kết hợp, và những luật này sẽ khác nhau tùy theo các tiêu chí được áp dụng Bài viết tiếp theo sẽ phân tích chi tiết một số luật kết hợp cụ thể.

3.4.1 Luật kết hợp của 120 mặt hàng với đầy đủ các trạng thái : tăng giá, giảm giá, giữ nguyên giá

Chạy phần mềm CBA trên tập dữ liệu với độ hỗ trợ tối thiểu minSup = 0,90 và độ tin cậy tối thiểu minConf = 0,8 đã phát hiện 82 luật kết hợp Trong số đó, 5 luật có độ hỗ trợ cao nhất được trình bày dưới đây (chi tiết xem Phụ lục 2, mục 1).

Rule 1: DF10 = Y -> DE90 = Y (Điện ->Nước)

Luật này cho thấy rằng trong khoảng thời gian từ năm 2008 đến quý 1/2010, có 82.203% các tuần giá điện (DF1) giữ nguyên, thì giá nước (DE9) cũng giữ nguyên với độ tin cậy 100% và độ hỗ trợ 82.203%.

Rule 30: DE90 = Y -> DD60 = Y (Nước ->Lavie )

Theo luật này, khi giá nước không tăng, giá nước đóng chai Lavie cũng sẽ không tăng, với độ tin cậy đạt 97.94% Điều này dễ hiểu vì nước là nguyên liệu chính trong sản xuất nước đóng chai.

Rule 80: DF50 = Y->DF90 = Y (Máy giặt-> Nồi cơm)

Trong nhóm mặt hàng điện dân dụng, việc điều chỉnh giá cả, bao gồm tăng, giảm hoặc giữ ổn định, thường diễn ra đồng loạt giữa các sản phẩm Điều này được thể hiện rõ ràng qua luật 80, khi mà giá của máy giặt không tăng thì giá của nồi cơm điện cũng sẽ không thay đổi.

Phân tích các luật cho thấy nhiều quy định phản ánh đúng thực trạng, tuy nhiên cũng tồn tại một số luật khó giải thích mối quan hệ kinh tế giữa các mặt hàng.

Rule 12: DA50 = Y->DK40 = Y (Ngô-> Đĩa CD)

Các luật kết hợp thể hiện mối quan hệ giữ nguyên giá của các mặt hàng, cho thấy hiện tượng này khá phổ biến trong vài tuần Khi giảm độ hỗ trợ, chúng ta thu được nhiều luật với các hiện tượng như hàng hóa tăng giá, giảm giá và giữ nguyên giá Tuy nhiên, số lượng luật sẽ tăng lên đáng kể; ví dụ, với độ hỗ trợ 50% và độ tin cậy 80%, chúng tôi đã thu thập hàng nghìn luật.

Nhận xét cuối đã gợi ý rằng nên loại bỏ hiện tượng giữ nguyên giá khi nghiên cứu mối quan hệ về biến động giá giữa 120 mặt hàng

3.4.2 Luật kết hợp của 120 mặt hàng khi không tính đến trạng thái giữ nguyên giá Để phát hiện những luật đó, tập dữ liệu đầu vào cần phải hiệu chỉnh bằng cách loại bỏ đi tất cả các thông tin giữ nguyên giá của mỗi mặt hàng so với tuần trước đó Như vậy ở mỗi tuần, chỉ có những mặt hàng tăng hoặc giảm giá thực sự so với tuần trước mới được đưa vào tập dữ liệu đầu vào

Với MINSUP đạt 30% và MICONF là 81%, đã xác định được 24 luật kết hợp cho 120 mặt hàng, không bao gồm thông tin về giá cả không thay đổi so với tuần trước Chi tiết các luật này được trình bày trong Phụ lục 2, Mục 2.

Phân tích các luật này cho thấy hầu hết các luật đều phản ánh tương đối trực quan quan hệ kinh tế

Chẳng hạn các luật sau là ví dụ cho các nhận xét này:

Theo nghiên cứu, trong khoảng thời gian từ năm 2008 đến quý 1 năm 2010, có 53.782% các tuần giá vàng miếng SJC (DK6) tăng thì đồng đô la Mỹ (DK7) cũng tăng, với mức độ tin cậy đạt 80.81%.

Chỉ số CPI trong hai năm qua có mối liên hệ chặt chẽ với giá vàng, với 51.261% số tuần có sự gia tăng của CPI cũng đồng thời ghi nhận sự tăng giá của vàng, đạt độ tin cậy 89.02%.

Các mặt hàng nhập khẩu cũng được phản ánh thông qua luật 36 này :

Trong luật 36 chỉ rõ, nếu Dầu DO nhập khẩu tăng giá thì Xăng RON 92 nhập khẩu cũng tăng giá với độ tin cậy là trên 79%

Biến động giá thế giới của các nguyên liệu cơ bản như dầu, gas và đồng có mối liên hệ chặt chẽ với sự thay đổi giá của các mặt hàng có tính trao đổi quốc tế cao, chẳng hạn như vàng và giá USD Những quy luật này cho thấy sự tương tác giữa các thị trường, ảnh hưởng đến kinh tế toàn cầu.

Theo các luật 3 và 11, hơn 50% thời gian trong hai năm 2008, 2009 và quý 1/2010, khi giá Dầu thô Brent IPE tại London hoặc giá Đồng tại New York tăng, giá vàng trong nước cũng có xu hướng tăng với độ tin cậy trên 80%.

Các luật có độ hỗ trợ và độ tin cậy cao thường liên quan đến nguyên liệu cơ bản Nếu giảm hai giá trị này, số lượng luật sẽ tăng lên đáng kể Điều này cho thấy từ năm 2008 đến đầu năm 2010, giá thế giới của nhiều nguyên liệu cơ bản đã biến động mạnh, và gợi ý rằng để nghiên cứu sâu hơn các loại mặt hàng khác, nên loại bỏ nguyên liệu cơ bản khỏi phân tích.

3.4.3 Luật kết hợp theo cho nhóm mặt hàng dân sinh

Trong bài viết này, chúng ta sẽ phân tích nhóm mặt hàng dân sinh để hiểu rõ sự biến động giá trong hai năm qua Dữ liệu phục vụ cho việc phát hiện luật kết hợp sẽ được xây dựng từ tập dữ liệu ban đầu, loại trừ các mặt hàng không thuộc nhóm dân sinh Chúng ta sẽ chỉ tập trung vào các mặt hàng dân sinh có sự thay đổi giá, bao gồm cả tăng và giảm so với tuần trước.

Kết luận chương

Trong chương cuối của luận văn, chúng tôi đã hoàn thành việc chuyển đổi dữ liệu thực tế thành định dạng phù hợp cho phần mềm phát hiện luật kết hợp CBA Đồng thời, chương này cũng đã phân tích một số kết quả quan trọng, làm rõ mối quan hệ giữa sự biến động giá của các mặt hàng dân sinh trong nước, hàng nhập khẩu, xuất khẩu và một số mặt hàng điển hình trên thế giới.

Ngày đăng: 27/06/2022, 15:36

HÌNH ẢNH LIÊN QUAN

- Qua bảng trên cho thấy: - (LUẬN VĂN THẠC SĨ) Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá
ua bảng trên cho thấy: (Trang 17)
Giả sử T là tập các loại mặt hàng như hình trên, gồm các đỉnh và các cạnh. Mỗi đỉnh biểu  diễn  một  lớp  (Hardware,  Computers,  Electronics,..),  đỉnh  mà  không  có  đỉnh  con(hay  có  độ  sâu  bằng  0)  thì  được  coi  là  các  mặt  hàng - (LUẬN VĂN THẠC SĨ) Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá
i ả sử T là tập các loại mặt hàng như hình trên, gồm các đỉnh và các cạnh. Mỗi đỉnh biểu diễn một lớp (Hardware, Computers, Electronics,..), đỉnh mà không có đỉnh con(hay có độ sâu bằng 0) thì được coi là các mặt hàng (Trang 20)
- Theo bảng: dữ liệu lưu tại hai file, file *.names, file *.data - (LUẬN VĂN THẠC SĨ) Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá
heo bảng: dữ liệu lưu tại hai file, file *.names, file *.data (Trang 43)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w