Phụ thuộc hàm

Một phần của tài liệu Khai phá dữ liệu trong mô hình dữ liệu dạng khối (Trang 47)

7. Cấu trúc của luận văn

2.1.4. Phụ thuộc hàm

Sau đây, để cho đơn giản ta sử dụng các kí hiệu: x(i) = (x; Ai) ; id(i) = {x(i) | x  id}.

Ta gọi x(i) (x  id, i = 1..n) là các thuộc tính chỉ số của lược đồ khối R = (id; A1,A2,...,An).

Định nghĩa 2.3: [3]

Cho lược đồ khối R = (id; A1,A2,...,An), r(R) là một khối trên R, n

i i 1 ) ( id Y X,   ,

X  Y là kí hiệu một phụ thuộc hàm. Một khối r thoả X  Y nếu với mọi t1, t2 R sao cho t1(X) = t2(X) thì t1(Y) = t2(Y).

Phụ thuộc hàm được suy diễn từ tập phụ thuộc hàm F

Cho lược đồ khối R = (id; A1,A2,...,An), F là tập các phụ thuộc hàm trên R và X

 Y là một phụ thuộc hàm với n i i 1 ) ( id Y X, 

 . Nói rằng X  Y được suy diễn logic từ F nếu với mỗi khối r xác định trên R thỏa các phụ thuộc hàm trong F thì cũng thỏa X  Y. Kí hiệu là:

F│=X  Y

Định nghĩa 2.4: (Bao đóng của tập phụ thuộc hàm) [3]

Cho lược đồ khối R = (id; A1, A2,..., An), F là tập các phụ thuộc hàm trên R. Khi đó bao đóng của F kí hiệu F+ được xác định như sau:

F+ = {X  Y | F  X  Y} .

Nếu X = {x(m)}  id(m), Y = {y(k)}  id(k) thì ta kí hiệu phụ thuộc hàm X  Y đơn giản là x(m) y(k). Khối r thoả x(m) y(k) nếu với mọi t1, t2 r sao cho t1(x(m)) = t2(x(m)) thì t1(y(k)) = t2(y(k)) . Trong đó:

t1(x(m)) = t1(x; Am), t2(x(m)) = t2(x; Am); t1(y(k)) = t1(y; Ak), t2(y(k)) = t2(y; Ak).

Nhận xét 2.2

Cho R = (id; A1, A2,..., An), r(R) là một khối trên R, n

i i 1 ) ( id Y X,   ,

X  Y là kí hiệu một phụ thuộc hàm. Giả sử r(R) thoả phụ thuộc hàm XY. Khi đó nếu id = {x} thì :

-r (R) trở thành quan hệ r(A1, A2,..., An) và phụ thuộc hàm X  Y,

( n i 1 i A Y X, 

Định nghĩa 2.5: Bao đóng của tập thuộc tính chỉ số [3]

Cho lược đồ khối R=(id; A1, A2,..., An ), F là tập các phụ thuộc hàm trên R. Với

mỗi n i i 1 ) ( id X 

 , ta định nghĩa bao đóng của X đối với F kí hiệu X+ như sau: X+ = {x(i), | X  x(i) F+ } với x  id, i = 1..n

Cho lược đồ khối R=(id; A1, A2,..., An ), ta ký hiệu tập các phụ thuộc hàm trên R: Fh = { X  Y |  A i i x X   () ,  B j j x Y   ( ) , A,B {1,2,...,n} và x  id } , Fhx = { X  Y  Fh | X, Y  n i i x 1 ) (  }, với x ∈ id và kí hiệu Fhx= Fh n i i x 1 ) ( 

2.1.5. Khoá của lược đồ khối R đối với tập phụ thuộc hàm F trên R Định nghĩa 2.6: [3]

Cho lược đồ khối R = (id; A1, A2, ..., An), F là tập các phụ thuộc hàm trên R, K n (i) i 1 id 

 K được gọi là khóa của lược đồ R đối với F nếu thỏa 2 điều kiện: a) K → x(i) ∈ F+ , ∀x ∈ id, i = 1.. n.

b) ∀K’ ⊂ K thì K’ không có tính chất a).

Nếu K là khoá và K ⊆ K’’ thì K’’ gọi là siêu khoá của lược đồ khối R đối với F.

Mệnh đề 2.2 [ 3]

Cho lược đồ khối R=(id; A1, A2, ..., An), Fh, Fhx là tập các phụ thuộc hàm trên R, Rx tương ứng, K n (i) i 1 id 

 , x ∈ id. Khi đó nếu K là khóa của R đối với Fh thì 

x ∈ id, Kx =

n (i) i 1

x

 ∩ K là khóa của Rx đối với Fhx.

Cho lược đồ khối R=(id; A1, A2, ..., An), Fh, Fhx là tập các phụ thuộc hàm trên R, Rx tương ứng, Kx n (i) i 1 x 

 , x ∈ id. Khi đó nếu Kx là khóa của Rx đối với Fhx thì

K = x

x id

K

 là khóa của R đối với Fh.

Mệnh đề 2.4 [3]

Cho lược đồ khối R=(id; A1, A2, ..., An), Fh, Fhx là tập các phụ thuộc hàm trên R, Rx tương ứng, K n (i) i 1 id 

 , x ∈ id. Khi đó nếu K là khóa của R đối với Fh khi và chỉ khi Kx = K ∩

n (i) i 1

x

 là khóa của Rx đối với Fhx.

Hệ quả:

Cho lược đồ khối R=(id; A1, A2, ..., An), Fh, Fhx là tập các phụ thuộc hàm trên R, Rx tương ứng, x ∈ id . Khi đó nếu (i)

i A

x

 với A  {1, 2, ..., n} là khóa của Rx đối

với Fhx thì (i)

i A

x

 là khóa của lược đồ R đối với Fh.

2.2. Khai phá dữ liệu trên khối bằng kỹ thuật phân cụm 2.2.1. Tính chất của kỹ thuật phân cụm 2.2.1. Tính chất của kỹ thuật phân cụm

Mệnh đề 2.5

Cho lược đồ khối R = (id; A1, A2,...., An), r(R) là một khối trên R. Khi đó nếu r thỏa tập luật K thì:

rx = r ∪ ( n (i) i 1

x

) thỏa tập luật Kx = K ∩ ( n (i) i 1

x

Chứng minh:

Thật vậy, vì r thỏa tập luật K => ∀x ∈ id thì rx cũng thỏa tập luật K. Nhưng tập luật K hạn chế trên rx chính là Kx. Kx = K ∩ ( n (i) i 1 x  )

Như vậy, lát cắt rx của r thỏa tập luật Kx, ∀x ∈ id.

Mệnh đề 2.6

Cho lược đồ khối R = (id; A1, A2,...., An), r(R) là một khối trên R. Khi đó, ∀x ∈

id, rx thỏa tập luật Kx thì r thỏa tập luật K =

x x id

K 

(chỉ số x được coi như nhau ở mỗi lát cắt)

Chứng minh:

Theo giả thiết với mỗi x ∈ id ta có tập luật mà rx thỏa mãn Kx =>

x x id r  sẽ thỏa mãn tập luật x x id K  . Từ đó ta có r = x x id r  thỏa K = x x id K 

tức là thỏa tập luật chung lớn nhất trong các tập luật Kx trên các lát cắt rx tương ứng.

Trên cơ sở các tính chất trên ta rút ra thuật toán khai phá dữ liệu trên khối bằng kỹ thuật phân cụm dựa trên thuật toán K-mean, ta thu được thuật toán K-mean trên khối.

Ý tưởng thuật toán K-mean trên khối: dựa trên thuật toán K-mean trong khai phá dữ liệu bằng kỹ thuật phân cụm trong mô hình quan hệ. Từ một khối dữ liệu r cho trước ta chia nó thành từng lát cắt rx = r ∩ ( n (i)

i 1

x

). Khi đó mỗi lát cắt rx là một quan hệ.

Sử dụng thuật toán K-mean đã biết trong mô hình quan hệ để tìm tập quy luật Kx trên lát cắt rx, ∀x ∈ id. Sau khi tìm được các tập luật Kx, ∀x ∈ id để tìm tập quy luật cho khối r cần tìm ta chỉ việc lấy giao của các tập Kx.

K = x x id K 

Từ đó ta có thuật toán K-mean trên khối như sau:

2.2.2. Thuật toán K-mean trên khối

Input: Số cụm k và các trọng tâm cụm {mj}kj=1.

Output: Các cụm C[i] (1 ≤ i ≤ k) và hàm tiêu chuẩn E đạt giá trị tối thiểu.

Begin

For x ∈ id do

Begin

Bước 1: Khởi tạo

Chọn k trọng tâm {mj}k

j=1 ban đầu trong không gian Rd (d là số chiều của dữ liệu). Việc lựa chọn này có thể là ngẫu nhiên hoặc theo kinh nghiệm.

Bước 2: Tính toán khoảng cách

Đối với mỗi điểm Xi (1 i n), tính toán khoảng cách của nó tới mỗi trọng tâm mj (1 j k). Sau đó tìm trọng tâm gần nhất đối với mỗi điểm.

Bước 3: Cập nhật lại trọng tâm

Đối với mỗi 1 j k, cập nhật trọng tâm cụm mj bằng cách xác định trung bình cộng các vectơ đối tượng dữ liệu.

Điều kiện dừng:

Lặp lại các bước 2 và 3 cho đến khi các trọng tâm của cụm không thay đổi. End;

Giao các cụm tương ứng tìm được trên các lát cắt rx đã tìm được, ∀ x ∈ id

End.

Mệnh đề 2.7:

Thuật toán K-mean trên khối là đúng.

Mệnh đề 2.8:

Thuật toán K-mean trên khối có độ phức tạp là: O((3mnkd)τTflop)

Trong đó, n là số đối tượng dữ liệu, m là số phần tử của tập id, k là số cụm dữ liệu, d là số chiều, τ là số vòng lặp, Tflop là thời gian để thực hiện một phép tính cơ sở như phép tính nhân, chia,...

Chứng minh:

Thật vậy, như ta đã biết thuật toán K-mean trên các lát cắt chính là thuật toán K-mean trên quan hệ có độ phức tạp là O((3nkd)τTflop) * m. Vì mỗi một khối được chia thành nhiều lát cắt, số lượng lát cắt đúng bằng số phần tử của tập id => nếu số phần từ id = m thì độ phức tạp của thuật toán K-mean trên khối sẽ là:

Kết luận chương 2

Chương này gồm hai phần:

Phần một giới thiệu về mô hình khối với các khái niệm khối, lược đồ khối, đại số quan hệ trên khối, phụ thuộc hàm, bao đóng của tập phụ thuộc hàm, khóa của lược đồ khối.

Phần hai, áp dụng khai phá dữ liệu trên mô hình khối phần này đã chứng minh một số tính chất của việc khai phá dữ liệu bằng phân cụm trên mô hình khối thể hiện qua các mệnh đề 2.5, 2.6, đã đề xuất ra một thuật toán mới dựa trên thuật toán K- means đã có trên mô hình quan hệ đó là thuật toán K-means trên mô hình khối và thuật toán này cũng đã có mệnh đề khẳng định tính đúng đắn của nó và một mệnh đề khẳng định độ phức tạp của thuật toán K-means trên khối.

CHƯƠNG 3

PHÂN CỤM KẾT QUẢ HỌC TẬP TẠI

TRƯỜNG CAO ĐĂNG NGHỀ CƠ KHÍ NÔNG NGHIỆP 3.1. Giới thiệu Trường Cao đẳng nghề Cơ khí nông nghiệp

Trường Cao đẳng nghề Cơ khí nông nghiệp trực thuộc Bộ NN và PTNT, tiền thân là Trường Máy kéo Hà Trung thành lập năm 1960 tại Hà Trung - Thanh Hoá. Tháng 8 năm 1965 Trường chuyển đến xã Trung Mỹ - huyện Bình Xuyên - tỉnh Vĩnh Phúc, tháng 4 năm 1966 đổi tên thành Trường Trung học Cơ khí nông trường, đến tháng 08 năm 1972 đổi tên thành Trường Công nhân Cơ khí nông nghiệp 1 Trung Ương.

Tháng 1 năm 2007, Trường Cao đẳng nghề Cơ khí nông nghiệp được thành lập trên cơ sở nâng cấp từ Trường Công nhân Cơ khí nông nghiệp 1 Trung Ương theo quyết định số 77/QĐ-Bộ LĐTB-XH của Bộ Lao động - Thương binh và Xã hội ngày 12/01/2007 và quyết định số 197/QĐ-BNN-TCCB ngày 24/01/2007 của Bộ NN và PTNT về chức năng nhiệm vụ và cơ cấu tổ chức của Trường Cao đẳng nghề Cơ khí nông nghiệp.

Với truyền thống 52 năm xây dựng và phát triển, Trường đã xây dựng được đội ngũ giáo viên đoàn kết một lòng, có kiến thức, có tay nghề cao, luôn luôn đổi mới và tâm huyết với nghề. Hiện tại nhà trường có 234 cán bộ công chức viên chức trong đó có 212 giáo viên với 126 người có trình độ trên đại học, có quy mô HSSV với lưu lượng đào tạo hiện tại từ 2000 - 3000 HSSV và HV. Trường đã đào tạo được nhiều thế hệ HSSV những kiến thức và kỹ năng cần thiết để khẳng định được mình. Xây dựng được thương hiệu của Trường và luôn có vị thế xứng đáng trong ngành NN & PTNT, tỉnh Vĩnh Phúc và khu vực.

Trường đã tạo lập được không gian văn hóa riêng đảm bảo điều kiện tốt nhất để cán bộ giáo viên phát huy hết nội lực và cống hiến cho sự nghiệp chung của nhà trường.

Trường có nhiệm vụ:

Đào tạo nguồn nhân lực chất lượng cao phục vụ Công nghiệp hoá Hiện đại hoá thực hiện ứng dụng, chuyển giao tiến bộ khoa học và hội nhập quốc tế, trong đó lấy đào tạo nguồn nhân lực các lĩnh vực: Cơ điện nông nghiệp, Cơ khí, Động lực, Điện, Sư phạm dạy nghề làm trọng điểm. Trường Đào tạo nghề theo 3 cấp trình độ: Cao đẳng nghề, Trung cấp nghề và Sơ cấp nghề theo qui định. Bồi dưỡng nâng cao trình độ kỹ năng nghề cho người lao động theo yêu cầu của cơ sở sản xuất, kinh doanh, dịch vụ và người lao động. Tham gia phổ cập nghề cho người lao động, dạy kỹ thuật và hướng nghiệp cho học sinh phổ thông. Tham gia đào tạo bồi dưỡng nâng cao trình độ cho đội ngũ giáo viên dạy nghề, tham gia nghiên cứu, ứng dụng các tiến bộ khoa học công nghệ liên quan đến các nội dung đào tạo của Trường và chuyển giao các tiến bộ kỹ thuật vào phục vụ sản xuất. Liên kết và hợp tác với các tổ chức: cơ sở đào tạo, nghiên cứu, sản xuất kinh doanh trong nước và ngoài nước để kết hợp đào tạo với sản xuất, tăng nguồn thu cho nhà trường. Quản lý tổ chức, viên chức và tài sản của Trường theo phân cấp quản lý của Bộ và quy định của Nhà nước.

Trong những năm qua, thực hiện chủ trương của Đảng, Nhà nước, các cấp các ngành và toàn xã hội, dạy nghề đang được phục hồi và phát triển mạnh mẽ trên nhiều mặt. Đào tạo nghề kết hợp chặt chẽ với sản xuất, tạo việc làm trong nước và xuất khẩu lao động, góp phần chuyển dịch cơ cấu lao động và cơ cấu kinh tế, xoá đói giảm nghèo, nâng cao chất lượng lao động. Tuy nhiên, việc triển khai xây dựng các trường chất lượng cao, trường đạt trình độ tiên tiến của khu vực còn chậm, cơ cấu ngành nghề đào tạo chưa sát với nhu cầu thị trường lao động, các điều kiện đảm bảo chất lượng dạy nghề còn hạn chế. Chất lượng dạy nghề chưa đáp ứng yêu cầu phát triển ngày càng cao của sự nghiệp Công nghiệp hoá, hiện đại hoá và hội nhập kinh tế quốc tế.

Với nhiệm vụ được giao, trường Cao đẳng nghề Cơ khí Nông nghiệp không thể nào khác là phải tự đổi mới toàn diện để đào tạo nguồn nhân lực có chất lượng cao;

nghiên cứu, ứng dụng và chuyển giao các tiến bộ khoa học công nghệ vào phục vụ sản xuất.

Các khoa và các ngành nghề đào tạo cụ thể:

1. Khoa công nghệ thông tin gồm các nghề đào tạo: Công nghệ thông tin (ứng dụng phần mềm), Sửa chữa và lắp ráp máy tính; Quản trị mạng; Tin văn phòng.

2. Khoa động lực gồm các nghề đào tạo: công nghệ ô tô.

3. Khoa điện gồm các nghề đào tạo: Điện dân dụng; Kỹ thuật lắp đặt điện và điều khiển trong công nghiệp.

4. Khoa điện tử gồm các nghề đào tạo: Điện tử công nghiệp; Kỹ thuật máy lạnh và điều hòa không khí; Điện tử dân dụng.

5. Khoa cơ khí gồm các nghề đào tạo: Hàn; Cắt gọt kim loại.

6. Khoa cơ giới gồm các nghề đào tạo: Xếp dỡ cơ giới tổng hợp; Vận hành máy xây dựng; Vận hành máy thi công nền; Vận hành máy nông nghiệp; Vận hành và sửa chữa trạm bơm điện; Kỹ thuật máy nông nghiệp.

7. Khoa sư phạm dạy nghề đào tạo các nghề: Sư phạm dạy nghề. 8. Khoa kế toán đào tạo các nghề: Kế toán doanh nghiệp.

3.1.1. Cơ cấu tổ chức

Tổ chức bộ máy nhà trường được thực hiện theo quyết định số 197/QĐ-BNN- TCCB ngày 24/01/2007 của Bộ Nông nghiệp và PTNT về chức năng nhiệm vụ và cơ cấu tổ chức của Trường Cao đẳng nghề Cơ khí nông nghiệp:

Hình 3.1: Sơ đồ tổ chức trường CĐN Cơ khí nông nghiệp

3.1.2. Yêu cầu xây dựng CSDL:

Hàng năm nhà trường được Bộ Lao động Thương binh và Xã hội và sở giáo dục đào tạo Vĩnh Phúc phê duyệt chỉ tiêu tuyển sinh. Trung tâm tuyển sinh và dịch vụ việc làm có nhiệm vụ thông báo tuyển sinh trên các địa bàn trong cả nước. Trung tâm tuyển sinh và dịch vụ việc làm làm nhiệm vụ phân công mọi người đi tuyển sinh các tỉnh phía Bắc (tập trung chủ yếu ở tỉnh Vĩnh Phúc và một số tỉnh miền núi phía Bắc). Mỗi người phụ trách một số tỉnh thành và đến các trường thông báo tuyển sinh trực tiếp tại trường đó. Sau khi học sinh tham gia học tập tại trường phòng đào tạo kết hợp với trung tâm tuyển sinh và dịch vụ việc làm nhập danh sách học sinh gồm các thông tin: Họ tên học sinh, ngày sinh, giới tính, nơi sinh, địa chỉ liên hệ, số điện thoại, mã nghề đăng ký. Vì vậy nhà trường cần lưu trữ dữ liệu học sinh trong vòng 5-10 năm để thực hiện việc tra cứu đối chiếu số liệu.

Bài toán đặt ra đối với hệ thống cơ sở dữ liệu là phân tích số liệu theo một số chủ đề quan tâm, phục vụ công tác quản lý đào tạo, như liệt kê sau :

1. Kết quả học tập của học sinh: Giỏi, khá, trung bình, yếu, kém 2. Kết quả vùng miền đến kết quả học tập đó như thế nào. 3. Các dân tộc khác nhau có kết quả học tập ra sao.

4. Hoàn cảnh gia đình, đạo đức lối sống của học sinh

5. Phân tích số liệu ảnh hưởng của các môn học tự nhiên đến các môn học xã hội

Một phần của tài liệu Khai phá dữ liệu trong mô hình dữ liệu dạng khối (Trang 47)

Tải bản đầy đủ (PDF)

(87 trang)