1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống tư vấn chọn ngành nghề cho sinh viên trường Cao đẳng Việt Nam - Han Quốc - Quảng Ngãi

19 127 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 19
Dung lượng 904,87 KB

Nội dung

Điều quan trọng nhất hiện nay là phải phân luồng đúng đối tượng, đúng mục đích và làm tốt công tác hướng nghiệp, giúp sinh viên định hướng được nghề nghiệp trong tương lai theo đúng sở t

Trang 1

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA



HỒ ANH TỐ

XÂY DỰNG HỆ THỐNG TƯ VẤN CHỌN NGÀNH NGHỀ CHO SINH VIÊN

TRƯỜNG CAO ĐẴNG VIỆT NAM – HÀN QUỐC - QUẢNG NGÃI

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01.01

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng – Năm 2017

Trang 2

Công trình được hoàn thành tại TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: PGS TS VÕ TRUNG HÙNG

Phản biện 1:

Phản biện 2:

Luận văn sẽ được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ

Kỹ thuật, , họp tại Trường Đại học Phạm Văn Đồng vào ngày 17 tháng

06 năm 2018

Có thể tìm hiểu luận văn tại:

 Trung tâm Học liệu và Truyền thông, Trường Đại học Bách khoa, ĐHĐN

 Thư viện Khoa CNTT, Trường Đại học Bách khoa – ĐHĐN

Trang 3

MỞ ĐẦU

Hiện tại, cơ hội học nghề cho sinh viên rất nhiều, với nhiều chính sách ưu tiên Luật Giáo dục nghề nghiệp vừa có hiệu lực cũng

có những đổi mới phù hợp với xu thế Điều quan trọng nhất hiện nay

là phải phân luồng đúng đối tượng, đúng mục đích và làm tốt công tác hướng nghiệp, giúp sinh viên định hướng được nghề nghiệp trong tương lai theo đúng sở thích, đam mê và điều kiện thực tế của bản thân, xã hội

Khi bước vào một ngôi trường đào tạo nghề, các bạn sinh viên luôn mong muốn mình chọn được một ngành nghề học phù hợp với năng lực, trình độ, sở thích, cơ hội việc làm và điều kiện của bản thân Tuy nhiên, không phải lúc nào các sinh viên cũng đủ khả năng lựa chọn cho mình một ngành nghề phù hợp

Khi chọn sai ngành nghề sinh viên là đối tượng chịu ảnh hưởng trực tiếp, sinh viên thường thiếu động lực và chán nản, dễ dẫn đến bỏ học, một số sinh viên có điều kiện thì chuyển ngành, số khác tiếp tục theo đuổi nhưng trong tâm thế buông trôi, từ đó dẫn đến chất lượng đào tạo kém, chất lượng nguồn lao động không đáp ứng được nhu cầu xã hội; ảnh hưởng tiếp đến là các cơ sở đào tạo và sâu xa hơn nữa là ảnh hưởng đến cả nền kinh tế quốc gia

Trường Cao đẳng Việt Nam - Hàn Quốc - Quảng Ngãi tiền thân là Trường Cao đẳng nghề Việt Nam - Hàn Quốc - Quảng Ngãi hiện nay đang đào tạo các ngành nghề như Công nghệ thông tin, Cơ khí, Kỹ thuật điện - điện tử, Kỹ thuật điều khiển và tự động hóa, Kỹ thuật xây dựng, Công nghệ ô tô, Công nghệ thực phẩm Trong tương lai sẽ đào tạo thêm nhiều ngành nghề khác như: Giáo dục mầm non, Công nghệ sau thu hoạch, Công nghệ chế biến thủy sản, Chăn nuôi,

Trang 4

Phát triển nông thôn, Nuôi trồng thủy sản, Xét nghiệm Y học, Dược, Điều dưỡng, Lúc đó việc tư vấn chọn ngành nghề phù hợp sẽ rất quan trọng đối với sinh viên

Chính vì vậy tôi quyết định chọn đề tài “Xây dựng hệ thống

tư vấn chọn ngành nghề cho sinh viên Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi” để làm đề tài luận văn tốt nghiệp

cao học Trong đề tài này, tôi đề xuất giải pháp ứng dụng KPDL bằng thuật toán luật kết hợp để xây dựng hệ thống tư vấn chọn ngành nghề học phù hợp cho sinh viên tại Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi

Trang 5

CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN

1.1 Khai phá dữ liệu

1.1.1 Tổng quan về khai phá dữ liệu

1.1.1.1 Khái niệm khai phá dữ liệu

Khai phá dữ liệu là một khái niệm ra đời vào cuối những năm

1980 Nó là quá trình khám phá thông tin ẩn được tìm thấy trong các CSDL và có thể xem như là một bước trong quá trình khám phá tri thức Quá trình này kết xuất ra các tri thức tiềm ẩn từ dữ liệu giúp cho việc dự báo trong kinh doanh, các hoạt động sản xuất, giáo dục KPDL làm giảm chi phí về thời gian so với phương pháp truyền thống trước kia

Một số định nghĩa của nhiều tác giả về KPDL:

- Định nghĩa của Ferruzza

- Định nghĩa của Parsaye

- Định nghĩa của Fayyad

1.1.1.2 Chức năng chính của khai phá dữ liệu

- Mô tả khái niệm (concept description): thiên về mô tả, tổng hợp và tóm tắt khái niệm

- Luật kết hợp (association rules): là dạng luật biểu diễn tri thức ở dạng khá đơn giản

- Phân lớp và dự đoán (classification & prediction): xếp một đối tượng vào một trong những lớp đã biết trước

- Phân cụm (clustering): xếp các đối tượng theo từng cụm

- Khai phá chuỗi (sequential/ temporal patterns): tương tự như khai phá luật kết hợp nhưng có thêm tính thứ tự và tính thời gian

Trang 6

1.1.1.3 Ứng dụng của khai phá dữ liệu

- Phân tích dữ liệu và hỗ trợ ra quyết định

- Điều trị y học (medical treatment)

- Text mining & Web mining

- Tin-sinh (bio-informatics)

- Tài chính và thị trường chứng khoán

- Bảo hiểm (insurance)

- Nhận dạng (pattern recognition),

1.1.1.4 Quy trình khai phá dữ liệu

Hình 1.1 Quy trình KPDL

- Tập hợp dữ liệu (Data)

- Trích lọc dữ liệu (Extraction)

- Tiền xử lý và chuẩn bị dữ liệu (Preprocessing)

- Chuyển đổi dữ liệu (Transformation)

- Khai phá dữ liệu (Data Mining)

- Đánh giá kết quả mẫu (Interpretation/ Evaluation)

1.1.1.5 Kiến trúc của một hệ thống KPDL

1.1.2 Khai phá dữ liệu sử dụng luật kết hợp

1.1.2.1 Khái niệm về luật kết hợp

Trang 7

- Luật kết hợp là tìm các mẫu phổ biến, sự kết hợp, sự tương quan hay các cấu trúc nhân quả giữa các tập đối tượng trong các cơ

sở dữ liệu giao tác, cơ sở dữ liệu quan hệ và những kho thông tin khác để đưa ra các mối liên kết giữa các phần tử dữ liệu

- Độ phổ biến (một số tài liệu dịch là độ hỗ trợ) của một tập mục X được định nghĩa là tỷ lệ các giao tác có chứa tập mục này trong cơ sở dữ liệu với tổng số các giao tác

- Độ tin cậy của luật X  Y là xác suất xuất hiện Y với điều kiện X trong tất cả các giao tác

- Một số định nghĩa về tập hợp

1.1.2.2 Quá trình thực hiện

1.1.2.3 Một số hướng tiếp cận

- Luật kết hợp nhị phân (Binary association rule)

- Luật kết hợp có thuộc tính số và thuộc tính hạng mục (Quantitative and categorial association rule)

- Luật kết hợp tiếp cận theo hướng tập thô (mining association rule base on rough set)

- Luật kết hợp nhiều mức (multi-level association rule)

- Luật kết hợp mờ (fuzzy association rule)

- Luật kết hợp với thuộc tính được đánh trọng số (association rules with weighted items)

1.1.2.4 Một số thuật toán

- Thuật toán Apriori

- Thuật toán ASI

- Thuật toán SETM

- Thuật toán Apriori-TID

- Thuật toán FP Growth

Trang 8

1.1.3 Khai phá dữ liệu với bài tốn phân lớp

1.1.3.1 Phân lớp dữ liệu

Phân lớp dữ liệu (classification) là một trong những hướng nghiên cứu khác của khai phá dữ liệu Thực tế đặt ra nhu cầu là từ một cơ sở dữ liệu với nhiều thơng tin ẩn con người cĩ thể trích rút ra các quyết định nghiệp vụ thơng minh

Phân lớp dữ liệu là một quá trình gồm hai bước: một bước học (trong đĩ xây dựng nên một mơ hình phân lớp) và một bước phân lớp (trong đĩ mơ hình vừa xây dựng được sử dụng để dự đốn các nhãn lớp cho những dữ liệu nào đĩ)

1.1.3.2 Các phương pháp phân lớp dữ liệu

- Phân lớp dữ liệu bằng cây quyết định

- Phân lớp dữ liệu bằng giải thuật học ILA

- Phân lớp dữ liệu bằng mạng Nạve Bayes

- Phân lớp dữ liệu bằng Neural Network

1.1.4 Khai phá dữ liệu sử dụng cây quyết định

1.1.4.1 Định nghĩa cây quyết định

Hình 1.7 Ví dụ về cây quyết định

Trang 9

1.1.4.2 Các thuật toán KPDL bằng cây quyết định

- Thuật toán CLS

- Thuật toán ID3

- Thuật toán C4.5

- Thuật toán SLIQ

1.1.4.3 Ưu điểm của cây quyết định

- Cây quyết định tương đối dễ hiểu

- Việc chuẩn bị dữ liệu cho một cây quyết định là cơ bản hoặc không cần thiết

- Cây quyết định có thể xử lý cả dữ liệu có giá trị bằng số và

dữ liệu có giá trị là tên thể loại

- Cây quyết định là một mô hình hộp trắng

- Có thể thẩm định một mô hình bằng các kiểm tra thống kê

- Cây quyết định có thể xử lý tốt một lượng dữ liệu lớn trong thời gian ngắn

1.2 Lý thuyết chọn nghề nghiệp

1.2.1 Lý thuyết cây nghề nghiệp

1.2.1.1 Nội dung lý thuyết cây nghề nghiệp (LTCNN)

Sở thích, khả năng, cá tính và giá trị nghề nghiệp của mỗi người đóng vai trò rất quan trọng trong việc chọn hướng học, chọn nghề phù hợp và nó được coi là phần “Rễ” của cây nghề nghiệp Rễ

có khỏe thì cây mới khỏe và ra hoa, kết trái như mong muốn của người trồng cây Vì vậy, muốn lựa chọn nghề nghiệp phù hợp, trước hết phải hiểu rõ sở thích, khả năng, cá tính và giá trị nghề nghiệp của bản thân và phải dựa vào chính những hiểu biết này để lựa chọn nghề nghiệp Nói cách khác là phải chọn nghề theo “rễ” vì đây là yếu tố có ảnh hưởng mang tính quyết định tới sự kết trái của cây nghề nghiệp

Trang 10

1.2.1.2 Ý nghĩa lý thuyết cây nghề nghiệp

LTCNN là lý thuyết quan trọng nhất trong hướng nghiệp vì lý thuyết này đã chỉ ra rằng, công việc đầu tiên cần làm trong công tác giáo dục hướng nghiệp (GDHN) là phải giúp cho sinh viên nhận thức đầy đủ về bản thân để các em chọn được nghề phù hợp với “rễ”, tránh được tình trạng chọn nghề theo “quả”, chọn nghề theo cảm tính, theo ý kiến của người khác hoặc chọn nghề theo trào lưu chung

1.2.2 Lý thuyết mật mã Holland

1.2.2.1 Nội dung lý thuyết mật mã Holland

Hình 1.9 Mô hình lục giác Holland

Từ những giả thiết của lý thuyết Holland, có thể rút ra 2 kết luận:

- Một là, hầu như ai cũng có thể được xếp vào 1 trong 6 kiểu tính cách và có 6 môi trường hoạt động tương ứng với 6 kiểu tính cách, đó là: Nhóm kỹ thuật (KT); nhóm nghiên cứu (NC); nhóm nghệ thuật (NT); nhóm xã hội (XH); nhóm quản lý (QL); nhóm nghiệp vụ (NV)

Trang 11

- Hai là, nếu một người chọn được công việc phù hợp với tính cách của họ, thì họ sẽ dễ dàng phát triển và thành công trong nghề nghiệp

1.2.2.2 Ý nghĩa lý thuyết mật mã Holland

Lý thuyết mật mã Holland có liên quan rất chặt chẽ với LTCNN vì sử dụng LTMM Holland là một trong những cách giúp sinh viên biết được sở thích và khả năng nghề nghiệp của bản thân và những nghề nghiệp phù hợp nhanh nhất, dễ làm nhất

Vì lẽ đó, trước khi tổ chức cho sinh viên học NPT, nhà trường

và giáo viên dạy NPT nên tổ chức cho sinh viên làm trắc nghiệm tìm hiểu sở thích và khả năng nghề nghiệp của bản thân theo LTMM Holland Kết quả tìm hiểu bản thân là cơ sở quan trọng để các em dựa vào đó lựa chọn NPT theo học cho phù hợp

Trang 12

CHƯƠNG 2 PHÂN TÍCH VÀ XÂY DỰNG HỆ THỐNG

2.1 Mô tả hệ thống hỗ trợ tư vấn chọn ngành nghề

Hệ thống hỗ trợ tư vấn chọn ngành nghề được xây dựng dựa trên lý thuyết về quá trình KPDL và là hệ thống đi theo hướng hoàn toàn mới tại Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi Sau khi khảo sát yêu cầu, tôi mô tả lại hệ thống gồm các chức năng

tư vấn phục vụ đối tượng chính là sinh viên Đối tượng sinh viên là người có dự định đăng ký xét tuyển vào trường, những học sinh THPT, THCS,… Đối tượng này sẽ được tư vấn chọn ngành theo mật

mã Holland Bên cạnh đó, hệ thống còn hỗ trợ tư vấn về bậc đào tạo

và chính sách hỗ trợ học phí, ở nội trú cho sinh viên khi theo học tại Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi

2.2 Giới thiệu bài toán

Dựa vào mô tả hệ thống hỗ trợ tư vấn chọn ngành nghề ở mục 2.1, tôi phát biểu bài toán tư vấn chọn ngành nghề như sau:

- Đầu vào: Bài toán tư vấn chọn ngành nghề theo mật mã Holland thì dữ liệu đầu vào là các câu trả lời về tính cách, sở thích, hoạt động nghề nghiệp hoặc khả năng và các môn khả năng của sinh viên

- Xử lý và phương pháp sử dụng: Đối với các câu trả lời nhận được từ sinh viên, hệ thống sẽ sử dụng kỹ thuật suy diễn tiến để thực hiện so khớp với các điều kiện của các luật được lưu trong cơ sở tri thức

- Đầu ra: Kết quả tư vấn là các ngành nghề học tại Trường Cao đẳng Việt Nam – Hàn Quốc – Quảng Ngãi phù hợp với người sử dụng

Trang 13

2.3 Mô hình cấu trúc hệ thống

Mô hình cấu trúc hệ thống tư vấn chọn ngành nghề như sau:

Hình 2.1 Mô hình cấu trúc hệ thống tư vấn chọn ngành nghề

2.3.1 Mô tả đầu vào/ đầu ra

Hệ thống tư vấn chọn ngành nghề học được xây dựng với đầu

ra (Output) là một ngành nghề học phù hợp với một sinh viên nào đó; Giá trị đầu ra này sẽ phụ thuộc vào các yếu tố độc lập của đầu vào (Input) là năng lực, trình độ, sở thích, cơ hội việc làm và điều kiện của bản thân của sinh viên thông qua các câu hỏi trắc nghiệm định hướng nghề nghiệp

2.3.2 Phương pháp xây dựng hệ thống

Từ phát biểu của bài toán như trên luận văn lựa chọn và thiết

kế hệ thống sử dụng kiểu mô hình luật kết hợp với thuật toán Apriori

và LTMM Holland

2.4 Phân tích và thiết kế hệ thống

2.4.1 Phân tích về bậc đào tạo

Tùy theo nguyện vọng và nhu cầu về thời gian học cũng như năng lực của bản thân mà sinh viên được tư vấn về bậc đào tạo

2.4.2 Phân tích LTMM Holland

Con người được chia làm 6 loại tính cách Tương ứng với 6

Trang 14

loại tính cách này là 6 môi trường làm việc phù hợp

2.4.3 Xây dựng tập luật cho hệ thống tư vấn chọn ngành nghề

2.4.3.1 Các luật xếp nhóm ngành nghề

Mỗi ngành nghề có thể thuộc một hoặc nhiều nhóm ngành khác nhau Dựa vào các phân tích về LTMM Holland, tôi xây dựng các luật xếp ngành nghề vào nhóm ngành nghề như sau:

- Ngành nghề Công nghệ thông tin (Công nghệ thông tin, Quản trị mạng)

- Ngành nghề Kỹ thuật Xây dựng (Xây dựng dân dụng và công nghiệp, Cầu đường, Máy công trình xây dựng)

- Ngành Kỹ thuật Cơ khí (Cắt gọt kim loại, Công nghệ ô tô, Hàn)

- Ngành Kỹ thuật Điện, điện tử (Hệ thống điện, Nhiệt điện, Điện công nghiệp, Công nghệ kỹ thuật điện tử, viễn thông)

- Ngành Kỹ thuật Điều khiển và tự động hóa (Quang điện tử,

Tự động hóa)

- Ngành Nông nghiệp (Khoa học canh tác cây trồng, Phát triển nông nghiệp nông thôn)

- Ngành Dược học

- Ngành Điều dưỡng

2.4.3.2 Các luật xét chọn ngành học theo LTMM Holland

Luật 1: Nếu người dùng có: Một trong những tính cách của

TC1, hoặc một trong những sở thích của ST1, hoặc một trong những

hoạt động về nghề nghiệp của HD1 Thì nên chọn ngành thuộc nhóm

kỹ thuật, mã R

Luật 2: Nếu người dùng có: Một trong những tính cách của

TC2, hoặc một trong những sở thích của ST2, hoặc một trong những

hoạt động về nghề nghiệp của HD2 Thì nên chọn ngành thuộc nhóm

Trang 15

nghiên cứu, mã I

Luật 3: Nếu người dùng có: Một trong những tính cách của

TC3, hoặc một trong những sở thích của ST3, hoặc một trong những

hoạt động về nghề nghiệp của HD3 Thì nên chọn ngành thuộc nhóm

nghệ thuật, mã A

Luật 4: Nếu người dùng có: Một trong những tính cách của

TC4, hoặc một trong những sở thích của ST4, hoặc một trong những

hoạt động về nghề nghiệp của HD4 Thì nên chọn ngành thuộc nhóm

xã hội, mã S

Luật 5: Nếu người dùng có: Một trong những tính cách của

TC5, hoặc một trong những sở thích của ST5, hoặc một trong những

hoạt động về nghề nghiệp của HD5 Thì nên chọn ngành thuộc nhóm

quản lý, mã E

Luật 6: Nếu người dùng có: Một trong những tính cách của

TC6, hoặc một trong những sở thích của ST6, hoặc một trong những

hoạt động về nghề nghiệp của HD6 Thì nên chọn ngành thuộc nhóm

nghiệp vụ, mã C

2.4.3.3 Xây dựng các luật cho tư vấn dựa trên điểm và LTCNN

Để tư vấn chọn nghề dựa trên điểm thi và LTCNN, ta kết hợp luật chọn ngành theo điểm thi và luật chọn ngành theo LTCNN Tức

là nếu chọn ngành theo điểm là đúng và chọn ngành theo LTCNN là đúng cho chọn ngành theo điểm và LTCNN

2.5 Xây dựng hệ thống

2.5.1 Thiết kế CSDL

Thiết kế dữ liệu với SQL Server 2008 R2

- Table DiemTrungBinh (Lưu trữ ĐTB của học sinh)

- Table Groups (6 nhóm sở thích)

- Table Groups_Nganh (Mã ngành thuộc vào nhóm sở thích (trong 6

Ngày đăng: 19/05/2019, 15:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w