Xây dựng CSDL

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu công cụ khai phá dữ liệu và ứng dụng vào đánh giá hiệu quả làm việc của cán bộ công chức tại bộ nội vụ nước CHDCND lào​ (Trang 49 - 55)

Khai phá dữ liệu (Data mining) là một tập hợp các kỹ thuật được sử dụng để tự động khai thác và tìm ra các mối quan hệ lẫn nhau của dữ liệu trong một tập hợp dữ liệu khổng lồ và phức tạp, đồng thời cũng tìm ra các mẫu tiềm ẩn trong tập dữ liệu [10].

Khai phá dữ liệu chính là sử dụng những kỹ thuật, những phương pháp để đưa ra những thông tin có cấu trúc, những tri thức tiềm ẩn trong lượng dữ liệu. Các kỹ thuật phát hiện tri thức được thực hiện qua nhiều giải đoạn và sử dụng nhiều phương pháp như: phân lớp, gom cụm, phân tích sự tương tự, tổng hợp, phát hiện luật kết hợp và mẫu tuần tự,... [5]

Với mục tiêu của luận văn này trước hết là khảo sát, thiết kế xây dựng cơ sở dữ liệu phụ vụ cho xử lý đưa ra các thông tin cần thiết sau đó thì xây dựng các giải pháp vận dụng thuật toán vào xử lý CSDL để đưa ra các kết quả cho người dùng đáp ứng các yêu cầu, tiêu chí phục vụ cho bài toán quản trị nhân lực hiệu quả.

Việc đánh giá hiệu quả làm việc là một việc rất quan trọng; trong hàng năm tại Bộ Nội Vụ có thực hiện công việc này thường xuyên và chưa có công cụ nào để giúp xử lý thông tin. Quá trình đánh giá có thực hiện bằng con người các công chức được ngồi đánh giá xếp loại với nhau làm cho việc đó chưa chính xác, không khách quan và khó lưu trữ. Như vậy tôi muồn dụng công cụ máy tính để giúp giải quyết việc này.

Hàm hồi quy là kỹ thuật đã được áp dùng trong luận văn này. Hồi quy (regression) là việc học một hàm ánh xạ từ một mẫu dữ liệu thành một biến dự đoán có giá trị thực[9]. Nhiệm vụ của hồi quy tương tự như phân lớp, điểm khác nhau chính là ở chỗ thuộc tính để dự báo là liên tục chứ không phải rời rạc. Việc dự báo các giá trị số thường được làm bởi các phương pháp thống kê cổ điển, chẳng hạn như hồi quy tuyến tính; mối phụ thuộc của hồi quy là một biến (gọi là biến phụ thuộc hay biến được giải thích) với một hay nhiều biến khác (được gọi là (các) biến độc lập hay biến giải thích có giá trị đã biết) nhằm ước lượng và dự báo giá trị trung bình của biến phụ thuộc với các giá trị đã biết của (các) biến độc lập.

Kết quả dữ liệu đánh giá hiệu quả làm việc là dữ liệu có giá trị thống kê nó là một trong những công cụ quản lý vĩ mô quan trọng, có vai trò cung cấp thông tin thống kê trung thực, khách quan, chính xác, đầy đủ, kịp thời đáp ứng yêu cầu đánh giá, dự báo tình hình, hoạch định chiến lược, xây dựng kế hoạch, quy hoạch chính sách, quản lý nguồn nhân lực và đáp ứng yêu cầu kiểm tra, giám sát việc thực hiện chiến lược, kế hoạch, chính sách phát triển đáp ứng nhu cầu sử dụng thông tin thống kê của cơ quan, tổ chức, cá nhân. Dữ liệu này gồm cả dữ liệu định lượng và dữ liệu định tính để hình thành thông tin thống kê về hiện tượng nghiên cứu.

- Dữ liệu cần thu thập và nhập vào hệ thống.

Dữ liệu nhập vào hệ thống là dữ liệu tổng hợp các bảng đánh giá hiệu quả làm việc của mỗi cán bộ công chức tại Cục tổ chức và quản lý cán bộ; Bộ Nội Vụ. Các dữ liệu đó chưa được xử lý và là cơ sở dữ liệu nguyên bản có giá trị cao cho việc phân tích và phát triển công việc.

Vì dụ: Bảng quyết định của một số công chức cán bộ đã khảo sát trong năm 2020

Bảng 3.1 Bảng quyết định của chị Chanthanet INKEO

Bảng 3.2 Bảng quyết định của anh Vilanoud PHONGPHILA

Bảng 3.3 Bảng quyết định của anh Konika VORRASAN

Bảng 3.4 Bảng quyết định của chị Nina CHANTHILA

- Tiền xử lý dữ liệu.

Dữ liệu là bảng quyết định đánh giá hiệu quả làm việc của cán bộ công chức cấp cán bộ chuyên môn trong số 21 người. Các cơ sở dữ liệu thu được thường chứa rất nhiều thuộc tính nhưng lại không đầy đủ, không thuần nhất, có nhiều lỗi và các giá trị đặc biệt. Vì vậy, giai đoạn thu thập và tiền xử lý dữ liệu trở nên rất quan trọng trong quá trình phát hiện tri thức từ cơ sở dữ liệu. Sau khi thu thập được thông tin trước khi nhập dữ liệu vào hệ thông bước đầu tiên phải chọn các dữ liệu và sau đó mã hóa dữ liệu như kết quả trong bảng đánh giá điểm 9.1-10 = 1; điểm 8-9 = 2; điểm 5-7.9 = 3; điểm 2-4.9 = 4 và điểm 1-1.9 = 5.

Cơ sở dữ liệu đã chạy trên Funtion Data Analysis (Regression) để tìm ra các giá trị của X với mỗi nhân tố có tác động đến Y.

Dữ liệu đầu vào: Định dạng đầu vào có 11 cốt. Cốt đầu tiền là định danh hiệu quả làm việc (Y) và từ cốt thứ 2 đến cốt 11 là định danh tiêu chí đánh giá hay gọi là các nhân tố (X)

Bước 1: Nhập thông tin vào hệ thông

Bảng 3.5: Bảng nhập thông tin bảng quyết định vào hệ thông cấp cán bộ chuyên môn

Bước 2: Trên thẻ Data, nhấn chuột vào biểu tượng Data Analysis. Trong cửa sổ Data analysis hiện ra chọn Regression rồi chọn OK.

Bước 3: Cửa sổ Regression xuất hiện. Với bảng tính trên, Thủ Thuật Phần Mềm lựa chọn thông số như sau rồi ấn nút OK.

Bảng 3.7: Bảng cửa số Fuction Regreesion

- Input Y Range: Vùng chứa biến phụ thuộc (nhấn chuột vào ô nhập bên phải sau đó ra ngoài màn hình chính kéo chọn vùng chứa biến phụ thuộc- bao gồm cả tên biến)

- Input X Range: Vùng chứa biến độc lập (nhấn chuột vào ô nhập bên phải sau đó ra ngoài màn hình chính ké chọn vùng chứa biến độc lập-bao gồm cả tên lẫn biến)

- Labels: Nhấn chọn ô này để có sử dụng tên biến

- Confidence Level: Độ tin cậy (1-a), mặc định 95%, nếu muốn thay đổi thì nhấn chuột chọn ô này và nhập độ tin cậy mới

- Output Range: Vùng xuất, nhấn chuột tùy chọn này, sau đó nhấn chuột vào ô nhập bên phải rồi ra ngoài màn hình chính nhấn chọn một ô bất kì làm nơi xuất ra

Bảng 3.8: Bảng Variables of Work Quality

Dữ liệu đầu ra: Đầu ra là một tập các bộ quy tắc, dữ liệu được trình bày theo hình thức bảng cho biết kết quả của các nhân tố (X) có giá trị tác động với hiệu quả làm việc (Y).

 Hệ số R Square cho thể diễn giải như: mô hình cho phép giải thích bao nhiêu % sự biến thiên của Y.

 Hằng số a cho biết liên hệ giữa Y và mỗi biến số độc lập x

 Trước tiên xét dấu của x

- x>0 quan hệ tỉ lệ thuận hay tương quan thuận: x tăng thì Y tăng, x giảm thì Y giảm.

- x<0 quan hệ tỉ lệ nghịch hay tương quan nghịch: x tăng thì Y giảm và ngược lại

 Intercept là giá trị của b (hệ số)

 x là giá trị của các nhân tố (biến số độc lập) - x1 là Chính trị tư tưởng

- x2 là Đạo đức - x3 là Tầm nhìn

- x5 là Sáng tạo quản lý công việc

- x6 là Kiến thức và khả năng chuyên môn - x7 là Quyết định

- x8 là Sự tin tưởng

- x9 là Trung thực với nghề nghiệp

- x10 là Lắng nghe ý kiến của người khác

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu công cụ khai phá dữ liệu và ứng dụng vào đánh giá hiệu quả làm việc của cán bộ công chức tại bộ nội vụ nước CHDCND lào​ (Trang 49 - 55)