Luận văn tìm hiểu về kho dữ liệu, xây dựng kho dữ liệu cho hệ thống tư vấn và chọn trường thi và đồng thời xây dựng một công cụ hỗ trợ cho việc tạo dữ liệu mẫu cho kho dữ liệu. Công cụ được viết bằng C và SQL Server. Đây là tài liệu và chương trình nguồn đáng có của các bạn đang lập trình C, SQL Server. Code được đính kèm theo tài liệu này.
CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN MỤC LỤC MỤC LỤC A PHẦN MỞ ĐẦU .3 I Lý chọn đề tài II Mục đích nghiên cứu III Đối tượng nghiên cứu IV Phạm vi nghiên cứu V Phương pháp nghiên cứu CHƯƠNG I: TỔNG QUAN VỀ HỆ THỐNG TƯ VẤN CHỌN NGÀNH THI VÀ TRƯỜNG THI I.1 TẦM QUAN TRỌNG CỦA HỆ THỐNG .6 I.2 MÔ TẢ HỆ THỐNG TƯ VẤN .7 CHƯƠNG II: LÝ THUYẾT VỀ TẠO DỮ LIỆU MẪU .10 II.1 Một số khái niệm xác suất có liên quan đến tạo liệu mẫu 10 II.1.1 Định nghĩa xác suất .10 II.1.2 Biến ngẫu nhiên quy luật phân phối xác suất 10 II.2 Số ngẫu nhiên, giả ngẫu nhiên phương pháp sinh số ngẫu nhiên máy tính 14 II.2 Số ngẫu nhiên .14 II.2 Sinh số ngẫu nhiên máy tính - số giả ngẫu nhiên 14 II.3 Mô hình cho trình bày mô thành phần 16 II.3.1 Động thúc đẩy 16 II.3.2 Mô hình 16 II.4 Những yêu cầu quy trình tạo liệu mẫu 18 II.4.1 Sự chia cắt việc thiết kế sản xuất liệu mẫu 18 II.4.2 Đầy đủ tính linh động việc thiết kế liệu mẫu 18 II.4.3 Những đắn trình bày thống kê 19 II.4.4 Tạo liệu mẫu gới thực 19 II.4.5 Tính quán .19 II.4.6 Tính biến đổi .19 II.4.7 Hỗ trợ tạo liệu theo yêu cầu 19 II.4.8 Hỗ trợ định dạng liệu 20 II.4.9 Điều khiển việc sản xuất liệu mẫu 20 II.4.10 Sự an toàn/Quyền hạn 20 II.4.11 Tính suốt cục bộ/Từ xa .20 II.4.12 Sự độc lập 20 II.5 Quy trình tạo liệu mẫu 21 II.6 Một số khái niệm kho liệu liên quan tới chương trình 22 II.6.1 Khái niệm mục đích kho liệu 22 II.6.2 Một số đặc tính liệu kho liệu 23 II.6.3 Mô hình liệu đa chiều .24 CHƯƠNG III: XÂY DỰNG CÔNG CỤ DATA GENERATOR TOOL (DGT) CHO HỆ THỐNG CHỌN NGÀNH THI VÀ TRƯỜNG THI 30 III.1 Tổng quan 30 III.1.1.Mô hình tổng quát quy trình tạo liệu mẫu cho hệ thống 30 III.1.2 Chỉ dẫn số thành phần mô hình quy trình tạo liệu 31 III.2 Xây dựng công cụ DGT cho việc tạo liệu mẫu 32 III.2.1 Mô hình trường hợp sử dụng công cụ 32 III.2.2 Biểu đồ hoạt động công cụ 33 KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN III.2.3 Định nghĩa nguồn liệu 34 III.2.4 Định nghĩa Các chiều (Dimension) 42 III.2.5 Định nghĩa Các bảng chiều (Dimension Table) 43 III.2.6 Định nghĩa kiện (Fact) 44 III.2.7 Định nghĩa bảng kiện (Fact Table) 45 III.2.8 Tạo liệu mẫu 46 C PHẦN KẾT LUẬN 48 I KẾT QUẢ ĐẠT ĐƯỢC 48 II NHỮNG HẠN CHẾ CỦA ĐỀ TÀI 49 III HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 49 TÀI LIỆU THAM KHẢO 50 KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN A PHẦN MỞ ĐẦU I Lý chọn đề tài Việc ứng dụng công nghệ thông tin vào ngành nghề khác xã hội ngày trọng Hệ thống mạng máy tính phát triển mạnh, đặc biệt xuất mạng internet làm cho xã hội dần chuyển sang sống số Các hệ thống kinh doanh, bán hàng, dịch vụ thông qua mạng internet áp dụng xa hội ngày Học bạ điện tử vấn đề nhà nước ta quan tâm Hệ thống thông tin tư vấn học tập sinh không nằm mục đích tận dụng phát triển mạng internet đưa dịch vụ tư vấn để người tư vấn cách trực tuyến Hệ thống tư vấn chọn khối thi ngành thi góp phần vào việc tư vấn cho học sinh chọn ngành nghề, chọn trường học dựa vào kho liệu tồn lâu (từ kho liệu người ta đưa luật sau dựa vào luật mà hệ thống tư vấn lại cho học sinh) Hệ thống thông tin tư vấn học tập dựa liệu sau : • Học bạ học sinh • Hồ sơ đăng ký dự thi học sinh • Kết tuyển sinh Hệ thống thông tin tư vấn sinh viên làm hướng dẫn Thầy giáo Nguyễn Thanh Bình Mỗi sinh viên đảm nhiệm nhiệm vụ tương ứng với quy trình làm phần mềm, có quy trình quan trọng kiểm định chất lượng phần mềm Mục đích kiểm định phần mềm để kiểm tra xem sản phẩm có đạt chất lượng hay không, có thảo mãn yêu cầu không? KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Đối với hệ thống tư vấn chọn khối thi ngành thi việc có kho liệu khó, lên tới 10 năm, 20 năm hay có đưa đựợc thông tin tư vấn xác Việc có liệu mô vấn đề quan trọng mà liệu thật khó khăn tập hợp (ví dụ ta khó xin sở liệu tuyển sinh trường …) Dữ liệu mô hỗ trợ cho việc test hệ thống, mô hệ thống thử nghiệm trước chuyển sang hệ thống thật Việc tạo công cụ giúp cho ta giảm bớt công sức thời gian để thu nhập liệu… Từ lý mà chọn đề tài “XÂY DỰNG CÔNG CỤ TẠO DỮ LIỆU DÙNG ĐỂ MÔ PHỎNG HỆ THỐNG TƯ VẤN CHỌN KHỐI THI VÀ NGÀNH THI” làm đề tài khóa luận II Mục đích nghiên cứu Xây dựng sở liệu hệ thống tư vấn Xây dựng công cụ tạo liệu dùng để mô hệ thống tư vấn chọn khối thi ngành thi gần giống liệu thực, phản ánh cấu trúc thật liệu III Đối tượng nghiên cứu Dữ liệu tuyển sinh (học bạ, hồ sơ tuyển sinh, kết tuyển sinh) Kho liệu (cấu trúc đa chiều kho liệu, bảng dự kiến số) Khai phá liệu Các phương pháp hỗ trợ cho việc tạo liệu mẫu Công cụ lập trình DOTNET, XML, SQL… IV Phạm vi nghiên cứu Tìm hiểu liệu liên quan đến tuyển sinh Xây dựng công cụ sinh liệu cho hệ thống tư vấn chọn khối thi ngành thi KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN V Phương pháp nghiên cứu Nghiên cứu lý thuyết Tham khảo sách, báo, tạp chí, website tài liệu liên quan đến vấn đề tư vấn học tập Nghiên cứu thực tiễn Tìm hiểu cách lưu trữ loại hồ sơ liên quan đến tuyển sinh số trường đại học Tham khảo ý kiến thầy giáo hướng dẫn để có định hướng tốt đề tài Nghiên cứu kỹ thuật lập trình Nghiên cứu công cụ hỗ trợ cho việc lập trình C#, hệ quản trị sở liệu SQL 2000, SQL 2005 ACCESS, ngôn ngữ đánh dấu mở rộng XML công nghệ liên quan tới KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN B NỘI DUNG CHƯƠNG I: TỔNG QUAN VỀ HỆ THỐNG TƯ VẤN CHỌN NGÀNH THI VÀ TRƯỜNG THI I.1 TẦM QUAN TRỌNG CỦA HỆ THỐNG Việc định hướng chọn ngành thi trường thi vấn đề quan trọng từ trước đến Hiện giáo dục đặt thành nhiệm vụ “quốc sách hàng đầu” vấn đề lại trở nên nóng bỏng Làm để biết tới nên thi khối gì?, ngành gì?, trường gì?, học sinh 12 vấn đề khó Thực tế cho thấy rằng, học sinh chưa hướng nghiệp cách rõ ràng đầy đủ chuẩn bị rời ghế phổ thông Học sinh gặp nhiều ngỡ ngàng lúng túng đặt bút vào hồ sơ tuyển sinh Hầu hết em nhắm vào ngành nghề đầy hấp dẫn lập trình viên, tiếp viên hàng không, phóng viên, kỹ thuật viên, kĩ sư, mà liệu có đủ khả để thi không không lường trước mạo hiểm Hoặc áp đặt bố mẹ bậc phụ huynh lại chưa nhận tư vấn Hơn nữa, thông tin vấn đề tuyển sinh sách, báo giới thiệu mang tính chất chung chung, sơ sài, thông tin mạng nhiều không phần sơ sài học sinh tốt nghiệp thi đại học có thời gian để tìm hiểu Hằng năm, trường, tỉnh có tổ chức tư vấn hướng nghiệp cho học sinh Nhưng liệu với thời gian ỏi đó, với số lượng giảng viên có hạn có cung cấp thông tin cách đầy đủ, chi tiết ngành trường giải đáp cho hàng ngàn học sinh, thí sinh không? Thực tế buổi cung cấp thông tin mang tính chất chung chung Thực trạng làm cho kết tuyển sinh thấp, số lượng học sinh bị điểm (tổng kết môn) nhiều, 80% thí sinh dự thi có tổng điểm thi ĐH 15 Thậm chí nhiều học sinh sinh viên năm 1, năm nhận định ban đầu nghề nghiệp không phù hợp đăng kí dự thi tuyển sinh Nếu học sinh tư vấn hướng nghiệp cách đầy đủ, phù hợp làm hạn chế nhiều tình trạng Do tư vấn hướng nghiệp nhu cầu cần thiết thiếu học sinh bậc phụ huynh Từ nhu KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN cầu đó, nhóm nghiên cứu chọn làm đề tài khoá luận hệ thống tư vấn chọn ngành thi trường thi với mong muốn giúp cho học sinh bậc phụ huynh có thông tin cần thiết, đầy đủ giúp họ trả lời cho câu hỏi “với khả vậy, thi vào trường A, ngành B có không? Và liệu định có mạo hiểm không?” giúp nâng cao chất lượng thi tuyển sinh đất nước Hệ thống tư vấn chọn ngành thi trường thi xây dựng nhằm tin học hoá việc tư vấn hướng nghiệp cho học sinh Hệ thống giúp cho học sinh bậc phụ huynh có thông tin tư vấn mà họ cần trước bước vào ngưỡng cửa đại học * Hệ thống hoạt động sau: Hệ thống cho phép học sinh bậc phụ huynh nhập thông tin cá nhân cần thiết mà hệ thống cần để tư vấn học lực, ngành thi , trường thi, địa nơi học, địa thường trú (hoặc đối tượng ưu tiên) vào Từ thông tin hệ thống trả cho học sinh tư vấn cần thiết, thông tin thông tin có tính xác cao phù hợp I.2 MÔ TẢ HỆ THỐNG TƯ VẤN * Hệ thống mô hình hình 1.1: Hình 1.1- Mô hình hệ thống tư vấn chọn ngành thi trường thi * Mô tả hệ thống: KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Giả sử từ sở liệu khác tồn khoảng thời gian dài, tức liệu sở liệu lớn thu nhập từ hoạt động hàng ngày cụ thể học bạ học sinh, hồ sơ đăng ký tuyển sinh, kết tuyển sinh Các sở liệu liên quan đến thông tin học sinh tên, tuổi, nơi ở, trình học tập trường phổ thông, thông tin liên quan đến sách thương binh liệt sĩ, người dân tộc hẻo lánh, điểm học tập học sinh năm học phổ thông, nguyện vọng học sinh đăng ký vào trường đại học, cao đẳng, kết tuyển sinh môn thi vào trường đại học …Vậy mà ta đưa kết tư vấn dựa vào thông tin trên? Đầu tiên hệ thống dựa vào sở liệu nguồn để tích hợp lên thành kho liệu gồm có chiều 1) chiều thời gian cụ thể năm tuyển sinh, 2) chiều địa lý nơi mà thí sinh ở, 3) chiều ngành, trường mà thí sinh đăng ký dự thi vào có kiện học lực môn thi, điểm cộng đối tượng thí sinh, số lượng thí sinh thi vào, số lượng thí sinh đậu số lượng thí sinh thi vào Dữ liệu tính hợp lên kho liệu liệu tồn thời gian dài tinh lọc, mang tính tổng hợp, quán… Nhưng từ kho liệu chưa đưa kết tư vấn, để có kết cho công việc cần phải có công cụ khai phá liệu Khai phá liệu nhằm trích rút từ kho liệu thông tin tiềm ẩn cần thiết có ích, có giá trị, hợp thức hiểu bị che dấu kho liệu hệ thống tư vấn chọn ngành thi trường thi Kết trình khai phá thể dạng luật liên kết, từ xây dựng nên mẫu thử khai phá liệu phương pháp, thuật toán thích hợp (như phương pháp định, phương pháp luật kết hợp, phương pháp phân cụm, ) để tìm tương tác, quan hệ có tầm quan trọng, hữu ích kho liệu.Và tương tác tìm dạng luật để tư vấn hệ thống Khi học sinh nhập thông tin cá nhân vào hệ thống, mẫu thử giúp cho học sinh dể dàng đối chiếu với khả năng, sở thích nguyện vọng trả lời điều mà học sinh cần hỏi hay nói cách khác đưa thông tin tư KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN vấn cho học sinh dựa việc đối chiếu thông tin học sinh đưa vào với mẫu dự đoán phương pháp khai phá liệu Từ thông tin tư vấn học sinh có định phù hợp cho hướng nghề nghiệp thân Nhưng hệ thống chạy theo mô hình mà liệu mang tính chất lịch sử chưa có? Ở hệ thống hoàn toàn mô việc tạo sở liệu nguồn học bạ học sinh, hồ sơ đăng ký tuyển sinh, kết tuyển sinh mô kho liệu tức liệu tích hợp từ cở sở liệu nguồn để kiểm nghiệm tính đắn việc tư vấn đảm bảo có sở liệu thật ta xây dựng nên hệ thống tư vấn hoàn toàn đắn nghiên cứu sở liệu mà mô Để có sở liệu mà liệu mang tính lịch sử điều khó có sở liệu chẳng có tổ chức, quan cho liên quan đến quyền lợi họ nhiều đối tượng khác trừ có tổ chức xây dựng nên hệ thống thực trước đưa sang sử dụng nguồn sở liệu thật cần phải có sở liệu mô tương tự sở liệu thật để thử nghiệm tính đắn Chính từ yêu cầu mà cần phải xây dựng nên công cụ mà sinh liệu để mô Công cụ sinh liệu mô cho học bạ học sinh, hồ sơ đăng ký tuyển sinh, kết tuyển sinh, sở liệu nguồn hệ thống sinh liệu cho kho liệu tức liệu tính hợp từ sở liệu dựa luật mà tính toán trước Với hệ thống mong muốn có sở liệu liên quan đến nghành nghề khác áp dụng theo khung hệ thống để tìm thông tin có giá trị cao liên quan đến ngành nghề mình… KHÓA LUẬN TỐT NGHIỆP Trang KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN CHƯƠNG II: LÝ THUYẾT VỀ TẠO DỮ LIỆU MẪU II.1 Một số khái niệm xác suất có liên quan đến tạo liệu mẫu II.1.1 Định nghĩa xác suất Định nghĩa: Xác suất xuất biến cố A phép thử tỷ số số kết cục thuận lợi cho A tổng số kết cục đồng khả xảy thực phép thử Nếu ký hiệu P(A) xác suất biến cố A, m số kết cục thuận lợi cho biến cố A, n số kết cục đồng khả phép thử Khi xác suất biến cố A xác định bằng: P( A ) = m n Xác suất biến cố thoả mãn điều kiện: ≤ P(A)≤ II.1.2 Biến ngẫu nhiên quy luật phân phối xác suất II.1.2.1 Định nghĩa phân loại biến ngẫu nhiên II.1.2.1.1 Định nghĩa Hàm X xác định không gian biến cố sơ cấp Ω lấy giá trị không gian R (R tập số thực) gọi biến ngẫu nhiên với x ∈ R tập {ω: X(ω) < x} biến cố ngẫu nhiên Ta thường ký hiệu biến ngẫu nhiên chữ hoa X, Y, Giá trị thường ký hiệu chữ thường x, y, Các ví dụ biến ngẫu nhiên: - X số trai lần sinh X biến ngẫu nhiên Giá trị mà nhận - X số viên đạn trúng đích bắn n viên đạn độc lập vào mục tiêu Giá trị mà nhận 0, 1, , n - X số sản phẩm tốt 10 sản phẩm chọn cách ngẫu nhiên từ lô sản phẩm có 100 sản phẩm tốt 50 sản phẩm xấu X biến ngẫu nhiên Giá trị mà nhận 0, 1, , 10 KHÓA LUẬN TỐT NGHIỆP Trang 10 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Trong QUATRINHID khoá chính, HOCSINHID khoá phụ • TBL_HBDIEM Name Data Type Size Null Chú thích QUATRINHID Int Mã trình học tập MONHOCID Int Mã môn học DTBHKI Float X Điểm trung bình học kỳ I DTBHKII Float X Điểm trung bình học kỳ II DTBCN Float X Điểm trung bình năm DIEMKTLAI Float X Điểm kiểm tra lại DTBMHSAUKTL Float X Điểm trung bình thi lại HTGIAOVIEN Nvarchar 100 X Họ tên giáo viên môn Trong QUATRINHID MONHOCID khoá phụ III.2.3.1.2 Ràng buộc liệu bảng giữ liệu Ta xem ràng buộc liệu bảng thông qua mô hình trình bày hình 2.9 KHÓA LUẬN TỐT NGHIỆP Trang 36 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Hình 2.9- Mối quan hệ bảng III.2.3.2 Định nghĩa sở liệu hồ sơ đăng ký dự thi kết tuyển sinh III.2.3.2.1 Định nghĩa bảng liệu Các bảng liệu thiết kế theo phiếu đăng ký dự thi Đại Học Cao Đẳng, điều cần biết tuyển sinh đại học kết tuyển sinh thiết kế theo bảng kết tuyển sinh đại học Đại Học Huế • TBL_TINH Name Data Type Size Null Chú thích MATINHID Nvarchar 100 Mã tỉnh TENTINH Nvarchar 100 Tên tỉnh Trong MATINHID khoá • TBL_HUYEN Name Data Type Size MAHUYENID Nvarchar 100 Mã huyện TENHUYEN Nvarchar 100 Tên huyện MATINHID Nvarchar 100 Mã tỉnh KHÓA LUẬN TỐT NGHIỆP Trang 37 Null Chú thích KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Trong MAHUYENID khoá MATINHID khoá phụ • TBL_DMTRUONG Name Data Type Size Null Chú thích KHTRUONGID Nvarchar 100 Ký hiệu trường TENTRUONG Nvarchar 100 Tên trường Trong KHTRUONGID khoá • TBL_DMNGANH Name Data Type Size Null Chú thích MANGANHID Nvarchar 100 Mã ngành TENNGANH Nvarchar 100 Tên ngành dự thi KHTRUONGID Nvarchar 100 Ký hiệu trường Trong MANGANHID khoá chính, KHTRUONGID khoá phụ • TBL_DMKHUVUC Name Data Type Size Null Chú thích KHUVUCID Int Mã khu vực KYHIEUKV Nvarchar 100 Ký hiệu khu vực SOCUAKV Int Số khu vực Trong KHUVUCID khoá • TBL_DOITUONGUT Name Data Type Size DTUUTIENID Nvarchar 100 Null Chú thích Mã đối tượng ưu tiên ghi theo hồ sơ đăng ký dự thi KHÓA LUẬN TỐT NGHIỆP Trang 38 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… CHIDANDTUT HỒ XUÂN KIÊN Nvarchar 100 Chỉ dẫn Trong DTUUTIENID khoá • TBL_ĐANGKYDT Name Data Type Size Null Chú thích DANGKYID Int Mã đăng ký dự thi SOPHIEU Int Số phiếu MANGANH1 Nvarchar 100 Mã ngành MANGANH2 Nvarchar 100 Mã ngành HO Nvarchar 100 Tên trước thí sinh CHULOT Nvarchar 100 Tên lót thí sinh TEN Nvarchar 100 Tên sau thí sinh GOITINH Nvarchar 100 Gới tính NGAYSINH Datetime Ngày sinh DANTOC Nvarchar 100 Dân tộc HKTHUONGTRU Nvarchar 100 Hậu thường trú MATINHID Nvarchar 100 Mã tỉnh MAHUYENID Nvarchar 100 Mã huyện KHUVUCID Int Mã khu vực NOINOPHSDKDT Nvarchar 100 Nơi nộp hồ sơ đăng ký dự thi MADVDKDT Nvarchar 100 Mã đơn vị đăng ký dự thi DTUUTIENID Nvarchar 100 Mã đối tượng ưu tiên KHÓA LUẬN TỐT NGHIỆP Trang 39 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN NAMTNTHPT Nvarchar 100 Năm tốt nghiệp phổ thông THITAI Nvarchar 100 Nơi thí sinh thi SOCMND Nvarchar 100 Số chứng minh nhân dân DCGUIGIAYTO Nvarchar 100 Địa nhận giấy báo Trong DANGKYID khoá chính, MANGANH1, MANGANH2, MATINHID, MAHUYENID, KHVUCID, DOITUONGUT khoá phụ • TBL_KQTS Name Data Type Size PHIEUSOID Int Mã phiếu BANTS Int Bản tuyển sinh DONVIDT Nvarchar 100 Đơn vị dự tuyển SOTT Int Số thứ tự DOT Int X Đợt tuyển sinh KHTRUONG1 Nvarchar 100 X Mã trường MANGANH1 Nvarchar 100 X Mã ngành KHTRUONG2 Nvarchar 100 X Mã trường MANGANH2 Nvarchar 100 X Mã ngành HOTEN Nvarchar 100 X Họ tên đầy đủ HO Nvarchar 100 Tên trước TENLOT Nvarchar 100 Tên TEN Nvarchar 100 Tên sau GOITINH Nvarchar 100 Giới tinh NGAYSINH Datetime Ngày sinh MATINHID Nvarchar 100 Mã tỉnh KHÓA LUẬN TỐT NGHIỆP Trang 40 Null Chú thích KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN MAHUYENID Nvarchar 100 Mã huyện KHUVUCID Int Mã khu vực DOITUONGID Nvarchar 100 Mã đối tượng ưu tiên LOP12 Nvarchar 100 Lớp 12 LOP11 Nvarchar 100 Lớp 11 LOP10 Nvarchar 100 Lơp 10 NAMTN Nvarchar 100 X Năm tôt nghiệp CUMTHI Nvarchar 100 X Nơi thi NOITHI Nvarchar 100 X Nơi thi PHONGTHI Int Phòng thi SOBD Int Số báo danh VANGTHI Nvarchar 100 X Vắng thi MON1 Nvarchar 100 X Tên môn thi MON2 Nvarchar 100 X Tên môn thi MON3 Nvarchar 100 X Tên môn thi MON4 Nvarchar 100 X Tên môn thi MON5 Nvarchar 100 X Tên môn thi KHEN Int X Khen thưởng DIEM1 Float X Điểm môn DIEM2 Float X Điểm môn DIEM3 Float X Điểm môn3 DIEM4 Float X Điểm môn DIEM5 Float X Điểm môn Trong PHIEUSOID MANGANH1, MANGANH2, khoá chính, MATINHID, KHTRUONG1, KHTRUONG2, MAHUYENID, KHUVUCID, DOITUONGID khoá ngoại III.2.3.2.2 Ràng buộc liệu bảng giữ liệu Ràng buộc liệu bảng mô tả hình 2.10: KHÓA LUẬN TỐT NGHIỆP Trang 41 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Hình 2.10- Mối quan hệ bảng III.2.4 Định nghĩa Các chiều (Dimension) Từ sở liệu nguồn học bạ học sinh, hồ sơ đăng ký tuyển sinh, kết tuyển sinh với trường liệu định nghĩa tích hợp chúng lên ta có số chiều liệu sau: 1) chiều thời gian, 2) chiều địa lý, 3)chiều ngành trường Ta có mô hình chiều sau: • Chiều thời gian: Chiều thời gian Tất Năm • Chiều địa lý: Chiều địa lý Tất Tỉnh Thành phố trực thuộc TW Thành phố/Huyện Quận KHÓA LUẬN TỐT NGHIỆP Trang 42 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN • Chiều ngành trường: Chiều ngành trường Tất Trường Ngành III.2.5 Định nghĩa Các bảng chiều (Dimension Table) Từ chiều ta xây dựng nên bảng chiều sau: • TBL_NAM Name Data Type Size Null Chú thích NAMID Int Mã năm tuyển sinh NAM Int Năm Trong NAMID khoá • TBL_MIEN Name Data Type Size Null Chú thích MIENID Int Mã miền TENMIEN Nvarchar 100 Tên miền Trong MIENID khoá • TBL_TINH Name Data Type Size TINHID Int Mã tỉnh TENTINH Nvarchar 100 Tên tỉnh KHÓA LUẬN TỐT NGHIỆP Trang 43 Null Chú thích KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… MIENID HỒ XUÂN KIÊN Int Mã miền Trong TINHID khoá MIENID khoá phụ • TBL_VUNG Name Data Type Size Null Chú thích VUNGID Int Mã vùng TENVUNG Nvarchar 100 Tên vùng TINHID Int Mã tỉnh Trong đó, VUNGID khoá chinh TINHID khoá phụ • TBL_TENTRUONG Name Data Type Size Null Chú thích TRUONGID Int Mã trường TENTRUONG Nvarchar 100 Tên trường Trong TRUONGID khoá • TBL_NGANHHOC Name Data Type Size Null Chú thích NGANHID Int Mã nghành TENNGANH Nvarchar 100 Tên ngành TRUONGID Int Mã trường Trong NGANHID khoá TRUONGID khoá phụ III.2.6 Định nghĩa kiện (Fact) Ta có số dự kiện kho dư liệu liệu sau: • Học lực học sinh qua môn thi gán cho số đo Giỏi (G), Khá (K), Trung bình (T), Yếu (Y) KHÓA LUẬN TỐT NGHIỆP Trang 44 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN • Điểm cộng gán cho số đo 0,1,2,3 • Số lượng thí sinh thi vào • Số lượng thi sinh thi đậu III.2.7 Định nghĩa bảng kiện (Fact Table) Từ việc định nghĩa bảng chiều định nghĩa kiện ta định nghĩa bảng kiện sở sau: • TBL_THONGTIN_TUYENSINH Name Data Type Size Null Chú thích ID Int Số thứ tự DIEMCONG Int Điểm cộng NAMID Int Mã năm tuyển sinh VUNGID Int Mã vùng NGANHID Int Mã ngành MON1 Nvarchar 50 Học lực môn thi MON2 Nvarchar 50 Học lực môn thi MON3 Nvarchar 50 Học lực môn thi SOLUONGVAO Int Số lượng thí sinh thi vào SOLUONGDAU Int Số lượng thí sinh thi đậu Trong ID khoá chính, VUNGID, NAMID, NGANHID khoá phụ • Mô hình tổ chức liệu theo lược đồ hình trình bày hình 2.11như sau: KHÓA LUẬN TỐT NGHIỆP Trang 45 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Hình 2.11 Lược đồ hình III.2.8 Tạo liệu mẫu Để tạo liệu mẫu cho kho liệu hay tạo liệu vào bảng dự kiến sở TBL_THONGTIN_TUYENSINH ta thiết lập form với cấu hình cho bảng dự kiện thấy hình 2.12 Hình 2.12- Form cầu hình cho bảng kiện Để tạo liệu mong muốn ta có số ràng buôc sau: KHÓA LUẬN TỐT NGHIỆP Trang 46 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN • Các trường liệu NAMID,VUNGID, NGANHID phải lấy bảng chiều Dữ liệu bảng chiều liệu có sẵn từ thực tế cách nhập liệu theo liệu lấy từ điều cần biết • Các giá trị MON1, MON2, MON3 lấy tự giá trị G, K,T,Y • Giá trị trường liệu SOLUONGRA phải nhở giá trị trường liệu SOLUONVAO • Trường liệu điểm cộng lấy giá trị từ đến 3, tương đương với mức ưu tiên • Tổng tỷ lệ đầu vào dòng tương ứng với giá trị học lực học sinh cột học lực phải số lượng vào • Tỷ lệ đậu tương ứng với giá trị học lực khác có sai khác ví dụ tỷ lệ đậu học lực GGG phải lớn tỷ lệ đậu học lực GGK • Tổng số lượng thi vào đối tượng không ưu tiên, đối tượng ưu tiên1, đối tượng ưu tiên2, đối tượng ưu tiên phải tỷ lệ đầu vào tương ứng với giá trị học lực Mỗi lần nhấn nút Create Values có giá trị tạo theo ràng buộc Sau thiết lập xong giá tri ta bắt đầu thực tạo liệu cách nhấn vào nút Generator kiểm tra liệu tạo mục Data Preview cho kết hình 2.13 KHÓA LUẬN TỐT NGHIỆP Trang 47 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN Hình 2.13- Form kết sau nhấn nút Generator C PHẦN KẾT LUẬN I KẾT QUẢ ĐẠT ĐƯỢC • Đã nghiên cứu số sở lý thuyết phục vụ cho việc tạo liệu mô • Đã nghhiên cứu số chức xây dựng ứng dụng lập trình DOTNET khả viết Procedure Function SQL Server • Đã thiết kế sở liệu theo học bạ học sinh, hồ sơ đăng ký tuyển sinh, kết tuyển sinh từ cấu trúc thực tế thiết kế mô hình kho liệu cho học sở liệu • Đã tạo công cụ tạo liệu mô cho sở liệu kho liệu • Đã tạo thư viện phục vụ cho việc sinh liệu mẫu KHÓA LUẬN TỐT NGHIỆP Trang 48 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN II NHỮNG HẠN CHẾ CỦA ĐỀ TÀI • Công cụ cho phép kết nối tới sở liệu lưu trữ SQL Server để sinh liệu • Chương trình chưa cho phép người dùng xem mối quan hệ bảng liệu sở liệu, nên trước tạo liệu cần phải xem trước cấu trúc III HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI • Nếu có điều kiện khắc phục hạn chế • Xây dựng thư viện liệu phong phú • Xây dựng thêm chức công cụ để thiết lập sinh liệu xác, làm hài lòng người sử dụng • Xây dựng thêm chức cho người sử dụng tự định nghĩa bảng liệu xuất định dạng khác KHÓA LUẬN TỐT NGHIỆP Trang 49 KHOÁ 2003-2007 CÔNG CỤ TẠO DỮ LIỆU MẪU… HỒ XUÂN KIÊN TÀI LIỆU THAM KHẢO [1] Ashu Gura, Paul Savory, A template- based conceptual modeling infrastructure for simulation of physical security systems [2] ParaKath Benjamin, Dursun Delen, Richard Mayer, Timothy O’Brien, A model- bases approach for component simulation development [3] Torben Bach Pedersen, Christian S Tensen, Multidimensional database technology [4] Thanh N Huynh, Binh T Nguyen, J Schiefer, and A.M Tjoa, “Representative Sample Data for Warehouse Environments” [5] Thanh N Huynh, Binh T Nguyen, J Schiefer, and A.M Tjoa, “BEDAWA- A Tool for Genetating Sample Data for Data Warehouses” [6] Jesse Liberty (2001), Programming C# [7] Eric Gunnerson (200), A Programmer’ Introduce to C# [8] Thuan thai, Hoang Q Lam (2001), NET Framework Essentials [9] Website http://tpc.org; http://www.sqledit.com; http://www.gsdatagenerator.com; http://www.mssqlutils.com;http://www.upscene.com; http://www.benjaminkeen.com; http://www.codeproject.com [10] Dương Quang Thiện (2003), Lập trình liệu với Visual C# $ ADO.NET, NHÀ XUẤT BẢN TỔNG HỢP TP.HCM [11] Phạm Hữu Khang (chủ biên), Nguyễn Phương Lan, Hoàng Đức Hải, Kỹ thuật lập trình ứng dụng C#.Net toàn tập (Tập 3) [13] Phạm Anh Tuấn, Thuật toán sinh số ngẫu nhiên, Luận Văn Khoa Công Nghệ Thông Tin Thành Phố Hồ Chí Minh KHÓA LUẬN TỐT NGHIỆP Trang 50 KHOÁ 2003-2007