1. Trang chủ
  2. » Tất cả

Nghiên cứu phương pháp mô hình hóa dữ liệu mẫu ngẫu nhiên bằng ngôn ngữ lập trình python

6 1 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 6
Dung lượng 399,02 KB

Nội dung

KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018 2019 P a g e 62 | 82 NGHIÊN CỨU PHƯƠNG PHÁP MÔ HÌNH HÓA DỮ LIỆU MẪU NGẪU NHIÊN BẰNG NGÔN NGỮ LẬP TRÌNH PYTHON Giảng viên hướng dẫn ThS Phạm Thị Kim Th[.]

KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 NGHIÊN CỨU PHƯƠNG PHÁP MƠ HÌNH HĨA DỮ LIỆU MẪU NGẪU NHIÊN BẰNG NGƠN NGỮ LẬP TRÌNH PYTHON Giảng viên hướng dẫn: ThS Phạm Thị Kim Thúy Sinh viên thực hiện: Nguyễn Phi Thái Lớp: CQ.57.CNTT Trần Xuân Lâm Lớp: CQ.57.CNTT Tóm tắt: Trong thời đại 4.0, cơng nghệ thơng tin có vai trị quan trọng tự động hóa trao đổi liệu Đáp ứng với xu hướng đó, việc áp dụng kiến thức cơng nghệ thơng tin để giải tốn quan trọng, cụ thể toán xác suất thống kê Vì vậy, đề tài chọn phương pháp lập trình với ngơn ngữ python để mơ hình hóa mẫu liệu mẫu ngẫu nhiên Việc mô tả liệu phương pháp có vai trị quan trọng, giúp cho phân tích đặc tính liệu, mối quan hệ mẫu khác Từ đưa kết xác cho mẫu liệu Từ khóa: Mơ hình hóa liệu, phương pháp lập trình, ngơn ngữ python ĐẶT VẤN ĐỀ Hiện nay, Việt Nam, sinh viên chuyên ngành Cơng Nghệ Thơng Tin, Tốn – Tin áp dụng kiến thức toán thuật toán để làm đề tài tốt nghiệp Khảo sát đề tài tốt nghiệp năm 2019 sinh viên CNTT K56 thuộc phân hiệu, có khơng sinh viên chọn Đại số tuyến tính, Xác suất Thống kê,… làm kiến thức cho việc lập trình đề tài sinh viên Đa số sinh viên sử dụng Python thuộc tính ưu việt việc tính tốn: tích phân, đạo hàm, giải phương trình vi phân, … Có thể thấy, lập trình giúp cho việc giải tốn nhanh, cần định nghĩa phương pháp giải giải tốn với mẫu liệu tương tự Cụ thể, việc sử dụng phương pháp lập trình với ngơn ngữ python để mơ tả liệu ngẫu nhiên giúp hình dung liệu đưa nhận xét xác, quan trọng CÁC NỘI DUNG CHÍNH 2.1 Phương pháp nghiên cứu - Phương pháp thu thập xử lý số liệu từ thực nghiệm - Phương pháp mơ hình hóa liệu thơng qua ngơn ngữ python 2.2 Phương tiện nghiên cứu - Sử dụng ngôn ngữ python để lập trình 2.3 Nội dung nghiên cứu thực Từ việc nghiên cứu phương pháp mô tả liệu thống kê bao gồm: Mô tả liệu phương pháp đồ thị, mô tả liệu phương pháp số việc nghiên cứu phương pháp lập trình với ngơn ngữ Python để mơ hình hóa liệu thơng qua dạng đồ thị: đồ thị hình cột (histogram), đồ thị tần số, đồ thị tần suất, đồ thị hình hộp (boxplot), P a g e 62 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 phương trình đường thẳng hồi quy tuyến tính tính tốn giá trị liên quan đến mơ hình: giá trị mode, trung vị, trung bình, … Trong đó, mơ hình hóa liệu với mẫu liệu thực phần trọng tâm đề tài Dữ liệu thực mô đề tài danh sách điểm thi kết thúc học phần điểm thành phần môn Xác suất Thống kê lớp CNTT-K57 Dữ liệu mô để giải dạng tốn: Tìm mối tương quan điểm thành phần điểm cuối kì cụ thể thơng qua mơ hình hồi quy tuyến tính Kết dạng mơ hình liệu tạo dựa ngơn ngữ python: Hình Biểu đồ hình Hình Biểu đồ hình theo cặp P a g e 63 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 Hình Biểu đồ đường Hình Biểu đồ tần số điểm thành phần điểm kết thúc học phần Hình Biểu đồ tần suất P a g e 64 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 Hình Biểu đồ hình hộp Hình Biểu đồ tán xạ Hình Đường thẳng hồi quy tuyến tính P a g e 65 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 Từ mơ hình trên, ta có nhận xét: Điểm thành phần thường cao điểm kết thúc học phần Hơn nữa, điểm thành phần, điểm kết thúc học phần có mối tương quan với cụ thể: điểm thành phần cao điểm kết thúc học phần có xu hướng cao Ngồi ra, thơng qua đồ thị hồi quy tuyến tính điểm thành phần điểm thi kết thúc học phần, nhóm có nhận xét sau: - Đường thẳng hồi quy tuyến tính có xu hướng lên nên điểm thành phần điểm kết thúc học phần tỉ lệ thuận với nhau, điểm thành phần tăng điểm thi kết thúc học phần tăng - Các giá trị điểm kết thúc học phần tương ứng với điểm thành phần phân bố hai bên đường thẳng hồi quy - Nhìn vào đồ thị, dự báo điểm kết thúc học phần có điểm thành phần Giả sử điểm thành phần điểm điểm kết thúc học phần dự đoán nằm khoảng từ [1.8, 2] điểm 2.4 Kết nghiên cứu Đề tài đánh giá mô hình hóa đại lượng tiêu biểu thống kê liệu Trong đó, nhóm nghiên cứu sử dụng hồi quy đơn tuyến tính để đưa phân tích đặc trưng kết thi mẫu liệu sinh viên Phân hiệu Kết thơng tin bổ ích để giảng viên Tốn Phân hiệu tham khảo để định hướng giảng dạy 2.5 Kiến nghị Dữ liệu thực tế thường lớn việc xử lý số liệu có nhiều phương pháp khác kết hợp với thuật toán phức tạp để xử lý đưa nhận định xác cho mẫu liệu Do đó, tương lai đề tài mở rộng với tập liệu quy mô lớn nên chọn mơ hình hồi quy đa tuyến KẾT LUẬN Trong môn học Xác xuất Thống kê, sinh viên giải tiếp cận toán cách phương pháp thơng thường phương pháp thiếu tính minh họa, trực quan Hơn nữa, lĩnh vực việc lấy mẫu dự liệu quan trọng, với mẫu liệu khác sinh viên phải giải nhiều lần khác nhau, điều tốn nhiều thời gian, cơng sức Vì vậy, việc thực giải tốn phương pháp lập trình giải vấn đề Ngơn ngữ python cơng cụ lập trình có tính mạnh mẽ việc giải toán, đặc biệt lĩnh vực phân tích liệu Cụ thể python có nhiều thư viện xây dựng giúp minh họa tốn thơng qua dạng đồ thị, biểu đồ histogram, tròn, boxplot, Điều giúp cho việc đánh giá liệu dễ dàng Từ đó, nhà thống kê đưa kết luận xác cho mẫu liệu Đề tài sử dụng phương pháp lập trình với ngôn ngữ python để xử lý liệu mơ hình hóa liệu cách trực quan Cụ thể, đề tài xây dựng mơ hình để biểu thị tương quan hai thuộc tính liệu phương trình hồi quy tuyến tính Thơng qua phương trình hồi quy tuyến tính, biết hai thuộc tính, có P a g e 66 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 thể dự đốn giá trị cịn lại Ngồi ra, việc mơ phương trình hồi quy tuyến tính phương pháp đồ thị mà sử dụng ngôn ngữ python cho phép dễ dàng hình dung phân bố tập liệu mối tương quan tập liệu Tài liệu tham khảo [1] TS Trần Văn Long, TS Nguyễn Mạnh Hùng, TS Phí Thị Vân Anh, Xác suất Thống Kê, Nhà xuất Giao thông vận tải, 2017 [2] PGS TS Đặng Đức Trọng, TS Đinh Ngọc Thanh, Lý thuyết Thống kê, Nhà xuất Đại học Quốc gia Thành phố Hồ Chí Minh, 2016 [3] C Burch, S Guyader, D Samarov, H Shen, Experimental estimate of the abundance and effects of nearly neutral mutations in the RNA vius  6, Genetics 176, pp 467-476, 2007 [4] Xavier Gendre, Introduction to Data Mining, France, 2016 P a g e 67 | 82 ... giúp cho việc đánh giá liệu dễ dàng Từ đó, nhà thống kê đưa kết luận xác cho mẫu liệu Đề tài sử dụng phương pháp lập trình với ngơn ngữ python để xử lý liệu mơ hình hóa liệu cách trực quan Cụ... mơ hình hồi quy tuyến tính Kết dạng mơ hình liệu tạo dựa ngơn ngữ python: Hình Biểu đồ hình Hình Biểu đồ hình theo cặp P a g e 63 | 82 KỶ YẾU NGHIÊN CỨU KHOA HỌC SINH VIÊN NĂM HỌC 2018-2019 Hình. .. lấy mẫu dự liệu quan trọng, với mẫu liệu khác sinh viên phải giải nhiều lần khác nhau, điều tốn nhiều thời gian, cơng sức Vì vậy, việc thực giải toán phương pháp lập trình giải vấn đề Ngơn ngữ python

Ngày đăng: 24/02/2023, 15:17

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w