Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 21 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
21
Dung lượng
1,45 MB
Nội dung
TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN ĐỒ HỌA MÁY TÍNH ĐỀ T I: XÂY DỰNG VIẾT CHƯƠNG TRÌNH KHẢO SÁT ĐỒ THỊ H M SỐ Sinh viên thực : LÊ MINH ĐẠT Giảng viên hướng dẫn : NGÔ QUỐC TẠO Ngành : CÔNG NGHỆ THÔNG TIN Chuyên ngành : CNTT Lớp : D14CNPM3 Khóa : 2019-2024 Hà Nội, 30 tháng năm 2022 PHIẾU CHẤM ĐIỂM STT Họ tên Chữ ký LÊ MINH ĐẠT Mã SV: 19810310083 LỜI CẢM ƠN Nhiệm vụ Trước hết nhóm chúng em xin gửi lời cảm ơn sâu sắc đến thầy NGÔ QUỐC TẠO, thầy giúp đỡ em nhiều định hướng nghiên cứu, hướng dẫn cho chúng em suốt thời gian học tập môn Cuốn báo cáo nhóm chúng em hồn thành theo thời gian quy định nhà trường khoa không nỗ lực chúng em mà giúp đỡ, bảo thầy hướng dẫn bạn sinh viên lớp giúp đỡ Chúng em xin chân thành cảm ơn thầy cô giảng dạy chúng em, đặc biệt thầy cô giáo khoa CNTT Xin cảm ơn bạn sinh viên lớp giúp đỡ nhiều mặt: phương tiện, sách vở, ý kiến … Mặc dù nhóm cố gắng hồn thành nghiên cứu song khơng tránh khỏi sai sót, mong thầy bạn đóng góp ý kiến q báu để nghiên cứu thành cơng LỜI MỞ ĐẦU Đồ họa máy tính ln lĩnh vực quan tâm ngành công nghệ thơng tin nói chung khoa học máy tính nói riêng Chúng ta bắt gặp nhiều ứng dụng đồ họa máy tính nhiều lĩnh vực đời sống: khoa học – y tế - quân - xây dựng kiến trức, giải trí v.v… Trong ứng dụng việc mô lại chương trình khảo sát đồ thị hàm số Tuy nhiên, phát triển vượt bậc CNTT làm tăng số lƣợng giao dịch thông tin mạng Internet cách đáng kể, đặc biệt thư điện tử, tin tức điện tử, Theo số liệu thống kê từ Brođer et (2008) sau khoảng đến 10 tháng lượng thơng tin lại tảng gấp đơi, bên cạnh tốc độ thay đổi thơng tin nhanh Hoạt động lĩnh vực đặt phải xử lý khối lượng thông tin đồ sộ Một yêu cầu lớn đặt chứng ta tổ chức, tìm kiếm thơng tin cách hiệu phân loại thông tin giải pháp hợp lý cho yêu cầu Nhƣng vối khối lượng thông tin lớn địi hỏi phải xử lý nhanh việc phân loại thủ công điều không tưởng Hướng giải xây dựng giải pháp cho phép thuật tốn hóa chương trình hóa máy tính để tự động phân loại thơng tin Chương trình có chức khảo sát viết chương trình đồ thị hàm số Chương trình viết ngơn ngữ C#, cơng nghệ Winform, có chức năng: Khảo sát vẽ đồ thị hàm số sơ cấp: Bậc Bậc Bậc trùng phương Hàm biến Hàm phân thức hữu tỉ (hàm bậc / bậc 1) Chương I: Tổng quan đồ họa máy tính 1, Giới thiệu Đồ họa máy tính Đồ họa máy tính lĩnh vực mà nghành công nghệ thông tin quan tâm đưa vào chương trình đào tạo khóa cho nghành cơng nghệ thơng tin trường Đại Học Nội dung chủ yếu nghiên cứu thuật toán, kỹ thuật vẽ hình máy tính, giúp sinh viên xây dựng phần mềm đồ họa máy tính Một ứng dụng lớn đồ họa máy tính hỗ trợ thiết kế (CAD – computer-aided design) Ngày CAD sử dụng hầu hết việc thiết kế cao ốc, ô tô, máy bay, tàu thủy, tàu vũ trụ, máy tính, trang trí mẫu vải, nhiều sản phẩm khác Sử dụng chương trình này, đối tượng hiển thị dạng phác thảo phần khung (wireframe outline), mà từ thấy tồn hình dạng thành phần bên đối tượng Sử dụng kĩ thuật này, người thiết kế dễ dàng nhận thấy thay đổi đối tượng tiến hành hiệu chỉnh chi tiết hay thay đổi góc nhìn, … Một thiết kế xong phần khung đối tượng, mô hình chiếu sáng, tơ màu tạo bóng bề mặt kết hợp để tạo kết cuối gần với giới thực Đồ họa máy tính tất liên quan đến việc sử dụng máy tính để phát sinh hình ảnh Các vấn đề liên quan tới công việc bao gồm : tạo, lưu trữ, thao tác mơ hình (các mơ tả hình học đối tượng) ảnh Theo định nghĩa đồ họa máy tính bao gồm việc thiết kế phần cứng thiết bị hiển thị, thuật toán cần thiết để phát sinh đường thiết bị này, phần mềm sử dụng cho người lập trình hệ thống người lập trình ứng dụng đồ họa, chương trình ứng dụng tạo ảnh máy tính - Đồ họa máy tính cung cấp phương cách tự nhiên cho việc truyền đạt thơng tin với máy tính Ngày nay, nhiều q trình thiết kế, cài đặt xây dựng, thơng tin mà hình ảnh mang lại khơng thể thiếu Kĩ thuật trực quan (scientific visualization) trở nên lĩnh vực quan trọng từ năm 1980, nhà nghiên cứu khoa học kĩ sư nhận họ khơng thể xử lí lượng liệu khổng lồ phát sinh từ siêu máy tính mà liệu khơng tóm lược làm bật xu hướng tượng qua nhiều loại biểu diễn đồ họa khác - Đồ họa máy tính tương tác phương tiện mang lại thêm nhiều thuận lợi cho người dùng việc phát sinh hình ảnh kể từ có phát minh máy ảnh truyền hình Với máy tính, tạo hình ảnh không đối tượng cụ thể, thực tế, mà đối tượng trừu tượng, nhân tạo; biểu diễn liệu mà khơng có tính kế thừa mặt hình học, kết điều tra, khảo sát Hơn nữa, với đồ họa máy tính khơng bị giới hạn ảnh tĩnh Các ảnh động thông thường mang lại nhiều hiệu so với ảnh tĩnh, đặc biệt với tượng biến đổi theo thời gian, thực tế (như đổi hướng cánh máy bay siêu âm, hay phát triển khuôn mặt người từ lúc trẻ thơ tới lúc già) trừu tượng (như xu hướng phát triển việc sử dụng lượng, gia tăng dân số, …) Có nhiều cách tiếp cận việc học môn đồ họa, trải rộng từ việc nghiên cứu phần cứng tới việc học để sử dụng đồ họa máy tính lĩnh vực chuyên biệt thiết kế mạch tích hợp cao (VLSI – very large scale integrated circuit) Ở tiếp cận từ góc độ người lập trình ứng dụng, người sử dụng tất hỗ trợ phần cứng, công cụ phần mềm để xây dựng nên ứng dụng Tuy nhiên để thiết kế cài đặt chương trình ứng dụng đồ họa tốt, ngồi việc tìm hiểu khả cơng cụ lập trình, cần phải nắm vững khái niệm phần cứng; vấn đề, nguyên lí liên quan đến cài đặt phần mềm, thuật toán, ứng dụng, … 2, Tổng quan hệ đồ họa Một hệ đồ họa có hai thành phần phần cứng phần mềm Phần cứng bao gồm thiết bị hiển thị nhập liệu, … Phần mềm bao gồm cơng cụ lập trình trình ứng dụng đồ họa Chúng ta khảo sát thành phần Phần cứng * Thiết bị hiển thị Màn hình thiết bị hiển thị thơng dụng hệ đồ họa Các thao tác hầu hết hình dựa thiết kế ống tia âm cực (CRT – cathode ray tube) Có nhiều loại phosphor dùng CRT Ngoài màu sắc ra, điểm khác loại phosphor "độ bền” (persistent), khoảng thời gian phát sáng sau tia CRT khơng cịn tác động Lớp phosphor có độ bền thấp cần tốc độ làm tươi cao để giữ cho hình ảnh hình khỏi nhịe Loại thường tốt cho hoạt hình, cần thay đổi hình ảnh liên tục Lớp phosphor có độ bền cao thường dùng cho việc hiển thị ảnh tĩnh, độ phức tạp cao Mặc dù số loại phosphor có độ bền lớn giây, nhiên hình đồ họa thường xây dựng với độ bền dao động từ 10 đến 60 micro giây Số lượng tối đa điểm hiển thị CRT gọi độ phân giải (resolution) Một định nghĩa xác độ phân giải số lượng điểm centimet mà vẽ theo chiều ngang chiều dọc, thường xem tổng số điểm theo hướng Kích thước vật lí hình đồ họa tính từ độ dài đường chéo hình, thường dao động từ 12 đến 27 inch lớn Một hình CRT kết hợp với nhiều loại máy khác nhau, số lượng điểm hình vẽ thật cịn tùy thuộc vào khả hệ thống mà kết hợp vào Một thuộc tính khác hình tỉ số phương (aspect ratio) Tỉ số phương tỉ lệ điểm dọc điểm ngang cần để phát sinh đoạn thẳng có độ dài đơn vị theo hai hướng hình (trong số trường hợp người ta thường dùng tỉ số phương tỉ số điểm theo chiều ngang so với điểm theo chiều dọc) Với hình có tỉ số phương khác 1, dễ dàng nhận thấy hình vng hiển thị có dạng hình chữ nhật, hình trịn có dạng hình ellipse Thực khái niệm tỉ số phương xuất phát từ chất khoảng cách (nếu tính đơn vị độ dài) điểm dọc không khoảng cách điểm ngang Một tỉ số phương có giá trị ¾ có nghĩa vẽ điểm theo chiều dọc có độ dài với việc vẽ điểm theo chiều ngang Màn hình dạng điểm (raster - scan display): Màn hình dạng điểm dạng thường gặp số dạng hình sử dụng CRT dựa cơng nghệ truyền hình Trong hệ thống này, chùm tia điện tử quét ngang qua hình, lần dịng qt từ xuống Sự bật tắt điểm sáng hình phụ thuộc vào cường độ tia điện tử sở việc tạo hình ảnh hình Mỗi điểm hình gọi pixel pel (viết tắt picture element) Các thông tin hình ảnh hiển thị hình lưu trữ vùng nhớ gọi vùng đệm làm tươi (refresh buffer) vùng đệm khung (frame buffer) Vùng nhớ lưu trữ tập giá trị cường độ sáng toàn điểm hình ln ln tồn song ánh điểm hình phần tử vùng Để tạo ảnh đen trắng, đơn giản cần lưu thông tin pixel bit (các giá trị 0, tượng trưng cho việc tắt (tối), bật (sáng) pixel hình) Trong trường hợp ảnh nhiều màu, người ta cần nhiều bit hơn, thông tin pixel lưu b bit, ta có 2bgiá trị màu phân biệt cho pixel Trong hình màu, người ta định nghĩa tập màu làm việc bảng tra (LookUp Table - LUT) Mỗi phần tử LUT định nghĩa ba giá trị R (Red), G (Green), B (Blue) mô tả màu Khi cần sử dụng màu, ta cần định số thứ tự (index) tương ứng màu LUT Bảng LUT thay đổi ứng dụng người lập trình can thiệp điều khiển Với cách làm tiết kiệm khơng gian lưu trữ cho phần tử vùng đệm khung Số phần tử LUT xác định từ số lượng bits/pixel Nếu phần tử vùng đệm khung dùng b bits để lưu thông tin pixel, bảng LUT có 2b phần tử Nếu b=8, LUT có 28=256 phần tử, số màu hiển thị lúc hình Việc làm tươi hình dạng thực tốc độ 60 đến 80 frame/giây Đôi tốc độ làm tươi biểu diễn đơn vị Hertz (Hz – số chu kì/ giây), chu kì tương ứng với frame Sử dụng đơn vị này, mơ tả tốc độ làm tươi 60 frame/giây đơn giản 60Hz Khi đạt đến cuối dòng quét, tia điện tử quay trở lại bên trái hình để bắt đầu dịng qt Việc quay trở lại phía trái hình sau làm tươi dịng qt gọi tia hồi ngang (horizontal retrace) Và tới cuối frame, tia điện tử (tia hồi dọc – vertical retrace) quay trở lại góc bên trái hình để chuẩn bị bắt đầu frame Trong số hình, frame hiển thị thành hai giai đoạn sử dụng kĩ thuật làm tươi đan xen (interlaced refesh) Ở giai đoạn đầu tiên, tia quét quét số dòng từ xuống dưới, sau tia hồi dọc, dòng lại quét Việc đan xen dòng quét cho phép thấy tồn hình hiển thị nửa thời gian so với dùng để quét tất dòng lần từ xuống Kĩ thuật thường dùng cho loại hình có tốc độ làm tươi thấp CHƯƠNG 2: BÀI TOÁN PHÂN LỚP QUAN ĐIỂM 2.1 SỰ KIỆN (Facts) V QUAN ĐIỂM (Opinions) : Sự kiện biểu khách quan ực thể, kiện thuộc tính họ VD: “ Biểu chủ quan mơ tả tình cảm, đánh giá hay cảm xúc người thực thể, kiện VD: “ ô tô , dễ sử dụng” 2.2 PHÁT BIỂU B I TOÁN Support Vector Machines (SVM) kỹ thuật việc phân lớp liệu, phương pháp học sử dụng không gian giả thuyết hàm tuyến tính khơng gian đặc trưng nhiều chiều, dựa lý thuyết tối ưu lý thuyết thống kê Trong kỹ thuật SVM không gian liệu nhập ban đầu ánh xạ vào không gian đặc trưng không gian đặc trưng mặt siêu phẳng phân chia tối ưu xác định Ta có tập S gồm e mẫu học S = {(x1,y1), (x2,y2), (x3,y3)… ( xe ,ye)} (X x Y)e với vectơ đầu vào n chiều xi ∈ R n thuộc lớp I lớp II (tương ứng nhãn y i=1 lớp I y i=-1 lớp II) Một tập mẫu học gọi tầm thường tất nhãn Đối với liệu phân chia tuyển tính, xác định siêu phẳng f(x) mà chia tập liệu Khí đó, với siêu phẳng nhận đƣợc ta có: f(x)≥ đầu vào x thuộc lớp dương, f(x)< x thuộc lớp âm f(x) = w.x +b = n j wxi i + b yi f(xi) = yi (w.xi + b) ≥ , i=1,….,l w vector pháp tuyến n chiều b giá trị ngưỡng Vector pháp tuyến w xác định chiều siêu phẳng f(x), giá trị ngưỡng b xác định khoảng cách siêu phẳng gốc Siêu phẳng có khoảng cách với liệu gần lớn (tức có biên lớn nhất) đƣợc gọi siêu phẳng tối ưu - Mục đích: Để dự đốn nhãn phân lớp cho liệu mẫu Đầu vào: Một tập mẫu liệu huấn luyện,với nhãn phân lớp cho mẫu liệu Đầu ra: Bộ phân lớp dựa tập huấn luyện,hoặc nhãn phân lớp Phân lớp liệu dựa tập huấn luyện giá trị thuộc tính phân lớp dùng để xác định lớp cho liệu Kỹ thuật phân lớp liệu tiến hành bao gồm bước: Bước 1: Xây dựng mơ hình từ tập huấn luyện Bước 2: Sử dụng mơ hình – kiểm tra tính đắn mơ hình dùng để phân lớp liệu Bước Xây dựng mơ hình - Mỗi bộ/mẫu liệu phân vào lớp xác định trước - Lớp bộ/mẫu liệu xác định thuộc tính gán nhãn lớp - Tập bộ/mẫu liệu huấn luyện - tập huấn luyện – dùng để xây dựng mơ hình - Mơ hình biểu diễn luật phân lớp,các định cơng thức tốn học Bước 2: Sử dụng mơ hình - Phân lớp cho đối tượng chưa phân lớp - Đánh giá độ xác mơ hình Lớp biết trước mẫu/bộ liệu đem kiểm tra so sánh với kết thu từ mơ hình Tỉ lệ xác phần trăm mẫu/bộ liệu phân lớp mô hình số lần kiểm tra 2.3 THUẬT TỐN SVM 2.3.1 Giới thiệu Bài toán phân lớp (Classification) dự đoán (Prediction) hai toán có nhiều ứng dụng tất lĩnh vực như: học máy, nhận dạng, trí tuệ nhân tạo, v.v Trong khóa luận này, chúng em sâu nghiên cứu phương pháp Support Vector Machines (SVM), phương pháp hiệu Phương pháp SVM coi cơng cụ mạnh cho tốn phân lớp phi tuyến tính tác giả Vapnik Chervonenkis phát triển mạnh mẽ năm 1995 Phƣơng pháp thực phân lớp dựa nguyên lý Cực tiểu hóa Rủi ro có Cấu trúc SRM (Structural Risk Minimization), xem phương pháp phân lớp giám sát không tham số tinh vi Các hàm công cụ đa dạng SVM cho phép tạo không gian chuyên đổi để xây dựng mặt phẳng phân lớp 1.2.2 Định nghĩa Là phương pháp dựa tảng lý thuyết thống kê nên có tảng tốn học chặt chẽ để đảm bảo kết tìm xác Là thuật toán học giám sát (supervied learning) đƣợc sử dụng cho phân lớp liệu Là phương pháp thử nghiệm, đưa phương pháp mạnh xác số thuật tốn tiếng phân lớp liệu SVM phương pháp có tính tổng qt cao nên áp dụng cho nhiều loại toán nhận dạng phân loại 1.2.3 Ý tưởng phương pháp Cho trước tập huấn luyện, biểu diễn không gian vector, tài liệu điểm, phương pháp tìm siêu phẳng định tốt chia điểm khơng gian thành hai lớp riêng biệt tương ứng lớp + lớp - Chất lượng siêu phẳng định khoảng cách (gọi biên) điểm liệu gần lớp đến mặt phẳng Khi đó, khoảng cách biên lớn mặt phẳng định tốt, đồng thời việc phân loại xác 2.4 Xây dựng mơ hình phân lớp Xây dựng mơ hình phân lớp để phân loại tài liệu Trong phân tích quan điểm, xu hướng từ, cụm từ trực tiếp thể quan điểm, cảm xúc người viết Phương pháp để nhận biết xu hướng quan điểm từ, cụm từ cảm nghĩ dựa thống kê dựa từ vựng Với nhiệm vụ phân lớp tài liệu, có nhiều phương pháp học máy thống kê sử dụng cho mục đích này, là: Naive Bayes, phân loại Maximum Entropy, học máy giám sát SVM, định,… Thuật toán gồm bước: Bước 1: Xác định n-gram, đặc trưng lọc qua tồn tập liệu Bước 2: Tính tốn tần số xuất n-gram tích cực, tiêu cực tính trọng số n-gram Bước 3: Chọn n-gram thỏa mãn ngưỡng có trọng số cao loại bỏ bigram khơng có ý nghĩa cho việc phân loại Bước 4: Tính tốn độ xác trình huấn luyện phân lớp CHƯƠNG 3: CHƯƠNG TRÌNH THỰC NGHIỆM 3.1 CƠNG CỤ SỬ DỤNG 3.1.1 Công cụ sinh SRIML SRILM công cụ để xây dựng áp dụng mơ hình ngôn ngữ thống kê , chủ yếu để sử dụng nhận dạng tiếng nói, gắn thẻ thống kê phân khúc, dịch máy thống kê Bộ công cụ đƣợc phát triển “Phịng thí nghiệm nghiên cứu cơng nghệ giọng nói SRI” từ năm 1995, chạy tảng Linux Windows SRILM bao gồm thành phần sau: Một tập hợp thư viện C++ giúp cài đặt mơ hình ngôn ngữ, hỗ trợ cấu trúc liệu chức tiện ích nhỏ Một tập hợp chƣơng trình thực thi thực nhiệm vụ xây dựng mơ hình ngơn ngữ, đào tạo thử nghiệm mơ hình ngơn ngữ liệu, gắn thẻ phân chia văn bản, Bộ cơng cụ SRILM có nhiều chương trình con, để xây dựng mơ hình ngơn ngữ ta sử dụng chương trình Ngram Chương trình Ngram thống kê tần số xuất cụm Ngram Kết việc thống kê ghi lại vào tệp sử dụng chúng để xây dựng mô hình ngơn ngữ Kết việc thống kê ghi lại theo định dạng sau: ngram –count –ordern -interpolate -text -lm Trong đó: Order n: thiết lập độ dài lớn cụm Ngram thống kê n Giá trị mặc định không thiết lập tham số n = Interpolaten: với n nhận giá trị 1, 2, 3, 4, 5, 6, 7, 8, Tính tốn tần số cụm Ngram có độ dài n cách nội suy từ cụm Ngram có độ dài nhỏ Text: File liệu cần thống kê tần số cụm Ngram Tệp văn chứa câu dịng Kí hiệu kết thúc bắt đầu dịng tự động thêm vào tệp đầu vào chƣa có Các dịng trống tệp bị loại bỏ Lm: xây dựng mơ hình ngơn ngữ truy hồi từ tần số vừa thống kê, sau ghi lại vào tệp fileketqua theo định dạng 3.1.2 Ngơn ngữ lập trình java Java ngơn ngữ lập trình dạng lập trình hướng đối tượng (OOP) Khác với phần lớn ngơn ngữ lập trình thơng thƣờng, thay biên dịch mã nguồn thành mã máy thông dịch mã nguồn chạy, Java thiết kế để biên dịch mã nguồn thành bytecode, bytecode sau mơi trường thực thi (runtime environment) chạy Bằng cách này, Java thường chạy nhanh ngơn ngữ lập trình thơng dịch khác nhƣ Python, Perl, PHP,… Cú pháp Java đƣợc vay mƣợn nhiều từ C & C++ có cú pháp hướng đối tượng đơn giản tính xử lý cấp thấp Một số đặc điểm bật java - Máy ảo java - Thông dịch - Độc lập - Hướng đối tượng - Đa nhiệm, đa luồng 3.2 Xác định cụm từ, quan điểm Những từ, cụm từ quan điểm từ ngữ sử dụng để diễn tả cảm xúc, ý kiến người viết, quan điểm chủ quan dựa vấn đề mà hay cô ta tranh luận Việc rút từ, cụm từ quan điểm giai đoạn hệ thống đánh giá quan điểm, từ, cụm từ chìa khóa cho cơng việc nhận biết phân loại tài liệu sau Ứng dụng dựa hệ thống đánh giá quan điểm tập trung vào từ nội dung câu: danh từ, động từ, tính từ phó từ Phần lớn cơng việc sử dụng từ loại để rút chúng (Hu Liu, 2004 , Turney, 2002) Việc gán nhãn từ loại sử dụng cơng việc này, điều giúp cho việc nhận biết xu hướng quan điểm giai đoạn Những kĩ thuật phân tích ngơn ngữ tự nhiên khác xóa: stopwords, stemming sử dụng giai đoạn tiền xử lý để rút từ, cụm từ quan điểm 3.3 Kết thực nghiệm Hàm bậc Hàm bậc Hàm bậc trùng phương Hàm biến KẾT LUẬN Luận văn hướng tới mục tiêu phân lớp liệu đạt độ xác cao, xem xét tất mục tiêu phần giới thiệu thời gian có hạn, nên số vấn đề chưa hoàn chỉnh Tuy nhiên, luận văn đạt số kết Nghiên cứu trình bày sở lý thuyết phương pháp học máy Trình bày phương pháp SVM Đây phương pháp phân lớp hiệu nghiên cứu nhiều thời gian qua Phân tích giải pháp cho phép mở rộng cải tiến để nâng cao hiệu ứng dụng SVM: Cài đặt số công cụ giúp đỡ cho việc xây dựng mô hình ngơn ngữ như: chuẩn hóa văn bản, tách từ ngơn ngữ Java Cài đặt chương trình để trích đặc trưng tạo liệu cho phân lớp SVM Tìm kiếm sử dụng liệu phân lớp tài liệu chứa quan điểm Cài đặt chạy thành công mã nguồn mở Srilm môi trường Linux Sử dụng công cụ mã nguồn mở SRILM để xây dựng mơ hình ngơn ngữ cho liệu đầu vào Do thời gian có hạn, nên luận văn nghiên cứu trích đặc trưng n-gram từ bình luận sử dụng phân lớp SVM để phân lớp bình luận tích cực hay tiêu cực Trong thời gian tới, tiếp tục nghiên cứu trích đặc trưng khác cho toán phương pháp phân lớp thống kê khác