Thuật tốn Naive Bayes Classifier

Một phần của tài liệu Mai văn nhật tiến (Trang 30)

7. Bố cục của đề tài:

1.1.5Thuật tốn Naive Bayes Classifier

1.1.5.1 Định lý Bayes

Định lý Bayes (Bayes‟ Theorem) là một định lý tốn học để tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự kiện liên quan B đã xảy ra.

Định lý này đặt theo tên nhà tốn học Thomas Bayes, người Anh sống ở thế kỷ 18. Đây là một trong những cơng cụ vơ cùng hữu ích, người bạn thân của các Data Scientist, những người làm trong ngành khoa học dữ liệu.

Ta cĩ 2 sự kiện ngẫu nhiên A và B.

Nếu A và B là 2 sự kiện độc lập, ta cĩ xác suất để xảy ra A và B đồng thời là:

trong đĩ:

P(A)P(A) là xác suất xảy ra A riêng biệt. P(B)P(B) là xác suất xảy ra B riêng biệt.

SVTH: MAI VĂN NHẬT TIẾN 20

Nếu A và B là 2 sự kiện liên quan đến nhau, và xác suất xảy ra sự kiện B lớn hơn 0, ta cĩ thể định nghĩa xác suất xảy ra A khi biết B xảy ra như sau:

Ta cĩ thể viết lại thành:

1.1.5.2 Thuật tốn Naive Bayes Classifier (NBC)

Naive Bayes Classification (NBC) là một thuật tốn phân loại dựa trên tính tốn xác suất áp dụng định lý Bayes. Thuật tốn này thuộc nhĩm Supervised Learning (Học cĩ giám sát).

Kĩ thuật phân lớp của Naive Bayes đặc biệt phù hợp cho các trường hợp phân loại cĩ kích thước đầu vào là lớn. Với mỗi loại văn bản, thuật tốn Naive Bayes tính cho mỗi lớp văn bản một xác suất mà tài liệu cần phân hoạch cĩ thể thuộc loại đĩ. Tài liệu đĩ sẽ được gán cho lớp văn bản nào cĩ xác suất cao nhất. Xác suất P(ck| di) gọi là xác suất mà tài liệu di cĩ khả năng thuộc vào lớp văn bản ck được tính tốn như sau:

tài liệu di sẽ được gán cho loại văn bản nào cĩ xác suất hậu nghiệm cao nhất nên được biểu diễn bằng cơng thức:

trong đĩ N là tổng số tài liệu.

Cĩ 2 mơ hình thuật tốn Naive Bayes thường sử dụng là: mơ hình Bernoulli và mơ hình Multinomial.

SVTH: MAI VĂN NHẬT TIẾN 21

 Bernoulli Nạve Bayes

Mơ hình này được áp dụng cho các loại dữ liệu mà mỗi thành phần là một giá trị binary - bẳng 0 hoặc 1. Ví dụ: cũng với loại văn bản nhưng thay vì đếm tổng số lần xuất hiện của 1 từ trong văn bản, ta chỉ cần quan tâm từ đĩ cĩ xuất hiện hay khơng.

Khi đĩ, p(xi|c) được tính bằng:

với p(i|c) cĩ thể được hiểu là xác suất từ thứ i xuất hiện trong các văn bản của class c.

 Multinomial Nạve Bayes

Mơ hình này chủ yếu được sử dụng trong phân loại văn bản mà feature vectors được tính bằng Bags of Words. Lúc này, mỗi văn bản được biểu diễn bởi một vector cĩ độ dài d chính là số từ trong từ điển. Giá trị của thành phần thứ i trong mỗi vector chính là số lần từ thứ i xuất hiện trong văn bản đĩ.

Khi đĩ, p(xi|c) tỉ lệ với tần suất từ thứ i (hay feature thứ i cho trường hợp tổng quát) xuất hiện trong các văn bản của class c. Giá trị này cĩ thể được tính bằng cách:

Trong đĩ:

Nci là tổng số lần từ thứ i xuất hiện trong các văn bản của class c, nĩ được tính là tổng của tất cả các thành phần thứ i của các feature vectors ứng với class c.

Nc là tổng số từ (kể cả lặp) xuất hiện trong class c. Nĩi cách khác, nĩ bằng tổng độ dài của tồn bộ các văn bản thuộc vào class c. Cĩ thể suy ra rằng từ

SVTH: MAI VĂN NHẬT TIẾN 22 1.2 Triển khai thực hiện

1.2.1 Mơ tả đề tài

Xây dựng một website đáp ứng nhu cầu của người đọc.

Tại đây bạn sẽ tìm được những đánh giá về sách của người dùng, thống kê được những đánh giá tốt về những quyển sách hay cho bạn cùng đọc,... .Bạn cũng cĩ thể tìm cho mình những quyển sách phù hợp để cĩ thể đọc, giải trí, stress sau buổi làm việc hay những buổi học căng thẳng. Bạn sẽ tìm thấy cả kho kiến thức sách. Nếu bạn cĩ thời gian hạn hẹp, trang web này khá hữu ích cho bạn vì cĩ những hướng dẫn chi tiết cho bạn dù bạn ở bất cứ đâu. Và điều quan trọng bạn cĩ thể lựa chọn các loại sách phù hợp mà khơng cần mất thời gian tìm kiếm trên mạng xã hội google, facebook,... (adsbygoogle = window.adsbygoogle || []).push({});

Website cĩ Admin để quản lý sách, thể loại, người dùng và đề nghị của người dùng.

Hệ thống cho phép:

Ngƣời dùng:

 Đăng kí, đăng nhập vào website.

 Xem sách, đánh giá, bình luận, tìm kiếm sách theo yêu cầu.

 Cĩ thể theo dõi/hủy theo dõi 1 tài khoản khác.

 Xem hoạt động của những bạn bè mà bạn theo dõi

 Yêu cầu thêm sách đến với admin nếu cĩ quyển sách hay cần đăng tải lên website để được đánh giá.

Admin quản lý:

 Quản lý sách: thêm, sửa, xĩa.

 Quản lý yêu cầu: trạng thái (accept, reject, waiting)

 Quản lý người dùng: thêm, xĩa, phân quyền.

 Thống kê: lượt like sách, lượt đánh giá sách, người dùng, trạng thái yêu cầu.

SVTH: MAI VĂN NHẬT TIẾN 23 1.2.2 Quy trình cần thực hiện

 Khởi tạo và lập kế hoạch.

 Xác định phạm vi hệ thống.

 Mơ tả bài tốn chi tiết của hệ thống.

 Xác định các yêu cầu mà hệ thống cần đáp ứng.

 Xác định các chức năng cần cĩ cho hệ thống.

 Mơ hình hĩa hệ thống.

 Thiết kế cơ sở dữ liệu.

 Thiết kế giao diện.

 Kiểm thử và đưa vào sử dụng.

1.3 Phân tích website 1.3.1 Khảo sát yêu cầu 1.3.1 Khảo sát yêu cầu - Khảo sát mức 1

an iến cho đ ài

Sau khi lên ý tưởng cho đề tài, em đã tiến hành khảo sát ý kiến của bạn bè và anh chị ở cơng ty. Nội dung xoay quanh về các chức năng của website, tìm hiểu về giao diện, cách thức hoạt động của trang website quản lý sinh viên.

- Khảo sát mức 2

Tham hảo iến đ nh i c a m i n ư i

Sau khi chuẩn bị cơ bản các nội dung về ý tưởng, em bắt đầu thực hiện khảo sát ý kiến, nhận xét của mọi người về website. Trong đĩ cĩ sự hỗ trợ, gĩp ý kiến nhiệt tình của các anh chị trainner thực tập tại cơng ty Sun Asterisk. Nội dung hướng đến là hồn thiện về mặt ý tưởng, nêu ra các chức năng tiêu biểu, loại bỏ các chức năng khơng cần thiết.

SVTH: MAI VĂN NHẬT TIẾN 24 (adsbygoogle = window.adsbygoogle || []).push({});

h n ch đ nh i ế ả hảo

Mặc dù chỉ khảo sát trong phạm vi nhỏ tại cơng ty Sun Asterisk nhưng em đã nhận được nhiều ý kiến đĩng gĩp vơ cùng quý giá. Kết quả là thống nhất xây dựng website quản lý sinh viên.

1.3.2 Phân tích yêu cầu

Với những ý kiến khảo sát trên ta cĩ 2 đối tượng sử dụng cơ bản là khách vãng lai, người dùng và người quản lí:

 Khách vãng lai: Thơng qua website, hệ thống cho phép xem thơng tin các loại sách được đánh giá, các thể loại, thơng tin sách và những đánh giá bình luận của người dùng.

 Người dùng: hệ thống cho phép đăng kí, đăng nhập tài khoản để sử dụng các chức năng như đưa ra các đánh giá, bình luận về sách mong muốn, thêm yêu thích sách và theo dõi bạn bè để xem các hoạt động của họ,…

 Người quản lí: Người quản lí cĩ tồn quyền sử dụng và quản lý, đảm bảo tính an tồn cho website.

SVTH: MAI VĂN NHẬT TIẾN 25 CHƢƠNG 2: PHÂN TÍCH THIẾT KẾ

2.1 Mục tiêu và chức năng của hệ thống 2.1.1 Yêu cầu về chức năng: 2.1.1 Yêu cầu về chức năng: 2.1.1 Yêu cầu về chức năng:

Chức năng thơng tin

 Giới thiệu tới bạn đọc các thơng tin về sách phù hợp bao gồm tên sách, thể loại, tên tác giả, nhà xuất bản, nội dung tĩm tắt,...

 Giới thiệu các loại sách hay với đầy đủ các bình luận đánh giá của bạn đọc về sách và phù hợp cho mọi lứa tuổi.

 Cập nhật nhiều loại sách theo thể loại cho người dùng cĩ thể tìm đọc và cĩ thể cập nhật theo yêu cầu của người dùng.

 Cung cấp chức năng tìm kiếm các thơng tin theo từng chuyên mục (tên, thể loại, tác giả, ...).

Chức năng hệ thống

 Cung cấp chức năng phân quyền, cập nhật, thống kê các thơng tin, dữ liệu trên hệ thống.

 Cho phép người quản trị chỉnh sửa các thơng tin trên website phù hợp với yêu cầu và mục đích.

 Cho phép người dùng đăng ký thơng tin để dễ dàng tham gia vào trang giao diện chính và đăng nhập, bình luận bài viết, thuận tiện cho đánh giá về sách đang đọc.

 Cung cấp chức năng tìm kiếm thơng tin hỗ trợ cho việc quản trị cơ sở dữ liệu trên website.

 Đảm bảo an tồn cho dữ liệu hệ thống.

. Yêu cầu phi chức năng

SVTH: MAI VĂN NHẬT TIẾN 26

 Đáp ứng nhanh.

 Dễ dàng tìm kiếm thơng tin.

 Thường xuyên cập nhật sách được đánh giá mới nhất.

2.2 Phân tích thiết kế hệ thống thơng tin 2.2.1 Biểu đồ Use Case của hệ thống 2.2.1 Biểu đồ Use Case của hệ thống

Đối với hệ thống

SVTH: MAI VĂN NHẬT TIẾN 27

Đối với khách vãng lai

SVTH: MAI VĂN NHẬT TIẾN 28 (adsbygoogle = window.adsbygoogle || []).push({});

Đối với ngƣời dùng (cĩ đăng nhập)

SVTH: MAI VĂN NHẬT TIẾN 29

Đối với quản trị viên

SVTH: MAI VĂN NHẬT TIẾN 30 2.2.2 Đặc tả Use Case

Mã Usecase US01

Tên Đăng nhập

Mơ tả Kiểm tra và xác thực vai trị người dùng Người thực hiện Khách hàng và người quản trị

Điều kiện trước xử lý Tồn tại tài khoản

Sau xử lý Hiển thị trang chủ theo từng vai trị

Các bước thực hiện Click “Login” trên thanh menu để hiển thị Login Form Nhập username và password

Nhấn vào button “Login”.

Ngoại lệ Sai tên đăng nhập hoặc mật khẩu, hiển thị thơng báo lỗi. Bảng 1: Bảng đặc tả Use Case đăng nhập

Mã Usecase US02

Tên Đăng xuất

Mơ tả Thốt khỏi hệ thống

Người thực hiện Khách hàng và người quản trị Điều kiện trước xử lý Tồn tại tài khoản

Sau xử lý Tài khoản được thốt ra và khơng cĩ quyền truy cập các chức năng cần đăng nhập

Các bước thực hiện Click “Logout” trên thanh menu Ngoại lệ

Bảng 2: Bảng đặc tả Use Case đăng xuất

SVTH: MAI VĂN NHẬT TIẾN 31

Tên Xem thơng tin sách.

Mơ tả Xem thơng tin sách: Mã sách, tên sách, tĩm tắt, nội dung, tác giả, nhà sản xuất, điểm đánh giá, số trang của sách.

Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống. Sau xử lý Hiển thị trang xem thơng tin sách Các bước thực hiện Đã đăng nhập vào hệ thống

Click chuột vào “Admin” trên thanh menu.

Click chuột vào “Quản lý sách” trên thành left menu trong trang admin

Ngoại lệ

Bảng 3: Bảng đặc tả Use Case xem thơng tin sách Mã Usecase US04

Tên Thêm mới sách

Mơ tả Xem thơng tin sách: Mã sách, tên sách, tĩm tắt, nội dung, tác giả, nhà sản xuất, điểm đánh giá, số trang của sách. (adsbygoogle = window.adsbygoogle || []).push({});

Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống. Sau xử lý Chuyển đến trang thêm sách

Các bước thực hiện Click chuột vào “Quản lý sách” trên thành left menu trong trang admin

Click Button “Thêm sách”

Điền đầy đủ và hợp lệ thơng tin vào form thêm mới Nhấn button “Tạo sách” để thêm thơng tin vào hệ thống

SVTH: MAI VĂN NHẬT TIẾN 32

Ngoại lệ

Bảng 4: Bảng đặc tả Use Case thêm mới sách Mã Usecase US05

Tên Xĩa sách

Mơ tả Xĩa một sách trong hệ thống Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống. Sau xử lý Tải lại danh sách hiển thị sách

Các bước thực hiện Click chuột vào “Quản lý sách” trên thành left menu trong trang admin

Click vào button “Delete” của sách cần xĩa

Xuất hiện thơng báo hỏi cĩ chắc chắn xĩa hay ko? Click “OK” để xĩa, Click “Hủy” để khơng xĩa Ngoại lệ

Bảng 5: Bảng đặc tả Use Case xĩa sách Mã Usecase US06

Tên Cập nhật thơng tin sách

Mơ tả Cập nhật thơng tin cho một sách khi cĩ thay đổi. Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Chuyển đến trang sửa thơng tin tour

Các bước thực hiện Click chuột vào “Quản lý sách” trên thành left menu trong trang admin

Click vào button “Edit” của sách cần cập nhật thơng tin Điền đầy đủ và hợp lệ thơng tin vào form cập nhật

SVTH: MAI VĂN NHẬT TIẾN 33

Click button “Cập nhật” để lưu cập nhật Ngoại lệ

Bảng 6: Bảng đặc tả Use Case cập nhật sách Mã Usecase US07

Tên Xem dánh sách người dùng.

Mơ tả Xem thơng tin khách hàng: Mã người dùng, tên, địa chỉ, địa chỉ email, password, hình ảnh.

Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Hiển thị trang xem danh sách người dùng

Các bước thực hiện Click chuột vào “Quản lý người dùng” trên thành left menu trong trang admin. (adsbygoogle = window.adsbygoogle || []).push({});

Ngoại lệ

Bảng 7: Bảng đặc tả Use Case xem thơng tin người dùng Mã Usecase US08

Tên Tạo mới tài khoản người dùng

Mơ tả Xem thơng tin khách hàng: Mã người dùng, tên, địa chỉ, địa chỉ email, password, hình ảnh.

Người thực hiện Người quản trị, người vãng lai Điều kiện trước xử lý Chưa cĩ tài khoản trên hệ thống. Sau xử lý Chuyển đến Login Form

Các bước thực hiện Click “Login” trên thanh menu để hiển thị Login Form Click “Register here” để chuyển sang Register Form Điền đầy đủ và hợp lệ thơng tin vào form

SVTH: MAI VĂN NHẬT TIẾN 34

vào hệ thống Ngoại lệ

Bảng 8: Bảng đặc tả Use Case tạo tài khoản mới Mã Usecase US09

Tên Cập nhật thơng tin tài khoản

Mơ tả Cập nhật thơng tin tài khoản khi cĩ thay đổi. Người thực hiện Khách hàng

Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Chuyển đến trang thơng tin cá nhân

Các bước thực hiện Click chuột vào “Settings” trên thành trên thanh menu top

Điền đầy đủ và hợp lệ thơng tin vào form cập nhật Click button “Cập nhật” để lưu cập nhật

Ngoại lệ

Bảng 9: Bảng đặc tả Use Case cập nhật thơng tin cá nhân Mã Usecase US10

Tên Cập nhật quyền của tài khoản

Mơ tả Cập nhật quyền của tài khoản (setUser, setAdmin) Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Chuyển đến trang danh sách người dùng

Các bước thực hiện Click chuột vào “setUser” hoặc “setAdmin” trên thành trên thanh left menu

“setAdmin” để đưa người dùng đĩ từ người quản trị xuống làm người dùng

SVTH: MAI VĂN NHẬT TIẾN 35

người quản trị Ngoại lệ

Bảng 10: Bảng đặc tả Use Case cập nhật quyền cho user Mã Usecase US11

Tên Xĩa tài khoản

Mơ tả Xĩa một tài khoản trong hệ thống Người thực hiện Người quản trị

Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Tải lại danh sách hiển thị người dùng (adsbygoogle = window.adsbygoogle || []).push({});

Các bước thực hiện Click chuột vào “Quản lý người dùng” trên thành left menu trong trang admin.

Click vào button “Delete” của tài khoản cần xĩa Xuất hiện thơng báo hỏi cĩ chắc chắn xĩa hay ko? Click “OK” để xĩa, Click “Hủy” để khơng xĩa Ngoại lệ

Bảng 11: Bảng đặc tả Use Case xĩa tài khoản Mã Usecase US12

Tên Xem danh sách yêu cầu

Mơ tả Xem thơng tin đặt tour: Mã yêu cầu, tên sách, tác giả, nội dung, thể loại

Người thực hiện Người quản trị, người dùng Điều kiện trước xử lý Đã đăng nhập vào hệ thống.

Sau xử lý Hiển thị trang xem danh sách yêu cầu Các bước thực hiện Đã đăng nhập vào hệ thống

Click chuột vào “Quản lý yêu cầu” trên thanh menu.( Đối với người quản trị )

Một phần của tài liệu Mai văn nhật tiến (Trang 30)