Cấu trúc của môt Message

Một phần của tài liệu Xây dựng một Email Client với khả năng lọc thư rác tự động bằng việc ứng dụng phương pháp phân loại văn bản Naive Bayes (Trang 52)

Lớp Message mô phỏng một tin nhắn thư điện tử. nó là một lớp trừu tượng thực thi một giao diện Part.

Lớp Message định nghĩa một tập các thuộc tính và nội dung cho một tin nhắn thư điện tử. Các thuộc tính, các cặp giá trị tên, xác định các thông tin định địa chỉ và định nghĩa cấu trúc nội dung của một tin nhắn điện tử (kiểu nội dung của một tin nhắn). Tin nhắn có thể chứa một đối tượng nội dung đơn lẻ hoặc gián tiếp là một đối tượng đa nội dung khác. Trong trường hợp nào thì nội dung cũng đuợc chứa trong một đối tượng DataHandler.

Mỗi tin nhắn có một nội dung riêng. Nội dung này được gói gọn trong một đối tượng DataHandler

Hình 3: Cấu trúc của một tin nhắn đơn giản (Simple Message) Bên cạnh cấu trúc đơn giản, tin nhắn cũng có thể chứa nhiều đối tượng nội dung. Trong trường hợp này đối tượng DataHandler chứa một đối tượng MultiPart thay vì chỉ đơn thuần là một khối dữ liệu nội dung đơn lẻ.

Một đối tượng MultiPart chứa nhiều đối tượng BodyPart. Cấu trúc của một đối tượng Message bởi vì chúng đều sử dụng giao diện Part.

Mỗi đối tượng BodyPart chứa các thuộc tính và nội dung nhưng các thuộc tính của một đối tượng BodyPart bị giới hạn bởi các thuộc tính được định nghĩa bởi giao diện Part. Một thuộc tính quan trọng là kiểu nội dung của phần này của nội dung tin nhắn. Nội dung của một BodyPart là một DataHandle có chứa dữ liệu hoặc một đối tượng MultiPart khác.

Lớp Message này sẽ là đối tượng chính được thao tác bởi người sử dụng trong chương trình Mail Client của em. Chi tiết về chương trình được trình bày trong chương V của đồ án này.

Chương V: Chương trình Email client và chức năng lọc thư rác tự động bằng giải thuật Naive Bayes

Chức năng lọc thư rác của chương trình MailClient mà tôi xây dựng được mô hình hóa như hình vẽ sau: các messge được lấy về từ server sẽ qua bộ lọc Bayes và được chứa trong (yellow mail) tại đây nó có thể được loại bỏ một lần nữa qua các dấu hiệu về sender và subject, cuối cùng nó sẽ được phân bổ vào hai thư mục Spam và Ham, trong đó Ham là thư mục chứa các thư hợp lệ, còn Spam là thư mục chứa các thư rác

Ham

Sp

a

Một phần của tài liệu Xây dựng một Email Client với khả năng lọc thư rác tự động bằng việc ứng dụng phương pháp phân loại văn bản Naive Bayes (Trang 52)

w