Em xin chân thành cảm ơn Khoa Công nghệ thông tin 1, Trường Học Viện Công Nghệ Bưu Chính Viễn Thông cơ sở phía Bắc đã tạo điều kiện tốt cho em thực hiện đề tài tốt nghiệp này. Em xin gửi lời cảm ơn sâu sắc nhất đến Th.s. Nguyễn Mạnh Sơn, người thầy đã cho em định hướng và tận tình chỉ bảo em những ý kiến quý báu ngay từ khi em bước chân vào giảng đường học viện. Thầy đã giúp đỡ em tận tình và đi cùng em trong suốt thời gian thực hiện đề tài này. Thầy chỉ cho em cách tiếp cận, nghiên cứu và cách tìm ra những giải pháp cho vấn đề mắc phải. Em xin bày tỏ lời cảm ơn sâu sắc đến những thầy cô giáo đã giảng dạy em trong bốn năm rưỡi qua, những kiến thức mà em nhận được trên giảng đường đại học sẽ là hành trang giúp em vững bước trong tương lai.
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA CƠNG NGHỆ THÔNG TIN ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Đề tài: “Ứng dụng data mining vào phần mềm đọc truyện di động” Người hướng dẫn : Ths NGUYỄN MẠNH SƠN Sinh viên thực : ĐẶNG BẢO CHUNG Lớp : D08CNPM2 Khố : 2008 Hệ : CHÍNH QUY Hà Nội, tháng 11/2012 LỜI CẢM ƠN Em xin chân thành cảm ơn Khoa Công nghệ thông tin 1, Trường Học Viện Cơng Nghệ Bưu Chính Viễn Thơng sở phía Bắc tạo điều kiện tốt cho em thực đề tài tốt nghiệp Em xin gửi lời cảm ơn sâu sắc đến Th.s Nguyễn Mạnh Sơn, người thầy cho em định hướng tận tình bảo em ý kiến quý báu từ em bước chân vào giảng đường học viện Thầy giúp đỡ em tận tình em suốt thời gian thực đề tài Thầy cho em cách tiếp cận, nghiên cứu cách tìm giải pháp cho vấn đề mắc phải Em xin bày tỏ lời cảm ơn sâu sắc đến thầy cô giáo giảng dạy em bốn năm rưỡi qua, kiến thức mà em nhận giảng đường đại học hành trang giúp em vững bước tương lai Cuối cùng, em muốn gửi lời cảm ơn sâu sắc đến tất bạn bè, đặc biệt cha mẹ, em trai, người thân em, người kịp thời động viên, giúp đỡ động lực để em vượt qua khó khăn sống Đề tài “Ứng dụng data mining vào phần mềm đọc truyện di động” đề tài mẻ, em cố gắng hoàn thành phạm vi khả cho phép chắn không tránh khỏi thiếu sót Em mong nhận cảm thơng tận tình bảo, góp ý thầy bạn để đề tài mở rộng, nghiên cứu kỹ Sinh viên thực Đặng Bảo Chung MỞ ĐẦU Đọc sách nhu cầu tất người, lẽ sách phương tiện học tập thuận lợi, giúp người nâng cao nhận thức, hiểu biết Sách kho tàng tri thức mà nhân loại tạo ra, lưu lại, truyền cho hệ sau Đó nguồn tri thức quan trọng vơ tận tất người, sách có nội dung tốt đưa đến cho khơng hiểu biết mà cịn suy nghĩ tìm tịi biến đổi tâm hồn Mọi thành công người nhờ kết hợp kinh nghiệm thân với tri thức lĩnh hội từ việc học từ sống từ sách Nếu đọc sách thường xun có phương pháp khoa học kiến thức người không ngừng mở rộng, nâng cao tiếp cận phát triển khoa học, bồi dưỡng nâng cao lực tư lôgic, phương pháp làm việc khoa học, lịng u nghề nghiệp có thái độ đắn giới xung quanh thân mình, bồi dưỡng hứng thú, lực thói quen tự học suốt đời… Với tầm quan trọng việc đọc sách vậy, nên đọc sách có quyền đọc sách Đối với người khiếm thị hay người già việc đọc sách lại trở nên quan trọng nguồn tri thức dồi mà họ tiếp cận Tuy nhiên, tình hình với phát triển ạt loại sách, báo, việc tìm cho sách hay hữu ích việc khơng dễ dàng Sách nhiều khiến cho nên đọc chọn phương án “đọc nhầm bỏ sót” dẫn đến khơng thể nắm bắt hết nội dung sách lãng phí thời gian Nhằm giải vấn đề làm để tất người đọc sách, chọn cho sách phù hợp với thân, tiết kiệm thời gian giúp cho người đọc cảm thụ tối đa hay sách Em có ý tưởng áp dụng công nghệ thông tin vào việc đọc sách Em xin vào đề tài “Ứng dụng data mining vào phần mềm đọc truyện di động” Khai phá liệu trình chắt lọc hay khai phá tri thức từ lượng lớn liệu, đượcứng dụng nhiều lĩnh vực khác giới thiên văn học, phân lớp văn bản, tóm tắt văn tin sinh học, thương mại điện tử, quản lý quan hệ khách hàng, viễn thơng, thể thao, giải trí, đầu tư Tại Việt Nam kỹ thuật tương đối mẻ nhiên nghiên cứu bắt đầu đưa vào số ứng dụng thực tế Nội dung đồ án gồm chương sau: Chương 1: Tổng quan toán khai phá mẫu phổ biến Chương tập trung trình bày khái quát toán khai phá mẫu phổ biến, làm để khái phá liệu, giới thiệu cài đặt thuật tốn điển hình cho tốn khai phá Chương 2: Tổng quan tổng hợp tiếng nói từ văn Chương trình bày khái quát vấn đề tổng hợp tiếng nói từ văn Quá trình phương pháp để tổng hợp tiếng nói Cuối giới thiệu API tổng hợp tiếng nói Google Chương 3: Xây dựng phần mềm đọc truyện di động Chương trình bày phân tích thiết kế xây dựng phần mềm đọc truyện điện thoại di động Chương 4: Cài đặt thử nghiệm Cài đặt, đánh giá kết đạt MỤC LỤC MỞ ĐẦU iii MỤC LỤC iv DANH MỤC HÌNH ẢNH vii CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN KHAI PHÁ MẪU PHỔ BIẾN 1.1 Giới thiệu toán khai phá mẫu phổ biến .2 1.2 Thuật toán Apriori 1.3 Cài đặt thuật toán Apriori CHƯƠNG 2: TỔNG QUAN VỀ TỔNG HỢP TIẾNG NÓI TỪ VĂN BẢN 10 2.1 Giới thiệu tốn tổng hợp tiếng nói từ văn 10 2.2 Ý nghĩa tổng hợp tiếng nói 10 2.3 Vấn đề tổng hợp tiếng nói Việt Nam 11 2.4 Các phương pháp tổng hợp tiếng nói 11 2.4.1 Tổng hợp mức cao 12 2.4.2 Tổng hợp mức thấp 14 2.4.3 Tạo sóng âm .15 2.4.4 Phương pháp tổng hợp Formant .15 2.4.5 Các phương pháp tổng hợp ghép nối 17 2.5 API tổng hợp tiếng nói Google 18 CHƯƠNG 3: XÂY DỰNG PHẦN MỀM ĐỌC TRUYỆN TRÊN DI ĐỘNG 22 3.1 Bài toán .23 3.2 Khảo sát yêu cầu nghiệp vụ 23 3.2.1 Kiến trúc tổng quan 23 3.2.2 Chức hệ thống 24 3.2.3 Xác định actor 25 3.2.4 Xác định usecase nghiệp vụ 25 3.3 Khảo sát yêu cầu hệ thống 25 3.3.1 Xác định actor hệ thống 25 3.3.2 Xác định usecase hệ thống 26 3.4 Biểu đồ usecase 26 3.4.1 Biểu đồ usecase tổng quát 26 3.4.2 Phân rã usecase 27 3.5 Biểu diễn usecase kịch 28 3.5.1 Kịch cho usecase Đăng nhập 28 3.5.2 Kịch cho usecase Đăng xuất .28 3.5.3 Kịch cho usecase Thay đổi thông tin cá nhân 29 3.5.4 Kịch cho usecase Xem danh sách thể loại 29 3.5.5 Kịch cho usecase Thêm thể loại 30 3.5.6 Kịch cho usecase Cập nhật thể loại 31 3.5.7 Kịch cho usecase Xóa thể loại 31 3.5.8 Kịch cho usecase Xem danh sách người dùng 32 3.5.9 Kịch cho usecase Xem danh sách truyện 32 3.5.10 Kịch cho usecase Thêm truyện 33 3.5.11 Kịch cho usecase Cập nhật truyện 34 3.5.12 Kịch cho usecase Xóa truyện 35 3.5.13 Kịch cho usecase Chọn thể loại 35 3.5.14 Kịch cho usecase Chọn ngôn ngữ 36 3.5.15 Kịch cho usecase Chọn truyện 36 3.6 Các yêu cầu phi chức .37 3.6.1 Trang quản trị 37 3.6.2 Phần mềm đọc truyện 37 3.7 Phân tích hệ thống .37 3.7.1 Xác định lớp 37 3.7.2 Danh sách lớp website quản trị 37 3.7.3 Mối quan hệ lớp 37 3.7.4 Danh sách lớp phần mềm đọc truyện 38 3.7.5 Mối quan hệ lớp 38 3.7.6 Xác định thuộc tính phương thức lớp 38 3.7.7 Biểu đồ 39 3.7.8 Biểu đồ hoạt động .41 3.8 Thiết kế hệ thống .42 3.8.1 Lựa chọn công nghệ 42 3.8.2 Lựa chọn topology mạng 42 3.8.3 Biểu đồ lớp thiết kế .43 3.8.4 Đặc tả chi tiết lớp 43 3.8.5 Biểu đồ 44 3.8.6 Thiết kế CSDL 45 3.8.7 Kịch thiết kế giao diện 46 CHƯƠNG 4: CÀI ĐẶT VÀ THỬ NGHIỆM 50 4.1 Cài đặt môi trường 50 4.1.1 Cài đặt wampserver 50 4.1.2 Cài đặt IIS 50 4.1.3 Cài đặt trang quản trị hệ thống TTS-S 51 4.1.4 Tạo webservice phục vụ cho ứng dụng điện thoại 51 4.2 Thử nghiệm 52 KẾT LUẬN 55 Những nội dung đồ án thực .55 Một số hướng phát triển 55 TÀI LIỆU TAM KHẢO 56 DANH MỤC HÌNH ẢNH Hình 1-1 Hàm FirstCanditdate Hình 1-2 Hàm FirstPatternGen Hình 1-3 Hàm CandiateGen Hình 1-4 Hàm PatternGen .8 Hình 1-5 Hàm JoinStep Hình 1-6 Hàm PruneStep Hình 2-1 Mơ hình tổng hợp tiếng nói 12 Hình 2-2 Mơ hình hệ thống tổng hợp tiếng nói .12 Hình 2-3 Sự phụ thuộc ngôn điệu vào yếu tố 14 Hình 2-4 Mơ hình Formant nối tiếp 16 Hình 2-5 Mơ hình Formant Klatt 16 Hình 2-6 Chức Google Translate 18 Hình 2-7 Giao diện Google Text To Speech 19 Hình 3-1 Mơ hình tổng quan hệ thống 24 Hình 3-2 Biểu đồ Usecase tổng quát .27 Hình 3-3 Biểu đồ usecase phân rã 27 Hình 3-4 Biểu đồ lớp pha phân tích trang quản trị 38 Hình 3-5 Biểu đồ lớp pha phân tích cho phần mềm đọc truyện 38 Hình 3-6 Biểu đồ cho chức đăng nhập .40 Hình 3-7 Biểu đồ cho chức thêm truyện 40 Hình 3-8 Biểu đồ cho chức đọc truyện .41 Hình 3-9 Biểu đồ lớp pha thiết kế 43 Hình 3-10 Biểu đồ chức đăng nhập 44 Hình 3-11 Biểu đồ cho chức thêm truyện 45 Hình 3-12 Biểu đồ cho chức đọc truyện 45 Hình 3-13 Cơ sở liệu hệ thống TTS-S .46 Hình 3-14 Giao diện trang đăng nhập 46 Hình 3-15 Giao diện thông báo đăng nhập thành công 47 Hình 3-16 Giao diện danh sách truyện 47 Hình 3-17 Form nhập thơng tin truyện 48 Hình 3-18 Giao diện chọn thể loại tryện .48 Hình 3-19 Giao diện chức đọc truyện 49 Hình 4-1 Giao diện wampserver 50 Hình 4-2 Giao diện Windows Features 51 Hình 4-3 Cài đặt webservice (1) 51 Hình 4-4 Cài đặt webservice (2) 52 GVHD: Nguyễn Mạnh Sơn CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN KHAI PHÁ MẪU PHỔ BIẾN 1.1 Giới thiệu toán khai phá mẫu phổ biến Khai phá liệu (datamining) định nghĩa trình chắt lọc hay khai phá tri thức từ lượng lớn liệu Một ví dụ hay sử dụng là việc khai thác vàng từ đá cát, Dataming ví cơng việc "Đãi cát tìm vàng" tập hợp lớn liệu cho trước Thuật ngữ Dataming ám việc tìm kiếm tập hợp nhỏ có giá trị từ số lượng lớn liệu thơ Có nhiều thuật ngữ dùng có nghĩa tương tự với từ Datamining Knowledge Mining (khai phá tri thức), knowledge extraction(chắt lọc tri thức), data/patern analysis(phân tích dữliệu/mẫu), data archaeoloogy (khảo cổ liệu), datadredging(nạo vét liệu), Hiện có nhiều phương pháp khai phá liệu như: Phân lớp dự đoán, phân cụm phân đoạn, luật kết hợp, khai phá chuỗi theo thời gian, mô tả khái niệm tổng hợp hóa Trong khn khổ đề tài, sâu vào nghiên cứu phương pháp kha phá luật kết hợp để tìm mẫu phổ biến Ví dụ 1-1 Trong hiệu sách lưu lại phiếu mua sách, người ta phát rằng: Trong số người mua "Các khái niệm kỹ thuật khai phá liệu" có 40% số người mua thêm "Hệ quản trị sở liệu", 25% mua thêm "Kho liệu" Trong ví dụ trên, tìm hai luật kết hợp: - Có 40% số người mua "Các khái niệm kỹ thuật khai phá liệu" đồng thời mua "Hệ quản trị sở liệu" - Có 25% số người mua "Các khái niệm kỹ thuật khai phá liệu" đồng thời mua "Kho liệu" Với quy tắc khám phá trên, ta xếp sách có liên quan với vị trí gần để giúp cho người mua sách thuận tiện Những quy tắc giúp cho nhà sách có chiến lược kinh doanh tốt Luật kết hợp sử dụng rộng rãi nhiều lĩnh vực khác như: Kinh doanh, sản xuất, giao thông, viễn thông, giáo dục, quản lý thị trường, … Luật kết hợp cho biết phạm vi mà đó, xuất tập thuộc tính A ghi CSDL D kéo theo xuất tập thuộc tính khác B, ghi đó, có dạng A ⇒ B Mỗi luật kết hợp đặc trưng cặp tỷ lệ đó, độ hỗ trợ độ tin cậy Thông tin mà luật kết hợp mang lại to lớn hỗ trợ đáng kể cho trình định kinh doanh nghiên cứu khoa học Các định nghĩa bản: Cho I = {i1, i2,…, in-1, in} tập đầy đủ sản phẩm CSDL Cho T = (t1, t2,…, tn-1, tn) tập toàn giao dịch (transaction), tương đương với CSDL giao dịch, ti tập sản phẩm ti I Một luật kết hợp phép kéo theo có dạng sau: X Y (với X Y nhóm sản phẩm, X I, Y I X Y = ) Ví dụ 1-2 SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page GVHD: Nguyễn Mạnh Sơn Cho tập giao dịch Bảng 1.1, giao dịch ti tập sản phẩm mua giỏ hàng khách hàng Tập I tập tất sản phẩm bày bán cửa hàng t1 t2 t3 t4 t5 t6 t7 Thịt bò, Thịt gà, Sữa Thịt bò, Pho mát Pho mát, Giày Thịt bò, Thịt gà, Pho mát Thịt bò, Thịt gà, Quần áo, Pho mát, Sữa Thịt gà, Quần áo, Sữa Thịt gà, Sữa, Quần áo Bảng 1-1 Tập giao dịch I = {Thịt bò, Thịt gà, Sữa, Pho mát, Giày, Quần áo} T = {t1, t2, t3, t4, t5, t6, t7} {Thịt bò, Thịt gà, Pho mát} tập mặt hàng mua Như luật kết hợp Thịt bò, Thịt gà Pho mát Định nghĩa 1.1: Chứa (contain) Một giao dịch ti T coi chứa (contain) nhóm sản phẩm (nhóm sản phẩm) X X tập ti Ví dụ: t5 chứa nhóm sản phẩm {Thịt gà, Pho mát} Định nghĩa 1.2: Giá trị hỗ trợ (support count) Giá trị hỗ trợ X T (ký hiệu: X.count) số lượng giao dịch T có chứa X Ví dụ: Với X = {Pho mát} giá trị hỗ trợ X T số lượng giao dịch có chứa sản phẩm “Pho mát” Ở X.count = Định nghĩa 1.3: Độ hỗ trợ (support) Độ hỗ trợ (support) X = X.support = (Trong n số lượng giao dịch T) Ví dụ: Với X = {Pho mát} X.support = = Định nghĩa 1.4: Tính tin cậy luật kết hợp Tính tin cậy luật kết hợp đại diện giá trị support confidence nó: Support: giá trị support luật, X Y, phần trăm số giao dịch T có chứa X Y, hiểu xác suất hợp Pr(X Y) Như giá trị support luật định mức độ phổ biến CSDL giao dịch T Cho n tổng số giao dịch T Giá trị support luật X Y tính sau: ( ) (1) ( ) = SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page GVHD: Nguyễn Mạnh Sơn Giá trị support thước đo hữu ích bởi giá trị thấp, luật xuất ngẫu nhiên luật thật phổ biến Ngồi ra, mơi trường thương mại, luật xuất giao dịch khơng có khả sinh lợi áp dụng Confidence: giá trị confidence luật, , X Y, phần trăm số giao dịch T có chứa X đồng thời chứa Y Giá trị coi xác suất có điều kiện Pr(X | Y), tính sau: ( ) (2) ( ) = Như giá trị confidence định tính tiên đốn (predictability) luật Nếu giá trị confidence luật thấp, dự đoán Y kéo theo sau X khơng đáng tin cậy X kèm với sản phẩm khác nhiều Một luật có tính tiên đốn thấp có giá trị sử dụng hạn chế 1.2 Thuật tốn Apriori Tính chất Apriori: Nếu nhóm sản phẩm (nhóm sản phẩm) thỏa mãn ngưỡng minsup tập khác rỗng thỏa mãn ngưỡng minsup Ý tưởng tính chất đơn giản, nhóm sản phẩm X t (t giao dịch T) => t chứa tất tập khác rỗng X => (Y nhóm sản phẩm) Tính chất đơn giản với giá trị ngưỡng minsup giúp loại bỏ số lượng đáng kể nhóm sản phẩm khơng phổ biến q trình khai phá Thuật tốn Apriori bao gồm bước: - Tìm tất nhóm sản phẩm phổ biến (frequent nhóm sản phẩm): nhóm sản phẩm phổ biến nhóm sản phẩm có support lớn ngưỡng minsup - Sinh tất luật kết hợp (association rules) từ tập nhóm sản phẩm phổ biến trên: Các luật kết hợp đáng tin cậy có giá trị confidence lớn ngưỡng minconf Để tăng hiệu thuật tốn mà khơng làm tính tổng quát, giả sử sản phẩm I xếp theo thứ tự từ điển mã sản phẩm Thuật toán Apriori dựa phép duyệt theo chiều rộng (level-wised search): thực k lần duyệt qua toàn CSDL, lần duyệt thứ i (1 i k), thuật tốn sinh tồn nhóm sản phẩm phổ biến có độ dài i (hay có i sản phẩm) Lần duyệt thứ nhất, sản phẩm xuất CSDL giao dịch T đưa vào tập ứng cử C1, sau giá trị support sản phẩm tính tốn so sánh với ngưỡng minsup để xác định sản phẩm phổ biến, kết thúc thu tập nhóm sản phẩm phổ biến độ dài (hay gồm phần tử) F1 (dịng 1,2) Thuật tốn Apriori C1 init-pass(T); // Lần duyệt qua tập giao dịch T F1 {f | f C1, f.count/n minsup}; // n số giao dịch T for ( k = 2; Fk-1 ; k++) // Các lần duyệt T sau Ck candidate-gen(Fk-1); SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page GVHD: Nguyễn Mạnh Sơn Bảng 3-21 Biểu đồ hoạt động chức thêm truyện Biểu đồ hoạt động chức đọc truyện 3.8 Thiết kế hệ thống 3.8.1 Lựa chọn công nghệ Đối với trang quản trị, sử dụng ngôn ngữ PHP tảng Zend Framework Cơ sở liệu MySql Tool phát triển Zend Studio 8.0 Apache wampserver Đối với phần mềm đọc truyện, sử dụng công nghệ NET, phát triển webservice Tool phát triển Visual Studio 2010 Webserver IIS 3.8.2 Lựa chọn topology mạng Tầng client o Thể giao diện người dùng Đối với trang quản trị nhập liệu xem kết nhanh qua WebBrower Đối với phần mềm đọc truyện, hiển thị điện thoại chạy môi trường WP7 SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 42 GVHD: Nguyễn Mạnh Sơn Tầng o Tầng nghiệp vụ logic chạy mã chương trình đa luồng Tầng liệu (Database) o Tầng chịu trách nhiệm lưu trữ liệu, cho phép thực thi thao tác với sở liệu, với trợ giúp hệ sở liệu MySql 3.8.3 Biểu đồ lớp thiết kế Hình 3-9 Biểu đồ lớp pha thiết kế 3.8.4 Đặc tả chi tiết lớp Tên lớp Category Thuộc tính id: int title: String Language id: int code: String title: String id: int user: User category: Category language: Language timeCreate: datetime id: int Story User SVTH: Đặng Bảo Chung Lớp D08CNPM2 Phương thức ThemTheLoai(category: Category): void SuaTheLoai(category: Category):void XoaTheLoai(category: Category): void ThemNgonNgu(language: Language): void SuaNgonNgu(language: Language):void XoaNgonNgu(language: Language): void ThemTruyen(story: Story): void SuaTruyen(story: Story):void XoaTruyen(story: Story): void DangKy(user: User): void Page 43 GVHD: Nguyễn Mạnh Sơn Seqrecord username: String password: String role: String email: String id: int user: User data: String Apriori DangNhap(user: User): Void LuuTruyenDaDoc(story: Story, user: User): void TimTruyenPhoBien(): Story[] Bảng 3-22 Đặc tả chi tiết lớp 3.8.5 Biểu đồ Biểu đồ cho chức đăng nhập Hình 3-10 Biểu đồ chức đăng nhập Biểu đồ cho chức thêm truyện SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 44 GVHD: Nguyễn Mạnh Sơn Hình 3-11 Biểu đồ cho chức thêm truyện Biểu đồ cho chức đọc truyện Hình 3-12 Biểu đồ cho chức đọc truyện 3.8.6 Thiết kế CSDL SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 45 GVHD: Nguyễn Mạnh Sơn Hình 3-13 Cơ sở liệu hệ thống TTS-S 3.8.7 Kịch thiết kế giao diện Kịch giao diện cho chức đăng nhập Hình 3-14 Giao diện trang đăng nhập Quản trị nhập username password Quản trị nhấn vào nút “Đăng nhập TTS-S” Đăng nhập thành cơng hình hiển thị giao diện chào mừng SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 46 GVHD: Nguyễn Mạnh Sơn Hình 3-15 Giao diện thông báo đăng nhập thành công Kịch giao diện chức thêm truyện Kích vào menu Truyện Hệ thống hiển thị danh sách truyện có hệ thống Hình 3-16 Giao diện danh sách truyện Kích vào nút thêm truyện để thêm truyện SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 47 GVHD: Nguyễn Mạnh Sơn Hình 3-17 Form nhập thơng tin truyện Quản trị chọn thể loại truyện, chọn ngôn ngữ, nhập tiêu đề, nhập nội dung sau bấm vào nút Thêm truyện Kịch giao diện cho chức đọc truyện di động Hệ thống đọc danh sách thể loại truyện cho hiển thị hình Bạn đọc chọn nhấn vào hình chọn thể loại truyện Hình 3-18 Giao diện chọn thể loại tryện SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 48 GVHD: Nguyễn Mạnh Sơn Hệ thống đọc danh sách ngôn ngữ cho hiển thị hình Bạn đọc nhấn vào hình chọn ngơn ngữ Hệ thống đọc danh sách truyện cho hiển thị hình Bạn đọc nhấn vào hình để chọn truyện muốn đọc Hệ thống đọc truyện cho hiển thị nội dung hình Hình 3-19 Giao diện chức đọc truyện SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 49 GVHD: Nguyễn Mạnh Sơn CHƯƠNG 4: CÀI ĐẶT VÀ THỬ NGHIỆM Trong chương này, tìm hiểu cách cài đặt hệ thống TTS-S thử nghiệm hệ thống sau cài đặt hoàn chỉnh Để hệ thống chạy cách hiệu ta cần thức cài đặt số công cụ sau: 4.1 Cài đặt môi trường 4.1.1 Cài đặt wampserver WAMP chữ viết tắt Windows, Apache, MySQL, PHP / Perl / Python WAMP hình thức máy chủ nhỏ chạy hệ điều hành Windows Bộ cài wamp bao gồm: o Apache: chương trình sử dụng máy chủ, cho phép máy chủ phân phát trang web o PHP: coi “plugin” Apache, cần có Apache để hoạt động Nhờ PHP mà Apache biết làm việc với trang Php, nói cách khác Apache+PHP = server PHP o Hệ quản trị sở liệu MySql Tải cài đặt địa http://www.wampserver.com/dl.php#downloadwrapper Sau tải tiến hành cài đặt cài đặt chương trình phần mềm khác Cuối phần cài đặt, server Apache chạy trước Nếu tường lửa máy ngăn chặn chương trình, cần kích chuột vào Unlock phép chương trình chạy Sau cài đặt chạy chương trình Ta giao diện sau: Hình 4-1 Giao diện wampserver 4.1.2 Cài đặt IIS Để cài đặt IIS7 ta thực bước sau: - Bước 1: Vào Start ⇒Control Panel ⇒Programs and Features - Bước 2: Trên menu phía bên trái giao diện Programs and Features, kích chọn Turn Windows features on or off Giao diện sau xuất hiện: SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 50 GVHD: Nguyễn Mạnh Sơn Hình 4-2Giao diện Windows Features - Bước 3: Tích chọn Internet Information Services nhấn OK - Bước 4: Cấp quyền đầy đủ cho thư mục C:\Windows\Temp Sau bước ta cài đặt thành công IIS7 4.1.3 Cài đặt trang quản trị hệ thống TTS-S - Bước 1: Từ giao diện wampserver, kích vào phpMyAdmin Một giao diện quản trị sở liệu - Bước 2: Tạo bảng sở liệu có tên TTS-S - Bước 3: Import CSDL có sẵn vào database TTS-S - Bước 4: Copy mã nguồn trang quản trị vào thư mục PATH_TO_WAMP/wamp/www/ 4.1.4 Tạo webservice phục vụ cho ứng dụng điện thoại - Bước 1: Vào Start gõ “inetmgr.exe” để chạy chương trình IIS Manager - Bước 2: Chọn hình Hình 4-3 Hình 4-3 Cài đặt webservice (1) - Bước 3: Nhập Hình 4-4, sau nhấn OK SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 51 GVHD: Nguyễn Mạnh Sơn Hình 4-4 Cài đặt webservice (2) Sau thực bước ta đường dẫn đến webservice có dạng http://localhost:84/tts-s/Service1.svc?wsdl 4.2 Thử nghiệm Thử nghiệm dịch vụ lấy danh sách truyện phổ biến từ webservice thơng qua thuật tốn Apriori cài đặt Giả sử đầu vào liệu: Bảng miêu tả bạn đọc có mã id_user đọc truyện có mã nằm data Chẳng hạn bạn đọc có mã đọc truyện có mã 1, Giả sử bạn đọc có mã mở phần mềm đọc truyện lên Trong khứ, bạn đọc đọc truyện có mã Để gợi ý cho bạn đọc đọc truyện phổ biến ta gọi SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 52 GVHD: Nguyễn Mạnh Sơn phương thức GetApriori(9) với tham số đầu vào mã bạn đọc từ dịch vụ webservice Quá trình gọi mơ hình sau: Bấm vào nút Execute ta kết sau: Hệ thống phát luật {4}⇒{1} tức đa số bạn đọc đọc truyện có mã đọc truyện có mã Tương tự, ta kiểm tra với bạn đọc có mã 10 Trong khứ bạn đọc đọc truyện có mã Sau gọi hàm GetApriori(10) ta kết sau: SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 53 GVHD: Nguyễn Mạnh Sơn Bạn đọc có mã 10 thích đọc truyện có mã hệ thống phát luật {2,3}⇒{6} SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 54 GVHD: Nguyễn Mạnh Sơn KẾT LUẬN Những nội dung đồ án thực Đồ án trình bày tổng quan khai phá mẫu phổ biến Tìm hiểu định nghĩa, ví dụ luật kết hợp khai phá mẫu, sâu vào nghiên cứu cài đặt thuật toán Apriori Đồ án trình bày khái quát phương pháp tổng hợp tiếng nói Giúp hiểu phần cách mà Google sử dụng để phát triển API Google Translate Text to Speech Đồ án xây dựng thành công phần mềm đọc truyện từ chữ sang giọng nói Trợ giúp cho người khiếm thị hay trường hợp khơng thể nhìn vào hình để đọc Trợ giúp tìm mẫu truyện phổ biến giúp người đọc khơng bị tốn thời gian để tìm truyện mà u thích Một số hướng phát triển Cải tiến thuật toán khai phá thuật toán khác tối ưu Tự phát triển hệ thống Text To Speech để nắm bắt cơng nghệ, từ cải thiện chất lượng giọng đọc ngữ âm để người nghe cảm nhận tốt SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 55 GVHD: Nguyễn Mạnh Sơn TÀI LIỆU TAM KHẢO Sách tham khảo [1] Binh Liu1 Bing Liu: “Web Data Mining Exploring Hyperlinks, Contents, and Usage Data”,ACM Comput ing Classification (1998): H.2, H.3, I.2, I.5, E.5 [2] J.Han, J.Pei, and X.Yan: “Sequential Pattern Mining by Pattern-Growth: Principles and Extensions”, StudFuzz 180, 183–220 (2005) [3] Đoàn Duy: “Đề tài: Ứng dụng Sequential Pattern Mining hệ thống thương mại điện tử”, Học viện Cơng nghệ Bưu Viễn thơng [4] Thierry Dutoit: “A Short Introduction to Text-to-Speech Synthesis” [5] Lawrence R.Rabiner: “Biing−Huang Juang Foundamentals of speech recognition”, Prentice Hall, 1993 [6] Vô danh: “Luận văn Tổng hợp tiếng Việt giải thuật TD-PSOLA” Website tham khảo [7] http://www.winphoneviet.com [8] http://www.tinhte.vn/threads/830617/ [9] http://www.ctrlq.org/code/19147-text-to-speech-php [10] HTML, CSS, Javascript: http://w3schools.com/ [11] Jquery: http://jquery.com/ [12] Zend Framework Forum: http://www.zend.vn/ SVTH: Đặng Bảo Chung Lớp D08CNPM2 Page 56 ... PHẦN MỀM ĐỌC TRUYỆN TRÊN DI ĐỘNG Thiết bị di động lúc chứng tỏ phổ biến gần trở thành vật bất ly thân người trẻ động Vì thế, phát triển ứng dụng cho di động đánh giá mục tiêu bỏ qua công ty phần. .. gian giúp cho người đọc cảm thụ tối đa hay sách Em có ý tưởng áp dụng cơng nghệ thơng tin vào việc đọc sách Em xin vào đề tài ? ?Ứng dụng data mining vào phần mềm đọc truyện di động? ?? Khai phá liệu... Google Chương 3: Xây dựng phần mềm đọc truyện di động Chương trình bày phân tích thiết kế xây dựng phần mềm đọc truyện điện thoại di động Chương 4: Cài đặt thử nghiệm Cài đặt, đánh giá kết đạt MỤC