Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 44 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
44
Dung lượng
1,43 MB
Nội dung
TRƯỜNG ĐẠI HỌC VINH KHOA CÔNG NGHỆ THÔNG TIN ================= XÂY DỰNG WEBSITE TIN TỨC ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Giáo viên hướng dẫn : Th.S Phan Anh Phong Sinh viên thực : Đậu Văn Hòa Lớp : 48K – CNTT NGHỆ AN, 12/2011 Đồ án tốt nghiệp: Xây dựng website tin tức LỜI CẢM ƠN Em xin gửi lời cảm ơn chân thành đến tất quý thầy cô giáo trường Đại học Vinh giảng dạy em suốt thời gian qua Đặc biệt em xin cảm ơn thầy giáo Th.S Phan Anh Phong - người hướng dẫn em thực đồ án Nhân đây, em xin bày tỏ lòng biết ơn sâu sắc đến Bố Mẹ gia đình ni dạy em nên người, chỗ dựa tinh thần vững chắc, giúp cho em vượt qua khó d viên quý báu bạn bè, anh chị thân hữu; em xin hết lòng ghi ơn Tuy nhiên, thời gian hạn hẹp, nỗ lực mình, đồ án khó tránh khỏi thiếu sót Em mong nhận thơng cảm bảo tận tình q Thầy cô bạn Nghệ An, tháng 12 năm 2011 Sinh viên Đậu Văn Hòa Đồ án tốt nghiệp: Xây dựng website tin tức MỤC LỤC CHƯƠNG TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý chọn đề tài 1.2 Phạm vi đề tài 1.3 Yêu cầu người sử dụng website tin tức 1.4 Yêu cầu từ bên phía quản trị 1.5 Mơ tả tốn 1.6 Mục đích đề tài 1.7 Phương pháp tiếp cận 1.8 Lựa chọn công cụ 1.8.1 Ngôn ngữ ASP.NET 1.8.2 Hệ quản trị CSDL Sql Server 2005 CHƯƠNG PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG 10 2.1 Khảo sát trạng Website tin tức 10 2.1.1 Mục đích, yêu cầu website tin tức 10 2.1.2 Tóm tăt chức hệ thống 11 2.2 Đặc tả yêu cầu 11 2.3 Xây dựng hệ thống 12 2.3.1 Phân tích chức năng: 12 2.3.2 Biểu đồ phân cấp chức 14 2.3.3 Biểu đồ luồng liệu 15 2.3.4 Mơ hình thực thể - liên kết 17 2.3.5 Thiết sở liệu 19 CHƯƠNG THIẾT KẾ WEBSITE TIN TỨC 24 3.1 Giao diện 24 3.1.1 Bố cục 24 3.1.2 Bản thiết kế 24 3.2 Lấy tin từ website khác 33 3.2.1 Đặt vấn đề 33 3.2.2 Hướng tiếp cận 33 3.2.3 Một ví dụ tổng quát 34 3.2.4 Quá trình lấy liệu 38 CHƯƠNG KẾT LUẬN 39 4.1 Kết đạt 39 4.2 Hạn chế 39 4.3 Hướng phát triển 40 TÀI LIỆU THAM KHẢO 41 Đồ án tốt nghiệp: Xây dựng website tin tức CHƯƠNG TỔNG QUAN VỀ ĐỀ TÀI 1.1 Lý chọn đề tài Trong thờ đại tri thức, thông tin thực trở thành nguồn tài nguyên quan trọng thiết xã hội Nhu cầu vật chất tinh thần ngày cao, số người sử dụng Internet tăng dần, số báo cho biết: Nhu cầu tìm hiểu nghiệp vụ báo chí Việt Nam lớn, báo chí ngày có vai trị rộng lớn xã hội Hiện nước ta có 600 tờ báo, tạp chí, 60 đài truyền thanh, truyền hình Trung ương địa phương, 12.000 nhà báo cấp thẻ hành nghề, nhiều trường đại học trung tâm đào tạo, bồi dưỡng nghiệp vụ báo chí, nhiều khóa đào tạo ngành, địa phương, v.v… Không nhà báo chuyên nghiệp mà nhiều người ngồi giới có nhu cầu tìm hiểu báo chí Theo kết nghiên cứu Net Index công ty Yahoo công ty nghiên cứu thị trường Kantar Media thực thành phố lớn Hà Nội, Đà Nẵng, Sài Gòn Cần Thơ hai tháng đầu năm số người sử dụng internet hàng ngày Việt Nam vượt qua báo giấy radio Cụ thể, số người dùng internet đạt 42% số người đọc báo giấy chiếm 40% nghe radio chiếm 23%.Ngoài ra, khảo sát khác công ty nghiên cứu thị trường tồn cầu Nielsen cho biết có đến 96% số người sử dụng internet Việt Nam ghé qua trang mạng xã hội Thêm vào đó, họ lại người bị ảnh hưởng nhiều từ thông tin đăng mạng xã hội so với cư dân nước khác khu vực Đông Nam Á Như Internet, cụ thể trang báo điện tử đóng vai trị quan trọng, khơng thể thiếu kỷ XXI Ý thức đòi hỏi xã hội, đặc biệt người hoạt động ngành truyền thông đại chúng Và trí giáo viên hướng dẫn, em định chọn đề tài “xây dựng website tin tức” nhằm phục vụ nhu cầu bạn đọc 1.2 Phạm vi đề tài Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Đề tài nghiên cứu cách thức xây dựng website quản lý tin tức website Đây lĩnh vực rộng gồm nhiều yêu cầu khác Đề tài bước đầu nghiên cứu tin học hóa số cơng đoạn việc nhập viết phương pháp trình bày viết cho bạn đọc website 1.3 Yêu cầu người sử dụng website tin tức Theo truyền thống thơng thường người có nhu cầu tìm hiểu thơng tin phải mua th báo, tạp chí điểm bán Việc không cần thiết nhiều thời gian tiền bạc nhiều người Để giải vấn đề việc sử dụng cổng thông tin trực tuyến điều kiện cần cho bạn đọc 1.4 Yêu cầu từ bên phía quản trị Có thể quản lý viết thuộc nhiều lĩnh vực khác nhau, quản lý quyền người dùng phải xác, xảy sai sót giúp hệ thống phát nguyên nhân Có thể lấy tin từ website khác cho website mình, nhằm làm phong phú số lượng viết cho website tin tức 1.5 Mơ tả tốn Em xây dựng Website tin tức, website giới thiệu tin tức ngày thuộc nhiều lĩnh vực khác sống mà bạn đọc quan tâm Qua nghiên cứu http://www.dantri.com.vn, tìm hiểu website http://www.thegioitin.com, có mạng http://www.24h.com.vn, http://www.vietbao.com, http://www.vnexpress.net; em rút số nhận xét sau: - Đối với trang Dantri.com.vn có số đặc điểm sau: Thông tin đa dạng từ nhiều lĩnh vực văn hoá, xã hội, sức khoẻ, thể thao, địên ảnh, giải trí… ngồi nước Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Các thông tin cập nhật liên tục, cho phép xem theo chủ đề, theo ngày tháng … Màu sắc hài hoà, chức rõ ràng dễ sử dụng… Bên cạnh có viết, tin tức tồn lâu ngày - Đối với trang vnexpress.net: Giao diện không chứa đầy hình ảnh viết trang Dantri, có đầy đủ lĩnh vực để đọc giả lựa chọn Hình ảnh khơng đẹp mắt trang Dân trí Qua thăm dị độc giả (bạn bè, người thân) hay tham gia vào trang tin tức, đa số độc giả muốn xem tin tức thường vào trang Dân trí Vì họ tìm kiếm thơng tin nhanh chóng, có hình ảnh minh họa, thông tin đa chủng loại… Qua Khảo sát tham khảo ý kiến bạn đọc, em định xây dựng Website tin tức tương tự trang Dân trí Việt Nam (http://www.dantri.com.vn) 1.6 Mục đích đề tài Mục đích nghiên cứu đề tài em nhằm tìm hiểu sâu xây dựng thiết kế website thực tế Từ đó, xác định quy trình thiết kế website tin tức cho phù hợp với nhu cầu thời đại Website tin tức phải trình bày bắt mắt, dễ sử dụng, thân thiện với bạn đọc, giúp cho bạn đọc có thơng tin bổ ích mà họ quan tâm Qua trình tìm hiểu xây dựng website tin tức rèn luyện cho thân em phương pháp phong cách trình bày viết rõ ràng, thu hút người xem Xây dựng cho em phương pháp làm việc độc lập, tự tìm tịi học hỏi thầy cơ, bạn bè, giúp cho em tự tin làm Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức 1.7 Phương pháp tiếp cận - Với cố gắng nghiên cứu tìm tịi sáng tạo thân em - Nghiên cứu, tìm hiểu qua sách vở, qua thầy bạn - Tìm tòi cập nhật ứng dụng qua mạng, bạn bè - Lắng nghe giúp đỡ, bổ sung ý kiến nhiệt tình đóng góp thầy hướng dẫn để hoàn thiện đề tài cách hiệu 1.8 Lựa chọn công cụ 1.8.1 Ngôn ngữ ASP.NET a Giới thiệu ngôn ngữ ASP.NET Hiện ASP.NET trở thành kịch nhiều người sử dụng để thiết kế ứng dụng thương mại điện tử nhiều hình thức khác Chúng hộ trợ mạnh ngơn ngữ lập trình C#, VB.NET… sở liệu SQL Server 2005 với đời công nghệ COM DCOM, ứng dụng trở nên hồn hảo ưu việt q trình trao đổi thông tin mạng Internet Intranet Tuy nhiên, Microsoft nổ lực cho công nghệ Web xử lý phía máy chủ hồn tồn ASP.NET độc lập với trình duyệt Điều có nghĩa trình duyệt khơng cần phải cài đặt công cụ hỗ trợ để duyệt trang Web dạng ASP.NET(.aspx) Với kỹ thuật cho phép thực thi nằm trình chủ (Server), có nghĩa trình duyệt xử lý nhiều vấn đề lúc cho nhiều người dùng, địi hỏi cấu hình máy chủ có cấu hình mạnh địi hỏi băng thơng có khả truyền liệu với khối lượng lớn tốc độ truy cập nhanh ASP.NET thiết kế tương thích với phiên ASP trước Ta triển khai ứng dụng phát triển ASP.NET chung với ứng dụng phát triển ASP máy chủ mà không cần thay đổi cấu hình ứng dụng ASP Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Những ngôn ngữ dùng để viết ASP.NET VBScript, Jscript, C# Tùy thuộc vào khai báo mục đối tượng dẫn đầu trang ASP.NET, bạn rõ ngơn ngữ lập trình bạn sử dụng để xây dựng trang ASP.NET Công nghệ ASP.NET hướng lập trình viên Web vào quỹ đạo chúng lý sau : - Độc lập ngôn ngữ cho phép bạn không biên dịch ngôn ngữ, thực tối ưu ngôn ngữ kết hợp - Dễ phát triển: ASP.NET cho phép bạn khai báo viết mã đơn giản hóa vấn đề - Tách mã nội dung hai phần khác nhau: Trong mở Web form bạn khai báo số thủ tục tập tin với tên mở rộng - Tính mềm dẻo khả nâng cấp: Cho phép quản lý trạng thái Sesion tạo form ứng dụng sử dụng hệ thống Server - Hỗ trợ nhiều trình khách tự động nhận dạng trình khách để thị cho phù hợp - Thay sử dụng mơ hình DLL, COM, DCOM trước đây, trường hợp ứng dụng sử dụng công nghệ ASP.NET bạn sử dụng dịch vụ tương tự có tên Web Services b Ưu điểm ASP.NET ASP.NET có nhiều ưu điểm tảng khác dùng để tạo ứng dụng Web Có thể phần lớn ưu điểm quan trọng kèm với máy chủ Windows công cụ lập trình Windows Ứng dụng web tạo ASP.NET tạo ra, bắt lỗi triển khai dễ dàng thơng qua tác vụ thực thi trọn vẹn môi trường phát triển - Visual Studio NET Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Với nhà phát triển ứng dụng Web, ASP.NET bộc lộ ưu điểm sau : - Những phần thực thi ứng dụng Web biên dịch, chúng thực thi nhanh kịch thông dịch - Các cập nhập giúp cho việc triển khai ứng dụng Web mà khởi động lại máy chủ - Truy cập tới NET Framework, đơn giản hóa nhiều khía cạnh lập trình Windows - Sử dụng nhiều hiểu biết ngơn ngữ lập trình C#, VB, vốn tăng cường để hỗ trợ lập trình hướng đối tượng - Giới thiệu ngơn ngữ lập trình mà cung cấp khả an toàn kiểu, hướng đối tượng, so với ngơn ngữ lập trình C - Tự động quản lý trạng thái để điều khiển trang Web (được gọi Server Controls) chúng có giống với Windows Controls - Các tính bảo mật xây dựng sẵn thông qua máy chủ Windows thông qua phương thực xác nhận/phân quyền khác - Tích hợp chặt chẽ với ADO.NET để cung cấp truy xuất CSDL công cụ thiết kế CSDL trực quan VS.NET - Hỗ trợ đầy đủ XML, CSS chuẩn Web thiết lập khác - Các tính sẵn có để đệm trang web thường xuyên yêu cầu máy chủ, nội dung địa hóa cho ngôn ngữ trao đổi, nhận khả tương thích trình duyệt c Lý chọn ASP.NET Ta biết NET Framework ứng dụng tạo cách mạng kỹ thuật công nghệ tin học (Information Technology), thay đổi tận Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức gốc rễ kiểu mẫu lập trình hay phát triển triển khai mạng giới, tạo bước ngoặt đáp ứng yêu cầu khẩn thiết cho ngành nghề kỹ thuật thương mại ASP.NET ứng dụng quan trọng để phát triển triển khai mạng cách dễ dàng chưa thấy từ xưa tới Không ASP kiểu cổ điển giới hạn với VBScript Jscript, ASP.NET hỗ trợ 25 ngơn ngữ lập trình (dĩ nhiên ngồi ngôn ngữ thiết lập cài sẵn hỗ trợ NET Framework VB.NET, C#, Jscript.NET cịn có MC++.NET, Smalltalk.NET, COMBOL.NET, …) Mặc dù ta cần tới Notepad để triển khai trang ASP.NET Visual Studio.NET giúp suất triển khai mạng thêm phần hiệu quả, ta quan sát kế hoạch ta dễ dàng phác họa (Design) thành phần ASP.NET hình ảnh với ASP.NET Web Forms hay Services theo phương pháp nhấp đúp chuột quên thuộc Windows Thêm nữa, lại hỗ trợ ta phát loại bỏ lỗi sai cách thuận lợi phát triển ứng dụng mạng (support for debugging and deploying ASP.NET Web application) ASP.NET chạy nhanh ASP cổ điển gấp năm lần mà cịn trì kiểu mẫu cập nhật gọi kiểu mẫu ‘just hit save’, nghĩa ASP.NET tự động dị tìm thay đổi compiler files cẩn thiết lưu trữ kết compiler để cung ứng dịch vụ cho yêu cầu sau, nhờ ứng dụng ln ln cập nhật hóa chạy nhanh ASP.NET có khẳ lưu trữ kết chung phần memory trang để gửi giải đáp cho yêu cầu từ nhiều cách khác nhờ khơng tiết kiệm lặp lặp lại công tác thi hành trang web mà gia tăng hiệu suất cách ngoạn mục giới hạn tối đa việc chất vấn CSDL (Eliminating the need to query the database on every request) tốn nhiều thời gian Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức 27 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức -phần bình luận - Nhóm video: 28 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức - Trang xem video: 29 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Trang đăng nhập hệ thống quản lý(login.aspx): Trang quản lý chung: -Trang quản lý viết: 30 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức 31 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: - Xây dựng website tin tức Trang cập nhật viết: 32 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức -Trang quản lý lời binh (comment.aspx): 3.2 Lấy tin từ website khác 3.2.1 Đặt vấn đề Để giảm tải công việc lấy liệu từ website khác cách thủ cơng, em tìm hiểu cách lấy thơng tin từ url http//:www.vnxpress.net, http//:dantri.com, http//:xalo.vn, … 3.2.2 Hướng tiếp cận Có hai hướng tiếp cận Hướng tiếp cận thứ địi hỏi người sử dụng cơng cụ phải cung cấp đặc tả đầu vào, xác định vùng liệu cần trích xuất trang web 33 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức đặc tả cần thiết khác (một cách thủ cơng), để chương trình chạy Hướng tiếp cận thứ hai thể tính chất thơng minh chương trình, người sử dụng khơng cần can thiệp nhiều, chương trình tự động học, tìm kiếm bóc tách liệu cho phù hợp Do tính phức tạp hướng tiếp cận thứ hai (liên quan đến lĩnh vực AI, Machine Learning) nên đề tài theo hướng tiếp cận thứ Như biết, trang Web, cho dù xây dựng công nghệ Web nữa, trang Web kết xuất hiển thị phía người dùng (Client / Web Browser), nội dung đơn tài liệu HTML, kèm với CSS JavaScript Trong đa số trường hợp, website thường xây dựng dựa template, bố cục cố định thay đổi Dựa vào đặc điểm này, người sử dụng phân vùng liệu cần trích xuất trang web, chương trình sử dụng đặc tả để tự động bóc tách trang web có bố cục (cũng người sử dụng cung cấp đặc tả) 3.2.3 Một ví dụ tổng qt Xem xét mơ hình website cung cấp danh bạ địa website khác Danh bạ chia làm nhiều mục lớn (category), category lại phân làm nhiều phân mục nhỏ (sub-category), sub category lại phân làm nhiều phân mục nhỏ nữa, phân mục nhỏ nhất, phân mục nhỏ chứa danh sách địa website thuộc phân mục Lưu ý mức có phân trang (danh sách category thuộc cấp khơng nằm trang mà nằm nhiều trang) Ta gọi trang hiển thị danh sách category lớn trang cấp 0, từ trang cấp ta chọn category dẫn đến trang hiển thị sub-category thuộc category chọn, trang ta gọi trang cấp 1, cấp N Cấu trúc file XML cấu hình đặc tả liệu cần trích xuất có cấu trúc sau: 34 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) 35 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức (16) (17) … 36 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức url: URL trang web mà chương trình lấy liệu đầu tiên, URL trang web cấp data: chứa tập đặc tả phân vùng liệu cần trích xuất trang web cấp (chỉ dùng liệu cần trích xuất nằm trang cấp 0) property: đặc tả phân vùng liệu cần trích xuất, có nhiều phân vùng, phân vùng thẻ property riêng name: tên định danh phân vùng (trong thẻ data) type: kiểu template sử dụng để chương trình trích xuất phân vùng liệu mong muốn, có kiểu “xpath” “expression” template: biểu thức dùng để trích xuất liệu mong muốn trang web cấp Nếu type “xpath” biểu thức Xpath, ngược lại type “expression” biểu thức Perl Expression pagination: đặc tả đường hyperlink dẫn đến trang cấp Những trang cấp hiểu trang phân trang danh sách liệu, trang độc lập có cấu trúc, bố cục type: kiểu template sử dụng để đặc tả hyperlink, có kiểu “xpath” “expression” template: biểu thức template dùng để lọc hyperlink dẫn đến trang cấp Nếu type “xpath” biểu thức Xpath, ngược lại type “expression” biểu thức Perl Expression 10 numpage: số trang tối đa thuộc cấp mà chương trình thực trích xuất liệu (sẽ crawl tới) Giá trị đồng nghĩa với không giới hạn, giá trị -1 đồng nghĩa với không crawl tới trang 11 subpage: liệu cần trích xuất tồn trang cấp 1, 2, trở phải sử dụng đến thẻ subpage Cụ thể subpage đặc tả đường hyperlink dẫn đến trang cấp (từ trang cấp 0) 12 type: kiểu template sử dụng để đặc tả hyperlink dẫn đến trang cấp từ trang cấp 0, có kiểu “xpath” “expression” 37 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức 13 template: biểu thức template dùng để lọc hyperlink dẫn đến trang cấp từ trang cấp Nếu type “xpath” biểu thức Xpath, ngược lại type “expression” biểu thức Perl Expression 14 numsubpage: số trang tối đa thuộc cấp link đến từ trang cấp mà chương trình thực trích xuất liệu (sẽ crawl tới) Giá trị đồng nghĩa với không giới hạn, giá trị -1 đồng nghĩa với không crawl tới trang 15 data: tương tự (2), chứa tập đặc tả phân vùng liệu cần trích xuất trang web cấp 16 pagination: trang cấp có phân trang thẻ lại sử dụng tương tự (7) 17 subpage: tương tự (11), liệu cần trích xuất nằm trang có cấp sâu cấp ta lại sử dụng thẻ subpage, thẻ subpage lồng cách đệ quy số cấp hữu hạn 3.2.4 Quá trình lấy liệu Quá trình lấy liệu bao gồm cơng việc chính: crawling extracting Crawling q trình tự động tải trang web dựa vào liên kết hyperlink trang web website Extracting q trình trích xuất, bóc tách liệu theo đặc tả người sử dụng, với input đầu vào văn HTML có sau bước crawling Crawling extracting thực đan xen với 38 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức CHƯƠNG KẾT LUẬN 4.1 Kết đạt Nắm bắt yêu cầu xây dựng website tin tức trình bày viết cho bạn đọc xem bình luận, dùng RSS để chia sẻ thơng tin Xây dựng hệ thống, từ khâu phân tích đến thiết kế sở liệu, thiết kế hệ thống webform, chức quản lý viết, quản lý người dùng… Tiếp cận với công nghệ ASP.NET, cơng nghệ viết web nhiều lập trình viên sử dụng phát triển 4.2 Hạn chế Website mang tính chất nghiên cứu demo, chưa đưa vào sử dụng thực tế Quá trình cài đặt, kiểm thử hạn chế localhost, mang tính chủ quan Chắc chặn hệ thống gặp nhiều lỗi cần phải khắc phục chạy mạng Hạn chế lớn việc lấy thơng tin thời điểm tại, xử lý trang web phân trang tĩnh (các trang web lấy phương thức HTTP GET) Các trang web phân trang động (sử dụng phương thức HTTP POST) phân trang công nghệ AJAX chương trình chưa xử lý khơng thể lấy liên kết cụ thể đến phân trang Vấn đề em nghiên cứu tìm hiểu Hạn chế thứ hai người sử dụng cần phải có kiến thức Regex Expression XPath Người sử dụng phải đảm bảo biểu thức template trả xác liệu mong muốn, trả tập liên kết xác Chưa hỗ trợ để người sử dụng phân vùng liệu cần trích xuất cách trực quan đơn giản (tương tự plugin FireBug Mozilla Firefox) Tuy nhiên công việc phức tạp, em tìm hướng giải đơn giản thay ngơn ngữ biểu thức đặc tả Regex Expression XPath tập tin XML cấu hình ngơn ngữ đơn giản 39 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Hạn chế thứ ba, thời gian thực thi không xác định được, điều gây khó khăn chương trình phải trích xuất lượng liệu lớn Hướng giải dự định là: trước thời gian thực thi chương trình kết thúc, chương trình tiến hành lưu lại trạng thái trình thực thi danh sách URL ghé thăm, liệu trích xuất v.v…, để lần sau chương trình chạy lại tiếp tục cơng việc thực lần chạy trước người sử dụng muốn 4.3 Hướng phát triển Mong muốn hoàn thiện website chức giao diện để đưa vào sử dụng website chuyên nghiệp Nghiên cứu phương pháp nhận liệu tự động theo hướng thông minh, tạo robot tự động nhận liệu từ website tin tức khác 40 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức TÀI LIỆU THAM KHẢO Tài liệu: [1] Nguyễn Văn Ba, Phân tích thiết kế hệ thống, NXB Đại học quốc gia Hà Nội – 2003 [2] Biên dịch: KS Ngọc Tuấn, hướng dẫn học lập trình với C# tập 1, tập 2, tập 3, NXB thống kê - 2004 Website: [3] http://dantri.com.vn/, báo điện tử TW hội khuyến học Việt Nam [4] http://vnexpress.net/, tin nhanh Việt Nam [5]http://msdn.microsoft.com/en-s/library/system.text.regularexpressions.regex.aspx, hướng dẫn sử dụng lớp regex CSharp 41 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh ... nguyên nhân Có thể lấy tin từ website khác cho website mình, nhằm làm phong phú số lượng viết cho website tin tức 1.5 Mơ tả tốn Em xây dựng Website tin tức, website giới thiệu tin tức ngày thuộc nhiều... tốt nghiệp: Xây dựng website tin tức - Sơ đồ liên kết: 23 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức CHƯƠNG THIẾT KẾ WEBSITE TIN TỨC 3.1 Giao... học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức 25 Sinh viên thực hiện: Đậu Văn Hòa – CNTT – Đại học Vinh Đồ án tốt nghiệp: Xây dựng website tin tức Trang xem tin tức theo nhóm chuyên mục chuyên