1. Trang chủ
  2. » Tất cả

Đề án nghiên cứu cài đặt ứng dụng xây dựng từ điển

29 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

TRƯỜNG ĐẠI HỌC KINH TẾ QUỐC DÂN VIỆN CÔNG NGHỆ THƠNG TIN KINH TẾ Bộ Mơn CƠNG NGHỆ THƠNG TIN  ĐỀ ÁN CHUYÊN NGÀNH Đề tài: nghiên cứu cài đặt ứng dụng xây dựng từ điển Giảng viên hướng dẫn: Lưu Minh Tuấn Họ tên sv: Nguyễn Tân Châu Mã sv: 11150580 Chuyên ngành : Công Nghê Thông Tin Hà Nội, Tháng 12/2017 Mục Lục Mục Lục .2 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT I.Giới thiệu chung từ điển 1.Các từ điển Online II.Giới thiệu tổng quan ASP.NET, C# ngôn ngữ UML 1.Tổng quan ASP.NET 2.Ngôn ngữ C# 2.1 Ngôn ngữ thống mô hình hóa UML .8 2.3 Các thành phần ngôn ngữ UML 2.3 Một số biểu đồ UML 10 III.Các giải pháp kỹ thuật xử lý xây dựng chương trình 11 1.Xử lý liệu 11 2.Thuật tốn tìm kiếm nhị phân 12 3.Phát âm cho từ điển .13 4.Lựa chọn công cụ 13 CHƯƠNG 2: CHUẨN DỮ LIỆU TỪ ĐIỂN 14 I.Cơ sử liệu từ điển 14 II.Các chuẩn liệu từ điển 14 Chuẩn dict.org 14 2.Định dạng Spdict 15 CHƯƠNG 3:PHÂN TÍCH THIẾT KẾ HỆ THỐNG WEBSITE TRA TỪ ĐIỂN 17 I.Khảo sát hệ thống website tra từ điển 17 1.Nhiệm vụ 17 2.Quy trình xử lý 17 II.Phân tích hệ thống 17 1.Mơ hình hóa trường hợp sử dụng (Mơ hình Use-Case) 17 2.Mơ hình Use-Case 18 Đặc tả số Use-Case 19 CHƯƠNG :HOÀN THÀNH ỨNG DỤNG WEBSITE TRA TỪ ĐIỂN .23 I Các thành phần giao diện .23 II Cài đặt ứng dụng 28 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT I.Giới thiệu chung từ điển Ngơn ngữ ta nói ngày có vơ vàn nghĩa cách diễn đạt, quốc gia có ngơn ngữ riêng Với xu hướng tồn cầu hóa việc học ngơn ngữ tất yếu, nhiều phần mềm tra từ với nhiều ngôn ngữ đời Hiện có nhiều chương trình tra từ điển phát triển thành công bao gồm phần mềm online offline Việc xây dựng từ điển khó xây dựng liệu Với loại từ điển ta quy định việc dây dựng liệu cho phải quy chuẩn, định dạng, chuẩn phải thật tiện lợi cho việc tìm kiếm, tra cứu người dùng Hiện với phát triển rộng rãi Internet, nhu cầu người Internet phục vụ, mà ln gắn liền với người lứa tuổi với nhu cầu công việc Vì mà nhiều từ điển online đời nhằm đáp ứng nhu cầu Với ưu điểm nhanh, tiện lợi, khơng phải cài đặt,miễn phí đâu có Net có từ điển Ngồi từ điển online nơi kết nối cộng đồng giúp người trao đổi học tập kiến thức ngoại ngữ với Dù từ điển online có nhiều nhược điểm mà từ điển offline có 1.Các từ điển Online Có nhiều từ điển online với nhiều tính hữu dụng, ta tham khảo số chức để tích hợp cho phần mềm offline +http://vdict.com/ trang mua quyền phần mềm dịch evtran 3.0, dùng để dịch online miễn phí +http://tratu.baamboo.com/ mua liệu từ điển prodic với lượng từ lớn, nhiều chuyên ngành +http://vi.wikipedia.org bách khoa tồn thư mở +nếu khơng tra dùng http://www.google.com.vn/ Từ điển offline từ điển chạy máy mà không cần kết nối net Hiện tiếng giới mã nguồn mở Stardict, phần mềm có khả tra từ nhanh, gọn nhẹ, bắt từ ứng dụng khác tốt ,định dạng biến thể nâng cấp chuẩn Dict, chuẩn mà thời điểm đa số phần mềm miễn phí, nguồn mở dùng để làm từ điển, có nhược điểm định chưa khắc phục chuẩn Dict liệu từ điển phải ghi vào nhiều file liệu khác nhau, stardict file Ngoài khả thêm xố khơng có hạn chế lớn chuẩn từ điển biến thể Ngồi soft mã nguồn mở, phải kể đến phận không nhỏ soft từ điển miễn phí với đại diện mà cho tốt lingoes, với tính giống stardict có ưu điểm phần danh sách từ xuyên suốt từ đầu đến cuối, có phát âm cơng nghệ text to speech microsoft, cịn stardict có 30 từ danh sách Nhưng có nhược điểm tác giả khơng cung cấp cơng cụ convert liệu từ điển, phải gửi liệu biên soạn text cho tác giả để tác giả convert thành liệu từ điển không nhiều ngôn ngữ stardict phổ biến Đối với phần mềm miễn phí nước có phần mềm :Multidictionary (phổ biến nhất), powerclick jtranslator xuất Tất từ điển khơng có khả thêm xố từ tạo từ điển Hi vọng từ điển đời khoả lấp chỗ trống Đồng thời với chế liệu mở mã nguồn mở thúc đẩy xuất từ điển miễn phí, nguồn mở tăng thêm chất lượng, tính phục vụ cho cộng đồng Giới thiệu ln cho người số từ điển thương mại phổ biến nay: - Lạc Việt mtd: có thêm xóa từ, tra từ click and see, chạy ổn định, liệu từ điển tương đối đầy đủ - English Study 4.0: phần mềm ngữ pháp tiếng anh, từ điển luyện nghe tốt - Prodict javidict thuộc hãng, đặc điểm loại liệu lớn gồm nhiều chuyên ngành, khơng thêm xóa, tra từ click and see ngang Lạc Việt, giá đắt Hiện trang http://tratu.baamboo.com mua quyền, tra trực tuyến miễn phí II.Giới thiệu tổng quan ASP.NET, C# ngôn ngữ UML 1.Tổng quan ASP.NET ASP (active server pages ) mơi trường lập trình script server, cho phép người lập trình tạo trang web động có tính bảo mật cao làm tăng khả giao tiếp chương trình ứng dụng Các ứng dụng xây dựng ASP có phần mở rộng ASP Trong file ASP trộn lẫn đoạn mã script, thẻ html đoạn văn (text) Trên trang ASP có ngôn ngữ script gọi ngôn ngữ script sở Ngơn ngữ sở ngôn ngữ script thông dụng sau: jscript, vbscript, perl ngôn ngữ sở mặc định vbscript Để thiết lập lại ngôn ngữ script mặc định, ASP cung cấp lệnh sau: Các script chạy web server mà không cần biên dịch riêng Chính điều làm cải thiện đáng kể tới tốc độ thực ứng dụng xây dựng ASP  Mơ hình hoạt động ASP.NET Cách hoạt động mơ hình ASP mơ tả tóm tắt qua bước sau: - Bước 1: Khi web browser người dùng gửi yêu cầu tệp ASP cho web server - Bước 2: Tệp ASP nạp vào nhớ thực (tại máy chủ) Các đoạn chương trình script tệp ASP mở liệu, thao tác với liệu để lấy thông tin mà người dùng cần đến Trong giai đoạn tệp ASP xác định xem đoạn script chạy máy chủ, đoạn script chạy máy người dùng - Bước 3: Sau thực hiện, kết trả cho web browser người dùng dạng trang web tĩnh  Các đối tượng xây dựng sẵn ASP.NET a) Application: dùng để chia sẻ thông tin người dùng hệ thống ứng dụng Một ứng dụng ASP định nghĩa gồm tất tệp ASP thư mục ảo tất thư mục thư mục ảo Đối tượng application hỗ trợ phương thức lock unlock để khoá bỏ khoá chạy ứng dụng với nhiều người dùng b) Session: dùng lưu trữ thông tin cần thiết phiên làm việc người dùng, thông tin lưu trữ sesion khách hàng không bị người dùng di chuyển qua trang ứng dụng c) Request: dùng để truy cập thông tin chuyển với yêu cầu http Thường thông tin gồm có tham số form submit dùng phương thức post get hay tham số ghi với trang ASP lời gọi đến trang Dùng đối tượng request để chia sẻ thơng tin qua lại trang ASP ứng dụng Ngồi request cịn dùng để lấy giá trị cookie lưu trữ máy client d) Server: đối tượng cung cấp phương thức thuộc tính server thường sử dụng phương thức server.createobject để khởi tạo instance active object trang ASP 2.Ngôn ngữ C# Ngôn ngữ C# đơn giản, khoảng 80 từ khóa mười kiểu liệu xây dựng sẵn Tuy nhiên, ngôn ngữ C# có ý nghĩa cao thực thi khái niệm lập trình đại C# bao gồm tất hỗ trợ cho cấu trúc, thành phần, lập trình hướng đối tượng Những tính chất diện ngơn ngữ lập trình đại Và ngơn ngữ C# hội đủ điều kiện vậy, xây dựng tảng hai ngôn ngữ mạnh C+ + Java Một số kiến thức cần nắm rõ trình xây dựng chương trình:  Các kiểu liệu C#: Bảng 1.1: Các kiểu liệu C# 2.1 Ngơn ngữ thống mơ hình hóa UML Với phát triển công nghệ phần mềm, nhiều công cụ lập trình phát triển có khả hỗ trợ mạnh cho người sử dụng, giảm thiểu cơng sức lập trình viên xây dựng chương trình Khi triển khai tin học hố tốn thực tế, vấn đề gặp nhiều khó khăn phân tích, thiết kế hệ thống (PTTKHT) cho tốn Đã có nhiều phương pháp PTTKHT sử dụng phổ biến phương pháp có cấu trúc như: SADT (Structured Analysis and Design Technique - Kỹ thuật Thiết kế Phân tích cấu trúc), phương pháp MERISE (Méthode pour Rassembler des Idées Sans Effort - Phương pháp để tập hợp ý tưởng không cần nỗ lực), phương pháp MCX (Méthode de Xavier Castellani - Phương pháp Xavier Castellani), … Mỗi phương pháp có điểm mạnh điểm yếu riêng, vấn đề ưu tiên chọn lựa phương pháp PTTKHT là: dễ sử dụng, mơ hình hóa cách tổng qt vấn đề đặt thực tế, có khả áp dụng cho lớp tốn tương tự có khả chuyển thành chương trình sử dụng thực tế nhanh Trên sở yêu cầu trên, em chọn UML để tiến hành PTTKHT cho toán xây dựng chương trình tra từ điển Phương pháp phân tích, thiết kế hệ thống hướng đối tượng (UML) giúp hiểu rõ công việc phải làm, yêu cầu thực tế số liệu cần phải đáp ứng, sở xây dựng mơ hình cần thiết để mơ tả mối tương quan thành phần hệ thống, từ dễ dàng nhiều việc triển khai lập trình bảo trì, nâng cấp cho hệ thống hoạt động tốt, đáp ứng yêu cầu hay thay đổi người sử dụng 2.2 Khái niệm UML (Unifield Modeling Language) ngơn ngữ mơ hình hố thống có phần bao gồm ký hiệu hình học, phương pháp hướng đối tượng sử dụng để thể miêu tả thiết kế hệ thống Nó ngơn ngữ để đặc tả, trực quan hoá, xây dựng làm sưu liệu cho nhiều khía cạnh khác hệ thống UML sử dụng làm cơng cụ giao tiếp người dùng, nhà phân tích, nhà thiết kế nhà phát triển phần mềm Mục đích UML là: - Mơ hình hố hệ thống sử dụng khái niệm hướng đối tượng - Thiết lập kết nối từ nhận thức người đến kiện cần mơ hình hố - Giải vấn đề mức độ thừa kế hệ thống phức tạp, có nhiều ràng buộc khác - Tạo ngơn ngữ mơ hình hố sử dụng người máy 2.3 Các thành phần ngôn ngữ UML Ngôn ngữ UML bao gồm loạt phần tử đồ họa (graphic element) kếp hợp với để tạo biểu đồ Bởi ngơn ngữ, nên UML có nguyên tắc để kết hợp phần tử Một số thành phần chủ yếu ngôn ngữ UML: - Hướng nhìn (view): Hướng nhìn khía cạnh khác hệ thống cần phải mơ hình hóa Một hướng nhìn khơng phải vẽ, mà trừu tượng hóa bao gồm loạt biểu đồ khác Chỉ qua việc định nghĩa loạt hướng nhìn khác nhau, hướng nhìn khía cạnh riêng biệt hệ thống, người ta tạo dựng nên tranh hoàn thiện hệ thống Cũng hướng nhìn nối kết ngơn ngữ mơ hình hóa với quy trình chọn cho giai đoạn phát triển - Biểu đồ (diagram): Biểu đồ hình vẽ miêu tả nội dung hướng nhìn UML có tất loại biểu đồ khác sử dụng kết hợp khác để cung cấp tất hướng nhìn hệ thống - Phần tử mơ hình hóa (model element): Các khái niệm sử dụng biểu đồ gọi phần tử mơ hình, thể khái niệm hướng đối tượng quen thuộc Ví dụ lớp, đối tượng, thông điệp quan hệ khái niệm này, bao gồm liên kết, phụ thuộc, khái quát hóa Một phần tử mơ hình thường sử dụng nhiều biểu đồ khác nhau, ln ln có ý nghĩa kí hiệu - Cơ chế chung: Cơ chế chung cung cấp thêm lời nhận xét bổ sung, thông tin quy tắc ngữ pháp chung phần tử mơ hình; chúng cịn cung cấp thêm chế để mở rộng ngôn ngữ UML cho phù hợp với phương pháp xác định (một quy trình, tổ chức người dùng) 2.3 Một số biểu đồ UML  Biểu đồ Use-Case (Use Case Diagram) Biểu đồ Use case số lượng tác nhân ngoại cảnh mối liên kết chúng Use case mà hệ thống cung cấp (hình 1.2) Hình 1.2: Ví dụ biểu đồ UseCase  Biểu đồ lớp Biểu đồ lớp mô tả cấu trúc tĩnh hệ thống, thể phần hệ thống xử lý UML thể lớp hình chữ nhật có phần: Phần thứ chứa tên 10 từ Thật may mắn, www.dict.org xây dựng format từ điển dễ sử dụng, Dạng format số cá nhân sử dụng để xây dựng từ điển lớn Dict format mô tả sau: toàn sở liệu chứa file, file chứa nghĩa từ file index File index bao gồm tên từ, vị trí nghĩa từ bắt đầu file chứa nghĩa độ dài nghĩa Ngồi cịn nhiều từ điển chuyên dụng khác nữa, bạn tham khảo thêm địa www.dict.org 2.Định dạng Spdict Cấu trúc định dạng sau: Hình 2.4: Cấu trúc file liệu chuẩn Spdict - Phần 1: Thông tin từ điển + byte đầu vị trí mảng trỏ vị trí bắt đầu phần thứ ba + byte lưu số lần phát sinh liệu thừa (đến số chương trình tự cập nhật liệu thừa) + Tiếp theo String kiểu binary: gồm mã xếp, giọng phát âm, tên từ điển, tác giả, nguồn gốc xuất xứ (phân cách ký tự \0, dùng 2byte để lưu độ dài) - Phần 2: Dữ liệu từ điển (phần lưu nội dung từ nghĩa nó), từ gồm string nối tiếp nhau: string từ string nghĩa dạng binary, phần từ dùng byte phần nghĩa dùng byte để lưu độ dài 15 - Phần 3: Là mảng số nguyên kiểu int (mảng trỏ), mảng số nguyên xếp theo thứ tự tăng dần bảng chữ Mỗi phần tử (chiếm byte) mảng liệu trỏ đến vị trí từ Các bạn hiểu phần thứ liệu thông tin từ điển, phần thứ nội dung từ, phần thứ mảng trỏ (cái quan trọng ) Để lấy tổng số từ ta lấy kích thước file - vị trí mảng (lấy phần 1) tất chia cho để nhảy đến vị trí thứ n ta việc nhảy đến vị trí mảng +4*(n-1) Vì mảng, việc tìm kiếm nhị phân có lẽ khơng phải nói nhiều biết có điều mảng bình thường ta gõ số biến có nội dung ví dụ a[3], mảng ta tự định nghĩa nên phải nhảy đến phần tử cần lấy nội dung, đọc byte lấy vị trí nội dung, nhảy đến từ lấy nghĩa Để thêm xố từ, ví dụ thêm từ vị trí thứ n (để cho danh sách theo thứ tự abc) , ta tống toàn mảng trỏ (gọi cho quen thuộc) lên ram, ghi nội dung từ vào cuối phần liệu từ, lưu phần mảng từ đầu -> n-1 vào file, thêm vị trí phần tử thêm, lưu nốt phần cịn lại vào Xoá từ, để nguyên phần nội dung, xố phần vị trí từ cần xố mảng trỏ Giống access vậy, liệu liệu thừa, đẩy dùng lệnh "compact and repair database" Chúng ta phải tạo thêm cơng cụ có chức tương tự cho từ điển Cần lưu ý phần mảng trỏ phải ln cuối file để kích thước ln (4byte cho phần tử) , để mảng đầu file, load lên ram, phải load ln phần nội dung (có hàng trăm mb) chết Nói chung so với loại thêm xố chậm từ điển, nhập không thay đổi liên tục tốc độ hồn tồn thoả mãn Người dùng nhận thấy khác biệt thời gian nhập từ 0.001 giây với 0.1 giây Định dạng thích hợp thêm xố 16 với từ điển Mọi người ứng dụng để làm csdl loại nhỏ, động, khơng địi hỏi q nhiều CHƯƠNG 3:PHÂN TÍCH THIẾT KẾ HỆ THỐNG WEBSITE TRA TỪ ĐIỂN I.Khảo sát hệ thống website tra từ điển 1.Nhiệm vụ Hệ thống website tra từ điển phải đảm bảo chức nó, là: -Tra từ, nghĩa từ hiển thị rõ ràng - Có chức phát âm cho từ - Tốc độ tra từ nhanh xác - Mục đích hệ thống chức tra từ điển Người dùng đăng nhập khơng cần đăng nhập để tra từ 2.Quy trình xử lý - Để xây dựng hệ thống tra từ điển, vấn đề quan trọng giai đoạn thu thập sở liệu Các file liệu lưu trữ theo định dạng Sau thu thập liệu nghiên cứu cách xử lý file - Định hướng chức cho hệ thống, phân tích tìm hiểu nhu cầu người dùng để đưa thêm số chức vào website II.Phân tích hệ thống 1.Mơ hình hóa trường hợp sử dụng (Mơ hình Use-Case) Xác định danh sách tác nhân ca sử dụng Hệ thống bao gồm tác nhân người dùng (User) Admin  Người dùng: tác nhân tham gia vào chương trình chủ yếu tìm kiếm ngữ nghĩa từ cần tra, nge phát âm từ, tìm kiếm từ gần Ngồi cịn thực chức khác thảo luận 17 user khác, kiểm tra vốn từ vựng hay góp ý với Admin hệ thống Nhưng để thực chức User phải đăng nhập vào hệ thống, trước đăng nhập đăng ký thành viên  Admin: Ngoài chức tác nhân người dùng chức Admin quản lý thơng tin người dùng Sau danh sách ca sử dụng tác nhân: Tác nhân Use-Case Người dùng (User) - Admin Đăng ký Đăng nhập Quên mật Tra từ Nge phát âm Thảo luận Góp ý Quản lý thông tin User Quản lý viết User Bảng 3.1: Danh sách Use Case 2.Mơ hình Use-Case  Mơ hình Use-Case tác nhân User 18 Hình 3.2: Mơ hình Use-Case cho tác nhân User  Mơ hình Use-Case cho tác nhân Admin Hình 3.3: Mơ hình Use-Case cho tác nhân Admin Đặc tả số Use-Case Đặc tả số Use-Case tác nhân người dùng a) Use-Case Đăng Ký:  Mục đích: Đăng ký tài khoản vào hệ thống để thực chức yêu cầu có tài khoản  Tác nhân: Người dùng (User)  Luồng kiện chính: - Khởi động hệ thống - Click chuột vào mục đăng ký - Hệ thống hiển thị form đăng ký - User nhập thông tin yêu cầu vào form đăng ký - Click vào nút Đăng Ký để hoàn thành đăng ký  Luồng kiện phụ: 19 - Hệ thống kiểm tra thông tin đăng ký - Đăng ký bị lỗi thông tin tài khoản bị trùng hay thông tin cá nhân thiếu - Hệ thống hiển thị thơng báo lỗi User đầu luồng kiện hay hủy bỏ việc đăng ký b) Use-Case Đăng Nhập sửa thông tin cá nhân:  Mục đích: Đăng nhập vào hệ thống tài khoản đăng ký thay đổi thơng tin cá nhân theo ý muốn  Tác nhân: User  Luồng kiện chính: - Từ trang chủ website, chọn chức đăng nhập - Hệ thống hiển thị form đăng nhập - User nhập thông tin nhấn Đăng nhập để xác nhận - Hệ thống kiểm tra thông tin User hiển thị kết - Đăng nhập thành công hệ thống chuyển đến trang thông tin cá nhân cho phép User xem sửa thông tin  Luồng kiện phụ: - Nếu người dùng nhập sai tên đăng nhập mật khẩu, hệ thống hiển thị thông báo lỗi Người dùng chọn trở đầu luồng kiện hủy bỏ việc đăng nhập c) Use-Case Tra Từ, nge phát âm:  Mục đích: Tìm kiếm nghĩa từ nghe cách phát âm từ tra  Tác nhân: User  Luồng kiện chính: - Chọn chức tra từ trang chủ mặc định chức ta từ - Chọn loại từ điển cần tra - Gõ từ cần tra vào textbox - Click vào button Tra từ - Hệt thống tìm kiếm nghĩa từ hiển thị nghĩa  Luồng kiện phụ: 20 ... DỮ LIỆU TỪ ĐIỂN I.Cơ sử liệu từ điển Phần quan trọng ứng dụng từ điển sở liệu (CSDL) Việc xây dựng CSDL cho từ điển phải đảm bảo khả truy cập nhanh liệu từ điển thường lớn. Để nhập CSDL từ đầu... nhanh cho ứng dụng liệu từ điển thường lớn, lên tới hàng chục nghìn 14 từ Thật may mắn, www.dict.org xây dựng format từ điển dễ sử dụng, Dạng format số cá nhân sử dụng để xây dựng từ điển lớn... áp dụng định dạng dict.org định dạng Spdict II.Các chuẩn liệu từ điển Chuẩn dict.org Phần quan trọng ứng dụng từ điển khả hoạt động ứng dụng đó, mà lại sở liệu Việc xây dựng sở liệu cho từ điển

Ngày đăng: 10/03/2023, 13:59

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w