Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 93 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
93
Dung lượng
840,52 KB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN HOÀNG GIANG XÂY DỰNG ỨNG DỤNG TRA TỪ ĐIỂN BẰNG CAMERA TRÊN ĐIỆN THOẠI DI ĐỘNG LUẬN VĂN THẠC SĨ NGÀNH HỆ THỐNG THÔNG TIN Thành phố Hồ Chí Minh - 2011 ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN NGUYỄN HOÀNG GIANG XÂY DỰNG ỨNG DỤNG TRA TỪ ĐIỂN BẰNG CAMERA TRÊN ĐIỆN THOẠI DI ĐỘNG Ngành: HỆ THỐNG THÔNG TIN Mã số: 60.48.05 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS ĐINH ĐIỀN TS TRẦN THÁI SƠN Thành phố Hồ Chí Minh - 2011 -i- LỜI CÁM ƠN Lời đầu tiên, xin chân thành cám ơn thầy Đinh Điền thầy Trần Thái Sơn, người cung cấp ý tưởng, hướng dẫn, động viên hỗ trợ nhiều trình thực luận văn Tôi xin chân thành cảm ơn thầy cô Khoa Công nghệ thông tin, Trường Đại học Khoa học Tự nhiên truyền thụ cho kiến thức quý báu suốt thời gian học tập trường, tạo tảng kiến thức giúp thực tốt luận văn Cuối cùng, xin chân thành cám ơn gia đình, bạn lớp cao học K18 bạn Công ty Dữ liệu Đa ngữ Kim từ điển giúp đỡ, động viên suốt thời gian khóa học lúc thực luận văn Tp Hồ Chí Minh, tháng 09 năm 2011 Học viên thực Nguyễn Hoàng Giang - ii - MỤC LỤC LỜI CÁM ƠN i DANH MỤC BẢNG v DANH MỤC HÌNH VẼ vi Chương 1: TỔNG QUAN VỀ ĐỀ TÀI 1.1 Nhu cầu thực tế lý thực đề tài 1.2 Mục tiêu đề tài 1.3 Nội dung thực 1.4 Đóng góp luận văn 1.5 Cấu trúc luận văn Chương 2: THU NHẬN VÀ TIỀN XỬ LÝ ẢNH 2.1 Thu nhận ảnh 2.1.1 Giới thiệu khung đa phương tiện 2.1.2 Camera 2.1.2.1 Truy xuất camera 2.1.2.2 Điều khiển camera 2.1.2.3 Hiển thị kính ngắm 2.1.2.4 Chụp ảnh tĩnh 7 12 18 20 2.2 Tiền xử lý ảnh 2.2.1 Cắt ảnh 2.2.2 Chuyển đổi định dạng ảnh 2.2.3 Làm mờ ảnh 2.2.4 Làm nét ảnh 2.2.5 Hiệu chỉnh độ tương phản 25 28 30 31 34 34 Chương 3: NHẬN DẠNG KÝ TỰ QUANG HỌC 37 3.1 Tổng quan nhận dạng ký tự quang học 3.1.1 Nhận dạng ký tự quang học 3.1.2 Một số công cụ OCR miễn phí 37 37 38 - iii - 3.2 Tổng quan nhận dạng Tesseract 3.2.1 Giới thiệu 3.2.2 Kiến trúc hoạt động 3.2.3 Phân ngưỡng thích ứng 3.2.4 Phân tích thành phần liên thông 3.2.5 Tìm hàng tìm từ 3.2.6 Nhận dạng từ 40 40 42 43 44 45 45 3.3 Nhận dạng ký tự quang học 3.3.1 Cấu trúc khối 3.3.2 Chuyển mã nhận dạng Tesseract vào hệ điều hành Symbian 46 46 47 Chương 4: XỬ LÝ NGÔN NGỮ VÀ TRA TỪ ĐIỂN 51 4.1 Tra từ điển 4.1.1 Tổ chức cấu trúc liệu lưu trữ 4.1.1.1 Tổ chức mục từ có kích thước 4.1.1.2 Tổ chức mục từ có kích thước biến động 4.1.2 Tổ chức cấu trúc liệu hỗ trợ cho việc tìm kiếm nhanh 4.1.2.1 Tổ chức tập tin nghĩa 4.1.2.2 Tổ chức tập tin mục 4.1.2.3 Tổ chức băm tập tin mục 52 53 54 54 55 56 56 57 4.2 Xử lý ngôn ngữ 4.2.1 Tìm từ gốc (Stemming) 4.2.2 Tìm từ gần giống với từ cần tra 4.2.2.1 Khoảng cách Levenshtein 4.2.2.2 Ma trận chữ tương tự 4.2.3 Tìm từ tiếng Việt có nghĩa 58 59 60 60 62 65 Chương 5: KẾT QUẢ THỰC NGHIỆM 67 5.1 Kết thử nghiệm khối tiền xử lý ảnh 67 5.2 Kết thử nghiệm khối nhận dạng ký tự quang học 5.2.1 Tiếng Anh 5.2.2 Tiếng Việt 68 68 70 5.3 72 Kết thử nghiệm khối xử lý ngôn ngữ Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 74 - iv - 6.1 Kết luận 74 6.2 Hướng phát triển 74 TÀI LIỆU THAM KHẢO 76 Tiếng Việt 76 Tiếng Anh 76 PHỤ LỤC 77 Phụ lục: Hướng dẫn sử dụng chương trình 77 Cài đặt chương trình 1.1 Yêu cầu cấu hình 1.2 Cài đặt chương trình Sử dụng chương trình 77 77 77 78 -v- DANH MỤC BẢNG Bảng 3.1: Độ xác Tesseract số ngôn ngữ 41 Bảng 3.2: So sánh nhận dạng thương mại Tesseract 42 Bảng 4.1: Bảng mô tả trường liệu 54 Bảng 4.2: Các trường liệu mẫu tập tin mục 56 Bảng 4.3: Một phần ma trận chữ tương tự theo David B Boles 63 Bảng 4.4: Một phần ma trận chữ tương tự theo McGraw 63 Bảng 4.5: Danh sách chữ chữ gần giống 64 Bảng 5.1: Kết chạy thử nghiệm máy Nokia N97 67 Bảng 5.2: Kết kiểm tra ứng dụng tiếng Anh 69 Bảng 5.3: Một số trường hợp nhận dạng sai (tiếng Anh) 70 Bảng 5.4: Kết kiểm tra ứng dụng tiếng Việt 71 Bảng 5.5: Một số trường hợp nhận dạng sai (tiếng Việt) 72 - vi - DANH MỤC HÌNH VẼ Hình 1.1: Mô hình “Ứng dụng tra từ điển camera điện thoại di động” Hình 2.1: Khối thu nhận tiền xử lý ảnh Hình 2.2: Kiến trúc MMF Hình 2.3: Hệ thống đa phương tiện Hình 2.4: Khối tiền xử lý ảnh 27 Hình 2.5: Giới hạn vùng ảnh chụp định từ cần tra 29 Hình 2.6: Một ví dụ phép tích chập 32 Hình 2.7: Ma trận “nhân” dùng để làm mờ ảnh theo phương pháp Gauss 33 Hình 2.8: Ma trận “nhân” dùng để làm nét ảnh 34 Hình 3.1: Một ví dụ OCR 37 Hình 3.2: Kiến trúc nhận dạng Tesseract 43 Hình 3.3: Phân ngưỡng 44 Hình 3.4: Phân tích bố cục trang 44 Hình 3.5: Tìm hàng văn tìm từ 45 Hình 3.6: Khối nhận dạng ký tự quang học 47 Hình 4.1: Khối xử lý ngôn ngữ tra từ điển 52 Hình 5.1: Minh họa trình tiền xử lý ảnh 68 Hình 5.2: Một ví dụ kết nhận dạng (tiếng Anh) 69 Hình 5.3: Một ví dụ kết nhận dạng 71 Hình 5.4: Tìm từ gốc 72 Hình 5.5: Tìm từ gần giống 73 Hình 5.6: Tìm từ tiếng Việt có nghĩa 73 Hình A.1: Chạy chương trình 78 Hình A.2: Màn hình khởi động chương trình 78 Hình A.3: Chương trình lấy tiêu cự tự động 79 Hình A.4: Kết lấy tiêu cự tự động 79 Hình A.5: Hiển thị kết 80 - vii - Hình A.6: Menu Options 80 Hình A.7: Chọn từ điển 81 Hình A.8: Liệt kê từ gần giống với kết nhận dạng 81 Hình A.9: Không thể nhận dạng 82 Hình A.10: Nhận dạng bị lỗi 82 Hình A.11: Không tìm từ cần tra 83 -1- Chương 1: TỔNG QUAN VỀ ĐỀ TÀI TỔNG QUAN VỀ ĐỀ TÀI 1.1 Nhu cầu thực tế lý thực đề tài Trong sống người, thông tin liên lạc nhu cầu thiếu người Vô số phương pháp liên lạc đời nhằm phục vụ nhu cầu thư tín, điện thoại bàn, thư điện tử, điện thoại di động, Trong đó, điện thoại di động bật lên phương tiện liên lạc hữu ích nhất, tiện lợi nhất, đặc biệt người sống làm việc đô thị lớn Điện thoại di động, với chức đàm thoại trực tiếp lúc nơi, ngày sử dụng rộng rãi “vật bất ly thân” người Hiện giới, điện thoại di động phát triển không ngừng Hàng loạt điện thoại với tính năng, ứng dụng đại tung thị trường Có thể nói điện thoại di động thiết bị điện tử phát triển nhanh chóng công nghệ lẫn tính năng, ứng dụng Riêng Việt Nam, thị trường điện thoại di động phát triển mạnh mẽ với số lượng người dùng đông đảo, hẳn thiết bị di động cá nhân khác Pocket PC, máy nghe nhạc,… Bên cạnh đó, nhu cầu từ điển đa ngôn ngữ phục vụ cho công việc, học tập, giao tiếp,… luôn cần thiết Tuy nhiên lúc có mặt nhà, quan để tra từ điển Việc mang theo từ điển dày cộm máy tính xách tay công tác, học, du lịch,… đem đến cho người dùng nhiều bất tiện Vì vậy, ứng dụng từ điển điện thoại di động cho phép tra cứu “mọi lúc nơi” người dùng chờ đợi ủng hộ Sự đời hệ điện thoại thông minh sử dụng hệ điều hành mở Symbian cho phép thực điều - 70 - Bảng 5.3: Một số trường hợp nhận dạng sai (tiếng Anh) Ø Nhận xét: o Đa số chữ ‘e’ bị nhầm thành ‘€’ o Đa số chữ ‘r’ bị nhầm thành ‘\'’ ‘|'’ o Hai chữ ‘m’ ‘n’ thường bị nhận dạng sai o Đa số kết nhận dạng sai khó sửa 5.2.2 Tiếng Việt Tương tự trường hợp tiếng Anh, ứng dụng chạy thử chụp 300 ảnh điều kiện ánh sáng tốt đồng Ø Dữ liệu thử nghiệm: tài liệu in tiếng Việt (chữ màu đen giấy trắng, gồm 1000 từ trích ngẫu nhiên từ liệu từ điển) Tài liệu chia làm phần, phần định dạng ba font chữ thông dụng Arial, Times New Roman VNI-Times, cỡ chữ 12, kiểu chữ thường chữ nghiêng Ø Kết thử nghiệm: xem bảng 5.4 Font chữ Tổng số từ Số từ sai % Lỗi Arial 100 11 11% Times New Roman 100 12 12% - 71 - VNI-Times 100 19 19% Bảng 5.4: Kết kiểm tra ứng dụng tiếng Việt Ø Minh họa kết nhận dạng đúng: Hình 5.3 mô tả trình nhận xử lý ứng dụng ảnh trung gian mà ứng dụng tạo trường hợp kết nhận dạng Hình 5.3: Một ví dụ kết nhận dạng Ø Minh họa kết nhận dạng sai: Một số kết nhận dạng sai dẫn đến tra từ điển (xem bảng 5.5) - 72 - Bảng 5.5: Một số trường hợp nhận dạng sai (tiếng Việt) Ø Nhận xét: o Trong kết nhận dạng thường xuất ký tự lạ ‘´’ o Các lỗi sai thường xảy dấu, đặc biệt dấu hỏi o Dấu hỏi dễ bị nhầm thành ký tự ‘º’ 5.3 Kết thử nghiệm khối xử lý ngôn ngữ Luận văn tiến hành chạy thử nghiệm bước xử lý ngôn ngữ tất bước xử lý ngôn ngữ thực thành công Sau số hình ảnh kết bước xử lý ngôn ngữ: Ø Tìm từ gốc Hình 5.4: Tìm từ gốc - 73 - Ø Tìm từ gần giống Hình 5.5: Tìm từ gần giống Ø Tìm từ tiếng Việt có nghĩa Hình 5.6: Tìm từ tiếng Việt có nghĩa - 74 - Chương 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 6.1 Kết luận Luận văn đưa mô hình ứng dụng tra từ điển camera điện thoại di động, góp phần mang lại phương thức tra từ điển vừa mang phong cách đại vừa thuận tiện cho người dùng Luận văn xây dựng thành công “Ứng dụng tra từ điển camera điện thoại di động” đạt số kết khả quan: 85% tiếng Anh 86% tiếng Việt Ngoài ra, luận văn cải tiến số tính nhận dạng Tesseract góp phần nâng cao độ xác tốc độ nhận dạng phạm vi ứng dụng tra từ điển 6.2 Hướng phát triển Đề tài giới hạn mức tra từ điển song ngữ Anh-Việt chưa hỗ trợ ngôn ngữ khác, đặc biệt ngôn ngữ không sử dụng mẫu tự Latin như: tiếng Hoa, tiếng Nhật, tiếng Thái,… Hướng phát triển thứ đề tài nghiên cứu thêm nhận dạng ký tự quang học để hỗ trợ thêm ngôn ngữ không sử dụng mẫu tự Latin Việc mang ý nghĩa lớn ngôn ngữ gây nhiều khó khăn cho người dùng từ điển thông thường việc nhập từ cần tra cứu Hướng phát triển thứ hai đề tài cải thiện khối nhận dạng ký tự quang học để nhận dạng nhiều văn không cần phải giới hạn vùng ảnh chụp Đây tảng để phát triển ứng dụng dịch tự động cụm từ, câu đoạn văn camera điện thoại di động - 75 - Đề tài giới hạn ảnh chụp điều kiện ánh sáng tốt đầu vào văn giấy với số ràng buộc định Hướng phát triển thứ ba đề tài cải thiện khối xử lý ảnh để thực nhận dạng nhiều điều kiện ánh sáng khác từ nhiều nguồn đầu vào khác từ văn giấy Điều giúp cho phạm vi sử dụng ứng dụng mở rộng Ngoài việc hỗ trợ cho người có nhu cầu học tập làm việc với ngoại ngữ, ứng dụng hỗ trợ du khách nước tham quan tra cứu thông tin từ bảng hiệu, bảng dẫn,… - 76 - TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đinh Điền (2006), Xử lý ngôn ngữ tự nhiên, Nhà xuất Đại học Quốc gia TP.HCM [2] Bùi Tấn Lộc, Cao Thái Phương Thanh (2005), Nghiên cứu xây dựng ứng dụng từ điển điện thoại di động, Luận văn cử nhân tin học, Đại học Khoa học Tự nhiên TP.HCM Tiếng Anh [3] Adi Rome, Mark Wilcox (2008), Multimedia on Symbian OS, John Wiley & Sons Ltd., pp 35-54 [4] David B Boles, John E Clifford (1989), “An upper- and lowercase alphabetic similarity matrix, with derived generation similarity values”, Behavior Research Methods, Instruments & Computers, 21 (6), pp 579-586 [5] Dwayne Phillips (1994), Image Processing in C, R & D Publications, pp 75101 [6] McGraw, G., Rehling, J., Goldstone, R (1994), “Letter Perception: Toward a conceptual approach”, Proceedings of the Sixteenth Annual Conference of the Cognitive Science Society, pp 613-618 [7] Michael Aubert (2008), Quick Recipes on Symbian OS, John Wiley & Sons Ltd., pp 236-262 [8] Ray Smith (2007), “An Overview of the Tesseract OCR Engine”, Proc 9th Int Conf on Document Analysis and Recognition, pp 629-633 [9] Ray Smith, Daria Antonova, Dar-Shyang Lee (2009), “Adapting the Tesseract Open Source OCR Engine for Multilingual OCR”, Google Inc [10] Richard Harrison, Mark Shackman (2007), Symbian OS C++ for Mobile Phones, John Wiley & Sons Ltd., pp 14-387 - 77 - PHỤ LỤC Phụ lục: Hướng dẫn sử dụng chương trình Cài đặt chương trình 1.1 Yêu cầu cấu hình • Cấu hình hệ thống: CPU ARM 11, 369 MHz, 128MB RAM, 50MB thẻ nhớ trở lên • Hệ điều hành: Symbian OS 9.2 • Camera: MP, 1600x1200 pixels, LED flash 1.2 Cài đặt chương trình • Cài đặt thư viện Open C++ 1.7 (nếu chưa có điện thoại) o Chép tập tin STDCPP_s60_1_7_SS.sis (trong thư mục SOFT\S60OPENCPPSIS đĩa CD) vào thẻ nhớ điện thoại (E:\) o Chạy tập tin STDCPP_s60_1_7_SS.sis để cài đặt o Lần lượt thực bước theo hướng dẫn hoàn tất • Cài đặt chương trình OCR Dictionary o Chép tập tin OcrDict.sisx (trong thư mục OCR DICTIONARY\SETUP đĩa CD) vào thẻ nhớ điện thoại o Chạy tập tin OcrDict.sisx để cài đặt o Lần lượt thực bước theo hướng dẫn hoàn tất o Tạo thư mục E:\OcrDict thẻ nhớ điện thoại di động o Chép thư mục: Dictionaries, tessdata DICTIONARY\SETUP vào thư mục E:\OcrDict thư mục - 78 - • Chạy chương trình từ hình Home Hình A.1: Chạy chương trình Sử dụng chương trình • Khởi động chương trình: Sau chạy chương trình ta thu hình A.2: Hình A.2: Màn hình khởi động chương trình • Bắt đầu tra từ điển: Chọn “Start” để bắt đầu sử dụng chương trình Kính ngắm hiển thị người dùng bắt đầu chụp ảnh để tra từ điển Kính ngắm hiển thị người dùng di chuyển camera đến văn cần chụp, giữ khoảng cách camera văn giấy cho ảnh thu kính ngắm - 79 - rõ Chữ thập màu đỏ trỏ vào từ cần tra Sau chọn xong từ cần tra, người dùng chọn “Capture” chọn “Options→Capture” để chụp ảnh Nếu điện thoại có hỗ trợ chức Auto focus chương trình tiến hành lấy tiêu cự tự động Hình A.3: Chương trình lấy tiêu cự tự động Sau thực lấy tiêu cự xong (xem hình A-4), chương trình mở hình vừa chụp lên bắt đầu nhận dạng tra từ điển từ kết nhận dạng Hình A.4: Kết lấy tiêu cự tự động • Hiển thị kết quả: Sau nhận dạng tra từ điển xong, chương trình hiển thị kết cho người dùng: - 80 - Hình A.5: Hiển thị kết • Tra từ mới: Người dùng chọn “New word” hay “Options→New word” Hình A.6: Menu Options • Chọn từ điển: Từ điển mặc định chương trình “EnglishVietnamese” Để thay đổi từ điển, từ hình hiển thị kính ngắm hình hiển thị kết quả, người dùng chọn “Options→Dictionaries→Vietnamese-English / English-Vietnamese”: - 81 - Hình A.7: Chọn từ điển Trên hình ảnh có chương trình hoạt động bình thường, nghĩa chương trình chạy tốt, nhận dạng tra thành công từ người dùng cần tra Tuy nhiên, trình sử dụng chương trình, người dùng gặp phải trường hợp không bình thường sau: • Liệt kê từ gần giống: Người dùng phải chọn số từ gần giống với từ cần tra giấy Hình A.8: Liệt kê từ gần giống với kết nhận dạng Trong hình A.8, ứng dụng liệt kê hai từ gần giống với kết nhận dạng, hai từ từ mà người dùng cần tra chụp ảnh Chương - 82 - trình hiển thị nghĩa từ mà người dùng chọn Nếu ứng dụng tìm từ gần giống tự động hiển thị nghĩa, người dùng không cần phải chọn từ • Không thể nhận dạng: Chương trình nhận dạng từ mà người dùng cần tra Trong trường hợp này, người dùng nên thử chụp lại Hình A.9: Không thể nhận dạng • Nhận dạng bị lỗi: Chương trình nhận dạng sai, có nhiều ký tự chữ Trong trường hợp này, người dùng nên thử chụp lại Hình A.10: Nhận dạng bị lỗi • Không tìm từ cần tra: Có thể kết nhận dạng đúng, từ cần tra từ điển chương trình Trong trường hợp này, người dùng nên - 83 - thử tra lại Nếu kết không thay đổi khẳng định từ cần tra không nằm từ điển ứng dụng Hình A.11: Không tìm từ cần tra —¶– XÁC NHẬN CỦA GIẢNG VIÊN HƯỚNG DẪN GV hướng dẫn PGS TS Đinh Điền GV đồng hướng dẫn TS Trần Thái Sơn Học viên Nguyễn Hoàng Giang [...]... do trên, Ứng dụng tra từ điển bằng camera trên điện thoại di động là một ứng dụng thật sự có ý nghĩa thực tiễn rất to lớn 1.2 Mục tiêu của đề tài Mặc dù đã có những ứng dụng từ điển trên điện thoại di động nhưng các ứng dụng này chưa thật sự mang lại cho người dùng hiệu quả và sự tiện lợi khi sử dụng Những ứng dụng từ điển này chỉ cho phép người dùng nhập từ cần tra cứu bằng bàn phím của điện thoại. .. camera trên điện thoại di động Hình 1.1 mô tả mô hình của Ứng dụng tra cứu từ điển bằng camera trên điện thoại di động : Đầu vào của ứng dụng: là văn bản giấy chứa từ cần tra Đầu ra của ứng dụng: là kết quả tra từ điển (hoặc là nghĩa của từ cần tra hoặc là các thông báo lỗi) Ứng dụng gồm ba khối xử lý: khối thu nhận và tiền xử lý ảnh, khối nhận dạng ký tự quang học, khối xử lý ngôn ngữ và tra từ điển. .. đề tài là xây dựng một ứng dụng từ điển thông minh trên điện thoại di động có khả năng tra cứu từ trên giấy thông qua camera được tích hợp sẵn trên điện thoại di động, từ đó có thể giúp cho người dùng tra cứu từ vựng trên sách, báo một cách đơn giản và tiện dụng Để thực hiện được mục tiêu đã nêu trên chúng ta phải khai thác khả năng nhận dạng ký tự quang học của camera trên điện thoại di động, sau... học Xử lý ngôn ngữ và tra từ điển Nghĩa của từ cần tra Hình 1.1: Mô hình Ứng dụng tra từ điển bằng camera trên điện thoại di động 1.3 Nội dung thực hiện Luận văn này tập trung nghiên cứu các vấn đề sau: Ø Hệ điều hành Symbian và môi trường lập trình Carbide C++ Ø Tiền xử lý ảnh trên điện thoại di động để cải thiện kết quả nhận dạng Ø Nhận dạng ký tự quang học trên điện thoại di động đối với hai ngôn... Đóng góp của luận văn Luận văn này đã đưa ra một mô hình cơ bản của một ứng dụng tra từ điển bằng camera trên điện thoại di động, góp phần mang lại một phương thức tra từ điển mới vừa mang phong cách hiện đại vừa thuận tiện cho người dùng Luận văn đã xây dựng thành công Ứng dụng tra từ điển bằng camera trên điện thoại di động và đã đạt được một số kết quả khả quan Ngoài ra, luận văn đã cải tiến một số... camera của điện thoại di động đã được cải thiện rất nhiều và có khả năng thay thế máy ảnh kỹ thuật số thông thường Tuy nhiên, trên thực tế, camera điện thoại di động chỉ đáp ứng được một số nhu cầu cơ bản Trong trường hợp cụ thể của ứng dụng này (ứng dụng tra từ điển cần chụp những bức ảnh trên giấy ở khoảng cách gần vì cỡ chữ trên giấy là khá nhỏ), chất lượng camera của đa phần các điện thoại di động. .. nếu ứng dụng từ điển cho phép người dùng sử dụng camera của điện thoại di động để chụp hình từ cần tra cứu để làm đầu vào thay vì phải nhập từ bàn phím, khi đó việc am hiểu về ngôn ngữ đang tra cứu và bộ gõ của ngôn ngữ đó không còn thật sự cần thiết nữa Ngoài ra, chất lượng hình ảnh được chụp bằng camera của điện thoại di động ngày càng được cải thiện và hầu hết các điện thoại di động đều có camera. ..-2- Trên thị trường đã có rất nhiều ứng dụng từ điển được phát triển cho điện thoại di động như Lạc Việt, Stardict, MobiDict,… Khi sử dụng những ứng dụng từ điển này, người dùng sẽ nhập từ cần tra cứu bằng bàn phím của điện thoại di động Việc này hoàn toàn dễ dàng đối với các ngôn ngữ Latin như tiếng Anh, nhưng điều tương tự không di n ra đối với các ngôn ngữ có dấu... nhau Trong một ứng dụng nói chung và trong ứng dụng tra từ điển bằng camera trên điện thoại di động này nói riêng chỉ có thể giải quyết bài toán trong một trường hợp cụ thể - 26 - Trong phạm vi của luận văn này, tôi chỉ thực hiện một số thao tác tiền xử lý ảnh cơ bản đủ để đáp ứng yêu cầu của ứng dụng và cải thiện một phần chất lượng của ảnh chụp Một số thao tác tiền xử lý ảnh được áp dụng: làm mờ ảnh... DevSound Codec Hình 2.2: Kiến trúc của MMF 2.1.2 Camera Khi camera trở nên phổ biến trên điện thoại di động, các nhà sản xuất điện thoại di động đã cho phép người phát triển truy xuất các chức năng của camera bằng nhiều API khác nhau Từ đó đã xảy ra sự phân mảnh, điều này có nghĩa là đã có nhiều mã nguồn điều khiển camera được viết phụ thuộc vào nền tảng của điện thoại và khả năng riêng biệt của thiết bị