PICTION : Tại trung tâm cao cấp để phân tích và nhận dạng tƣ liệu CEDAR tại đại học Newyork, các nghiên cứu viên đã phát triển hệ thống ghi nhận và chỉ số hóa ảnh ngƣời xuất hiện trong ảnh chụp tạp chí, nhƣ Srihari, 1995. Ngƣời ta dùng hai khía cạnh chính đối với xử lý diễn giải việc nắm bắt và định vị hình ảnh mặt ngƣời trong ảnh. Bƣớc đầu tiên cần xác định tên tác giả, tức tên riêng PNC, nhƣ tên ngƣời... Sau đó xác định ngƣời đó là ai, chính xác hóa. Một vài hình có thể bị nhận dạng nhập nhặng. Tiếp sau, hình mặt ngƣời đƣợc định vị, hầu hết dựa trên nét đặc trƣng, mạnh nhƣ mắt, mũi. Hệ thống xác định trên khuôn mặt chính diện
Hình 2.7 Tìm kiếm trong QBIC
QBIC là hệ thống do IBM phát triển để thể hiện một loạt các phƣơng pháp tìm theo nội dung. Câu hỏi có thể dựa trên mẫu về màu và mẫu, khung xƣơng, hình thí dụ, thông tin về chuyển động. Cơ sở dữ liệu QBIC chứa cả ảnh tĩnh lẫn video. Bình thƣờng video đƣợc chia thành các lia, nhƣ giới thiệu trƣớc đây.
Các đối tƣợng đƣợc tách khỏi nền nhờ kĩ thuật nữa tự động “Magic wand”, là kĩ thuật thông dụng trong bộ đồ họa. Ngƣời dùng chọn điểm ảnh riêng, sang điểm ảnh liền kề theo màu nằm trong ngƣỡng, rồi mở rộng biên của vùng đƣợc chọn. Giá ngƣỡng thay đổi theo các hình, theo môi trƣờng cho phép chụp ảnh đối tƣợng.
Các đối tƣợng cũng có thể đƣợc xác định bằng cách đi theo lề ; ngƣời dùng vẽ quanh đối tƣợng và đƣờng cong sẽ tạo nên lề của đối tƣợng. Việc này thực hiện thời gian thực.
Hình 2.7 Hỏi theo nội dung với ngôn ngữ QBIC
Các câu hỏi đƣợc thực hiện theo cách khớp các chuyển động của đối tƣợng, về hình dạng...
CVQL : CVQL là ngôn ngữ hỏi cho xác định câu hỏi theo thuật ngữ không gian, thời gian của các đối tƣợng trong video, thông qua các hàm xác định trƣớc. 1996, Kuo và Chem sử dụng nó để tìm hình trong cơ sở dữ liệu video. Họ dựa trên việc tìm hình tùy theo các đặc tính không gian, thời gian. Video đƣợc nhìn theo cấu trúc phân cấp với loại video = { thể thao, xổ số, kinh tế}, thể thao = {bóng đá, tennis}...
Hình 2.8 Tìm kiếm trong CVQL
Một số hàm trong CVQL nhƣ EXIST() cho phép xác định một đối tƣợng kí hiệu có xuất hiện trong khung khung cụ thể hay trong dãy các khung không, FP() cho biết vị
trí của đối tƣợng ký hiệu trong khung, OM() xác định một đối tƣợng ký hiệu là tĩnh hay thay đổi vị trí trong dãy các khung, OOM() tính biên của miền chuyển động của đối tƣợng trong dãy các khung, RP() cho biết vị trí tƣơng đối giữa hai đối tƣợng, DISTANCE() có một số miêu tả, tùy vào ngữ cảnh đƣợc dùng, có thể dùng để xác định vị trí tƣơng đối.
Câu hỏi đƣợc thực hiện theo cách loại bỏ :
1. Trƣớc tiên “bảng kí hiệu video” đƣợc dùng để loại bỏ đoạn video không xuất hiện các đối tƣợng kí hiệu.
2. Sau đó “bảng thời gian sống của đối tƣợng kí hiệu” đƣợc dùng để loại bỏ khung (trong video) không thấy đối tƣợng xuất hiện.
3. Cuối cùng, “bảng thông tin không gian, thời gian của đối tƣợng kí hiệu” đƣợc dùng để xác định khung đáp ứng yêu cầu, hay đƣa ra câu trả lời. VEVA: hệ thống VEVA do Golshani và Dimitrova, 1998 đề xuất nhƣ ngôn ngữ hỏi cho giao diện theo kí hiệu và hiển thị. Giao diện kí tự của VEVA là ngôn ngữ hỏi đại số, dữ liệu âm thanh đƣợc coi nhƣ ký hiệu một chiều, hình đồ họa đƣợc xem là hai chiều và video nhƣ đối tƣợng ba chiều.
Hình 2.9 Hiển thị kết quả trong hệ thống VEVA
Ngôn ngữ xác định các phép sơ khởi để soạn thảo video, tìm thuộc tính video và thể hiện đoạn video. Ngoài ra còn có các phép toán không gian, thời gian. Họ đã
nghiên cứu phƣơng pháp phân tích thuộc tính và đƣờng chuyển động của đối tƣợng trong video.
Giao diện hiển thị đƣợc xác định theo ngôn ngữ đại số. Các câu lệnh đƣợc cấu trúc theo các thẻ và biểu tƣợng. Ngƣời ta đƣợc phép chọn các biểu tƣợng, thể hiện, các hành động và các liên kết
V-QBE : Một tiếp cận tìm trên video, dựa theo chuyển động của các đối tƣợng trong video, đƣợc phát hiện tại đại học Hiroshima. V-QBE cho phép ngƣời dùng tìm đoạn video theo khung xƣơng hay đƣờng thí dụ của chuyển động. Ngƣời ta có thể xác định thông tốc độ và/ hoặc kích thƣớc của đối tƣợng.
Quĩ đạo của đối tƣợng đƣợc xác định theo tâm của đối tƣợng. Biên của đối tƣợng đƣợc xác định theo tính tƣơng tự của giá trị màu của điểm ảnh liền kề. Vị trí của tâm đối tƣợng có thể vạch thành đƣờng chuyển động của đối tƣợng. Hƣớng chuyển động đƣợc thể hiện nhƣ dãy mã hóa.
Hình 2.10 Thể hiện quĩ đạo
2.3.2. Tìm các đối tượng dựa trên hình dạng và từ khóa
2.3.2.1. Tìm các đối tượng dựa vào hình dạng
Có một số điều liên quan tới việc định tên các đối tƣợng theo hình dạng. Trƣớc tiên cách thể hiện hình dạng và cách thể hiện hình dạng đƣợc trích ra từ hình ảnh. Thứ hai, cách so sánh hai hình và điều tạo nên tính tƣơng tự. Thứ ba, cách tổ chức cơ sở dữ liệu các hình dạng để tìm kiếm hiệu quả.
1. Các đối tƣợng có thể cố định theo hình dạng hay động đậy. Thí dụ căn nhà là tĩnh và hai đồ vật trong nhà có thể di chuyển.
2. Các đối tƣợng trong hình có thể chiếm một phần hay toàn bộ miền thấy đƣợc.
3. Việc trích rút hình của các đối tƣợng bị tác động của nguồn sáng, độ tƣơng phản khác nhau giữa đối tƣợng và nền.
4. Khía cạnh hiển thị ảnh hƣởng đến việc nhận dạng đối tƣợng.
2.3.2.2. Tìm các đối tượng dựa vào từ khóa
Nếu thông tin dựa vào từ khoá thì thông tin cần đƣợc chỉ số hoá; hay các đối tƣợng cần đƣợc tự động ghi nhận và có từ khoá tƣơng ứng trong chỉ số. Tuy nhiên, khi dùng chỉ số hoá thủ công hay tự động, các từ mô tả đƣợc thêm vào chỉ số có thể phù hợp hay không phù hợp với các từ khoá đã đƣợc ngƣời dùng sử dụng.
Hệ thống ONO đã đề nghị hệ thống dùng hai hệ thống chỉ số khác nhau để tìm kiếm trong cơ sở dữ liệu. Đó là chỉ số theo khoá khái niệm và khoá miêu tả ngữ cảnh.
Lọc thông tin: Các bộ lọc thông tin là cầu nối giữa ngƣời dùng và nguồn tin. Các bộ lọc trợ giúp tìm thông tin, qua đƣợc nhiều thông tin từ nhiều hệ thống khác nhau.
Cơ chế lọc thông tin chọn các đối tƣợng đƣợc phân tán đến ngƣời dùng theo tiêu chuẩn đáng quan tâm. Cơ chế ra quyết định dựa vào tham số ban đầu do ngƣời dùng cung cấp để lọc và thông tin phản hồi từ ngƣời dùng của lần tìm kiếm trƣớc. Phản hồi có thể ở dạng ẩn hay hiện. Phản hồi hiện trả lời câu hỏi ngƣời dùng; phản hồi ẩn đƣợc suy ra từ các đối tƣợng mà ngƣời dùng thấy, và thời gian dùng để xem đối tƣợng.
Shoshana Loeb đã xác định các ý chính mà ngƣời phát triển cần biết khi lọc thông tin trong cơ sở dữ liệu đa phƣơng tiện.
Hệ thống lọc đƣợc phát triển cho nguồn thông tin chuyên dụng và lớp ngƣời dùng chuyên, do không thể có lọc tổng quát;
Thời gian thiết kế và phát triển bộ lọc tuỳ thuộc vào thời gian sống của cơ sở dữ liệu, các báo cáo kĩ thuật.
Việc phân phát thông tin cũng là đặc tính của phƣơng tiện và liên quan đến khả năng vùng đệm lƣu trữ thông tin.
Thông tin lọc cần đƣợc kiểm tra để xác định loại thông tin đƣa đến ngƣời dùng.
Ngƣời dùng có thể sử dụng hệ thống thƣờng xuyên hay không thƣờng xuyên.
2.3.3. Thể hiện hình dạng
Trong FIBSSR, do Mehrotra và Gảy đƣa ra 1995, mỗi đối tƣợng đƣợc lƣu trữ trong cơ sở dữ liệu sẽ đƣợc xử lý để xác định hình dạng. Kích thƣớc của đối tƣợng là không quan trọng, do ngƣời ta dùng hình dạng để so sánh khớp.
1. Hình dạng của đối tƣợng đƣợc thể hiện qua tập có thứ tự của biên điểm tọa độ.
2. Điểm biên cũng là “điểm đáng quan tâm”;
3. Hình của đối tƣợng đƣợc vạch ra bởi các điểm đáng quan tâm, xác định các điểm trên bờ của hình.
4. Hình dạng của đối tƣợng đƣợc thẻ hiện theo “các tham số chuyển hóa”, đƣợc lƣu trong chỉ số.
Việc tìm kiếm không cần dựa vào toàn bộ khung của hình ảnh, nhƣng xóa thể dựa trên bộ khung về các khía cạnh của đối tƣợng. Việc chỉ số để tìm tất cả các hình thỏa mãn các khía cạnh yêu cầu.
2.3.4. Việc khớp các hình
Năm 1996 Del Bimbo đã phát triển hệ thống khớp hình, cho phép ngƣời dùng vạch ra khung xƣơng thể hiện hình dạng đối tƣợng muốn tìm. Rồi hệ thống tìm hình
ảnh trong cơ sở dữ liệu khớp với hình đƣợc vạch. Ngƣời dùng có thể làm tinh việc tìm kiếm bằng cách lựa chọn hình ảnh khớp nhất với đối tƣợng mong muốn.
Ngƣời dùng có thể sửa hình ảnh, hủy các đối tƣợng không cần thiết, chọn một hình để tìm kiếm tiếp theo. Việc tìm có thể đƣợc lặp lại trên cơ sở khớp các hình ảnh các hình đƣợc lƣu trữ.
Hình 2.11 Một số bước xác định công việc trích đặc trưng ảnh
2.4. Kết luận
Chƣơng này của luận văn đã trình bày các bƣớc để thực hiện việc xây dựng cơ sở dữ liệu đa phƣơng tiện cũng nhƣ là cơ sở dữ liệu hình ảnh, một số kỹ thuật tìm kiếm dữ liệu đa phƣơng tiện. Và cài thử nghiệm cơ sở dữ liệu hình ảnh, xây dựng các công cụ tìm kiếm hình ảnh.
Một số hệ thống, phần mềm cho phép tìm kiếm các ảnh theo nội dung, theo siêu dữ liệu. Các hệ thống cho thấy việc đặt câu hỏi tìm kiếm dữ liệu ảnh và thể hiện kết quả tìm đƣợc rất đa dạng, tùy theo nhu cầu của bài toán tổ chức dữ liệu ảnh và thẩm mĩ của ngƣời dùng vè ảnh đồ họa.
Chƣơng 3. TỔ CHỨC LƢU TRỮ ẢNH PHONG CẢNH THANH HÓA
Chƣơng này trình bày yêu cầu thực hiện với cơ sở dữ liệu ảnh, sau khi tiêp thu các kiến thức lí thuyết về đặc trƣng màu sắc, ảnh đồ họa trong các chƣơng trƣớc.
Các dữ liệu ảnh liên quan đến phong cảnh du lịch, đất nƣớc và con ngƣời Thanh Hóa đƣợc xem là đối tƣợng của hệ thống tổ chức thông tin và tìm kiếm, xử lí ảnh đồ họa trong luận văn.
3.1. Mô tả bài toán
3.1.1. Giới thiệu về quê hương Thanh Hóa
Theo thông tin chính thức, đã thể hiện trên các trang thông tin web, ngƣời ta thấy Thanh Hóa là tỉnh cực Bắc miền Trung Việt Nam, cách thủ đô Hà Nội khoảng 150 km về phía Nam và cách thành phố Hồ Chí Minh 1.560km về hƣớng Bắc. Đây là một tỉnh lớn của Việt Nam, đứng thứ 5 về diện tích và thứ 3 về dân số trong số các đơn vị hành chính trực thuộc trung ƣơng, cũng là một trong những địa điểm sinh sống đầu tiên của ngƣời Việt.
Việc nêu các đặc trƣng về địa phƣơng trong bài toán ứng dụng là cần thiết, để thấy đƣợc nhu cầu có hệ thống quản lí các ảnh, ghi nhận đồ họa về quê hƣơng nổi tiếng này. Cách đây khoảng 6000 năm đã có ngƣời sinh sống tại Thanh Hóa. Các di chỉ khảo cổ cho thấy nền văn hóa xuất hiện đầu tiên tại đây là văn hóa Đa Bút. Sang đầu thời đại kim khí, thuộc thời đại đồ đồng, qua các bƣớc phát triển với các giai đoạn trƣớc văn hóa Đông Sơn, Thanh Hóa đã trải qua một tiến trình phát triển với các giai đoạn văn hoá: Cồn Chân Tiên, Đông Khối - Quỳ Chữ tƣơng đƣơng với các văn hóa Phùng Nguyên - Đồng Đậu - Gò Mun ở lƣu vực sông Hồng. Và sau đó là nền văn minh Văn Lang cách đây hơn 2.000 năm, văn hoá Đông Sơn ở Thanh Hóa đã toả sáng rực rỡ trong đất nƣớc của các vua Hùng.[1]
Thanh Hóa là tỉnh chuyển tiếp giữa miền Bắc và miền Trung Việt Nam trên nhiều phƣơng diện. Về hành chính, Thanh Hóa là tỉnh cực bắc Trung Bộ, tiếp giáp với Tây Bắc Bộ và đồng bằng Bắc Bộ. Về địa chất, miền núi Thanh Hóa là sự nối dài của Tây Bắc Bộ trong khi đồng bằng Thanh Hóa là đồng bằng lớn nhất Trung Bộ, ngoài ra một phần nhỏ (phía bắc huyện Nga Sơn) thuộc đồng bằng châu thổ sông Hồng. Về khí hậu, Thanh Hóa vừa có kiểu khí hậu của miền Bắc lại vừa mang những hình thái khí hậu của miền Trung. Về ngôn ngữ, phần lớn ngƣời dân nói phƣơng ngữ Thanh Hóa với vốn từ vựng khá giống từ vựng của phƣơng ngữ Nghệ Tĩnh song âm vực lại khá gần với phƣơng ngữ Bắc Bộ.
Thanh Hóa bao gồm 1 thành phố trực thuộc tỉnh, 2 thị xã và 24 huyện, với diện tích 11.133,4 km2 và số dân 3,405 triệu ngƣời với 7 dân tộc Kinh, Mƣờng, Thái, H'mông, Dao, Thổ, Khơ-mú[2], trong đó có khoảng 355,4 nghìn ngƣời sống ở thành thị.[3]
Năm 2005 Thanh Hóa 2,16 triệu ngƣời trong độ tuổi lao động, chiếm tỷ lệ 58,8% dân số toàn tỉnh, lao động đã qua đào tạo chiếm 27%, trong đó lao động có trình độ cao đẳng, đại học trở lên chiếm 5,4%.[1]
Hình 3.1 Bãi biển Hải Hoà, Tĩnh Gia.
Theo thiên văn cổ xƣa đo đạc năm 1831 (năm Minh Mệnh thứ 10) thì tỉnh Thanh Hóa thuộc về sao Dực, sao Chẩn, tinh thứ sao Thuần Vĩ, múc cao nhất là 19 độ 26 phân, lệch về phía tây 1 độ 40 phân.
Ngày nay, theo số liệu đo đạc hiện đại của cục bản đồ thì Thanh Hóa nằm ở vĩ tuyến 19°18' Bắc đến 20°40' Bắc, kinh tuyến 104°22' Đông đến 106°05' Đông. Phía bắc giáp ba tỉnh: Sơn La, Hòa Bình và Ninh Bình; phía nam và tây nam giáp tỉnh Nghệ An; phía tây giáp tỉnh Hủa Phăn nƣớc Lào với đƣờng biên giới 192 km; phía đông Thanh Hóa mở ra phần giữa của vịnh Bắc Bộ thuộc biển Đông với bờ biển dài hơn 102 km. Diện tích tự nhiên của Thanh Hóa là 11.106 km², chia làm 3 vùng: đồng bằng ven biển, trung du, miền núi. Thanh Hóa có thềm lục địa rộng 18.000 km².
.
Hình 3.2 Vị trí tỉnh Thanh Hóa trên bản đồ đất nước
Địa hình, địa mạo : ngƣời ta thấy địa hình Thanh Hóa nghiêng từ tây bắc xuống đông nam. Ở phía tây bắc, những đồi núi cao trên 1.000 m đến 1.500 m thoải dần, kéo dài và mở rộng về phía đông nam. Đồi núi chiếm 3/4 diện tích của cả tỉnh, tạo tiềm năng lớn về kinh tế lâm nghiệp, dồi dào lâm sản, tài nguyên phong phú. Dựa vào địa hình có thể chia Thanh Hóa ra làm các vùng miền.
Miền núi, trung du: Miền núi và đồi trung du chiếm phần lớn diện tích của Thanh Hóa. Riêng miền đồi trung du chiếm một diện tích hẹp và bị xé lẻ, không liên tục, không rõ nét nhƣ ở Bắc Bộ. Do đó nhiều nhà nghiên cứu đã không tách miền đồi trung du của Thanh Hóa thành một bộ phận địa hình riêng biệt mà coi các đồi núi thấp là một phần không tách rời của miền núi nói chung.
Miền đồi núi chiếm 2/3 diện tích Thanh Hóa, nó đƣợc chia làm 3 bộ phận khác nhau bao gồm 11 huyện: Nhƣ Xuân, Nhƣ Thanh, Thƣờng Xuân, Lang Chánh, Bá Thƣớc, Quan Hóa, Quan Sơn, Mƣờng Lát, Ngọc Lạc, Cẩm Thủy và Thạch Thành. Vùng đồi núi phía tây có khí hậu mát, lƣợng mƣa lớn nên có nguồn lâm sản dồi dào, lại có tiềm năng thủy điện lớn, trong đó sông Chu và các phụ lƣu có nhiều điều kiện thuận lợi để xây dựng các nhà máy thủy điện. Miền đồi núi phía Nam đồi núi thấp, đất màu mỡ thuận lợi trong việc phát triển cây công nghiệp, lâm nghiệp, cây đặc sản và có Vƣờn quốc gia Bến En (thuộc địa bàn huyện Nhƣ Thanh và huyện Nhƣ Xuân), có rừng phát triển tốt, với nhiều gỗ quý, thú quý.
Vùng đồng bằng của Thanh Hóa lớn nhất của miền Trung và thứ ba của cả