Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 15 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
15
Dung lượng
319,62 KB
Nội dung
NHẬP MÔN CÔNG NGHỆ THÔNG TIN 2 15CTT ĐỒ ÁN MÔN HỌC #2 Tài liệu mô tả đồ án môn học cho môn học Nhập môn Công nghệ thông tin theo hướng chun ngành Khoa học máy tính – Cơng nghệ tri thức và Thị giác máy tính & Robot Khoa Công nghệ Thông tin Đại học Khoa học Tự nhiên TP HCM Tháng 03/2016 MỤC LỤC Các nội dung chính 1 Nội dung đồ án 2 Các sản phẩm cần đạt được Hướng dẫn thực hiện theo tuần Các công cụ gợi ý 8 Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT ĐỒ ÁN MƠN HỌC Các nội dung chính • • • Mô tả nội dung đồ án và các kết quả cần đạt được Hướng dẫn thực hiện đồ án theo tuần cho giảng viên và sinh viên Cách thức đánh giá ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT Nội dung đồ án Nội dung chính Có tất cả 3 chủ đề Nhóm sinh viên chọn một trong ba để thực hiện Chủ đề 1 - Nhận dạng ảnh: Xây dựng một video demo cho một hệ thống tìm kiếm thơng tin bằng hình ảnh văn Đồng thời, sinh viên tìm hiểu nội dung kiến thức liên quan Chủ đề – Khai thác liệu: Xây dựng video demo cho hệ thống khai thác ý kiến người dùng qua internet Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Chủ đề 3 – Bảo mật: Xây dựng một video demo cho một mơ hình bảo mật ở một cơng ty truyền thơng Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Mục tiêu đồ án Sinh viên thực hiện đồ án sẽ nắm được các kiến thức: • • • • Kiến thức cơ bản cho một số chủ đề thuộc 3 chun ngành KHMT, CNTT và TGMT Cách tiến hành thực hiện một dự án theo mơ hình linh hoạt Một số cơng cụ hỗ trợ làm việc cộng tác trên mơi trường Internet Xây dựng mơ hình sản phẩm theo u cầu Sinh viên thực hiện đồ án sẽ rèn luyện các kĩ năng: • • • Lập kế hoạch, làm việc nhóm, tổ chức và quản lí nhóm Tìm hiểu và viết báo cáo Đọc hiểu tiếng Anh và các tài liệu chun ngành ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT 1.1 Đồ án 1 - Nhận dạng ảnh Xây dựng video demo cho một hệ thống tìm kiếm thơng tin bằng hình ảnh văn bản Đồng thời sinh viên tìm hiểu các nội dung kiến thức liên quan Biết rằng hệ thống hoạt động theo mơ hình sau: • • Đầu vào là một tập tin ảnh của một từ, câu hoặc một đoạn văn bản(text) Đầu ra là các tài liệu có nội dung liên quan đến nội dung của văn bản được tìm thấy từ Internet Hệ thống chuyển tập tin hình ảnh thành dạng văn cơng cụ OCR Tiếp theo, văn rút được sẽ được sử dụng trực tiếp (đối với trường hợp chỉ là một từ hoặc câu ngắn) hoặc phải qua rút trích từ khóa (đối với trường hợp là một đoạn văn bản) để tìm các tài liệu từ Internet Việc tìm kiếm các tài liệu này được thực hiện bởi các chương trình tìm kiếm như Google, Yahoo! Video demo cần thể hiện được: • • • Đầy đủ các bước được đề cập phía trên và theo đúng trình tự Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước Video cần dễ hiểu và trực quan sinh động Các nội dung kiến thức sinh viên cần tìm hiểu: • • • OCR (optical character recognition) Rút trích các từ khóa, là các từ chính thể hiện nội dung văn bản (keyword extractor) So sánh 2 cơng cụ tìm kiếm, ví dụ Google và Yahoo! Đánh giá ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI A (50% điểm của đề tài) Yếu (0 -49%) OCR - Nhận dạng chữ viết (25%) Biết khái Hiểu khái niệm bản, ứng d niệm bản, ứng ụng dụng Liệt kê phương pháp OCR Rút trích từ khóa (20%) Biết khái Hiểu khái Hiểu niệm cơ bản niệm cơ bản khái niệm Biết phương pháp rút trích từ khóa So sánh cơng cụ tìm kiếm (20%) So sánh được, So sánh được, So sánh được, số lượng tiêu chí ≤ 3 số lượng số lượng tiêu chí ≤ 5 tiêu chí > ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin TB(50 – 74%) Khá (75-89%) Tốt (90 100%) Hiểu khái niệm, ứng dụng Trình bày phương pháp OCR Hiểu khái niệm, ứng dụng Trình bày phương pháp OCR Thử nghiệm cơng cụ OCR(có minh chứng) Hiểu khái niệm, Biết phương pháp rút trích từ khóa Thử nghiệm cơng cụ (có minh chứng So sánh được, số lượng tiêu chí > – Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT Video demo (35%) Thể hiện đủ các bước của mơ hình Hình ảnh nhiều chỗ khơng phù hợp với nội dung Thể đủ bước mơ hình Nêu rõ kĩ thuật sử dụng bước Hình ảnh phù hợp với nội dung Sử dụng hồn tồn hình ảnh khơng tự quay Thể đủ bước mơ hình Nêu rõ kĩ thuật sử dụng mỗi bước Hình ảnh phù hợp với nội dung 50% hình ảnh sử dụng tự quay 1.2 Đồ án 2 – Khai thác dữ liệu Xây dựng video demo cho hệ thống khai thác ý kiến người dùng (opinion mining) qua internet Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Biết rằng hệ thống hoạt động theo mơ hình sau: • • Đầu vào là từ khóa liên quan đến một sản phẩm hoặc sự kiện nào đó Đầu ra là thống kê có bao nhiêu phần trăm ý kiến trên internet thích hay khơng thích sản phẩm hoặc sự kiện Khi nhận được từ khóa, hệ thống sẽ thực hiện tìm kiếm các status, comment (dạng văn bản) của người dùng trên một số trang web như Facebook, Twitter, blogs… có chứa từ khóa trong khoảng thời gian nhất định Tiếp đó, hệ thống sẽ phân loại thái độ (thích hay khơng thích) từ các status thu Cuối cùng tính số lượng phần trăm thích và khơng thích tương ứng Video demo cần thể hiện được: • • • Đầy đủ các bước được đề cập phía trên và theo đúng trình tự Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước Video cần dễ hiểu và trực quan sinh động Các nội dung kiến thức sinh viên cần tìm hiểu: • • Web crawler (lấy dữ liệu từ internet) Opinion mining (khai thác ý kiến người dùng) Đánh giá ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI B (50% điểm của đề tài) Yếu (0 -49%) Web crawler (lấy dữ liệu từ internet) (30%) Biết khái Hiểu khái niệm bản, ứng d niệm bản, ứng ụng dụng Liệt kê phương pháp OCR ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin TB(50 – 74%) Khá (75-89%) Tốt (90 100%) Hiểu khái niệm, ứng dụng Trình bày phương pháp OCR Hiểu khái niệm, ứng dụng Trình bày phương pháp OCR Thử nghiệm công cụ OCR(có – Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT Opinion mining (khai thác ý kiến người Biết khái Hiểu khái niệm bản, ứng d niệm bản, ứng dùng) (35%) ụng dụng Video demo (35%) Thể hiện đủ các bước của mơ hình Hình ảnh nhiều chỗ khơng phù hợp với nội dung Thể đủ bước mơ hình Nêu rõ kĩ thuật sử dụng bước Hình ảnh phù hợp với nội dung Sử dụng hồn tồn hình ảnh khơng tự quay Hiểu khái niệm, ứng dụng Biết phương pháp rút trích từ khóa Thể đủ bước mơ hình Nêu rõ kĩ thuật sử dụng mỗi bước Hình ảnh phù hợp với nội dung 50% hình ảnh sử dụng tự quay 1.3 Đồ án 3 - Bảo mật Xây dựng một video demo cho một mơ hình bảo mật ở một cơng ty truyền thơng Đồng thời, sinh viên tìm hiểu các nội dung kiến thức liên quan Những vấn đề bảo mật quan tâm là: • • Các sản phẩm (hình ảnh, video) được thiết kế/quay bởi cơng ty cần được chứng thực Chứng thực như một cách đánh dấu (hay kí tên) cho sản phẩm Các hình ảnh/video có thể gửi qua lại giữa các phòng ban và cần được bảo mật trước thời điểm cơng bố Mơ hình bảo mật hoạt động như sau: • • Các tập tin sản phẩm được áp dụng kĩ thuật ẩn dữ liệu để ẩn chữ kí chứng thực vào bên trong (mà khơng thể phá vỡ được) Các sản phẩm trước khi gửi đi đến các phòng ban cần được mã hóa trước Người nhận mong muốn sẽ phải giải mã để có sản phẩm gốc Video demo cần thể hiện được: • • Đầy đủ các bước được đề cập phía trên và theo đúng trình tự Ở mỗi bước, cần thể hiện được kĩ thuật nào được sử dụng, cũng như đầu vào và đầu ra ở mỗi bước ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT • Video cần dễ hiểu và trực quan sinh động Các nội dung kiến thức sinh viên cần tìm hiểu: • • Ẩn dữ liệu (data hiding) Mã hóa dữ liệu Ngồi ra, sinh viên sẽ phải tự quay một video giới thiệu về nhóm để demo cho mơ hình của mình Đánh giá: ĐÁNH GIÁ SẢN PHẨM ĐỀ TÀI C (50% điểm của đề tài) Yếu (0 -49%) Ẩn dữ liệu (data hiding) (25%) Biết khái Hiểu khái niệm bản, ứng d niệm bản, ứng ụng dụng Liệt kê phương pháp Mã hóa dữ liệu (25%) Biết khái Hiểu khái niệm bản, ứng d niệm bản, ứng ụng dụng Video demo (30%) Thể hiện đủ các bước của mơ hình Hình ảnh nhiều chỗ khơng phù hợp với nội dung Video giới thiệu nhóm (20%) Thể đủ bước mơ hình Nêu rõ kĩ thuật sử dụng bước Hình ảnh phù hợp với nội dung Sử dụng hồn tồn hình ảnh không tự quay Đầy đủ thông tin Đầy đủ thơng tin các thành viên các thành viên Hình ảnh nghèo nàn Hình ảnh âm thanh phù hợp ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin TB(50 – 74%) Khá (75-89%) Tốt (90 100%) Hiểu khái niệm, ứng dụng Trình bày phương pháp – Hiểu khái niệm, ứng dụng Trình bày phương pháp Thử nghiệm cơng cụ OCR(có minh chứng) Hiểu Hiểu khái khái niệm, ứng niệm, ứng dụng dụng Biết phương Biết phương pháp rút trích từ pháp rút trích từ khóa khóa Thử nghiệm cơng cụ (có minh chứng Thể đủ Thể đủ bước mơ hình bước mơ hình Nêu rõ kĩ Nêu rõ kĩ thuật sử dụng thuật sử dụng mỗi bước mỗi bước Hình ảnh phù Hình ảnh phù hợp với nội dung hợp với nội dung 50% hình ảnh sử dụng tự sử dụng tự quay quay Đầy đủ thông tin các thành viên Nội dung hấp dẫn, sáng tạo Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT Các sản phẩm cần đạt được Project plan (phác thảo dự án) Kế hoạch thực hiện dự án theo qui trình Scrum Meeting minutes (chi tiết cuộc họp) Ghi lại nội dung các cuộc họp hang tuần của nhóm Các thành phần cơ bản gồm có: Các cơng việc của tuần trước, tiến độ của các cơng việc này (đã xong, đã hồn thành ?%), các vấn đề còn tồn động và các giải pháp đã chọn sau khi thảo luận, các cơng việc mới, phân cơng cơng việc cho tuần mới Reflective report (báo cáo rút kinh nghiệm) Báo cáo rút kinh nghiệm sau khi hồn thành dự án: nhận xét những điểm đã làm tốt, những điểm còn tồn đọng, mức độ đóng góp của các thành viên Báo cáo Slide Báo cáo dạng Slide về sản phẩm của nhóm (về video & nội dung kiến thức) Sản phẩm demo ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT Hướng dẫn thực hiện theo tuần Mục tiêu Nội dung thực hiện được viết trên cơ sở 5 tuần thực hiện Tuần 7 TH: 18/04/2016 Tuần 8 TH: 25/04/2016 Tuần 9 TH: 02/05/2016 Tuần 10 TH: 09/05/2016 Tuần 11 TH: 16/05/2016 Tuần 12 TH: 23/05/2016 Giới thiệu đề tài và các u cầu Lên kế hoạch cho dự án Tìm hiểu một qui trình và các cơng cụ sẽ sử dụng Tiến hành thử nghiệm quy trình Mơ tả quy trình Tiến hành thử nghiệm quy trình Mơ tả quy trình Hồn chỉnh sản phẩm, slide & báo cáo Báo cáo đồ án 2 vào giờ lí thuyết Nhóm (đứng đầu là trưởng nhóm với vai trò Scrum Master) báo cáo hàng tuần cho Giảng viên hướng dẫn thực hành (vai trò Product Owner) trong giờ thực hành hàng tuần Kết quả thảo luận nhóm cần được ghi lại trong meeting minutes Các cơng cụ gợi ý A Các cơng cụ xử lý hình ảnh ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT a IrfanView b MS Paint B Các công cụ nhận dạng ảnh c VietOCR A Java/.NET GUI frontend for Tesseract OCR engine Supports optical character recognition for Vietnamese and other languages supported by Tesseract VietOCR is released and distributed under the Apache License, v2.0 http://vietocr.sourceforge.net/ d Other OCR tools tool OCR tham khảo Sinh viên khuyến khích sử dụng so sánh kết tool khác Đa phần tool cho phép dùng thử Sinh viên cần submit thông tin để download trial http://en.wikipedia.org/wiki/List_of_optical_character_recognition_software C Các công cụ xử lý phim e Window Movie Maker Window Live Movie Maker - có sẵn máy Windows f Adobe Premiere Adobe Premiere Pro is a timeline-based video editing software application It is part of the Adobe Creative Suite, a suite of graphic design, video editing and web http://www.adobe.com/cfusion/tdrc/index.cfm?product=premiere_elements&loc=us g Other video_editing_softwares Các tool tham khảo Sinh viên khuyến khích sử dụng so sánh độ tiện dụng hiệu tool khác Một số tool miễn phí, số trial Sinh viên cần submit thông tin để download trial http://en.wikipedia.org/wiki/Comparison_of_video_editing_software ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT h Adobe After Effects, tool Roto Brush Adobe After Effects is a digital motion graphics and compositing software package published by Adobe Systems, used in the post-production process of filmmaking and television production Its main uses are the origination of 2D and 2.5D animation, visual effects compositing and finishing (image adjustment, color correction etc.) After Effects can also be used as a basic non-linear editor and a media transcoder http://www.adobe.com/cfusion/tdrc/index.cfm?product=after_effects i Một số tool tham khảo khác http://en.wikipedia.org/wiki/Adobe_After_Effects#Comparable_products D j Các công cụ xử lý âm thanh Jet Audio JetAudio là một trong những trình nghe nhạc vào loại bậc nhất hiện nay, có khả năng chơi hầu hết các định dạng phổ biến và các định dạng khác, JetAudio còn có riêng một bộ Equalizer của riêng mình làm tăng chất lượng âm thanh khi chơi bằng JetAudio k Audacity Audacity® là một phần mềm nguồn mở, tự do cho việc ghi âm và chỉnh sửa âm Rất nhỏ gọn và nhanh http://audacity.sourceforge.net/ http://vi.wikipedia.org/wiki/Audacity http://www.youtube.com/watch?v=3TyF_vukSVY http://www.youtube.com/watch?v=5rQr5YVNqI0 l MKVToolNix MKVToolnix cho phép lấy phần audio của bộ phim chất lượng kém hơn ghép qua phim chất lượng cao của bạn Tất cả các yêu cầu trên có thể thực hiện dể dàng với MKVToolnix Dù tên là MKVToolnix nhưng ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin 10 Nhập mơn Cơng nghệ thơng tin 2 Đồ án hướng KHMT-CNTT-TGMT MKVToolnix hỗ trợ hầu hết các định dạng video, audio và sub hiện có, hơn nữa, đây là cơng cụ miễn phí 100% http://www.bunkus.org/videotools/mkvtoolnix/downloads.html#windows http://forum.taiphanmem.org/index.php?topic=605.0 m Video Edit magic Khi bạn có nhiều đoạn phim và muốn nối lại với nhau bằng các hiệu ứng độc đáo hay chèn chữ giới thiệu, Video Edit Magic là một cơng cụ hữu ích Phần mềm này chỉ có 12,8 MB nên khơng u cầu máy tính cấu hình cao Ngồi ra, Video Edit Magic còn có thể chụp hình từ webcam và chèn ln vào đoạn phim đang chỉnh sửa Bản dùng thử 30 ngày sẽ chèn đoạn chữ quảng cáo vào sản phẩm cuối cùng Phần hướng dẫn được thực hiện dưới dạng flash giúp người dùng dễ dàng theo dõi http://www.download.com.vn/audio+video/video+editor+studio/5020_video-edit-magic.aspx n Audio To Video Mixer Công cụ “Audio to Video Mixer” sẽ giúp bạn thực hiện việc lồng âm thanh vào video số chỉ bằng một vài cú click chuột http://www.download.com.vn/timkiem/Audio+to+Video+Mixer/index.aspx http://diendan.yeulaptop.com/phan-mem-long-am-thanh-vao-video-audio-video-mixer-3-0-7-a- 15524.html E Các cơng cụ xử lý ngơn ngữ tự nhiên o VLSP Hệ thống trình diễn một số sản phẩm của nhánh đề tài "Xử lí văn bản" là một phần của đề tài KC01.01/0610 "Nghiên cứu phát triển một số sản phẩm thiết yếu về xử lí tiếng nói và văn bản tiếng Việt" (VLSP) Hệ thống tích hợp sản phẩm do Nguyễn Việt Cường và Nguyễn Lê Minh (JAIST) phát triển Các cơng cụ xử lí tiếng Việt nhóm thực cung cấp Hệ thống tích hợp sử dụng công cụ mã nguồn mở: PHP, ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin 11 Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT MySQL, Smarty, Snoopy, WZToolTip, Mudim, Zapatec http://vlsp.vietlp.org:8080/demo/ p Stanford NLP The Stanford NLP Group makes parts of our Natural Language Processing software available to everyone These are statistical NLP toolkits for various major computational linguistics problems They can be incorporated into applications with human language technology needs http://nlp.stanford.edu:8080/parser/ F Các cơng cụ mã hóa và ẩn dữ liệu q as3crypto Cryptography library for ActionScript 3, including partial TLS 1.0 support http://crypto.hurlant.com/demo/ r Javascript implementation of DES http://www.tero.co.uk/des/test.php s AspEncrypt Demo 2: Text Encryption/Decryption http://support.persits.com/encrypt/demo_text.asp t Secret Key Encryption Demo http://www.codeproject.com/Articles/28112/Secret-Key-Encryption-Demo u RSA Demo Applet http://cisnet.baruch.cuny.edu/holowczak/classes/9444/rsademo/ v MSU StegoVideo Unique tool for hiding information in video (VirtualDub filter/standalone executable) MSU Graphics & Media Lab (Video Group) MSU StegoVideo allows hiding any file in a video sequence ĐH Khoa học Tự nhiên TP HCM | Khoa Công nghệ Thông tin 12 Nhập môn Công nghệ thông tin 2 Đồ án hướng KHMT-CNTT-TGMT Different popular codecs were analyzed and an algorithm, providing the smallest data loss after compression, was chosen Convolutional codes with Viterbi decoding are used to correct occurred errors http://compression.ru/video/stego_video/index_en.html Ngồi ra, cũng có thể sử dụng (thêm) các phần mềm hợp pháp khác phù hợp với cơng việc ĐH Khoa học Tự nhiên TP HCM | Khoa Cơng nghệ Thơng tin 13