Trò chơi đa phương tiện và mô phỏng có thể được sử dụng trong một môi trường vật lý với các hiệu ứng đặc biệt, với nhiều người dùng trong một mạng lưới trực tuyến, hoặc tại địa phương vớ
Trang 1Công nghệ đa phương tiện Bài tập lớn
TRƯNG ĐI HC M ĐA CHT
KHOA CÔNG NGHỆ THÔNG TIN
- -
BÀI TẬP LỚN MÔN: CÔNG NGHỆ ĐA PHƯƠNG TIỆN
Mã học phần: 7080209
ĐỀ TÀI : Làm lyric nhạc và tìm hiểu về thuật toán haar cascade classifier
Trang 2Công nghệ đa phương tiện Bài tập lớn
MỤC LỤC
Lời nói đầu 2
Chương 1: ỨNG DỤNG MULTIMEDIA TO LYRIC NHC 3
I.GIỚI THIỆU VỀ PHẦN MỀM CAMTASIA 9 3
1.Các tính năng của phần mềm Camtasia 9 4
a.Quay phim màn hình máy tính 4
b.Các tính năng ghi hình thông minh 4
c.Chỉnh sửa dễ dàng 4
d.Chia sẻ thuận tiện 4
2.Yêu cầu hệ thống tối thiểu 4
II.Cách tạo lyric nhạc 5
Chương II: GIỚI THIỆU VỀ THUẬT TOÁN HAAR CASCADE CLASSIFIER 1.Lịch sử 2 HAAR CASCADE CLASSIFIER là gì?
3 Ý tưởng chín
4 Các bước nhận diện khuôn mặt
5.Ví dụ về thuật toán 17
Kết luận 18
Trang 3Công nghệ đa phương tiện Bài tập lớn
Lời nói đầu
Ngày nay, truyền thông đa phương tiện được sử dụng rất rộng rãi trong cuộc sống hiện đại, được sử dụng ở hầu hết tất cả lĩnh vực đời sống thường nhật đến môi trường làm việc học tập và trong các hoạt động giải trí Báo mạng, các tin tức trên Facebook, Twitter, các TVC, teaser, trailer,… chúng đều được gọi là những sản phẩm truyền thông đa phương tiện
Bài thuyết trình đa phương tiện có thể được xem bởi người trên sân khấu, dự kiến, truyền đi, hoặc đóng tại địa phương với một máy nghe nhạc phương tiện truyền thông Chương trình phát sóng có thể là một bài trình bày đa phương tiện trực tiếp hoặc ghi Chương trình phát sóng và các bản ghi âm có thể là tương tự hoặc kỹ thuật số phương tiện truyền thông công nghệ điện tử Đa phương tiện trực tuyến kỹ thuật số có thể được tải về hoặc xem trực tiếp Dòng đa phương tiện có thể trực tiếp hoặc theo yêu cầu
Trò chơi đa phương tiện và mô phỏng có thể được sử dụng trong một môi trường vật lý với các hiệu ứng đặc biệt, với nhiều người dùng trong một mạng lưới trực tuyến, hoặc tại địa phương với một máy tính ẩn, hệ thống trò chơi, hoặc mô phỏng
Các định dạng đa phương tiện khác nhau của công nghệ hoặc kỹ thuật số có thể được dùng để nâng cao kinh nghiệm của người sử dụng, ví dụ để làm cho nó dễ dàng hơn và nhanh hơn để truyền đạt thông tin Hoặc trong làng giải trí, nghệ thuật, để vượt qua kinh nghiệm hàng ngày
Trang 4Công nghệ đa phương tiện Bài tập lớn
Mức độ nâng cao của các tương tác có thể được thực hiện bằng cách kết hợp nhiều hình thức nội dung phương tiện truyền thông Đa phương tiện trực tuyến đang ngày càng trở thành đối tượng theo định hướng và điều khiển dữ liệu, cho phép các ứng dụng với hợp tác đổi mới của người dùng cuối và cá nhân trên nhiều hình thức nội dung theo thời gian Ví dụ về các phạm vi từ nhiều hình thức nội dung trên các trang web như phòng trưng bày ảnh với cả hai hình ảnh (hình ảnh) và tiêu đề (văn bản) với người sử dụng cập nhật, để mô phỏng mà đồng Hệ số, sự kiện, hình ảnh minh họa, hình ảnh động hoặc video được sửa đổi được, cho phép
đa phương tiện "kinh nghiệm" để được thay đổi mà không cần lập trình lại Ngoài nhìn thấy và nghe, công nghệ Haptic cho phép các đối tượng ảo để được cảm nhận Công nghệ đang nổi lên liên quan đến ảo tưởng về hương vị và mùi cũng có thể nâng cao kinh nghiệm đa phương tiện
Qua tìm hiểu nhóm chúng mình đã ứng dụng các cộng cụ phần mềm và làm
ra sản phầm multimedia thông qua lyric nhạc Bên cạnh đó, chúng mình cũng tìm hiểu sơ qua về thuật toán được sử dụng hầu hết ở các sản phầm multimedia khác
đó là thuật toán thuật toán haar cascade classifier Mong được sự góp ý từ mọi người để sản phầm của chúng mình hoàn thiện hơn!!!
Chương 1: ỨNG DỤNG MULTIMEDIA TẠO LYRIC NHẠC
I.GIỚI THIỆU VỀ PHẦN MỀM CAMTASIA 9
Camtasia 9 là một trong những lựa chọn hàng đầu trong thị trường phần mềm với khả năng quay video màn hình máy tính với chất lượng và hình ảnh cao Bên cạnh đó, phần mềm cũng cung cấp các tính năng chỉnh sửa phong phú như thay đổi góc chiếu, thêm ảnh, âm thanh, tốc độ khung hình tùy chỉnh
Với các tính năng ưu việt được cộng đồng người dùng cực kỳ yêu thích, Camtasia Studio hiện đã phát triển nhiều phiên bản Trong số đó, phiên bản 9 này mang đến nhiều tính năng sáng tạo, hấp dẫn người dùng
Ứng dụng Camtasia 9 được phân loại theo hai tính năng chính bao gồm quay phim màn hình và chụp ảnh màn hình Trong đó, tính năng quay phim ghi lại mọi hoạt động diễn ra trên màn hình máy tính và xuất sang tập tin video, còn tính năng chụp ảnh màn hình hỗ trợ người dùng chụp ảnh nhanh (snapshot) toàn bộ hay một phần màn hình và tạo tập tin hình ảnh
1.Các tính năng của phần mềm Camtasia 9
a.Quay phim màn hình máy tính
TechSmith Camtasia Studio hỗ trợ người dùng ghi lại màn hình Video dưới dạng một đoạn phim, đoạn thuyết trình, bài huấn luyện, minh họa, các khóa học trực tuyến … Download Camtasia Studio để sử dụng, người dùng có thể theo dõi lại một thông điệp tiếp thị, bản ghi màn hình, bài giảng, hoặc video đào tạo trực
Trang 5Công nghệ đa phương tiện Bài tập lớn
tiếp… từ bất cứ nơi nào và lúc nào đảm bảo không bỏ sót một nội dung quan trọng nào Các Video trích xuất có chất lượng hình ảnh mượt mà, âm thanh rõ nét
b.Các tính năng ghi hình thông minh
Công cụ Camtasia SmartFocus được tích hợp giúp ghi lại tất cả những hành động đã xảy ra trong suốt quá trình quay phim và phát lại dưới dạng những hình ảnh sắc nét, rõ ràng ở bất kỳ kích cỡ nào
c.Chỉnh sửa dễ dàng
TechSmith Camtasia Studio sẽ giúp bạn chỉnh sửa nhiều thông số đầu ra cho Video như tăng giảm âm lượng, độ phân giải, chọn kích thước khung hình, kênh
âm thanh… và áp dụng các hiệu ứng như tăng/giảm tỷ lệ hình ảnh, trong suốt/làm
mờ, bóng đổ, màu sắc, khung viền… để video sống động và thú vị hơn Với cửa sổ chỉnh sửa trực quan, bạn sẽ tiết kiệm được nhiều thời gian khi biên tập lại các Video Ngoài ra, bạn cũng được thêm các đoạn văn bản ghi cho và hiển thị chúng ở bất kỳ thời gian tùy chọn nào
d.Chia sẻ thuận tiện
Các video trích xuất dưới các định dạng Flash, QuickTime… để bạn chia sẻ trên Web, CD hoặc DVD thuận lợi hơn Phần mềm tương thích với chương trình Production Wizard để hỗ trợ trong việc lựa chọn các thiết lập và định dạng tốt nhất cho các video Người dùng cũng có thể lựa chọn các điều khiển bộ giải mã hình ảnh và âm thanh cũng như chất lượng, tốc độ hiển thị, độ sâu màu, thêm hoặc loại
bỏ các hiệu ứng đặc biệt
2.Yêu cầu hệ thống tối thiểu
Bộ xử lý: lõi kép
Dung lượng RAM: 2 GB
Dung lượng ổ cứng: 2 GB
Độ phân giải màn hình: 1024×768
Card âm thanh tương thích với Windows
Microsoft NET 4.0
Microsoft DirectX 9.0 hoặc sau đó
II.Cách tạo lyric nhạc
- Khi mở camtasia 9, chúng ta sẽ được một màn hình giao diện (hình 1) bao
gồm:
+ 1: màn hình hiển thị ảnh và video
+ 2: thanh time line để đưa ảnh, video và audio của mình xuống
Trang 6Công nghệ đa phương tiện Bài tập lớn
+ 3: đây là thanh công cụ gồm có 2 mũi tên là quay lại hành động, hình cái kéo là cắt bỏ đi phần thừa trong time line, hình 2 tờ giấy là copy và paste, tiếp theo là spint tách đôi video cuối cùng là thanh kéo dài video
+ 4: tiếp là phần thêm và chỉnh sửa ảnh,video bao gồm:
record là quay video màn hình
media để chọn hình ảnh, video hoặc audio
library là các video,icon mẫu của nhà sản xuất đề xuất
Annotations là chèn text, biểu tượng chỉ dẫn mô phỏng, làm phong phú cho video
transitons là hiệu ứng chuyển cảnh giữa hai hình ảnh,xuất hiện hoặc biến mất ấn tượng
behaviors là thêm hiệu ứng cho text để text chuyển động, xuất hiện hoặc biến mất ấn tượng hơn
animations là thêm hiệu ứng chữ chuyển động chữ,zoom vào ra
cursor effects là hiệu ứng cho chuột, làm nổi bật chuột khi di chuyển
voice narration là phần thu âm
audion effects là hiệu ứng cho âm thanh
visual effects tạo khung hoặc thay đổi màu video
- Thực hiện là video:
+ Đầu tiên ta click vào import media chọn ảnh, video và audio bài hát
1
2 3
4
Hình 1
Trang 7Công nghệ đa phương tiện Bài tập lớn
+ Sau đó, nếu thấy ảnh quá ngắn so với file audio thì mình sẽ click và ảnh để copy thêm cho vừa đủ với thanh track audio
+ Sau khi chỉnh sửa xong mình click vào Annotations để chọn các kiểu text (chọn text chữ không có biểu tượng rồi kéo thả ra màn hình trình chiếu ảnh) như hình dưới
Trang 8Công nghệ đa phương tiện Bài tập lớn
+ Tiếp theo ta chọn font chữ, cỡ chữ và màu chữ cho phù hợp (chọn font chữ impact) như hình dưới
Trang 9Công nghệ đa phương tiện Bài tập lớn
+ Sau đó click chọn Behavios để chọn hiệu ứng cho chữ thêm đẹp và sinh động hơn
Trang 10Công nghệ đa phương tiện Bài tập lớn
+ Tiếp theo ta chọn hiệu ứng fade (phai màu) sau đó kéo xuống 2 thanh track 3,4
để text hiện ra không bị quá thô
+Sau đó click quay lại Annotation chọn phần text để thêm lời bài hát
Trang 11Công nghệ đa phương tiện Bài tập lớn
+ Căn chỉnh thanh text phù hợp với video và căn chỉnh thời gian text chuyển lời bài hát (dùng size chữ 19, font chữ calibary)
+ Tiếp theo, tiếp tục thêm text để hoàn thành hết lời bài hát cho video
+ Sau đó, ta quay lại Behavior để chọn kiểu xuất hiện cho phần text của mình
Trang 12Công nghệ đa phương tiện Bài tập lớn
+ Ở đây, chúng ta dùng hiệu ứng driffting (trôi dạt) để thêm vào 4 ô text đầu tiên (khi xuất hiện để tốc độ 79% còn offset tốc độ là 0.05s, phần During và out giữ nguyên)
+ Sau đó 14 ô text còn lại ta thêm hiệu ứng Scale
Trang 13Công nghệ đa phương tiện Bài tập lớn
+ Ở phần Scale này chỉnh cài đặt hiệu ứng in với Tension là 5, offset là 0.03s để phù hợp với thời gian chiếu Ở phần During và out ta vẫn giữ nguyên cài đặt
+ Sau đó, ta quay lại media vào file chọn 1 bức ảnh làm background rồi vào Anntotions thêm dòng text Thank you for whatching
Trang 14Công nghệ đa phương tiện Bài tập lớn
+ Cuối cùng ta chọn Transitions (hiệu ứng chuyển cảnh) chọn hiệu ứng circle stretch (căng tròn) để video sinh động hơn
+ Sau khi đã hoàn thành xong ta bắt đầu lưu lại Đầu tiên click vào share chọn local file và chọn lưu ở chế độ HD 1080p cho video của mình được net nhất có thể Tiếp đó, ta đặt tên file và chọn nơi lưu phù hợp, click finish Như vậy là đã hoàn thành xong bước lưu video
Trang 15Công nghệ đa phương tiện Bài tập lớn
CHƯƠNG 2 : TÌM HIỂU VỀ THUẬT TOÁN HAAR CASCADE
CLASSIFIER
I.Lịch sử
Thuật toán Haar Cascade Classifier được giới thiệu bởi Paul Viola và Michael Jones trong bài báo "Rapid Object Detection using a Boosted Cascade of Simple Features" vào năm 2001 Ý tưởng ban đầu của họ là áp dụng một kỹ thuật phân lớp được biết đến là AdaBoost để nhận diện đối tượng nhanh chóng và hiệu quả
Các Bước Quan Trọng Trong Lịch Sử của Haar Cascade Classifier:
1 Nền tảng ý tưởng: Viola và Jones đã nhận thấy rằng sử dụng các đặc trưng đơn
giản (đặc trưng Haar) để mô tả sự khác biệt giữa các vùng sáng và tối trong hình ảnh có thể giúp nhận diện đối tượng một cách hiệu quả
2 Cải tiến AdaBoost: Họ áp dụng thuật toán AdaBoost, một phương pháp học
máy để xây dựng một bộ phân loại mạnh từ các bộ phân loại yếu AdaBoost giúp tạo ra một chuỗi các bộ phân loại yếu từ các đặc trưng Haar và kết hợp chúng để tạo thành một bộ phân loại mạnh
3 Cấu trúc Cascade: Để tăng tốc độ xử lý, họ đề xuất cấu trúc Cascade Classifier,
trong đó mỗi giai đoạn có thể chứa nhiều bộ phân loại Các bộ phân loại ở giai đoạn đầu tiên được thiết kế để loại bỏ nhanh chóng các vùng không phải đối tượng quan trọng
4 Ứng dụng Ban Đầu: Công nghệ Haar Cascade Classifier ban đầu được sử dụng
chủ yếu trong việc nhận diện khuôn mặt trong hình ảnh và video
5 Phát triển và Cải Tiến: Kỹ thuật Haar Cascade đã trở thành một trong những
công cụ quan trọng trong lĩnh vực thị giác máy tính Nó đã trải qua nhiều cải tiến, bao gồm việc tối ưu hóa và tăng khả năng nhận diện các đối tượng khác nhau ngoài khuôn mặt
6 Sự Lớn Mạnh: Phương pháp Haar Cascade Classifier đã mở ra một lĩnh vực
mới trong việc nhận diện đối tượng, giúp cung cấp nền tảng cho nhiều ứng dụng thực tế trong công nghiệp, an ninh, và nhận diện vật thể
Trang 16Công nghệ đa phương tiện Bài tập lớn
Haar Cascade Classifier không chỉ đánh dấu bước tiến quan trọng trong lịch sử của thị giác máy tính mà còn tiếp tục là một trong những công cụ phổ biến và quan trọng trong việc nhận diện đối tượng
II Haar Cascade Classififier là gì?
Haar Cascade là một thuật toán được tạo ra dựa trên những tính năng đó để phát hiện đối tượng (có thể là khuôn mặt, mắt, tay, đồ vật,…) được đề xuất vào năm
2001 bởi Paul Viola và Michael Jones trong bài báo của họ với khẳng định “Phát hiện đối tượng một cách nhanh chóng bằng cách sử dụng tầng (Cascade) tăng cường các tính năng đơn giản”
Triển khai ban đầu được sử dụng để phát hiện khuôn mặt chính diện và các đặc điểm như Mắt, Mũi và Miệng Tuy nhiên, có nhiều đặc trưng Haar được đào tạo trước đó trong GitHub của họ cho các đối tượng khác cũng như cho toàn bộ cơ thể, thân trên, thân dưới, nụ cười và nhiều đồ vật khác
III Các bước nhận dạng khuôn mặt
B1: Cài đặt thư viện opencv-python
B2:Sử dụng hàm imread để đọc file ảnh
B3:Gọi hàm Cascade và truyền file vào
B4: Tạo khoanh vùng để nhận diện mặt
B5: Show bức ảnh ra màn hình và kết thúc
Trang 17Công nghệ đa phương tiện Bài tập lớn
IV Ví dụ
B1: Cài đặt thư viện opencv-python + B2:Sử dụng hàm imread để đọc file ảnh
import cv2
img = cv2.imread('dataimg/istockphoto-489776304-612x612.jpg')
B3:Gọi hàm Cascade và truyền file vào
people_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml') people_img= cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
people =people_cascade.detectMultiScale(people_img)
B4: Tạo khoanh vùng để nhận diện mặt
for(x,y,w,h) in people:
img = cv2.rectangle(img, (x,y),(x+w, y+h),(0 255 0 3, , ), )
cv2.putText(img, ,(x,y), cv2.FONT_HERSHEY_SIMPLEX,'lê' 2 255 255 255,( , , ))
B5: Show bức ảnh ra màn hình và kết thúc
cv2.imshow( ,img)'lê'
cv2.waitKey( )0
cv2.destroyAllWindows()
Kết quả của thuật toán
Trang 18Công nghệ đa phương tiện Bài tập lớn
KẾT LUẬN
Thuật toán Haar Cascade Classifier là một công cụ quan trọng trong lĩnh vực nhận diện đối tượng Mặc dù có nhược điểm nhất định, nhưng nó vẫn đóng góp quan trọng trong việc phát triển các thuật toán nhận diện đối tượng hiệu quả và vẫn tiếp tục được nghiên cứu và cải tiến để đáp ứng nhu cầu ngày càng cao của xã hội hiện đại
Trang 19Công nghệ đa phương tiện Bài tập lớn