Với khả năng kết hợp hình ảnh, âm thanh, video và văn bản, kỹ thuật đa phương tiện mang lại nhiều lợi ích vượt trội trong việc trình bày, phân tích và minh họa dữ liệu khoa học.. Giới th
Trang 1
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI
KHOA ĐIỆN - ĐIỆN TỬ
Sinh viên thực hiện:
Trần Trung Hiếu Lép: KTVT - Kó2 Khoa: Điện — Điện tử
H6 Minh Hoang Lớp: KTVT-Kó62 Khoa: Điện - Điện tử
Dang Việt Hoàng Lớp: KTVT - Kó2 Khoa: Điện - Điện tử Đường Văn Hoàng Lớp: KTVT - K62 Khoa: Điện - Điện tử
Nguyễn Duy Hoàn Lớp: KTVT - K62 Khoa: Điện - Điện tử
Trang 2CHUONG 2 CAU TRÚC HỆ THĨNG VÀ KỸ THUẬT XỬ LÝ 10
2.1 Hệ thống xử lý âm thanh trong khoa học và cơng nghỆ 5-5 5s2sc5e2 10
2.5.2 Các bước xử lý AnImafIOH 2 201020122011 121111211 1111111111115 51111 k cay 36
CHUONG 3 KY THUAT BERT TRONG KHOA HOC VA CONG NGHE 38
ENNCiv8iiLušẽiadadadaaiaaiiiẳáiaaảaậaià 38
3.2 Các dự án liên quan 0 2221211121 12112 1112110111511 1 1921111111115 11 111111 k tra 40 3.2.1 Mơ hinh phân tích ý tưởng đa phương thức - ¿22 2 22212222 sssxses 40
3.2.2 Cải tiến mơ hình tối ưu hĩa dựa trên BERT -:-©222cc222zvcrzrezre 41
3.3 Cau tric BERT kênh cơng và tự chủ đầu phan CAp ccccccccccescseesesereeeeeees 41
3.3.1 Tự chủ nhiều đầu theo mơ hình phân cấp -2- 2222 SE22E2 E22 xze 42
Trang 33.3.3 Phương pháp hợp nhất TensOr - 2 S2 2 SE 1E EE5112721127111115121121 1 6
3.4 Phân tích kết quả thực nghiệm
3.4.1 Môi trường thử nghiệm và tập dữ liệu - c2 2221222221222 22x xe 3.4.2 Đường cơ sSở
3.4.3 Phân tích kết quả
3.4.4 Nguyên lý hoạt động
3.4.5 Hiệu quả của giải thích đa phương tiện - 2 2 22 2222222222212 zzxcses
3.5 Phân tích kết quả thực nghiệm
3.5.1 Nhiệm vụ ưu tiên cao
3.5.2 Nhiệm vụ có mức độ ưu tiên thấp ¬ 3.5.3 Điều chỉnh cho các tác vụ ƯU tIÊH G2 HH1 T 121111 1k kế 3.5.4 Loại bỏ tác vụ không dùng đến ST 222 HE HH He 3.6 Ứng dụng của kỹ thuật BERT trong thực An
3.6.1 Sự chiếm dụng và giới hạn theo thời p1an thực -: +2: c2 222cc ccss2
3.6.2 Mối liên hệ giữa BERT và
3.6.3 Tổng quát hóa các ưu tiên
00 cee eect cree cnneceee cee ee terete
3.6.4 Sự nhạy bén với những dự đoán chính xác 5c 2 222222 cs>s
3.6.5 BERT trong các hệ thông
Trang 4
Hình 3.1 Các thuộc tính của thông tin 39 Hình 3.2 BERT (trải) và mô hình HG-BERT (phải) 42 Hình 3.3 Cấu trúc cơ chế tự chú ý nhiều đầu phân cấp Sử dụng số lượng đầu khác nhau ở các lớp khác nhau để xử |ÿ các tinh nang 43 Hình 3.4 Cấu trúc của kênh công 44 Hình 3.5 Quá trình hợp nhất mô hình của văn bản và âm thanÌ - 45 Hình 3.6 Bảng 2: Kết quả thực nghiệm của các mô hình khác nhau trên bộ dữ liệu
CMU-MOST 47
Hình 3.7 Bảng 3: Nghiên cứu cắt bó HG-BERT 48
Hình 3.8 Bảng 4: Kết quả phân phối đầu trong cơ chế tự chủ ý nhiều đầu phân cấp
49
Hình 3.9 Thuật toán lập lich BERT 51 Hình 3.10 CPU được sử dụng bởi túc vit thot Qian Ht cossssssssseesssssssvensssssnssvsssssens 54
Trang 5Trong kỷ nguyên số hóa hiện nay, kỹ thuật đa phương tiện (multimedia) đã trở thành một trong những công cụ quan trọng, đóng vai trò không thê thiếu trong việc truyền tải
và xử lý thông tin một cách hiệu quả Không chỉ giới hạn ở lĩnh vực giải trí, các ứng dụng của kỹ thuật đa phương tiện ngày càng phát triển và mở rộng vào các lĩnh vực khoa học và công nghệ Với khả năng kết hợp hình ảnh, âm thanh, video và văn bản,
kỹ thuật đa phương tiện mang lại nhiều lợi ích vượt trội trong việc trình bày, phân tích
và minh họa dữ liệu khoa học
Trong lĩnh vực khoa học, kỹ thuật đa phương tiện không chỉ giúp truyền đạt những kiến thức phức tạp đến với công chúng một cách sinh động và dễ hiểu hơn, mà còn hỗ trợ các nhà nghiên cứu trong việc thu thập và xử lý đữ liệu Ứng dụng công nghệ này
đã thúc đây sự phát triển mạnh mẽ của các mô hình trực quan hóa dữ liệu và các phương pháp mô phỏng, giúp nâng cao độ chính xác trong nghiên cứu khoa học Đối với lĩnh vực công nghệ, đa phương tiện được ứng dụng để cải tiến quá trình thiết kế sản phẩm, phát triển các hệ thông thông tin tương tác và hỗ trợ đảo tạo kỹ thuật từ xa
Bài báo cáo này nhằm phân tích các ứng dụng của kỹ thuật đa phương tiện trong khoa học và công nghệ, đồng thời làm rõ những lợi ích cũng như thách thức trong việc ứng dụng công nghệ này Qua đó, chúng tôi mong muốn mang đến cái nhìn toàn diện về vai trò của kỹ thuật đa phương tiện trong việc thúc đây sự tiến bộ và đổi mới trong các
lĩnh vực trên
Trang 61.1 Giới thiệu về kỹ thuật đa phương tiện
Đa phương tiện là lĩnh vực liên quan đến sự tích hợp được điều khiến bằng máy tính của văn bản, đồ họa, bản vẽ, hình ảnh tĩnh và động (Video), hoạt hình, âm thanh và bắt
kỳ phương tiện nào khác, trong đó mọi loại thông tin đều có thể được biểu thị, lưu trữ, truyền đạt và xử lý kỹ thuật số Đa phương tiện có thể được ghi lai va phát, hién thi, tương tác hoặc truy cập bằng các thiết bị xử lý thông tin thỏa mãn, chắng hạn như các thiết bị công nghệ cao và tự động, nhưng cũng có thê là một phần của bản trình bảy trực tiếp Các thiết bị đa phương tiện là các chiến lược phương tiện điện tử được sử dụng để lưu trữ và liên quan đến nội dung đa phương tiện Đa phương tiện đáng chú ý
từ các phương tiện đa dạng trong mỹ thuật; ví dụ, bằng cách chứa âm thanh, nó có phạm vi rộng hơn Trong những năm đầu của đa phương tiện, thuật ngữ "phương tiện phong phú" giống hệt với đa phương tiện cộng tác và "siêu phương tiện" là một ứng dụng của đa phương tiện Trong bài báo này, chúng tôi đã thảo luận về các yếu tố khác nhau của đa phương tiện cùng với các ứng dụng, tính năng, ưu điểm và nhược điểm CỦA HÓ, V.V
1.2 Tầm quan trọng của kỹ thuật đa phương tiện trong khoa học và công nghệ
Trong thời đại kỹ thuật số, đa phương tiện đã trở thành thành phần không thể thiếu trong nhiều lĩnh vực, đặc biệt là khoa học và công nghệ Đa phương tiện đã phát triển
một phần không thê tránh khỏi của bất kỳ buổi biêu diễn nào Nó đã tạo ra sự đa dạng
của các bài thuyết trình ngay từ giải trí đến giáo dục Sự phát triển của internet cũng đã
mở rộng nhu cầu về nội dung đa phương tiện Đa phương tiện là phương tiện sử dụng nhiều hình thức thông tin được chứa và xử lý thông tin (ví dụ: văn bản, âm thanh, dé họa, hoạt hình và tương tác video) để thông báo hoặc giải trí cho người dùng Đa phương tiện cũng đề cập đến việc sử dụng phương tiện điện tử để lưu trữ và hiểu biết nội dung đa phương tiện Đa phương tiện giỗng với phương tiện truyền thống đa dạng trong mỹ thuật, nhưng có cơ hội rộng hơn Thuật ngữ "phương tiện phong phú" tương đương với đa phương tiện tương tác
Trang 71 Văn bản (Text):
e©_ Văn bản là thành phần cơ bản và dễ tiếp cận nhất trong các tài liệu đa phương tiện, giúp trình bảy các khái niệm, hướng dẫn và diễn giải thông tin chỉ tiết Trong khoa học và công nghệ, văn bản được sử dụng để cung cấp các công thức, thuật toán, mô tả đữ liệu và giải thích kết quả nghiên cứu
e _ Ví dụ: Các báo cáo nghiên cứu, bài giảng lý thuyết và các mô tả chỉ tiết trong mô phỏng khoa học
e© Ví dụ: Hình ảnh X-quang trong y học, sơ đồ cơ khí trone kỹ thuật, biểu
đề đữ liệu trong phân tích khoa học
3 Âm thanh (Audio):
e Âm thanh giúp tăng tính tương tác và hấp dẫn, đặc biệt là trong các bai giang hoac khóa học trực tuyến Âm thanh cũng có thể được sử dụng đề
mô phỏng hoặc cảnh báo trong các hệ thông điều khiến
¢ Vi du: Loi thuyét minh trong bài giảng, âm thanh báo động trong các hệ thông công nghiệp, mô phỏng âm thanh trong nghiên cứu âm học
4 Video:
® - Video minh họa các quá trình phức tạp và tạo trải nghiệm học tập sinh
động Video kết hợp hình ảnh, âm thanh và văn bản để cung cấp thông
tin toàn diện
e - Ví dụ: Video mô phỏng phẫu thuật trong y học, hướng dẫn kỹ thuật cho các thiết bị khoa học, bài giang trực tuyến
Trang 8® VR và AR giúp người dùng trải nghiệm môi trường ảo hoặc tăng cường
thông tin thực Công cụ tiên tiến giup hoc tap, thử nghiệm và đảo tạo chân thực
e© Ví dụ: Thực tế ảo trong phẫu thuật, AR trong sửa chữa thiết bị công nghiệp, đào tạo
Sự kết hợp của các thành phần này giúp tối ưu hóa khả năng truyền tải và phân tích thông tin trone khoa học và công nghệ, hỗ trợ học tập, nghiên cứu và phát triển công nghệ Các công nghệ mới như trí tuệ nhân tạo, thực tế ảo và thực tế tăng cường giúp đa phương tiện ngày càng được ứng dụng rộng rãi, mang lại trải nghiệm học tập vả nghiên cứu phong phú
1.3 Ưu và nhược điểm của kỹ thuật đa phương tiện
UU DIEM
Sang tao: no mang lai strc song hơn cho các cuộc thảo luận
Đa dạng: nơi đây phục vụ cho mọi đối tượng người học
Tiết kiệm chi phí: đa phương tiện phần lớn chỉ cần mua một lần thiết bị và phần mềm, sau đó có thê sử dụng không giới hạn số lần
Sự đánh giá: nó cung cấp các công cụ đánh giá học tập lý tưởng và cũng mang tính giải trí cho học sinh
Cách tiếp cận thực tế: nó cung cấp những phương pháp giúp việc học trở nên thực tế hơn
Hỗ trợ đa dạng: có nhiều định dạng phương tiện truyền thông có thể sử dụng, với nhiều kiểu máy khác nhau có khả năng tạo nội dung đa phương tiện
Xu hướng: xu hướng văn hóa hiện nay đang thiên về công nghệ và rất nhiều tài nguyên được cung cấp cho các định đạng phương tiện truyền thông khác nhau
NHUOC DIEM CUA ĐA PHƯƠNG TIỆN
Trang 9một số vùng nông thôn hoặc không thé cd được một cách có hệ thống do thiếu hụt và
gián đoạn
Gây mắt tập trung: đa phương tiện có thé lam mất đi sự tập trung vào bài học đo định dang gay chu y cua no
Tốn kém trong sản xuất: sản xuất đa phương tiện tốn kém hơn các sản phẩm khác vì
nó được tạo thành từ nhiều phương tiện Sản xuất đa phương tiện đòi hỏi một thiết bị điện tử, có thê tương đối đắt tiền
Tốn thời gian: việc tạo nội dung đa phương tiện cần nhiều thời gian hon
Yéu cau thanh thao: da phương tiện đỏi hỏi phải thực hành liên tục và lau dai để thành thạo, điều này có thế tốn nhiều thời gian và công sức của người dùng
Hỗ trợ/Khả năng tương thích hạn chế: có rất nhiều mẫn thiết bị khác nhau gây ra sự không tương thích về định dạng phương tiện
Dễ hỏng: thiết bị dùng cho đa phương tiện phải được sử dụng cần thận; độ âm hoặc các yếu tố khác có thể gay ra thiệt hại tốn kém và phải mua lại thiết bị khác
Trang 102.1 Hệ thống xử lý âm thanh trong khoa học và công nghệ
2.1.1 Câu trúc hệ thống
Thiết bị đầu vào và đầu ra
Thiết bị đầu vào:
o Microphone: Thiết bị đầu vào âm thanh chính, biến đồi tín hiệu âm thanh (sóng âm) thành tín hiệu điện tử Microphone thường dùng trong các ứng dụng như phi âm, nhận diện giọng nói, cuộc gọi thoại, và truyền thông
trực tuyến
o_ Bàn Mixer hoặc Soundboard: Thiết bị trộn âm thanh chuyên dụng, nhận
âm từ nhiều nguồn, điều chỉnh âm lượng, tần số, và tạo hiệu ứng trước khi phát ra hoặc ghi lại Mixer thường dùng trong sản xuất âm nhạc và
phát sóng truyền hình
Thiết bị đầu ra:
o_ Loa: Chuyên đổi tín hiệu điện tử trở lại thành sóng âm để phát lại âm
thanh cho người nghe Loa thường được sử dụng trong các hệ thông âm
thanh gia đình, hội trường và sân khẩu
ø_ Tai nghe: Giống như loa nhưng cung cấp âm thanh cá nhân hóa, cho
phép người dùng nghe mà không gây nhiễu cho môi trường xung quanh
Tai nghe thường được sử dụng trong sản xuất âm nhạc, chơi game, và Cuộc øỌI trực tuyền
Chức năng của thiết bị đầu vào và dầu ra
Microphone: Nhận diện và thu sóng âm thanh tử môi trường, chuyên đổi tín hiệu âm thanh (sóng âm) thành tín hiệu điện tử Microphone có vai trò quan trọng trong các ứng dụng giao tiếp (đàm thoại, gọi video), nhận diện giọng nói
và các hệ thông ghi âm
Loa và Tai nghe: Chuyển đổi tín hiệu điện tử thành sóng âm để tạo ra âm thanh
mà người nghe có thể cảm nhận Các thiết bị này đảm bảo rằng âm thanh được phát lại trung thực và rõ ràng, øiữ nguyên bản chất của âm thanh gốc
Trang 11Khối Xử lý Tín hiệu
* B6 loc tan số:
o Loc thap (Low-pass filter): Loai bo các tần số cao không mong muốn,
giữ lại các tần số thấp dé giảm nhiễu va tao ra âm thanh mượt mà hơn
o Loc cao (High-pass filter): Gitr lai các tần số cao, loại bỏ tần số thấp đề loại bỏ tiếng ồn nền và tạo ra âm thanh trong trẻo hơn
o Loc bang théng (Band-pass filter): Chi git lai tan số trong một dải nhất định, loại bỏ các tần số ngoài dải này để cô lập hoặc làm nỗi bật một phần của tín hiệu
« _ Chỉnh âm lượng và khuếch đại:
o_ Bộ khuếch đại (Amplifer): Tăng cường tín hiệu âm thanh yếu đề đạt mức
âm lượng cần thiết mà vẫn giữ chất lượng
øo_ Bộ điâi chỉnh âm lượng (Volume control): Điều chỉnh độ lớn của tín hiệu đề phủ hợp với từng loại phát lại hoặc môi trường cụ thê
« _ Bộ điều chỉnh chất lượng âm thanh (Equalizer):
o_ Chỉnh sửa các dai tan số riêng lẻ để điều chỉnh chất lượng của âm thanh
dau ra Equalizer giúp tạo ra âm thanh hài hòa hơn bằng cách tăng cường
hoặc giảm bớt một số tần số nhất định
o Phan tan âm thanh duoc chia theo dai, vi du: 4m tram, 4m trung, va 4m bồng, giúp người dùng tùy chỉnh chất lượng âm thanh theo sở thích hoặc yêu cầu của môi trường phát
« - Giảm tiếng ồn và loại bỏ nhiễu:
ø_ Bộ lọc tiếng (Noise filter): Loại bỏ tiếng ồn nền không mong muốn bằng cách sử dụng thuật toán lọc và xử lý âm thanh
o_ Hủy nhiễu (Noise cancellation): Dùng công nghệ xử lý âm thanh số để loại bỏ các tiếng ồn nền như tiếng gió, tiếng ồn từ môi trường
Khôi mã hóa và nén tín hiệu (Encoding and Compression)
Trang 12Sau khi xử lý, tín hiệu âm thanh được mã hóa và nén để giảm dung lượng lưu trữ hoặc băng thông khi truyền tải Một số codec nén phô biến là:
« - MP3: Nén mất dữ liệu, giữ lại các phần quan trọng của âm thanh để tiết kiệm dune lượng
« - FLAC: Nén không mắt dữ liệu, giữ nguyên chất lượng âm thanh gốc
- - AAC: Định dạng nén có chất lượng cao, thường dùng trong các ứng dụng truyền phát trực tuyến
a) Khối giải mã và chuyển đối D/A (Decoding and Digital-to-Analog Converter - DAC)
« - Khi phát lại, tín hiệu âm thanh được giải mã từ định dạng nén và chuyên qua bộ chuyên đổi D/A để biến đổi tín hiệu số trở lại thành tín hiệu analog
« Tin higu analog nay được truyén đến các thiết bị đầu ra để tạo ra âm thanh mà người nghe có thé cam nhận được
Khối Lưu trữ Dữ liệu
- - Âm thanh được lưu trữ dưới dạng các tệp kỹ thuật số với nhiều định dạng khác nhau:
o MP3: Dinh dang nén giúp giảm dung lượng nhưng vẫn giữ được chất lượng âm thanh chấp nhận được Phù hợp cho các ứng dụng nghe nhạc, chia sẻ âm thanh trực tuyến
o WAV: Định dạng không nén, lưu trữ âm thanh với chất lượng cao WAV thường được dùng trong sản xuất âm nhạc và hậu kỳ âm thanh
o AAC, FLAC: Cac dinh dang âm thanh chất lượng cao hơn, giúp giảm dung lượng mà vẫn giữ được chất lượng âm thanh
2.1.2 Các bước xử lý âm thanh
Bước 1: Thu Nhận Âm Thanh
- Thiết bị thu 4m: Microphone la thiết bị thu nhận chính, có nhiệm vụ chuyển đôi sóng âm từ môi trường thành tín hiệu điện Microphone chứa các cảm biên
Trang 13áp suất hoặc cảm biến màng để dao động theo sóng âm thanh và tạo ra các tín hiệu điện tương ứng với tần số và biên độ của sóng âm
«Biến đối tín hiệu âm thanh: Tín hiệu điện từ microphone là dạng tín hiệu
analoe, phản ánh cường độ và tần số của âm thanh Để có thể xử lý trên hệ thông kỹ thuật số, tín hiệu này sẽ cần qua bước chuyên đổi từ analoe sang kỹ thuật số (A/D Conversion)
Bước 2: Khuếch Đại và Lọc Âm Thanh
-Ổ Khuéch đại tín hiệu: Sau khi được thu nhận, tín hiệu điện từ microphone thường rất yếu, vi vậy cần qua một bộ khuếch đại để nâng cường độ tín hiệu lên
một mức phù hợp với thiết bị xử lý
«ồ Lọc tần số: Để loại bỏ các tần số không mong muốn như tiếng ồn nền hoặc nhiều, tín hiệu âm thanh được lọc qua các bộ lọc tần số:
o_ Lọc thấp (Low-pass filter): Cho phép các tần số thấp đi qua và chặn các
tan số cao, thường dùng đề giảm tiếng ồn từ môi trường xung quanh
o Loc cao (High-pass filter): Cho phép tan sé cao di qua và loại bó tần số thap, giup giam tiéng 6n từ tiếng động cơ hoặc tiếng gid
o Loc bang théng (Band-pass filter); Chi cho phép mét dai tan sé nhat dinh, tap trung vao tần số của giọng nói hoặc nhạc cụ để làm rõ âm thanh
« - Điều chỉnh âm sắc (Equalization): Bộ điều chỉnh âm sắc điều chỉnh các dải tần số khác nhau, øiúp tăng cường các dải tần số mong muốn và loại bỏ các tần
số không cần thiết, cải thiện âm thanh tông thể và tăng tính trung thực
Bước 3: Xử Lý Tín Hiệu Âm Thanh
« Xw ly ky thuat số: Sau khi lọc, tín hiệu âm thanh được chuyền đổi thành tín hiệu số qua bộ chuyên đổi A/D Tín hiệu số nay ổi qua các thuật toán xử ly kỹ thuật số:
o_ Tăng cường tần số (Frequency Boostine): Một số dải tần số có thê được tăng cường, để làm rõ hoặc làm nổi bật âm thanh, chẳng hạn như các tần
sô của giong hat hoac nhạc cụ
Trang 14o_ Hiệu chỉnh t3 s& (Frequency Adjustment): Can bang cac dai tan dé giữ
âm thanh ở mức cân đối, tránh hiện tượng “âm thanh bị méo” do các tần
ø_ Echo (tiếng dội): Tạo cảm giác âm thanh dội lại, tăng độ sâu của âm thanh
o_ Pitch Shift: Điều chỉnh cao độ của âm thanh để tạo ra âm sắc khác nhau hoặc kết hợp trong các bản nhạc điện tử
¢ Chuẩn hóa âm thanh (Normalization): Điều chỉnh biên độ tín hiệu để oir mức âm thanh ở mức ôn định, tránh hiện tượng âm lượng quá thấp hoặc quá cao trong các bản ghi am
Bước 4: Nén và Mã Hóa Âm Thanh
- - Mã hóa âm thanh: Âm thanh sau khi xử lý thường được mã hóa dưới các định dạng khác nhau như PCM (Pulse Code Modulation) nếu muốn lưu trữ dạng
không nén hoặc AAC và MP3 để tiết kiệm dung lượng lưu trữ
e« Nén âm thanh:
o Nén mat dt liéu (Lossy Compression): Su dung cac thuat toan để loại bỏ các phần dữ liệu không cần thiết, ví dụ MP3, AAC Phương pháp này giúp giảm kích thước file âm thanh đáng kế mà vẫn giữ được chất lượng
tốt cho việc nghe
o Nén khéng mất dữ liệu (Lossless Compression): Giữ nguyên chất lượng
âm thanh, ví dụ FLAC, ALAC, piúp lưu trữ chất lượng sốc mà không
giảm chí tiết.
Trang 15- Tối ưu hóa truyền tải: Với các định dạng như MP3, âm thanh nén có thé truyền tải qua mạng với băng thông thấp, phù hợp cho truyền phát trực tuyến, điện thoại và các ứng dụng di động
Bước 5: Lưu Trữ và Phát Lại Âm Thanh
¢ Lưu trữ dữ liệu: Tín hiệu âm thanh đã mã hóa được lưu trữ trên bộ nhớ kỹ thuật số như ô cứng, thẻ nhớ hoặc các hệ thống đám mây, dễ dàng truy xuất và
phát lại khi cần
« Giải mã và chuyển đổi lại thành tín hiệu analog: Khi phát lại, đữ liệu kỹ
thuật số được giai ma dé tai tao lại tín hiệu âm thanh ban đầu Bộ chuyền đôi D/A chuyén tín hiệu số trở lại thành tín hiệu analog, phu hop với các thiét bi
phat 4m thanh
Phát lại âm thanh: Tin hiéu analog được đưa đến các thiết bị đầu ra như loa hoặc tai
nghe Hệ thống âm thanh sẽ khuếch đại và truyền tải đến người nghe, tái hiện âm
thanh một cách trung thực và tự nhiên nhất có thê
2.2 Hệ thống xử lý hình ảnh trong khoa học và công nghệ
2.2.1 Cau trúc hệ thống
Thiết bị đầu vào và đầu ra
¢ Thiét bị đầu vào:
o May ảnh kỹ thuật số (Digital Camera):
» Chức năng: Ghi nhận hình ảnh dưới dạng tín hiệu số với độ phân giải cao, phục vụ cho các ứng dụng như giám sát, nghiên cứu khoa học, và truyền thông
- Cảm biến: Sử dụng cảm biến hình ảnh (Image Sensor) để thu thập ánh sáng và chuyền đổi thành điểm ảnh (pixels)
o May quét hinh anh (Scanner):
Trang 16»„ _ Chức năng: Chuyên đôi hình ảnh từ tài liệu vật lý sang dạng kỹ
thuật số, phù hợp cho xử lý văn bản, nhận dạng ký tự, lưu trữ tài liệu, và nghiên cứu
»_ Quá trình quét: Scanner quét qua bề mặt tài liệu và chuyên đổi từng phần tử thành điểm ảnh
«Ò Thiét bi dau ra:
o Man hinh (Monitor):
» Chire năng: Hiển thị hình ảnh với độ phân giải cao, giữ nguyên
màu sắc và chỉ tiết của ảnh gốc, phục vụ trong thiết kế đồ họa, chỉnh sửa ảnh, và xem xét dữ liệu trực quan
- _ Công nghệ hiển thị: Sử dụng công nghệ LCD, LED, hoặc OLED
để tạo ra hình ảnh sắc nét và sống động
o May in anh (Photo Printer):
- Chire nang: Tao ban in vật lý từ dữ liệu kỹ thuật SỐ, ứng dụng trong sản xuất hình ảnh, tài liệu nghiên cứu, và các ứng dụng thương mại
* Qua trinh in: May in sử dụng mực hoặc laser để tái tạo chính xác các màu sắc va chỉ tiết
Chức năng của thiết bị đầu vào và đầu ra
-ồ Thiết bị đầu vào (Camera va Scanner):
o Camera: Thu thap théng tin hình ảnh từ môi trường và chuyền đổi thành
dữ liệu số, øiúp ghi nhận cường độ ánh sáng và màu sắc
o_ Scamner: Quét tài liệu và chuyên đổi từng phần thành dữ liệu số đề xử lý hoặc lưu trữ
¢ Thiét bi dau ra (Monitor va Photo Printer):
o Monitor: Tai tạo hình ảnh số với độ phân giai va mau sắc tương ứng với
dữ liệu gốc, cho phép người đùng xem và tương tác
Trang 17o Photo Printer: Tao ban sao vật lý của hình ảnh, đảm bảo chất lượng in ảnh cao
Khối xử lý tín hiệu
« - Chuyên đổi tín hiệu:
o_ Analog-to-Digital Converter (ADC): Chuyến đổi tín hiệu ánh sáng từ camera thành tín hiệu số để xử lý tiếp theo
o Digital-to-Analog Converter (DAC): Tao tin hiéu analog dé xuat hinh ảnh lên màn hình với chất lượng tối ưu
¢ Bo xt ly hinh anh (Image Processor):
o_ Điều chỉnh ánh sáng và độ tương phản: Cải thiện độ sáng tối và cân bằng độ tương phản giữa các điểm ảnh để tạo ra hình ảnh sắc nét hơn o_ Cân bằng màu sắc: Chỉnh sửa các kênh màu RGB đề tăng cường hoặc giảm bớt các màu cụ thẻ, giúp hình ảnh rõ nét và trung thực hơn
o Bo loc hinh anh (Image Filters): Su dung cac bé lọc dé giam nhiéu va
làm rõ các đường viễn, giúp làm mịn hình ảnh
¢ BO bién doi khéng gian (Spatial Transformation):
o_ Điều chỉnh hình ảnh thông qua các thao tác như xoay, cắt, phóng to, và thu nhỏ
« Nén va ma hoa hinh anh (Image Compression and Encoding):
o_ Nén mất dữ liệu (Lossy Compression): Loại bỏ đữ liệu không cần thiết
để giảm kích thước tệp, giữ chất lượng hình ảnh ở mức chấp nhận được (ví dụ: JPEG)
o_ Nén không mất dữ liệu (Lossless Compression): Giữ nguyên toàn bộ
đữ liệu sốc, bảo toàn chất lượng hình ảnh (ví dụ: PNG)
Khối mã hóa và nén
« - Mã hóa hình ảnh:
o Chuyển đối hình ảnh thành định dạng số: Dé dé dàng lưu trữ và
truyền tải Các định dạng mã hóa phổ biến bao gồm:
Trang 18«= JPEG (Joint Photographic Experts Group):
» Dinh dang nén mat mat, thường dùng cho ảnh tĩnh với kích thước nhỏ và chất lượng chấp nhận được
»_ Phù hợp với ảnh chụp và hình ảnh có độ chỉ tiết thấp
«= PNG (Portable Network Graphics):
» _ Định dạng nén không mất mát, giữ nguyên chất lượng hình anh và hỗ trợ trong sudt (transparency)
Phu hop voi đồ họa và hình ảnh có nền trong suốt
= GIF (Graphics Interchange Format):
» _ Định dạng nén không mất mát, thường dùng cho ảnh động
và đồ họa đơn giản
„ Chỉ hỗ trợ 256 màu, thích hợp cho hoạt hình đơn giản
« Nén hình ảnh:
o_ Giảm kích thước tệp hình ảnh: Mà vẫn giữ được chất lượng chấp nhận được
o Nén mat mat (Lossy Compression):
»_ Loại bỏ một số thông tin không quan trọng để giảm kích thước, ví
dụ như JPEG
o Nén khong mat mat (Lossless Compression):
»_ Giữ nguyên tất cả thông tin, không làm giảm chất lượng, ví dụ như PNG
Khối Giải mã và chuyển déi D/A (Decoding and Digital-to-Analog Converter -
DAC)
« - Khi hiển thị, hình ảnh được giải mã từ định dạng nén và chuyền đổi thành tin
hiệu analos để truyền đến các thiết bị đầu ra như màn hình hoặc máy In
« - Tín hiệu analop này được sử dụng để tạo ra hình ảnh trên màn hình hoặc bản in trên giấy
Trang 19Khối Lưu trữ Dữ liệu
¢ Hinh anh được lưu trữ dưới dạng các tệp kỹ thuật số với nhiều định dạng khác nhau:
o JPEG, PNG, GIF: La cac dinh dang hinh anh phé bién duge str dung dé lưu trữ và chia sẻ hình ảnh trên internet và các thiết bị
o RAW:
- _ Định dạng tệp hình ảnh không nén, chứa thông tin hình ảnh sốc từ camera, thường được sử dụng trong nhiếp ảnh chuyên nghiệp để chỉnh sửa sau này
» _ Giữ lại toàn bộ đữ liệu từ cảm biến, cho phép điều chỉnh độ phơi sáng, cân băng trăng, và chỉnh sửa chi tiết
2.2.2 Các bước xử lý hình ảnh
Bước I: Thu nhận hình ảnh
‹« - Ghi nhận ánh sáng: Cảm biến trong camera hoặc scanner thu nhận ánh sáng từ
môi trường và chuyên đôi thành tín hiệu điện
« - Biến đối tín hiệu: Tín hiệu điện được chuyền qua ADC để chuyền đổi thành tín
hiệu số, giúp hệ thông xử lý chí tiết và đặc điêm của hình ảnh
Bước 3: Biến đối không gian và loại bó nhiễu
« - Xoay và phóng to/thu nhỏ: Điều chỉnh không gian vả kích thước để phù hợp
với yêu cầu hiển thị hoặc phân tích
« - Giảm nhiễu: Áp dụng các thuật toán đề loại bỏ nhiễu hạt hoặc vết xước, giúp cải thiện độ rõ nét
Trang 20Bước 4: Nén và mã hóa hình ảnh
‹ - Chọn phương pháp nén: Quyết định giữa nén mắt dữ liệu (JPEG) hoặc không
mắt đữ liệu (PNG, TIFE) tùy thuộc vào yêu cầu lưu trữ và chất lượng hình ảnh
« - Mã hóa hình ảnh: Hình ảnh được mã hóa để dễ dàng lưu trữ hoặc truyền tải
qua mạng
Bước 5: Lưu trữ và hiển thị hình ảnh
« - Lưu trữ: Hình ảnh được lưu trữ trên các phương tiện như ô cứng, đám mây, hoặc bộ nhớ di động
« - Giải mã và chuyền đổi: Khi hiển thị, hình ảnh được giải mã và chuyền đổi lại
thành tín hiệu phù hợp với thiết bị đầu ra như màn hình hoặc máy ¡n
« - Hiên thị: Tín hiệu được đưa ra các thiết bị đâu ra đề người dùng có thê xem và phân tích hình ảnh với độ chính xác cao
2.3 Xứ lý văn bản trong khoa học và công nghệ
2.3.1 Cau trúc hệ thống
a) Thiết bị đầu vào và đầu ra
¢ Thiét bị đầu vào:
o Ban phim (Keyboard):
„Chức năng: Là thiết bị nhập liệu chính, cho phép người dùng
nhập văn bản và điều khiến các lệnh trong hệ thống
- _ Cấu trúc: Gồm các phím chữ cái, số và các phím chức năng giúp thực hiện nhiều tác vụ khác nhau như sao chép, dán và lưu tải
liệu Bàn phím cũng có thế tích hợp các phím tắt để thao tác
nhanh chóng
o May quét ky tw quang hoc (OCR Scanner):
» Chire năng: Là thiết bị chuyển đổi văn bản từ tài liệu in (giấy) sang dạng kỹ thuật số bằng cách quét và nhận diện ký tự
Trang 21» Cong nghé: Sử dụng công nehệ nhận diện hình ảnh để nhận điện các ký tự và chuyên đổi chúng thành văn bản có thể chỉnh sửa Điều nảy giúp tiết kiệm thời gian và công sức trong việc nhập liệu
«Ò Thiét bi dau ra:
o Man hinh (Monitor):
- Chức năng: Hiển thị văn bản và các tài liệu cho người dùng xem, chỉnh sửa và thao tác
- Đặc điểm: Hỗ trợ nhiều độ phân giải và kích thước khác nhau,
giúp người dùng có trải nghiệm thị giác tốt hơn, bao gồm cả khả
năng điều chỉnh độ sáng và màu sắc
o May in (Printer):
» Chie nang: Xuat van ban từ hệ thống ra giấy, cho phép tạo bản sao vật lý của tài liệu để sử dụng hoặc lưu trữ
»_ Phân loại: Có nhiều loại máy in như máy ¡n phun, máy ¡n laser,
và may in đa chức năng, phù hợp với nhu cầu khác nhau của người đùng, từ ín tải liệu văn phòng đến ¡n ảnh chất lượng cao b) Chức năng của thiết bị đầu vào và đầu ra
¢ Thiét bi dau vao (Ban phim va OCR Scanner):
o Ban phim:
»„ _ Nhập liệu: Nhập liệu trực tiếp vào hệ thống, đồng thời cho phép
sử dụng các phím tắt để thực hiện nhanh chóng các lệnh như sao chép, dán
- Chuyến đổi mã: Ghi nhận các phím nhấn và chuyên đối chúng
thành mã nhị phân (ASCII, UTE-§, v.v.) để máy tính có thể hiểu
và xử ly
o OCR Scanner:
Trang 22- _ Chuyễn đổi văn bản: Chuyển đôi văn bản từ tài liệu in sang dạng
kỹ thuật số đề dễ đàng chỉnh sửa và lưu trữ
» Nhận diện ký tự: Sử dụng thuật toán nhận diện hình ảnh để phân tích và nhận diện các ký tự trong tài liệu quét, giúp tiết kiệm thời gian cho ngwoi dung
« - Thiết bị đầu ra (Màn hình và Máy in):
o May in:
« XuAt ban in: Tao ra cdc ban in vat lý từ tài liệu kỹ thuật SỐ, cung cấp sự tiện lợi trong việc chia sẻ và lưu trữ tài liệu
»„ - Định dạng in: Hỗ trợ nhiều định dạng ¡n khác nhau như in mảu,
in den trang, va in hai mat, dap ung nhu cầu đa dạng của người dung
c) Khối xử lý tín hiệu
« - Chuyên đổi tín hiệu:
o Bo chuyén đỗi ký tự (Character Encoding):
» _ Chức năng: Chuyên đôi các ký tự từ bản phím thành mã nhị phân
để máy tính có thể xử lý
- Dam bao hién thị: Đảm bảo rằng văn bản được hiển thị chính xác trên các thiết bị khác nhau
o Bo giai ma ky tw (Character Decoding):
» Chire nang: Chuyén đổi mã nhị phân thành các ký tự mà người dùng có thê đọc và hiệu
Trang 23Ứng dụng: Phục vụ cho việc hiển thị văn bản trên màn hình và
cho phép ¡n ấn, đảm bảo tính chính xác của thông tin
¢ Bo x ly van ban (Text Processor):
o Chinh stra van ban (Text Editing):
» Cong cu chinh stra: Cung cap các công cụ đề người dùng có thé nhap, chinh stra, dinh dang va quan ly van ban
» Tinh năng: Các tính năng bao gồm sao chép, dán, xóa, và định dạng đoạn văn (thay đôi font chữ, kích thước, màu sắc, v.v.)
o Kiém tra chinh ta va ngir phap (Spell and Grammar Check):
- _ Tự động kiểm tra: Tự động kiểm tra và sửa lỗi chính tả và ngữ
pháp trong văn bản
»_ Gợi ý sửa lỗi: Đưa ra gợi ý sửa lỗi và cung cấp chức năng kiểm tra chính tả theo ngữ cảnh, giúp nâng cao chất lượng văn bản
o Dinh dang van ban (Text Formatting):
-_ Áp dụng định dạng: Cho phép người dùng áp đụng các kiêu định dạng như đậm, nghiêng, sạch chân, và các kiểu danh sách
„Tăng tính chuyên nghiệp: Hỗ trợ định dạng tiêu đề, đoạn văn,
và bảng biểu đề tăng tính chuyên nghiệp cho tài liệu
« _ Bộ lọc và tim kiém (Filter and Search):
o Tim kiém van bản (Text Search):
- Chức năng tìm kiếm: Cho phép người dùng tìm kiếm và xác định vị trí các từ hoặc cụm từ trong văn bản
- _ Tìm kiếm nâng cao: Hỗ trợ tìm kiếm nâng cao với các tùy chọn
như tìm kiếm gần đúng, tìm kiếm theo từ khóa, và tìm kiếm theo
loại ký tự
o Loe noi dung (Content Filtering):
» Xr ly van ban: Xu ly van ban dé loc ra cac théng tin can thiét, loại bỏ nội dung không mong muốn
Trang 24Cung cầp công cụ: Cung cấp các công cụ đề sắp xếp và phân loại văn bản theo các tiêu chí khác nhau
d) Khối Mã hóa và Nén
« Ma hoa van ban:
o Chuyén doi dinh dạng: Chuyên đổi văn bản thành định dạng số để dễ dàng lưu trữ và truyền tải
o_ Định dạng mã hóa phố biến:
UTE-8§:
» Dinh dang ma hoa ký tự linh hoạt, hỗ trợ hầu hết các ký tự
trong các ngôn ngữ khác nhau
= Được sử dụng rộng rãi trong các ứng dụng web và hệ thông quản lý cơ sở đữ liệu
o Nén mat mat (Lossy Compression):
»_ Loại bỏ một số thông tin không quan trọng để giảm kích thước tệp
» _ Ít phổ biến trong văn bản do yêu cầu tính chính xác cao
o_ Nén không mất mát (Lossless Compression):
» _ Giữ nguyên tất cả thông tin, không làm giảm chất lượng, như ZIP hoặc GZIP
Trang 25» Thich hop cho lưu trữ văn bản và dữ liệu quan trọng
e) Khối Giải mã và Chuyén déi D/A (Decoding and Digital-to-Analog Converter -
DAC)
¢ Giai ma van ban:
o_ Chức năng: Khi văn bản được hiển thị hoặc in, nó sẽ được giải mã từ định dạng nén và chuyến đổi thành dạng đễ đọc cho người dùng
o_ Chuyến đổi tín hiệu: Sử dụng bộ giải mã ký tự để chuyển đôi mã nhị
phân thành các ký tự mà người dùng có thể đọc và hiểu
¢ Chuyén déi D/A:
° Chuyển đối tín hiệu: Tín hiệu số từ bộ piải mã được chuyên đổi thành tín hiệu analog đề truyền đến các thiết bị đầu ra như màn hình hoặc máy
11
o Ung dung: Tin hiéu analog nay duge str dung dé hién thị văn bản trên
man hinh hoac in trén giấy, đảm bảo tính chính xác và chất lượng của
văn bản hiển thị
f) Khối Lưu trữ Dữ liệu
-Ö - Văn bản được lưu trữ đưới các định dạng khác nhau:
o TXT:
._ Định dạng đơn giản: Lưu trữ văn bản mà không có định dạng, thích hợp cho lưu trữ nội dung thuần túy mà không cần định dạng phức tạp
o DOCX:
« Dinh dạng tài liệu: Định dạng tài liệu của Microsoft Word, hỗ trợ định dạng văn bản phong phú
»„ _ Tính năng: Cho phép tích hợp hình ảnh, bảng biểu và các yếu tố
đa phương tiện khác, giúp tài liệu trở nên sinh động và dễ hiểu hơn
o PDF:
Trang 26._ Định dạng di động: Định dạng tài liệu di động, git nguyên định dạng và bô cục của tài liệu khi chia sẻ
Bảo vệ nội dung: Thích hợp cho việc xuât bản tài liệu chính thức
và bảo vệ nội dung khỏi việc chỉnh sửa, đảm bảo tính toàn vẹn
của thông tin
« - Quét văn bản bằng OCR:
o Tai ligu ¡in được quét và chuyên đôi thảnh văn bản số thông qua phần
«Ö Dinh dang van ban:
° Áp dụng các kiểu định dạng như font chữ, kích thước, màu sắc, và kiểu đoạn văn
Trang 27o_ Cho phép người dùng tạo ra một tài liệu dé doc va hap dan, đáp ứng yêu cầu trình bày
Bước 3: Kiểm tra và sửa lỗi
« - Đánh giá chất lượng văn bản:
o_ Đánh giá sự rõ rang va mach lạc của văn bản, ø1úp cải thiện nội dung o_ Cung cấp phản hồi về cách tô chức va cau trúc của văn bản
Bước 4: Lưu trữ và xuất bản văn bản
¢ Hién thi trên màn hình:
o_ Văn bản đã được xử lý sẽ hiển thị trên màn hình cho người dùng xem và chỉnh sửa
o Cung cap cac tuy chon hiển thị như phóng to, thu nhỏ, và thay đổi bố cục văn bản
Trang 28- In an va phan phối:
o Tai liéu cĩ thê được ¡n ra và phân phối cho những người cần
ò_ Chia sẻ qua email và các nền tảng trực tuyến như Google Drive hoặc Dropbox, giúp việc cộng tác trở nên dễ dàng hơn
2.4 Xứ lý Video trong khoa học và cơng nghệ
2.4.1 Cấu trúc hệ thống
a) Thiết bị đầu vào và đầu ra
¢ Thiét bị đầu vào:
o Camera: Thiét bị chính để ghi lại video, biến đổi ánh sáng và hình ảnh thành tín hiệu điện tử Camera thường được sử dụng trong truyền hình, sản xuất video, và hội nghị truyền hình
o_ Micrơ: Thiết bi thu âm thanh, ghi lại âm thanh đồng bộ với video Micrơ rất quan trọng trong các ứng dụng như ghi âm, truyền hình, và sản xuất phim
¢ Thiét bi dau ra:
o Man hinh: Hiến thị video dưới dạng hình ảnh động cho người xem Màn hình cĩ thể là TV, màn hình máy tính hoặc thiết bị đi động
o_ Loa: Chuyến đổi tín hiệu âm thanh thành sĩng âm đề phát lại âm thanh đồng bộ với video Loa thường được sử dụng trong hệ thống âm thanh gia đình và rạp chiếu phim
b) Chức năng của thiết bị đầu vào và đầu ra
«Ị Camera: Ghi lại hình ảnh và video bằng cách chuyển đối ánh sáng thành tín hiệu điện tử Camera cung cấp hình ảnh chất lượng cao cho sản xuất video và truyền thơng
« Micrơ: Ghi âm thanh từ mơi trường, chuyền đơi sĩng âm thanh thành tín hiệu điện tử để đồng bộ với video
¢ Man hinh va loa: Hién thị video và phát âm thanh, giúp người xem trải nghiệm video một cách hồn chỉnh
Trang 29c) Khối Xử lý Tín hiệu
« - Bộ lọc và hiệu chỉnh:
o B6 loc tín hiệu: Xử lý video và âm thanh đề loại bỏ nhiễu, cải thiện chất
lượng hình ảnh và âm thanh
o Chinh sira mau sac (Color correction): Diéu chinh d6 sáng, độ tương
phản, và màu sắc để làm cho video trở nên hấp dẫn hơn
‹ - Khung hình (Frame) và xử lý chuyển động:
o_ Phân tích khung hình: Các khung hình video được phân tích dé phat hiện chuyên động, giúp tạo hiệu ứng hoặc chỉnh sửa video
o Giam dd mo (Motion blur reduction): Cai thign độ sắc nét của hình
ảnh trong các cảnh chuyên động nhanh
d) Khối mã hóa và nén
« - Mã hóa video: Quá trình chuyển đôi video sang định dạng số bằng các codec
Một số codec phổ biến bao gồm:
o_ H.264: Codec phố biến cho nén video, cung cấp chất lượng cao với ty lệ
nén tốt
ø_ H.265 (HEVC): Tiếp nối H.264, cho phép nén video 4K và 8K với chất
lượng tuyệt vời
ø_ VP9 và AVI: Codec mã nguồn mở được sử dụng trong các ứng dụng phát trực tuyến, cung cấp chất lượng tốt với kích thước tệp nhỏ
- - Nén video: Giảm kích thước tệp video bằng cách loại bỏ thông tin không cần thiết mà vẫn giữ lại chất lượng chấp nhận được
o Nén mat mat (Lossy Compression): Giam kích thước bằng cách loại
bỏ dữ liệu không quan trọng Ví dụ: H.264, H.265
o Nén không mất mát (Lossless Compression): Giữ nguyên chất lượng
nhưng kích thước tệp lớn hơn Ví dụ: Apple ProRes
e) Khối Giải mã và chuyền đỗi D/A (Decoding and Digital-to-Analog Converter - DAC)
Trang 30« - Khi phát lại, video được giải mã từ định dạng nén va chuyên qua bộ chuyên đổi D/A để biến đổi tín hiệu số trở lại thành tín hiệu analog
« - Tín hiệu analop này được truyền đến các thiết bị đầu ra như màn hình và loa để tao ra hình ảnh và âm thanh mà người xem có thế cảm nhận
f) Khối Lưu trữ Dữ liệu
« = Video được lưu trữ dưới dạng các tệp kỹ thuật số với nhiều định dạng khác nhau:
o MP4: Dinh dang phổ biến cho video nén, hỗ trợ nhiều codec khác nhau
Bước I: Ghi lại Video
¢« Ghi hình: Video được phi lại từ camera hoặc các thiết bị khác Hệ thông camera cần được cấu hình để tôi ưu hóa chất lượng hình ảnh, độ sáng và độ
phân giải
Bước 2: Chỉnh sửa và Xử lý Video
‹ - Chỉnh sửa: Sử dụng phần mềm chỉnh sửa video đề cắt, ghép và thêm hiệu ứng
« - Xử lý màu sắc: Điều chỉnh màu sắc, độ sáng, và độ tương phản đề tạo ra hình ảnh đẹp hơn
Bước 3: Mã hóa và Nén Video
¢ Chon codec va dinh dạng: Chọn codec phù hợp với nhu cầu phát trực tuyến hoặc lưu trữ
- - Nén video: Sử dụng các thuật toán nén đề giảm kích thước tệp mà vẫn giữ chất lượng chấp nhận được