Chuyên ngành: Kỹ thuật Công nghệ Công nghệ thông tin Tin học chuyên ngành Sơ lược: Lời mở đầu Chương 1: Giới thiệu chung Chương 2: Lý thuyết nén dữ liệu Chương 3: Nén tín hiệu EEG Chương 4: Mô phỏng Tài liệu tham khảo
Nguyễn Thị Hương k49db Khóa luận tốt nghiệp LỜI MỞ ĐẦU Trong thập kỉ trước nén liệu sử dụng khắp nơi Có thể nói nén liệu trở thành yêu cầu chung cho hầu hết phần mềm ứng dụng, lĩnh vực nghiên cứu quan trọng hấp dẫn khoa học máy tính Nếu kĩ thuật nén liệu phát triển Internet, TV số, truyền thông di động hay phát triển kĩ thuật truyền thông video Ưu điểm bật hiệu nén áp dụng phát triển nhiều lĩnh vực khác truyền thông đa phương tiện hay lĩnh vực nghiên cứu khác Thời gian gần đây, lĩnh vực phát triển nhanh ngày thu hút quan tâm nhiều người y tế từ xa (Telemedicine), mà nén đóng vai trò quan trọng Từ người chăm sóc sức khoẻ tốt cách khám, chữa bệnh từ bệnh viện giới mà không cần phải đến tận nơi Chỉ cần giao tiếp với bác sĩ qua thiết bị thu ghi phương tiện truyền thông sau nhận kết chẩn đoán phương thức chữa bệnh bác sĩ gửi Một tín hiệu EEG quan trọng tín hiệu EEG Và báo cáo trình bày phương pháp nén sử dụng để nén tín hiệu EEG Sự cần thiết việc trình bày sau 6/12/2012 -1- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1 Nén liệu Nén liệu hay gọi mã hóa nguồn (source coding), biểu diễn thông tin liệu nguồn dạng nén Nó công nghệ then chốt cách mạng truyền thông đa phương tiện số nhiều thập kỉ Mục tiêu nén liệu bao gồm việc tìm thuật toán hiệu để loại bỏ dư thừa tồn liệu Ví dụ cho xâu kí tự S, chuỗi kí tự thay ta không gian tích trữ nhỏ hơn? Những giải pháp cho vấn đề thuật toán nén mà xuất phát từ chuỗi kí tự thay để thu số bit toàn số bit cần biểu diễn, với thuật toán giải nén để khôi phục lại liệu ban đầu Tuy nhiên, bit? Điều phụ thuộc vào việc lựa chọn thuật toán mà sử dụng lượng dư thừa thông tin tồn liệu nguồn Dữ liệu khác yêu cầu thuật toán khác để nhận dư thừa loại bỏ Rõ ràng, điều khiến cho toán nén trở nên khó giải yêu cầu chung khó trả lời cách dễ dàng gồm nhiều trường hợp May mắn thay, đưa số ràng buộc định kết hợp với kinh nghiệm liệu mục đích sử dụng liệu để đưa thuật toán phù hợp Khi nén liệu, cần thiết phải phân tích đặc tính liệu nén hy vọng suy vài mô hình để biểu diễn nén Điều làm tăng mức độ đa dạng mô hình liệu Do vậy, kĩ thuật biểu diễn khâu trọng tâm kĩ thuật nén Một cách cụ thể, nén liệu xem phương pháp biểu diễn hiệu nguồn liệu số văn bản, hình ảnh, âm hay dạng kết hợp tất loại ví dụ video 6/12/2012 -2- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 1: data in compression Hình 2: figure of data compression 6/12/2012 -3- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Mục đích nén liệu biểu diễn nguồn số số lượng bit gặp yêu cầu tối thiểu để khôi phục lại liệu ban đầu Lý thuyết thông tin (information theory) sử dụng nhiều nén liệu 1.2 Tín hiệu EEG (Electroencephalograph) Sự cần thiết nén liệu y sinh (Biomedical data compression) Hình 3: system 10/20 Một ứng dụng quan trọng nén liệu lĩnh vực y học Yêu cầu nén tín hiệu y-sinh ngày cao phát triển ngày đa dạng dịch vụ y tế từ xa Những ứng dụng y tế từ xa ngày dành nhiều quan tâm, nghiên cứu cung cấp truy nhập dễ dàng tới thủ tục chuẩn đoán bệnh đánh giá bệnh Cần phải truyền lượng lớn liệu y sinh thúc đẩy cần thiết việc nén liệu y sinh mà không thông tin quan trọng mang tín hiệu ghi đựơc mà dẫn tới hành động chuẩn đoán hay đánh giá bệnh sai Do đó, nghiên cứu nén tín hiệu y-sinh cần thiết Một tín hiệu y-sinh phổ biến tín hiệu điện não (EEG- Electroencephalogram) Tín hiệu EEG ghi lại hoạt động điện não nhằm phục vụ nghiên cứu não, hay chẩn đoán điều trị bệnh nhân có rối lọan não Ví dụ như, chuẩn đoán động kinh vị trí não bị tổn thương liên quan đến rối loạn này- chứng bệnh phổ biến giới Việt Nam 6/12/2012 -4- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 1.2.1 Tín hiệu EEG Những hoạt động điện vỏ não thường tín hiệu nhịp (rhythms) chúng thường dao động lặp lặp lại Sự đa dạng tín hiệu nhịp EEG vô lớn phụ thuộc vào nhiều yếu tố trạng thái tinh thần đối tượng, mức độ kích động, trạng thái hay trạng thái ngủ Thông thường, tín hiệu ghi da đầu có biên độ nằm khoảng từ vài microvolts tới xấp xỉ 100 µV, tần số khoảng từ 0.5 đến 30-40 Hz Hình : tín hiệu nhịp EEG Tín hiệu EEG chia thành dải tần sau : ¾ Nhịp Alpha : nhịp sở não người lớn Là dạng sóng dễ nhận biết nhất, thành chuỗi sóng 8-13 Hz với biên độ 30-50 mV Hình 5: tín hiệu alpha ¾ Nhịp Beta : sóng có tần số 4-35 Hz, điện khoảng 5-30 mV Hình 6: tín hiệu Beta 6/12/2012 -5- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp ¾ Nhịp Delta : sóng chậm Hz có biên độ thay đổi Hình 7: tín hiệu Delta ¾ Nhịp Theta : bao gồm sóng 4-8 Hz , thường có biên độ lớn 20 mV Hình 8: tín hiệu Theta ¾ Nhịp Gamma : có tần số > 30 Hz Đối với người lớn bình thường dải tần tín hiệu EEG nằm khoảng 0.1-100 Hz Hầu hết tín hiệu trì vài phút , có tín hiệu khác xảy vài giây, nhịp gamma Ngoài có tín hiệu mà không xuất vào lúc Nó tín hiệu thời, đột ngột, biểu thị hoạt động mức, không bình thường hoạt động điện não ¾ Các gai (Spikes) biến đổi điện thoáng qua, nhanh, có biên độ thực cao hoạt động điện Có khoảng thời gian từ 20 – 70 ms Hình 9: Spike đơn ¾ Sóng nhọn (Sharp waves) : sóng đơn độc, có khoảng thời gian từ 70 – 200 ms Có biên độ xấp xỉ với Spikes ¾ Phức hợp sóng gai (Spike-wave complexes) : sóng phức hợp gai (spikes) theo sau sóng chậm Có tần số vào khoảng 3- Hz 6/12/2012 -6- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 10: Spike and Sharp wave Sự xuất dạng sóng hành động thần kinh sai lệch thường tìm thấy người phải trải qua động kinh Đó tín hiệu biểu bệnh lý 1.2.2 Sự cần thiết nghiên cứu nén tín hiệu y sinh Mong muốn nén liệu EEG nhiều lý do.Như biết, EEG phương pháp phổ biến giúp bác sĩ xác định vị trí ổ bệnh (khu vực phóng điện) chức phận não bệnh nhân bị tổn thương Là phương pháp hữu hiệu để phát chẩn đoán bệnh động kinh - bệnh phổ biến nguy hiểm Theo thống kê Tổ Chức Y tế Thế giới (WHO), tỉ lệ người mắc bệnh động kinh giới khoảng 0,5% dân số, thay đổi tuỳ theo quốc gia, vùng, dân tộc, Pháp Mỹ khoảng 0,85%; Canada 0,6% Tại Việt Nam khoảng 2% dân số có đến 60% số bệnh nhân trẻ em Theo BS Lê Văn Tuấn, chuyên khoa nội thần kinh BV Chợ Rẫy, TP.HCM: Động kinh biến chứng tai nạn gặp bệnh nhân lên động kinh: cắn phải lưỡi, viêm phổi hít phải dãi hay chất nôn ói; gãy xương chấn thương; tổn thương não cưoin kéo dài làm não thiếu oxy; ngừng thở tắc nghẽn đường thở… Tuy nhiên, bệnh hoàn toàn điều trị phát sớm điều trị cách khả hoàn toàn khỏi bệnh cao Đối với trẻ em, không điều trị kịp thời, điều trị không cách dẫn tới tình trạng không khống chế co giật Lâu dần, trẻ bị thiểu trí tuệ, rối loạn hành vi Những co giật làm cho hệ miễn dịch trẻ yếu đi, dễ nhiễm bệnh khác dễ tử vong trẻ bình thường Tre bị động kinh không điều trị thuốc, phác đồ nên sinh kháng thuốc Khi đó, khả hồi phục khó khăn nhiều Do việc phát kịp thời động kinh, chẩn đoán xác bệnh điều trị hợp lý vô quan trọng, cấp bách cần thiết Song bệnh viện làm điều hoàn toàn phụ thuộc vào trình độ khả bác sĩ đọc điện đồ não Tín hiệu EEG ghi phức tạp ghi tín hiệu (alpha, gamma,…), xung bất thường (spike, sharp…) mà có nhiều loại artifact (ECG, EMG…) Hơn việc nhận biết sóng nhịp không đơn giản, dễ dàng nhịp xuất phụ thuộc vào tuổi, vào trạng thái tinh thần bệnh nhân Song khắc 6/12/2012 -7- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp phục khó khăn việc gửi tín hiệu điện não EEG từ nơi không đáng tin cậy đến nơi tin cậy mà có bác sĩ giỏi, kinh nghiệm thực việc đọc ghi chẩn đoán lâm sàng Từ phát sinh yêu cầu cần thiết thực truyền hiệu tín hiệu EEG mặt vật lý lẫn hiệu kinh tế Do thực nén EEG cần thiết Hơn thực công việc giúp ích nhiều việc nghiên cứu tín hiệu EEG việc loại bỏ artifacts, dò tìm xung động kinh, phân loại dạng xung việc gửi ghi điện não từ bệnh viện đến nơi thực nghiên cứu Trước tiên nén để giảm thời gian truyền, giảm không gian lưu trữ, hệ thống xách tay, giảm yêu cầu nhớ hay tăng số lượng kênh dải thông Một mục đích việc làm tự động thu thập liệu EEG mà yêu cầu với đặc tính hạn chế từ trước ( luồng liệu 20 480 bps) từ bệnh viện ngoại vi hay từ nhà bệnh nhân, mà truyền qua môi trường truyền tốc độ thấp đường dây điện thoại đóng mạch hay mạng điện thoại tế bào, với phần cứng giá rẻ, mà không thiết phải có mặt bác sĩ Những thuật toán nén liệu cho phép người bệnh thực thi hệ thống xách tay để gửi tín hiệu EEG (20 kênh, 128 Hz, 8-b), thời gian thực qua đường điện thoại với modem 14 400 bps Một y tá trực thu tín hiệu trình thu, bác sĩ cần liên lạc với y tá qua điện thoại Vì vậy, bệnh nhân không cần gặp trực tiếp bác sỹ điều trị Dữ liệu thu thập từ nơi bệnh nhân nằm sau kết chẩn đoán, phương pháp điều trị gửi trở lại Điều dẫn đến việc giảm giá toàn bộ, việc chuyên chở bệnh nhân không cần Một động lực khác để nén liệu nhiều trường hợp lượng liệu lưu trữ vượt khả thiêt bị lưu trữ thương mại Trong trường hợp này, giá giới hạn công nghệ thiết bị lưu trữ khối có sẵn bắt buộc phải giảm tốc độ lấy mẫu từ 128 tới 64 Hz số lượng kênh ghi từ 20 kênh xuống 12 kênh, nhiên chất lượng tín hiệu chấp nhận được, kĩ thuật nén liệu EEG hữu ích đạt hiệu thương mại cao Bộ vi xử lý mà giám sát thiết bị thu EEG dành cho nén liệu phần nhỏ thời gian mẫu tín hiệu vào liên tiếp Chiều dài từ mà mã tạo từ thuật toán nén dài (những tín hiệu xảy khi), khiến liệu khả tính toán giới hạn vi xử lý Để đối phó với biến đổi A/D tốc độ liệu yêu cầu tính toán thấp, kĩ thuật nén dựa vào chiều dài từ mã lớn cố định chấp nhận Từ cần thiết đó, mục tiêu đề tài nghiên cứu vài thuật toán để tìm phương pháp nén EEG hiệu dựa yêu cầu tiêu chí đánh giá 6/12/2012 -8- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 2: LÝ THUYẾT NÉN DỮ LIỆU 2.1 Những vấn đề chung Mã chiều dài thay đổi mã mong muốn cho việc nén liệu đạt việc tiết kiệm toàn cục cách gán từ mã ngắn cho kí tự xuất thường xuyên từ mã dài cho kí tự xuất Ví dụ, cho mã chiều dài thay đổi (0, 100, 101, 110, 111) với chiều dài từ mã (1, 3, 3, 3, 3) cho bảng kí tự (A, B, C, D, E), chuỗi kí tự nguồn BAAAAAAAC với tần suất kí tự (7, 1, 1, 0, 0) Khi lượng bít trung bình yêu cầu là: (2.1) Việc tiết kiệm gần nửa số bit so với việc biểu diễn mã chiều dài cố định bits/symbol Một nguồn mô hình hoá bảng S = (s1, s2, …, sn) phân phối xác suất tương ứng P = (p1, p2,…,pn) Giả sử xuât phát từ mã C =(c1, c2, …, cn) với chiều dài từ mã L = (l1, l2,…, ln) Hình 11 : Code and source data 6/12/2012 -9- http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Mục tiêu cực tiểu hoá chiều dài trung bình từ mã : (2.2) Do mã chiều dài thay đổi hữu ích cho việc nén liệu Tuy nhiên, mã chiều dài thay đổi trở nên vô giá trị nhận cách từ mã mã từ tin mã hoá Ví dụ : Cho mã chiều dài thay đổi (0, 10, 010, 101) bảng kí tự (A, B, C, D) Một đoạn tin ‘0100101010’ giải mã nhiều cách Ví dụ ‘0100101010’ dịch ‘ 10 010 101 0’ ‘ ABCDA’ ‘010 101 010 ‘ CADC Khi không nhận xác liệu nguồn Một mã coi có khả giải mã có cách để giải mã tin mã hoá Một giải pháp dường khả quan cho trường hợp mã mã có khả giải mã thêm vào kí tự phân cách mở rộng giai đoạn mã hoá Ví dụ, sử dụng kí tự ‘/’, sau mã hoá chuối kí tự ABCDA ‘0/10/010/101/0’ Tuy nhiên, phương pháp phải trả giá đắt kí tự mở rộng ‘/’ phải chèn vào cho từ mã Mã lý tưởng trường hợp mã mà chiều dài thay đổi mà có đặc tính tự phân cách Một loại gọi mã tiền tố (prefix code) mã “Tiền tố” vài bit từ mã Khi hai từ mã có chiều dài khác nhau, từ mã ngắn giống hệt với vài bít từ mã dài Một mã tiền tố (prefix code) mã không từ mã tiền tố từ mã nào, hay từ mã mà xuất phát từ từ mã khác cách cộng thêm vào sau vài bit từ từ mã ngắn Hình 12 : A Prefix code 6/12/2012 - 10 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Markov có nghĩa là, cho trước trạng thái tại, trạng thái tương lai độc lập với trạng thái khứ Nói cách khác, mô tả trạng thái nắm bắt đầy đủ tất thông tin mà ảnh hưởng đến tiến trình tương lai trình Tiến đến trạng thái tương lai thông qua trình xác suất thay cho trình tất định Tức là, biết tại, không điều xảy khứ ảnh hưởng hay xác định kết cục tương lai, tương lai tất điều Về mặt toán học, trình Markov biểu diễn cho giá trị n t1 < t2 < t3, P(x (tn) ≤ xn / x(t) ∀ t ≤ tn-1) = P(x(tn) ≤ xn / x(tn-1)) (3.11) Thông thường, thuật ngữ chuỗi Markov (Markov chain) sử dụng để nói đến trình Markov thời gian rời rạc Chuỗi Markov chuỗi biến ngẫu nhiên X1, X2, X3, có tính chất Markov Ta có công thức : (3.12) Pr(Xn+1 = x|Xn = xn, …, X1 = x1) = Pr(Xn+1 = x|Xn = xn) Những giá trị Xi hình thành tập đếm S gọi không gian trạng thái chuỗi Cho chuỗi {xn} Chuỗi gọi theo mô hình Markov bậc k : P(xn / xn-1,…,xn-k) = P(xn / xn-1, …, xn-k, ) (3.13) Nói cách khác, biết k mẫu khứ biết toàn lịch sử khứ trình Nếu kích thước bảng nguồn l, số trạng thái lk Mô hình Markov sử dụng phổ biến mô hình Markov bậc nhất, P(xn / xn-1) = P(xn / xn-1, xn-2, xn-3,…) (3.14) Phưong trình (3.13) (3.14) biểu thị tồn phụ thuộc mẫu Tuy nhiên, chúng không mô tả dạng phụ thuộc Chúng ta phát triển mô hình Markov bậc (first-order Markov) khác tuỳ thuộc vào giả thiết dạng phụ thuộc mẫu Bộ dự đoán biểu diễn hình 19 thực thi giả thiết tín hiệu có tính chất Markov tạo nguồn mô hình chuỗi Markov Một chuỗi Markov bậc sử dụng để mô hình tín hiệu; yêu cầu ước lượng tất xác suất điều kiện P[Xn = / Xn-1 = aj], Xn biến ngẫu nhiên rời rạc lấy giá trị bảng chữ hữu hạn A = {a1, …, aM} Những xác suất xấp xỉ với tần suất có sẵn tập huấn luyện đủ lớn Một ma trận tần suất, mà thành phần Fij đếm xảy Xn = Xn-1 = aj, xuất 6/12/2012 - 36 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp phát từ tập huấn luyện (training set) bao gồm 96 mẫu EEG; tập kiểm tra khác bao gồm 58 mẫu EEG sử dụng để đánh giá Ma trận Fij tương đương với phân bố xác suất kết hợp Xn Xn-1 sử dụng (3.15) để ước lượng xác suất điều kiện Πij = P[Xn = / Xn-1 = aj] ∏ ≈ ij Fij ∑k Fij (3.15) Sau ước lượng cho kí tự kí tự aj cách sử dụng phương pháp tối thiểu hoá sai số bình phương trung bình Succ (aj) = ∑ k∏ k với ∀ aj ∈ A (12) (3.16) kj Do liệu lượng tử b, có 256 kí tự tạo ma trận tần suất 256×256; chứng thực nghiệm chứng tỏ : tập kiểm tra, khác ma trận đơn vị (identity function)và kí tự kí tự 0….255, tính toán theo (3.16) thuộc khoảng từ -3 tới +3, biểu thị ước lượng Markov (Markovian estimate) nhìn chung gần với ma trận đơn vị (identity function) 3.1.1.4.2 Bộ dự đoán lọc số Có thể thiết kế lọc dự đoán tuyến tính số cho tín hiệu EEG sử dụng theo sơ đồ dự đoán hình 19 Hãy xem xét lọc số mô tả phương trình sai phân en = xn – b1xn-1 – b2xn-2 - … - bNxn-N (3.17) Trong dự đoán hình 19 biểu diễn phương trình sau sử dụng tập hợp hệ số giống {b1…bN} yn = b1xn-1 + b2xn-2 + … + bNxn-N (3.18) Có thể thu tín hiệu lỗi (error signal) entropy thấp en cách tối thiểu hóa sai số bình phương tổng: E= ∑e n 6/12/2012 (3.19) n - 37 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Với quy ước sau : − b t = [b1…bN] _ x t = [xn-1…xn-N] (3.20) ∧ − − Bộ dự đoán tuyến tính sai số bình phương trung bình tối thiểu dạng x = b t x − cho nghiệm b phưong trình − bt − R x − R − x = E[xn x t] (3.21) ma trận tương quan trình xn Thực tế, hàm tự tương quan thật thu ước lượng từ việc sử dụng tập hợp mẫu 3.1.1.4.3 Dự đoán tuyến tính thích nghi Hai dự đoán tuyến tính thích nghi dự đoán tuyến tính thích nghi dấu (the sign adaptive linear predictor) dự đoán tuyến tính thích nghi bình phương trung bình tối thiểu (the least mean square adaptive linear predictor) Những hệ số dự đoán (3.18) xem hàm phụ thuộc thời gian, có khả thích nghi với hành vi tín hiệu (signal behavior) Thuật toán bình phương trung bình tối thiểu cập nhật hệ số dự đoán theo phương trình bi(n) = bi(n-1) + βxn-1en (3.22) trọng số β tốc độ thích nghi, en sai số dự đoán thời điểm n Những hệ số dự đoán thuật toán thích nghi dấu cập nhật theo phương trình: bi(n) = bi(n-1) + Δxn-1sgn (en) (3.23) trọng số Δ tốc độ thích nghi, sgn (en) lấy giá trị +1 hay -1 tuỳ theo dấu sai số dự đoán Tuy nhiên việc lựa chọn giá trị β Δ phải có giới hạn vì: lựa chọn giá trị thấp dẫn tới việc thích nghi không đủ, lựa chọn giá trị cao khiến cho hệ thống không ổn định 6/12/2012 - 38 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 3.1.1.4 Phương pháp nén biến đổi (Transformation compression) Một chuỗi N mẫu tín hiệu xem điểm X không gian N chiều Có thể biểu diễn X hiệu cách áp dụng phép biến đổi trực giao Y = TX, Y biểu thị vectơ biến đổi T biểu thị ma trận biến đổi Mục tiêu lựa chọn chuỗi Y gồm M thành phần, M nhỏ N (vẫn (NM) thành phần bị loại bỏ) dẫn đến nén Bằng cách mã hoá Huffman khác tín hiệu nguồn tín hiệu khôi phục từ M thành phần kia, kĩ thuật lại trở thành mã hoá không thông tin, khôi phục lại xác từ M thành phần sai khác Có thể chứng minh biến đổi Karhunen-Loeve (KLT) phương pháp tối ưu để biểu diễn tín hiệu giới hạn sai số bình phương trung bình Nhược điểm việc sử dụng KLT thời gian tính toán đáng kể Phép biến đổi cosin rời rạc (the discrete cosine transform (DCT)), với tính chất nén lượng mạnh có nghĩa là: hầu hết thông tin tín hiệu hướng đến tập trung vài thành phần tần số thấp DCT, giải pháp kề tối ưu với thuận lợi tính toán, thực tế, có tồn thuật toán nhanh Phép biến đổi cho vectơ lối vào thực trở nên đáng quan tâm mục đích sử dụng để nén tín hiệu EEG Hình 20: Phổ EEG trung bình tính DCT Đỉnh 10 Hz tín hiệu alpha, đỉnh 50 Hz đỉnh dòng điện nguồn Hình 20 biểu diễn phổ trung bình EEG tính DCT toàn Một số lượng đáng kể công suất phổ định vị tần số thấp, nhiên mức độ giảm phổ không cao Vì vậy, tỉ lệ nén dựa vào DCT không mong đợi cao 6/12/2012 - 39 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp thành phần bị loại bỏ phát sinh lỗi nghiêm trọng Một điều cần phải ý đỉnh phổ vị trí 10 Hz, tương ứng dạng sóng EEG quan trọng nhất, sóng alpha, thuộc phạm vi từ đến 13 Hz Một đỉnh thứ hai 50 Hz biểu diễn nhiễu mạng điện lưới loại bỏ lọc North số trước nhìn thấy Do thành phần quan trọng mặt sinh học nằm 20 Hz, tương ứng với 50 256 thành phần, nên 50 thành phần DCT giữ lại trình nén 3.1.2 Giới thiệu phương pháp nén EEG khác 3.2 Những đặc trưng tín hiệu EEG Những phương pháp trình bày gần không sử dụng thông tin EEG Một điều chắn sử dụng thông tin phụ thuộc miền tín hiệu quan trọng cung cấp chiến lược nén tốt Tín hiệu EEG có tương quan không gian thời gian mà ta khai thác để thiết kế chiến lược nén hiệu Về tương quan không gian, vài kĩ thuật sử dụng lượng tử hoá vectơ (vector quantization) phân tích chuỗi thời gian đa biến Chúng ta khai thác kĩ thuật lượng tử hoá vector cách ánh xạ vectơ bao gồm mẫu kênh lối vào tới vectơ mã, mã hoá với vectơ lỗi Sự tương quan thời gian nghiên cứu đưa kết biểu diễn đồ thị sau : Hình 21: Sự tương quan thời gian trung bình tín hiệu EEG 6/12/2012 - 40 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Sử dụng hiểu biết vào việc nén cách điều chỉnh phương pháp nén thông thường biểu diễn hình 19 bổ sung số lối vào trễ cho dự đoán 3.2.1 Nén dự đoán với lối vào trễ Ở hình 21 biểu diễn tương quan thời gian trung bình tính toán tập huấn luyện tín hiệu EEG Nhận thấy rõ ràng tương quan thời gian không tồn mẫu gần nhau, mà mẫu có độ trễ khoảng 12 mẫu Mức cực đại thu cho độ trễ 12 mẫu tương ứng khoảng 10.6 Hz Điều giải thích mặt sinh học sau: thực tế, sóng alpha, dạng sóng đặc trưng cho tín hiệu EEG bình thường, thuộc dải từ – 13 Hz Để lợi dụng ưu điểm đỉnh tương quan sóng alpha điều chỉnh (3.11) để tính toán đến khoảng trễ dài Đặt N = {k|α ≤ k ≤β} xác định lân cận độ trễ cho (3.11) viết lại sau: en = xn – f(xn-1, , xn-N, xn-α, ,xn-β) (3.24) Giá trị tương quan từ hình 21 gợi ý chọn N = 5, α = 10 β = 15 cung cấp cho dự đoán mẫu khứ tương quan Thực tế, kết thực nghiệm cho thấy N β - α chọn thấp mà không giảm hiệu suất dự đoán, điều làm cho đơn giản nhanh Kết chọn N = 2, α = 12, β = 13 3.2.2 Lượng tử hoá vectơ tín hiệu EEG Trong lượng tử hoá vectơ nhóm lối nguồn thành khối hay vectơ Ví dụ coi L mẫu liên tiếp tín hiệu thành phần vectơ N chiều Vectơ lối nguồn tạo thành lối vào lượng tử hoá vectơ Tại mã hoá giải mã lượng tử vectơ, có tậ hợp vectơ N-chiều gọi sách mã (codebook) lượng tử Những vectơ sách mã này, hiểu vectơ mã (code-vectơ), lựa chọn làm biểu diễn vectơ tín hiệu tạo từ lối nguồn Mỗi vectơ mã gán số nhị phân Tại mã hoá, vecơt lối vào so sánh với vectơ mã để tìm vectơ mã gần với vectơ lối vào Những thành phần vectơ mã giá trị lượng tử lối nguồn Để cho giải mã biết vectơ mã tìm thấy gần với vectơ lối vào nhất, truyền hay lưu trữ số nhị phân vectơ-mã Do giải mã có sách mã giống hệt mã, nên khôi phục lại vectơ mã cho số nhị phân Biểu diễn trình sơ đồ trực quan sau: 6/12/2012 - 41 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Source output Group into vectors Khóa luận tốt nghiệp Encoder Decoder Find closest codevector codebook … Unblock Table lookup index index reconstruction codebook Hình 22: Thủ tục lượng tử hoá vectơ Diễn đạt theo cách khác lượng tử hoá vectơ k chiều kích thước N phép ánh xạ Q từ vectơ k chiều, không gian Ơclit Rk, vào tập hữu hạn C bao gồm N lối hay điểm mô phỏng, gọi mã vectơ hay từ mã Q: Rk Æ C C = {y(1), y(2), y(N)} y(i) ∈ Rk i {1, 2, …, N} Tập C gọi sách mã hay đơn giản mã Áp dụng phương pháp cho tín hiệu EEG cách tính toán vectơ kênh lối vào cách xây dựng sách mã cho tập vectơ Có biến đổi nhỏ tính toán đạo hàm thay cho giá trị kênh đạo hàm EEG gần không Vì vậy, với sách mã nhau, thu méo trung bình thấp 6/12/2012 - 42 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 4: MÔ PHỎNG 4.1 Mã Huffman Sau mô thuật toán Huffman truyền thống với chiều dài từ mã không cố định tức kí tự nguồn nguồn có từ mã riêng Thủ tục xây dựng mã dựa vào xác suất kí tự nguồn hoàn toàn giống trình bày Hình 23 : tín hiệu nguồn tín hiệu khôi phục sau nén giải nén phương pháp mã Huffman 6/12/2012 - 43 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 24 : tín hiệu lỗi tín hiệu nguồn tín hiệu giải nén Kết quả: Name T ans compr_data data decom_data info recov_data Size 1x18432 32x1 1x38568 1x147456 1x147456 1x1 1x18432 Bytes 147456 147456 38568 147456 147456 1872 147456 Class double array double array uint8 array uint8 array uint8 array struct array double array Grand total is 388886 elements using 777720 bytes tỉ lệ nén = 0.2616 hệ số nén = 3.8233 phần trăm tiết kiệm = 73.84% 6/12/2012 - 44 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Nhận thấy nén tín hiệu EEG sử dụng mã Huffman hiệu quả: hệ số nén tương đối ≈ 4, phần trăm tiết kiệm cao 73.84%, mức độ phức tạp tính toán thấp, quan trọng cho phép khôi phục lại hoàn toàn xác tín hiệu ban đầu Nên yêu cầu đảm bảo thông tin xác mang tín hiệu EEG ghi từ bệnh nhân để không gây sai sót việc chẩn đoán kết luận lâm sàng bệnh nhân, bác sĩ hoàn toàn tin tưởng vào phương pháp nén Đối với thiết bị lưu trữ tính toán ngày nay, phương pháp tỏ hiệu 4.2 Biến đổi DCT Mô tả khái quát phương pháp sử dụng DCT transform: B1:Coi tín hiệu EEG vào : data B2: Bước biến đổi DCT tín hiệu vào : DCT_data B3: Giữ lại N phần tử để gửi đi, loại bỏ K phần tử lại B4: biến đổi DCT ngược liệu [N K]; K gồm K số :gọi recov_data B5: tính lỗi tín hiệu thật DCT ngược : err=data-recov_data B6: Lượng tử hoá lỗi này, sau sử dụng Huffman coding để nén truyền sai số Ở bên nhận thực B4 sau lấy kết cộng với lỗi nhận để khôi phục lại liệu ban đầu Kết mô phỏng: Hình 25 : tín hiệu nguồn sau khôi phục 6/12/2012 - 45 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 26 : tín hiệu lỗi tỉ lệ nén = 0.3336 phần trăm tiết kiệm = 66.64% Nhận thấy sử dụng biến đổi DCT để nén EEG đạt kết tương đối Mặc dù sai số tín hiệu khôi phục tín hiệu ban đầu nhỏ, song xảy xác suất gây lỗi chẩn đoán Hơn hiệu nén không cao Huffman Tuy nhiên cho phép mức độ tính toán đơn giản Một vấn đề khó giải chút trình mô việc lượng tử hoá lỗi Khi lấy hệ số N cao sai số tín hiệu nguồn tín hiệu khôi phục không lớn Nên ta sử dụng số bit để biểu diễn lỗi Trong Matlab liệu xử lý nhỏ bit, điều khiến cho việc mô trường hợp không bộc lộ hết hiệu mà tiềm thực Từ rút nhận xét : tuỳ thuộc vào thiết bị phần cứng tốc độ xử lý khả lưu trữ mà lựa chọn phương pháp cho phù hợp Người ta cho rằng, phương pháp nén không thông tin không giành nhiều quan 6/12/2012 - 46 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp tâm cho hiệu nén không cao, mà người ta tập trung nghiên cứu phương pháp nén thông tin để đạt hiệu nén cao Song tín hiệu EEG đặc biệt cần thiết yêu cầu khả khôi phục lại hoàn toàn liệu đựơc ghi ban đầu, nên sử dụng phương pháp nén thông tin cách phải biến loại không liệu (ví dụ nén lỗi gửi lỗi phương pháp biến đổi DCT trên) Khi hiệu nén cần phải xem xét kĩ, tuỳ vào trường hợp mà lựa chọn phương pháp Có lẽ điều đáng quan tâm mức độ phức tạp tính toán? 6/12/2012 - 47 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp TÀI LIỆU THAM KHẢO [1] Guiliano Antoniol and Paolo Tonella.” EEG data compression techniques” IRST, trento, Italy, Tech Rep 9508-03, 1997 [2] G.Nave and A Cohen, “ECG compression using long-term prediction” IEEE trans Biomed Eng., Vol 40, no 9, pp 877-885, Sept 1993 [3] Ida Mengyi Pu.” fundamental data compression”.Nxb Elsevier.,2006 [4] J Markel and A Grey Linear Prediction of speech New york: Springer-Verlag, 1976 [5] Khalid Sayood ”Introduction to data compression”, third edition., Nxb Elseveer., 2006 [6] Leif Sörnmo and Pablo Laguna “Bioelectrical signal processing in cardiac and neurological applications” tr.3-161 [7] Peyton Z Peebles, Jr., Ph.D.” Probability, Random variables, and random signal principles” [8] PGS.TS Nguyễn Bình.” Lý thuyết thông tin” tr 3-63 [9] Trần Mạnh Tuấn.” Xác suất & thống kê lý thuyết thực hành tính toán” Nxb ĐHQGHN IV/2004 [10] Website : www.datacompression.com 6/12/2012 - 48 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp MỤC LỤC NỘI DUNG LỜI MỞ ĐẦU CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1 Nén liệu 1.2 Tín hiệu EEG (Electroencephalograph) Sự cần thiết nén liệu y sinh (Biomedical data compression) 1.2.1 Tín hiệu EEG 1.2.2 Sự cần thiết nghiên cứu nén tín hiệu y sinh CHƯƠNG 2: LÝ THUYẾT NÉN DỮ LIỆU 2.1 Những vấn đề chung 2.2 Lý thuyết thông tin 11 2.2.1 Khái niệm thông tin 11 2.2.2.2.Giới thiệu lý thuyết thông tin 12 2.3 Các phương pháp nén liệu .15 2.3.1 Các phương pháp nén không thông tin 15 2.3.1.1 Mã Huffman 15 2.3.1.2 Mã số học 19 2.3.1.3.Kĩ thuật từ điển .22 2.3.1.4 Phương pháp nén dựa vào ngữ cảnh (context-based compression) .23 1.4 Đo chất lượng nén .25 CHƯƠNG 3: NÉN TÍN HIỆU EEG 26 3.1 Các phương pháp sử dụng để nén EEG 26 3.1.1 Các phương pháp nén không thông tin (lossless compression) .26 3.1.1.1 Giới thiệu phương pháp nén 26 3.1.1.2 Phương pháp mã Huffman .31 3.1.1.3 Nén đếm lặp 33 6/12/2012 - 49 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 3.1.1.4 Kĩ thuật nén dự đoán (preditive compression techniques) 35 3.1.1.4.2 Bộ dự đoán lọc số 37 3.1.1.4.3 Dự đoán tuyến tính thích nghi 38 3.1.1.4 Phương pháp nén biến đổi (Transformation compression) 39 3.1.2 Giới thiệu phương pháp nén EEG khác 40 3.2 Những đặc trưng tín hiệu EEG .40 3.2.1 Nén dự đoán với lối vào trễ 41 3.2.2 Lượng tử hoá vectơ tín hiệu EEG 41 CHƯƠNG 4: MÔ PHỎNG 43 4.1 Mã Huffman 43 4.2 Biến đổi DCT 45 TÀI LIỆU THAM KHẢO 48 6/12/2012 - 50 - http://www.ebook.edu.vn [...]... mọi mã T (A, W) Đ y là thuật toán x y dựng mã Huffman thông thường dựa vào xác suất đã biết của các mẫu tín hiệu Tuy nhiên, đối với tín hiệu EEG, nhiều khi cần phải tiến hành ghi tín hiệu điện não trong thời gian dài (long-term signal), và nhiều lúc xuất hiện những tín hiệu bộc phát biểu hiện bệnh lý bất thường có biên độ lớn hơn rất nhiều so với các tín hiệu cơ bản hay các tín hiệu x y ra hiếm khi Khi... những phương pháp nén đếm lặp (repetition count compression methods) Từ đó, người ta chỉ ra rằng c y Huffman “collapsed” cho phép thuật toán nén có thể lựa chọn chiều dài từ mã dài nhất mà không ảnh hưởng nhiều đến tỉ lệ nén Vì v y những bộ vi xử lý rẻ tiền và những thiết bị lưu trữ có thể sử dụng hiệu quả để lưu trữ những tín hiệu EEG dài trong dạng nén Khi nén tín hiệu EEG, một y u cầu cần được đảm... 25 - (2.20) http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 3: NÉN TÍN HIỆU EEG 3.1 Các phương pháp đã được sử dụng để nén EEG 3.1.1 Các phương pháp nén không mất thông tin (lossless compression) 3.1.1.1 Giới thiệu phương pháp nén Như chúng ta đã biết tín hiệu EEG ghi lại các hoạt động điện của não nhằm phục vụ các nghiên cứu về não, hay chẩn đoán và điều trị bệnh nhân có rối... từ dữ liệu được nén Trong bài báo cáo n y, những kĩ thuật nén dữ liệu EEG mà cho phép khôi phục lại hoàn toàn dạng sóng ghi được từ dữ liệu được nén sẽ được trình b y và thảo luận Nén dữ liệu cho phép chúng ta có thể đạt được việc giảm đáng kể không gian được y u cầu để lưu trữ tín hiệu và giảm thời gian truyền Kĩ thuật mã Huffman kết hợp với việc tính toán ban đầu đã đạt đựơc tỉ lệ nén cao (trung bình... x y ra của nó đối với ngữ cảnh bậc cao 1.4 Đo chất lượng nén Do y u cầu cần phải khôi phục lại tín hiệu EEG sau khi nén là chính xác, không đánh mất bất kì một thông tin nào Nên các phương pháp được nghiên cứu là những phương pháp nén không mất thông tin (lossless compression) Vì v y trong giới hạn khoá luận n y, chúng ta sẽ chỉ trình b y những đại lượng được đưa ra để đo hiệu quả của mỗi kĩ thuật nén. .. rối loạn n y Một đặc điểm của tín hiệu EEG đo được trên người bị động kinh là có sự xuất hiện đột ngột, bất thường, quá mức của các xung động kinh như gai (Spike) hay phức hợp gaisóng đứng (Spike and sharp wave complex) Vì thế, khi nén tín hiệu EEG phục vụ cho động kinh, các thông tin về các xung liên quan đến bệnh động kinh cần được bảo toàn đọ chính xác Hay nói cách khác, kĩ thuật nén EEG y u cầu khôi... phương pháp n y thực hiện tốt hơn mọi chiến lược nén dữ liệu khác (khoảng 62%) Tuy nhiên, bằng một sơ đồ dự đoán đơn giản, chúng ta có thể đạt được tỉ lệ nén khoảng 58%, cho phép thực hiện một bộ nén thời gian thực Để giải quyết khó khăn về sự hạn chế chặt chẽ thời gian, một mã chiều dài từ cực đại đã được thiết kế Kết quả là 16 b đủ để nén hiệu quả tín hiệu EEG với sự mất mát hạn chế về hiệu suất thực... khai thác c y nhị phân Huffman Do tỉ lệ nén nén của nó rất gần với giới hạn nén được biểu diễn ở (3), mã hóa Huffman cũng được gọi là mã hóa entropy Kĩ thuật n y được sử dụng cho phương pháp nén dữ liệu không mất thông tin Do đó ta hoàn toàn có thể sử dụng nó như là một phương pháp điển hình cho nén tín hiệu EEG Ở đ y chúng ta sử dụng những thuật ngữ “kí tự” (symbol or character), để biểu diễn dữ liệu... việc khôi phục EEG chính xác là một y u cầu cần thiết trước tiên để thực hiện nén tốt hơn Nén dữ liệu lossless EEG đã được nghiên cứu sâu Vì v y, những thuật toán nén (đếm lặp, mã Huffman), lượng tử hóa vectơ và những kĩ thuật được sử dụng rộng rãi đã dựa trên những bộ mã dự đoán tín hiệu (những bộ dự đoán tuyến tính, khả năng cực đại, mạng nơron) đã được thực hiện và đánh giá Những bộ nén dữ liệu được... đối với tín hiệu EEG) với mức độ phức tạp tính toán thấp Bằng cách khai thác kết quả n y một sơ đồ mã hoá / giải mã (coder/decoder) nhanh, đơn giản có khả năng thực hiện thời gian thực trên PC được thực thi: 6/12/2012 - 26 - http://www.ebook.edu.vn Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Dữ liệu nguồn (EEG signal) Source binary file Compression (coding) Compressed binary file Hình 16 : data EEG in