Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 50 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
50
Dung lượng
2,63 MB
Nội dung
Nguyễn Thị Hương k49db Khóa luận tốt nghiệp LỜI MỞ ĐẦU Trong thập kỉ trước nén liệu sử dụng khắp nơi Có thể nói nén liệu trở thành yêu cầu chung cho hầu hết phần mềm ứng dụng, lĩnh vực nghiên cứu quan trọng hấp dẫn khoa học máy tính Nếu khơng có kĩ thuật nén liệu khơng có phát triển Internet, TV số, truyền thơng di động hay phát triển kĩ thuật truyền thông video Ưu điểm bật hiệu nén áp dụng phát triển nhiều lĩnh vực khác truyền thông đa phương tiện hay lĩnh vực nghiên cứu khác Thời gian gần đây, lĩnh vực phát triển nhanh ngày thu hút quan tâm nhiều người y tế từ xa (Telemedicine), mà nén đóng vai trị quan trọng Từ người chăm sóc sức khoẻ tốt cách khám, chữa bệnh từ bệnh viện giới mà không cần phải đến tận nơi Chỉ cần giao tiếp với bác sĩ qua thiết bị thu ghi phương tiện truyền thơng sau nhận kết chẩn đốn phương thức chữa bệnh bác sĩ gửi Một tín hiệu EEG quan trọng tín hiệu EEG Và báo cáo trình bày phương pháp nén sử dụng để nén tín hiệu EEG Sự cần thiết việc trình bày sau 7/5/2011 -1- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1 Nén liệu Nén liệu hay gọi mã hóa nguồn (source coding), biểu diễn thông tin liệu nguồn dạng nén Nó cơng nghệ then chốt cách mạng truyền thông đa phương tiện số nhiều thập kỉ Mục tiêu nén liệu bao gồm việc tìm thuật tốn hiệu để loại bỏ dư thừa tồn liệu Ví dụ cho xâu kí tự S, chuỗi kí tự thay ta khơng gian tích trữ nhỏ hơn? Những giải pháp cho vấn đề thuật toán nén mà xuất phát từ chuỗi kí tự thay để thu số bit toàn số bit cần biểu diễn, với thuật tốn giải nén để khơi phục lại liệu ban đầu Tuy nhiên, bit? Điều phụ thuộc vào việc lựa chọn thuật tốn mà sử dụng lượng dư thừa thơng tin tồn liệu nguồn Dữ liệu khác u cầu thuật tốn khác để nhận dư thừa loại bỏ Rõ ràng, điều khiến cho toán nén trở nên khó giải u cầu chung khó trả lời cách dễ dàng gồm nhiều trường hợp May mắn thay, đưa số ràng buộc định kết hợp với kinh nghiệm liệu mục đích sử dụng liệu để đưa thuật toán phù hợp Khi nén liệu, cần thiết phải phân tích đặc tính liệu nén hy vọng suy vài mô hình để biểu diễn nén Điều làm tăng mức độ đa dạng mơ hình liệu Do vậy, kĩ thuật biểu diễn khâu trọng tâm kĩ thuật nén Một cách cụ thể, nén liệu xem phương pháp biểu diễn hiệu nguồn liệu số văn bản, hình ảnh, âm hay dạng kết hợp tất loại ví dụ video 7/5/2011 -2- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 1: data in compression Hình 2: figure of data compression 7/5/2011 -3- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Mục đích nén liệu biểu diễn nguồn số số lượng bit gặp yêu cầu tối thiểu để khôi phục lại liệu ban đầu Lý thuyết thông tin (information theory) sử dụng nhiều nén liệu 1.2 Tín hiệu EEG (Electroencephalograph) Sự cần thiết nén liệu y sinh (Biomedical data compression) Hình 3: system 10/20 Một ứng dụng quan trọng nén liệu lĩnh vực y học Yêu cầu nén tín hiệu y-sinh ngày cao phát triển ngày đa dạng dịch vụ y tế từ xa Những ứng dụng y tế từ xa ngày dành nhiều quan tâm, nghiên cứu cung cấp truy nhập dễ dàng tới thủ tục chuẩn đoán bệnh đánh giá bệnh Cần phải truyền lượng lớn liệu y sinh thúc đẩy cần thiết việc nén liệu y sinh mà không thông tin quan trọng mang tín hiệu ghi đựơc mà dẫn tới hành động chuẩn đoán hay đánh giá bệnh sai Do đó, nghiên cứu nén tín hiệu y-sinh cần thiết Một tín hiệu y-sinh phổ biến tín hiệu điện não (EEG- Electroencephalogram) Tín hiệu EEG ghi lại hoạt động điện não nhằm phục vụ nghiên cứu não, hay chẩn đốn điều trị bệnh nhân có rối lọan não Ví dụ như, chuẩn đốn động kinh vị trí não bị tổn thương liên quan đến rối loạn này- chứng bệnh phổ biến giới Việt Nam 7/5/2011 -4- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 1.2.1 Tín hiệu EEG Những hoạt động điện vỏ não thường tín hiệu nhịp (rhythms) chúng thường dao động lặp lặp lại Sự đa dạng tín hiệu nhịp EEG vơ lớn phụ thuộc vào nhiều yếu tố trạng thái tinh thần đối tượng, mức độ kích động, trạng thái hay trạng thái ngủ Thông thường, tín hiệu ghi da đầu có biên độ nằm khoảng từ vài microvolts tới xấp xỉ 100 µV, tần số khoảng từ 0.5 đến 30-40 Hz Hình : tín hiệu nhịp EEG Tín hiệu EEG chia thành dải tần sau : Nhịp Alpha : nhịp sở não người lớn Là dạng sóng dễ nhận biết nhất, thành chuỗi sóng 8-13 Hz với biên độ 30-50 mV Hình 5: tín hiệu alpha Nhịp Beta : sóng có tần số 4-35 Hz, điện khoảng 5-30 mV Hình 6: tín hiệu Beta 7/5/2011 -5- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Nhịp Delta : sóng chậm Hz có biên độ thay đổi Hình 7: tín hiệu Delta Nhịp Theta : bao gồm sóng 4-8 Hz , thường có biên độ lớn 20 mV Hình 8: tín hiệu Theta Nhịp Gamma : có tần số > 30 Hz Đối với người lớn bình thường dải tần tín hiệu EEG nằm khoảng 0.1-100 Hz Hầu hết tín hiệu trì vài phút , có tín hiệu khác xảy vài giây, nhịp gamma Ngồi cịn có tín hiệu mà khơng xuất vào lúc Nó tín hiệu thời, đột ngột, biểu thị hoạt động mức, khơng bình thường hoạt động điện não Các gai (Spikes) biến đổi điện thống qua, nhanh, có biên độ thực cao hoạt động điện Có khoảng thời gian từ 20 – 70 ms Hình 9: Spike đơn Sóng nhọn (Sharp waves) : sóng đơn độc, có khoảng thời gian từ 70 – 200 ms Có biên độ xấp xỉ với Spikes Phức hợp sóng gai (Spike-wave complexes) : sóng phức hợp gai (spikes) theo sau sóng chậm Có tần số vào khoảng 3- Hz 7/5/2011 -6- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 10: Spike and Sharp wave Sự xuất dạng sóng hành động thần kinh sai lệch thường tìm thấy người phải trải qua động kinh Đó tín hiệu biểu bệnh lý 1.2.2 Sự cần thiết nghiên cứu nén tín hiệu y sinh Mong muốn nén liệu EEG nhiều lý do.Như biết, EEG phương pháp phổ biến giúp bác sĩ xác định vị trí ổ bệnh (khu vực phóng điện) chức phận não bệnh nhân bị tổn thương Là phương pháp hữu hiệu để phát chẩn đoán bệnh động kinh - bệnh phổ biến nguy hiểm Theo thống kê Tổ Chức Y tế Thế giới (WHO), tỉ lệ người mắc bệnh động kinh giới khoảng 0,5% dân số, thay đổi tuỳ theo quốc gia, vùng, dân tộc, Pháp Mỹ khoảng 0,85%; Canada 0,6% Tại Việt Nam khoảng 2% dân số có đến 60% số bệnh nhân trẻ em Theo BS Lê Văn Tuấn, chuyên khoa nội thần kinh BV Chợ Rẫy, TP.HCM: Động kinh biến chứng tai nạn gặp bệnh nhân lên động kinh: cắn phải lưỡi, viêm phổi hít phải dãi hay chất nơn ói; gãy xương chấn thương; tổn thương não cưoin kéo dài làm não thiếu oxy; ngừng thở tắc nghẽn đường thở… Tuy nhiên, bệnh hồn tồn điều trị phát sớm điều trị cách khả hồn tồn khỏi bệnh cao Đối với trẻ em, không điều trị kịp thời, điều trị khơng cách dẫn tới tình trạng không khống chế co giật Lâu dần, trẻ bị thiểu trí tuệ, rối loạn hành vi Những co giật làm cho hệ miễn dịch trẻ yếu đi, dễ nhiễm bệnh khác dễ tử vong trẻ bình thường Tre bị động kinh không điều trị thuốc, phác đồ nên sinh kháng thuốc Khi đó, khả hồi phục khó khăn nhiều Do việc phát kịp thời động kinh, chẩn đốn xác bệnh điều trị hợp lý vô quan trọng, cấp bách cần thiết Song bệnh viện làm điều hồn tồn phụ thuộc vào trình độ khả bác sĩ đọc điện đồ não Tín hiệu EEG ghi phức tạp ghi khơng có tín hiệu (alpha, gamma,…), xung bất thường (spike, sharp…) mà cịn có nhiều loại artifact (ECG, EMG…) Hơn việc nhận biết sóng nhịp khơng đơn giản, dễ dàng nhịp xuất phụ thuộc vào tuổi, vào trạng thái tinh thần bệnh nhân Song khắc 7/5/2011 -7- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp phục khó khăn việc gửi tín hiệu điện não EEG từ nơi không đáng tin cậy đến nơi tin cậy mà có bác sĩ giỏi, kinh nghiệm thực việc đọc ghi chẩn đoán lâm sàng Từ phát sinh yêu cầu cần thiết thực truyền hiệu tín hiệu EEG mặt vật lý lẫn hiệu kinh tế Do thực nén EEG cần thiết Hơn thực cơng việc giúp ích nhiều việc nghiên cứu tín hiệu EEG việc loại bỏ artifacts, dị tìm xung động kinh, phân loại dạng xung việc gửi ghi điện não từ bệnh viện đến nơi thực nghiên cứu Trước tiên nén để giảm thời gian truyền, giảm không gian lưu trữ, hệ thống xách tay, giảm yêu cầu nhớ hay tăng số lượng kênh dải thông Một mục đích việc làm tự động thu thập liệu EEG mà yêu cầu với đặc tính hạn chế từ trước ( luồng liệu 20 480 bps) từ bệnh viện ngoại vi hay từ nhà bệnh nhân, mà truyền qua môi trường truyền tốc độ thấp đường dây điện thoại đóng mạch hay mạng điện thoại tế bào, với phần cứng giá rẻ, mà không thiết phải có mặt bác sĩ Những thuật tốn nén liệu cho phép người bệnh thực thi hệ thống xách tay để gửi tín hiệu EEG (20 kênh, 128 Hz, 8-b), thời gian thực qua đường điện thoại với modem 14 400 bps Một y tá trực thu tín hiệu q trình thu, bác sĩ cần liên lạc với y tá qua điện thoại Vì vậy, bệnh nhân không cần gặp trực tiếp bác sỹ điều trị Dữ liệu thu thập từ nơi bệnh nhân nằm sau kết chẩn đốn, phương pháp điều trị gửi trở lại Điều dẫn đến việc giảm giá toàn bộ, việc chuyên chở bệnh nhân không cần Một động lực khác để nén liệu nhiều trường hợp lượng liệu lưu trữ vượt khả thiêt bị lưu trữ thương mại Trong trường hợp này, giá giới hạn công nghệ thiết bị lưu trữ khối có sẵn bắt buộc phải giảm tốc độ lấy mẫu từ 128 tới 64 Hz số lượng kênh ghi từ 20 kênh xuống 12 kênh, nhiên chất lượng tín hiệu chấp nhận được, kĩ thuật nén liệu EEG hữu ích đạt hiệu thương mại cao Bộ vi xử lý mà giám sát thiết bị thu EEG dành cho nén liệu phần nhỏ thời gian mẫu tín hiệu vào liên tiếp Chiều dài từ mà mã tạo từ thuật toán nén dài (những tín hiệu xảy khi), khiến liệu khả tính toán giới hạn vi xử lý Để đối phó với biến đổi A/D tốc độ liệu u cầu tính tốn thấp, kĩ thuật nén dựa vào chiều dài từ mã lớn cố định chấp nhận Từ cần thiết đó, mục tiêu đề tài nghiên cứu vài thuật tốn để tìm phương pháp nén EEG hiệu dựa yêu cầu tiêu chí đánh giá 7/5/2011 -8- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 2: LÝ THUYẾT NÉN DỮ LIỆU 2.1 Những vấn đề chung Mã chiều dài thay đổi mã mong muốn cho việc nén liệu đạt việc tiết kiệm tồn cục cách gán từ mã ngắn cho kí tự xuất thường xuyên từ mã dài cho kí tự xuất Ví dụ, cho mã chiều dài thay đổi (0, 100, 101, 110, 111) với chiều dài từ mã (1, 3, 3, 3, 3) cho bảng kí tự (A, B, C, D, E), chuỗi kí tự nguồn BAAAAAAAC với tần suất kí tự (7, 1, 1, 0, 0) Khi lượng bít trung bình u cầu là: (2.1) Việc tiết kiệm gần nửa số bit so với việc biểu diễn mã chiều dài cố định bits/symbol Một nguồn mơ hình hố bảng S = (s1, s2, …, sn) phân phối xác suất tương ứng P = (p1, p2,…,pn) Giả sử xuât phát từ mã C =(c1, c2, …, cn) với chiều dài từ mã L = (l1, l2,…, ln) Hình 11 : Code and source data 7/5/2011 -9- LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Mục tiêu cực tiểu hố chiều dài trung bình từ mã : (2.2) Do mã chiều dài thay đổi hữu ích cho việc nén liệu Tuy nhiên, mã chiều dài thay đổi trở nên vô giá trị nhận cách từ mã mã từ tin mã hố Ví dụ : Cho mã chiều dài thay đổi (0, 10, 010, 101) bảng kí tự (A, B, C, D) Một đoạn tin ‘0100101010’ giải mã nhiều cách Ví dụ ‘0100101010’ dịch ‘ 10 010 101 0’ ‘ ABCDA’ ‘010 101 010 ‘ CADC Khi khơng nhận xác liệu nguồn Một mã coi có khả giải mã có cách để giải mã tin mã hoá Một giải pháp dường khả quan cho trường hợp mã khơng phải mã có khả giải mã thêm vào kí tự phân cách mở rộng giai đoạn mã hố Ví dụ, sử dụng kí tự ‘/’, sau mã hố chuối kí tự ABCDA ‘0/10/010/101/0’ Tuy nhiên, phương pháp phải trả giá đắt kí tự mở rộng ‘/’ phải chèn vào cho từ mã Mã lý tưởng trường hợp mã mà khơng có chiều dài thay đổi mà cịn có đặc tính tự phân cách Một loại gọi mã tiền tố (prefix code) mã “Tiền tố” vài bit từ mã Khi hai từ mã có chiều dài khác nhau, từ mã ngắn giống hệt với vài bít từ mã dài Một mã tiền tố (prefix code) mã khơng từ mã tiền tố từ mã nào, hay từ mã mà xuất phát từ từ mã khác cách cộng thêm vào sau vài bit từ từ mã ngắn Hình 12 : A Prefix code 7/5/2011 - 10 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Markov có nghĩa là, cho trước trạng thái tại, trạng thái tương lai độc lập với trạng thái q khứ Nói cách khác, mơ tả trạng thái nắm bắt đầy đủ tất thơng tin mà ảnh hưởng đến tiến trình tương lai trình Tiến đến trạng thái tương lai thơng qua q trình xác suất thay cho q trình tất định Tức là, biết tại, khơng điều xảy q khứ ảnh hưởng hay xác định kết cục tương lai, tương lai tất điều Về mặt tốn học, q trình Markov biểu diễn cho giá trị n t1 < t2 < t3, P(x (tn) xn / x(t) t tn-1) = P(x(tn) xn / x(tn-1)) (3.11) Thông thường, thuật ngữ chuỗi Markov (Markov chain) sử dụng để nói đến q trình Markov thời gian rời rạc Chuỗi Markov chuỗi biến ngẫu nhiên X1, X2, X3, có tính chất Markov Ta có công thức : Pr(Xn+1 = x|Xn = xn, …, X1 = x1) = Pr(Xn+1 = x|Xn = xn) (3.12) Những giá trị Xi hình thành tập đếm S gọi không gian trạng thái chuỗi Cho chuỗi {xn} Chuỗi gọi theo mơ hình Markov bậc k : P(xn / xn-1,…,xn-k) = P(xn / xn-1, …, xn-k, ) (3.13) Nói cách khác, biết k mẫu khứ biết toàn lịch sử khứ trình Nếu kích thước bảng nguồn l, số trạng thái lk Mơ hình Markov sử dụng phổ biến mơ hình Markov bậc nhất, P(xn / xn-1) = P(xn / xn-1, xn-2, xn-3,…) (3.14) Phưong trình (3.13) (3.14) biểu thị tồn phụ thuộc mẫu Tuy nhiên, chúng khơng mơ tả dạng phụ thuộc Chúng ta phát triển mơ hình Markov bậc (first-order Markov) khác tuỳ thuộc vào giả thiết dạng phụ thuộc mẫu Bộ dự đoán biểu diễn hình 19 thực thi giả thiết tín hiệu có tính chất Markov tạo nguồn mơ hình chuỗi Markov Một chuỗi Markov bậc sử dụng để mơ hình tín hiệu; u cầu ước lượng tất xác suất điều kiện P[Xn = / Xn-1 = aj], Xn biến ngẫu nhiên rời rạc lấy giá trị bảng chữ hữu hạn A = {a1, …, aM} Những xác suất xấp xỉ với tần suất có sẵn tập huấn luyện đủ lớn Một ma trận tần suất, mà thành phần Fij đếm xảy X n = Xn-1 = aj, xuất 7/5/2011 - 36 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp phát từ tập huấn luyện (training set) bao gồm 96 mẫu EEG; tập kiểm tra khác bao gồm 58 mẫu EEG sử dụng để đánh giá Ma trận Fij tương đương với phân bố xác suất kết hợp Xn Xn-1 sử dụng (3.15) để ước lượng xác suất điều kiện ij = P[Xn = / Xn-1 = aj] ij Fij k Fij (3.15) Sau ước lượng cho kí tự kí tự aj cách sử dụng phương pháp tối thiểu hố sai số bình phương trung bình Succ (aj) = k k với aj A (12) (3.16) kj Do liệu lượng tử b, có 256 kí tự tạo ma trận tần suất 256256; chứng thực nghiệm chứng tỏ : tập kiểm tra, khác ma trận đơn vị (identity function)và kí tự kí tự 0….255, tính tốn theo (3.16) thuộc khoảng từ -3 tới +3, biểu thị ước lượng Markov (Markovian estimate) nhìn chung gần với ma trận đơn vị (identity function) 3.1.1.4.2 Bộ dự đoán lọc số Có thể thiết kế lọc dự đốn tuyến tính số cho tín hiệu EEG sử dụng theo sơ đồ dự đốn hình 19 Hãy xem xét lọc số mô tả phương trình sai phân en = xn – b1xn-1 – b2xn-2 - … - bNxn-N (3.17) Trong dự đốn hình 19 biểu diễn phương trình sau sử dụng tập hợp hệ số giống {b1…bN} yn = b1xn-1 + b2xn-2 + … + bNxn-N (3.18) Có thể thu tín hiệu lỗi (error signal) entropy thấp en cách tối thiểu hóa sai số bình phương tổng: E= e (3.19) n n 7/5/2011 - 37 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Với quy ước sau : t b = [b1…bN] _ t x = [xn-1…x n-N] (3.20) Bộ dự đốn tuyến tính sai số bình phương trung bình tối thiểu dạng x = b t x cho nghiệm b phưong trình t b R x = E[xn x t] (3.21) R x ma trận tương quan trình xn Thực tế, hàm tự tương quan thật thu ước lượng từ việc sử dụng tập hợp mẫu 3.1.1.4.3 Dự đốn tuyến tính thích nghi Hai dự đốn tuyến tính thích nghi dự đốn tuyến tính thích nghi dấu (the sign adaptive linear predictor) dự đốn tuyến tính thích nghi bình phương trung bình tối thiểu (the least mean square adaptive linear predictor) Những hệ số dự đoán (3.18) xem hàm phụ thuộc thời gian, có khả thích nghi với hành vi tín hiệu (signal behavior) Thuật tốn bình phương trung bình tối thiểu cập nhật hệ số dự đốn theo phương trình bi(n) = bi(n-1) + xn-1en (3.22) trọng số tốc độ thích nghi, en sai số dự đốn thời điểm n Những hệ số dự đoán thuật tốn thích nghi dấu cập nhật theo phương trình: bi(n) = bi(n-1) + xn-1sgn (en) (3.23) trọng số tốc độ thích nghi, sgn (en) lấy giá trị +1 hay -1 tuỳ theo dấu sai số dự đoán Tuy nhiên việc lựa chọn giá trị phải có giới hạn vì: lựa chọn giá trị thấp dẫn tới việc thích nghi khơng đủ, cịn lựa chọn giá trị cao khiến cho hệ thống khơng ổn định 7/5/2011 - 38 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 3.1.1.4 Phương pháp nén biến đổi (Transformation compression) Một chuỗi N mẫu tín hiệu xem điểm X khơng gian N chiều Có thể biểu diễn X hiệu cách áp dụng phép biến đổi trực giao Y = TX, Y biểu thị vectơ biến đổi T biểu thị ma trận biến đổi Mục tiêu lựa chọn chuỗi Y gồm M thành phần, M nhỏ N (vẫn (NM) thành phần bị loại bỏ) dẫn đến nén Bằng cách mã hoá Huffman khác tín hiệu nguồn tín hiệu khơi phục từ M thành phần kia, kĩ thuật lại trở thành mã hố khơng thơng tin, khơi phục lại xác từ M thành phần sai khác Có thể chứng minh biến đổi Karhunen-Loeve (KLT) phương pháp tối ưu để biểu diễn tín hiệu giới hạn sai số bình phương trung bình Nhược điểm việc sử dụng KLT thời gian tính tốn đáng kể Phép biến đổi cosin rời rạc (the discrete cosine transform (DCT)), với tính chất nén lượng mạnh có nghĩa là: hầu hết thơng tin tín hiệu hướng đến tập trung vài thành phần tần số thấp DCT, giải pháp kề tối ưu với thuận lợi tính tốn, thực tế, có tồn thuật tốn nhanh Phép biến đổi cho vectơ lối vào thực trở nên đáng quan tâm mục đích sử dụng để nén tín hiệu EEG Hình 20: Phổ EEG trung bình tính DCT Đỉnh 10 Hz tín hiệu alpha, đỉnh 50 Hz đỉnh dịng điện nguồn Hình 20 biểu diễn phổ trung bình EEG tính DCT tồn Một số lượng đáng kể công suất phổ định vị tần số thấp, nhiên mức độ giảm phổ khơng cao Vì vậy, tỉ lệ nén dựa vào DCT không mong đợi cao 7/5/2011 - 39 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp thành phần bị loại bỏ phát sinh lỗi nghiêm trọng Một điều cần phải ý đỉnh phổ vị trí 10 Hz, tương ứng dạng sóng EEG quan trọng nhất, sóng alpha, thuộc phạm vi từ đến 13 Hz Một đỉnh thứ hai 50 Hz biểu diễn nhiễu mạng điện lưới loại bỏ lọc North số trước nhìn thấy Do thành phần quan trọng mặt sinh học nằm 20 Hz, tương ứng với 50 256 thành phần, nên 50 thành phần DCT giữ lại trình nén 3.1.2 Giới thiệu phương pháp nén EEG khác 3.2 Những đặc trưng tín hiệu EEG Những phương pháp trình bày gần không sử dụng thông tin EEG Một điều chắn sử dụng thông tin phụ thuộc miền tín hiệu quan trọng cung cấp chiến lược nén tốt Tín hiệu EEG có tương quan khơng gian thời gian mà ta khai thác để thiết kế chiến lược nén hiệu Về tương quan không gian, vài kĩ thuật sử dụng lượng tử hố vectơ (vector quantization) phân tích chuỗi thời gian đa biến Chúng ta khai thác kĩ thuật lượng tử hố vector cách ánh xạ vectơ bao gồm mẫu kênh lối vào tới vectơ mã, mã hoá với vectơ lỗi Sự tương quan thời gian nghiên cứu đưa kết biểu diễn đồ thị sau : Hình 21: Sự tương quan thời gian trung bình tín hiệu EEG 7/5/2011 - 40 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Sử dụng hiểu biết vào việc nén cách điều chỉnh phương pháp nén thông thường biểu diễn hình 19 bổ sung số lối vào trễ cho dự đoán 3.2.1 Nén dự đoán với lối vào trễ Ở hình 21 biểu diễn tương quan thời gian trung bình tính tốn tập huấn luyện tín hiệu EEG Nhận thấy rõ ràng tương quan thời gian không tồn mẫu gần nhau, mà mẫu có độ trễ khoảng 12 mẫu Mức cực đại thu cho độ trễ 12 mẫu tương ứng khoảng 10.6 Hz Điều giải thích mặt sinh học sau: thực tế, sóng alpha, dạng sóng đặc trưng cho tín hiệu EEG bình thường, thuộc dải từ – 13 Hz Để lợi dụng ưu điểm đỉnh tương quan sóng alpha điều chỉnh (3.11) để tính tốn đến khoảng trễ dài Đặt N = {k| k } xác định lân cận độ trễ cho (3.11) viết lại sau: en = xn – f(xn-1, , xn-N, xn-, ,xn-) (3.24) Giá trị tương quan từ hình 21 gợi ý chọn N = 5, = 10 = 15 cung cấp cho dự đoán mẫu khứ tương quan Thực tế, kết thực nghiệm cho thấy N - chọn thấp mà không giảm hiệu suất dự đoán, điều làm cho đơn giản nhanh Kết chọn N = 2, = 12, = 13 3.2.2 Lượng tử hố vectơ tín hiệu EEG Trong lượng tử hố vectơ nhóm lối nguồn thành khối hay vectơ Ví dụ coi L mẫu liên tiếp tín hiệu thành phần vectơ N chiều Vectơ lối nguồn tạo thành lối vào lượng tử hoá vectơ Tại mã hoá giải mã lượng tử vectơ, có tậ hợp vectơ N-chiều gọi sách mã (codebook) lượng tử Những vectơ sách mã này, hiểu vectơ mã (code-vectơ), lựa chọn làm biểu diễn vectơ tín hiệu tạo từ lối nguồn Mỗi vectơ mã gán số nhị phân Tại mã hoá, vecơt lối vào so sánh với vectơ mã để tìm vectơ mã gần với vectơ lối vào Những thành phần vectơ mã giá trị lượng tử lối nguồn Để cho giải mã biết vectơ mã tìm thấy gần với vectơ lối vào nhất, truyền hay lưu trữ số nhị phân vectơ-mã Do giải mã có sách mã giống hệt mã, nên khơi phục lại vectơ mã cho số nhị phân Biểu diễn q trình sơ đồ trực quan sau: 7/5/2011 - 41 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Source output Group into vectors Khóa luận tốt nghiệp Encoder Decoder Find closest codevector codebook … Unblock Table lookup index x index reconstruction codebook Hình 22: Thủ tục lượng tử hố vectơ Diễn đạt theo cách khác lượng tử hố vectơ k chiều kích thước N phép ánh xạ Q từ vectơ k chiều, không gian Ơclit Rk, vào tập hữu hạn C bao gồm N lối hay điểm mô phỏng, gọi mã vectơ hay từ mã Q: Rk C C = {y(1), y(2), y(N)} y(i) Rk i {1, 2, …, N} Tập C gọi sách mã hay đơn giản mã Áp dụng phương pháp cho tín hiệu EEG cách tính toán vectơ kênh lối vào cách xây dựng sách mã cho tập vectơ Có biến đổi nhỏ tính tốn đạo hàm thay cho giá trị kênh đạo hàm EEG gần khơng Vì vậy, với sách mã nhau, thu méo trung bình thấp 7/5/2011 - 42 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp CHƯƠNG 4: MƠ PHỎNG 4.1 Mã Huffman Sau mơ thuật tốn Huffman truyền thống với chiều dài từ mã không cố định tức kí tự nguồn nguồn có từ mã riêng Thủ tục xây dựng mã dựa vào xác suất kí tự nguồn hồn tồn giống trình bày Hình 23 : tín hiệu nguồn tín hiệu khơi phục sau nén giải nén phương pháp mã Huffman 7/5/2011 - 43 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 24 : tín hiệu lỗi tín hiệu nguồn tín hiệu giải nén Kết quả: Name Size Bytes Class T ans compr_data data decom_data 1x18432 32x1 1x38568 1x147456 1x147456 147456 147456 38568 147456 147456 double array double array uint8 array uint8 array uint8 array info recov_data 1x1 1x18432 1872 147456 struct array double array Grand total is 388886 elements using 777720 bytes tỉ lệ nén = 0.2616 hệ số nén = 3.8233 phần trăm tiết kiệm = 73.84% 7/5/2011 - 44 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Nhận thấy nén tín hiệu EEG sử dụng mã Huffman hiệu quả: hệ số nén tương đối 4, phần trăm tiết kiệm cao 73.84%, mức độ phức tạp tính tốn thấp, quan trọng cho phép khơi phục lại hồn tồn xác tín hiệu ban đầu Nên yêu cầu đảm bảo thông tin xác mang tín hiệu EEG ghi từ bệnh nhân để khơng gây sai sót việc chẩn đoán kết luận lâm sàng bệnh nhân, bác sĩ hồn tồn tin tưởng vào phương pháp nén Đối với thiết bị lưu trữ tính tốn ngày nay, phương pháp tỏ hiệu 4.2 Biến đổi DCT Mô tả khái quát phương pháp sử dụng DCT transform: B1:Coi tín hiệu EEG vào : data B2: Bước biến đổi DCT tín hiệu vào : DCT_data B3: Giữ lại N phần tử để gửi đi, loại bỏ K phần tử lại B4: biến đổi DCT ngược liệu [N K]; K gồm K số :gọi recov_data B5: tính lỗi tín hiệu thật DCT ngược : err=data-recov_data B6: Lượng tử hố lỗi này, sau sử dụng Huffman coding để nén truyền sai số Ở bên nhận thực B4 sau lấy kết cộng với lỗi nhận để khôi phục lại liệu ban đầu Kết mô phỏng: Hình 25 : tín hiệu nguồn sau khơi phục 7/5/2011 - 45 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp Hình 26 : tín hiệu lỗi tỉ lệ nén = 0.3336 phần trăm tiết kiệm = 66.64% Nhận thấy sử dụng biến đổi DCT để nén EEG đạt kết tương đối Mặc dù sai số tín hiệu khơi phục tín hiệu ban đầu nhỏ, song xảy xác suất gây lỗi chẩn đốn Hơn hiệu nén khơng cao Huffman Tuy nhiên cho phép mức độ tính tốn đơn giản Một vấn đề khó giải chút q trình mơ việc lượng tử hoá lỗi Khi lấy hệ số N cao sai số tín hiệu nguồn tín hiệu khơi phục khơng lớn Nên ta sử dụng số bit để biểu diễn lỗi Trong Matlab liệu xử lý nhỏ bit, điều khiến cho việc mô trường hợp không bộc lộ hết hiệu mà tiềm thực Từ rút nhận xét : tuỳ thuộc vào thiết bị phần cứng tốc độ xử lý khả lưu trữ mà lựa chọn phương pháp cho phù hợp Người ta cho rằng, phương pháp nén không thông tin không giành nhiều quan 7/5/2011 - 46 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp tâm cho hiệu nén không cao, mà người ta tập trung nghiên cứu phương pháp nén thông tin để đạt hiệu nén cao Song tín hiệu EEG đặc biệt cần thiết u cầu khả khơi phục lại hồn toàn liệu đựơc ghi ban đầu, nên sử dụng phương pháp nén thông tin cách phải biến loại khơng liệu (ví dụ nén lỗi gửi lỗi phương pháp biến đổi DCT trên) Khi hiệu nén cần phải xem xét kĩ, tuỳ vào trường hợp mà lựa chọn phương pháp Có lẽ điều đáng quan tâm mức độ phức tạp tính tốn? 7/5/2011 - 47 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp TÀI LIỆU THAM KHẢO [1] Guiliano Antoniol and Paolo Tonella.” EEG data compression techniques” IRST, trento, Italy, Tech Rep 9508-03, 1997 [2] G.Nave and A Cohen, “ECG compression using long-term prediction” IEEE trans Biomed Eng., Vol 40, no 9, pp 877-885, Sept 1993 [3] Ida Mengyi Pu.” fundamental data compression”.Nxb Elsevier.,2006 [4] J Markel and A Grey Linear Prediction of speech New york: Springer-Verlag, 1976 [5] Khalid Sayood ”Introduction to data compression”, third edition., Nxb Elseveer., 2006 [6] Leif Sörnmo and Pablo Laguna “Bioelectrical signal processing in cardiac and neurological applications” tr.3-161 [7] Peyton Z Peebles, Jr., Ph.D.” Probability, Random variables, and random signal principles” [8] PGS.TS Nguyễn Bình.” Lý thuyết thơng tin” tr 3-63 [9] Trần Mạnh Tuấn.” Xác suất & thống kê lý thuyết thực hành tính tốn” Nxb ĐHQGHN IV/2004 [10] Website : www.datacompression.com 7/5/2011 - 48 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp MỤC LỤC NỘI DUNG LỜI MỞ ĐẦU CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1 Nén liệu 1.2 Tín hiệu EEG (Electroencephalograph) Sự cần thiết nén liệu y sinh (Biomedical data compression) 1.2.1 Tín hiệu EEG 1.2.2 Sự cần thiết nghiên cứu nén tín hiệu y sinh CHƯƠNG 2: LÝ THUYẾT NÉN DỮ LIỆU 2.1 Những vấn đề chung 2.2 Lý thuyết thông tin 11 2.2.1 Khái niệm thông tin 11 2.2.2.2.Giới thiệu lý thuyết thông tin 12 2.3 Các phương pháp nén liệu 15 2.3.1 Các phương pháp nén không thông tin 15 2.3.1.1 Mã Huffman 15 2.3.1.2 Mã số học 19 2.3.1.3.Kĩ thuật từ điển 22 2.3.1.4 Phương pháp nén dựa vào ngữ cảnh (context-based compression) 23 1.4 Đo chất lượng nén 25 CHƯƠNG 3: NÉN TÍN HIỆU EEG 26 3.1 Các phương pháp sử dụng để nén EEG 26 3.1.1 Các phương pháp nén không thông tin (lossless compression) 26 3.1.1.1 Giới thiệu phương pháp nén 26 3.1.1.2 Phương pháp mã Huffman 31 3.1.1.3 Nén đếm lặp 33 7/5/2011 - 49 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Nguyễn Thị Hương k49db Khóa luận tốt nghiệp 3.1.1.4 Kĩ thuật nén dự đoán (preditive compression techniques) 35 3.1.1.4.2 Bộ dự đoán lọc số 37 3.1.1.4.3 Dự đoán tuyến tính thích nghi 38 3.1.1.4 Phương pháp nén biến đổi (Transformation compression) 39 3.1.2 Giới thiệu phương pháp nén EEG khác 40 3.2 Những đặc trưng tín hiệu EEG 40 3.2.1 Nén dự đoán với lối vào trễ 41 3.2.2 Lượng tử hoá vectơ tín hiệu EEG 41 CHƯƠNG 4: MÔ PHỎNG 43 4.1 Mã Huffman 43 4.2 Biến đổi DCT 45 TÀI LIỆU THAM KHẢO 48 7/5/2011 - 50 - LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... bình thường dải tần tín hiệu EEG nằm khoảng 0.1-100 Hz Hầu hết tín hiệu trì vài phút , có tín hiệu khác xảy vài giây, nhịp gamma Ngồi cịn có tín hiệu mà khơng xuất vào lúc Nó tín hiệu thời, đột ngột,... Hương k49db Khóa luận tốt nghiệp 1.2.1 Tín hiệu EEG Những hoạt động điện vỏ não thường tín hiệu nhịp (rhythms) chúng thường dao động lặp lặp lại Sự đa dạng tín hiệu nhịp EEG vơ lớn phụ thuộc vào... trọng mang tín hiệu ghi đựơc mà dẫn tới hành động chuẩn đoán hay đánh giá bệnh sai Do đó, nghiên cứu nén tín hiệu y-sinh cần thiết Một tín hiệu y-sinh phổ biến tín hiệu điện não (EEG- Electroencephalogram)