Để hiểu rõ bản chất cũng nhƣ tính năng của EMD, ta xét quá trình phân tích của EMD trên tín hiệu là thành phần một chiều. EMD đã đƣợc phát triển từ lâu kết hợp với phổ Hilbert (Hilbert spectrum-HS) trong việc phân tích tín hiệu thành các hàm nội IMF, cung cấp thông tìn về tần số của tín hiệu trong miền thời gian và các kiểu dao dộng trong các scale thời gian nội.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU (3.1) (3.2) ( ) ( ) ( ) Trong đó ( ) ∫ ( )
Với P là Cauchy principle value.
→ ( ) ( ) ( ) với ( ) √ ( ) ( ) và pha ( ) ( ( ) ( ))
Tần số tức thời đƣợc định nghĩa ( ( ))
( ) . Sau khi phân giải tín hiệu thành các IMFs
bằng phƣơng pháp EMD, vẫn duy trì đƣợc các đặc tính nội trong miền thời gian của tín hiệu, từ đó có thể tách thông tin nội trong miền tần số với biến đổi Hilbert dƣới dạng biên độ và tần số tức thời tƣơng ứng với thời gian của chúng.
Hình 3.2: Phổ Hilbert của IMF1 của tín hiệu, X-Y là thang thời gian và tần số, thanh cường độ màu tương ứng với biên độ tức thời.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
(3.3)
3.1.2.2 Giải thuật thực hiện EMD
Hầu hết tất cả các dữ liệu đều không phải là các IMFs, tại bất kỳ thời gian nào đƣợc đƣa ra thì dữ liệu có thể chứa trong nó nhiều hơn hai kiểu dao động, do đó một biến đổi Hilbert đơn giản không thể cung cấp đầy đủ sự mô tả nội dung tần số cho toàn dữ liệu. Ta phải phân giải dữ liệu thành các thành phần IMFs, phƣơng pháp EMD phân tách các thành phần tần số của tín hiệu trong các scale thời gian thành các IMFs. Sau khi thành phần tần số cao nhất của tín hiệu đƣợc tách ra, thì quá trình tƣơng tự đƣợc áp dụng cho phần tín hiệu còn lại (phần dƣ) để tách thành phần tần số cao nhất còn chứa trong phần dƣ đó, tín hiệu còn lại này đƣợc xem nhƣ một tín hiệu ngõ vào mới. Việc phân giải của EMD dựa trên các điều kiện sau:
Tín hiệu phải có ít nhất một cặp cực trị
Time scale đƣợc định nghĩa là khoảng thời gian giữa hai cực trị liên tiếp
Nếu nhƣ không có cực trị mà chỉ có một điểm uốn, thì tín hiệu có thể đƣợc lấy đạo hàm để xác định cực trị. Kết quả cuối cùng đạt đƣợc bằng sự kết hợp của các thành phần.
Đặc trƣng chủ yếu của phƣơng pháp này là xác định các kiểu dao động dựa trên các đặc tính scale thời gian trong dữ liệu một cách thực nghiệm. Nói cách khác, tín hiệu sẽ đƣợc phân giải một cách tuần tự từ thành phần tần số cao nhất, tƣơng ứng với IMF đầu tiên, cho đến thành phần tần số thấp nhất và phần còn dƣ của tín hiệu.
( ) ∑ ( ) ( )
3.1.2.3 Quá trình lựa chọn trong phân giải tín hiệu hay dữ liệu bằng EMD
Dựa trên sự thuận lợi trong định nghĩa IMF, phƣơng thức phân giải chỉ đơn giản là sử dụng các đƣờng bao đƣợc xác định bởi các cực đại và cực tiểu nội một cách riêng biệt,
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
Đối với việc xác định IMF đầu tiên, dữ liệu ngõ vào chính là , trị trung bình của các đƣờng bao là sẽ bị trừ với ta có thành phần đầu tiên ,
( )
sẽ đƣợc xem xét có đƣợc chọn là IMF hay không dựa trên các điều kiện về tính chất của một IMF, nếu không quá trình trên sẽ đƣợc lặp lại với tín hiệu đầu vào chính là và chính là trị trung bình của các đƣờng bao tạo từ .
Quá trình chọn lựa tiếp tục cho đến khi thành phần dƣ là một hàm đơn điệu và không thể tách ra dc nữa, thì tìm đƣợc IMF đầu tiên
( )
IMF đầu tiên tìm đƣợc là ,
Quá trình lựa chọn trên làm giảm các búp sóng chồng lên nhau và làm cho tín hiệu trở nên đối xứng.
3.1.2.4 Chuẩn ngừng cho quá trình lựa chọn
Quá trình chọn lọc dựa trên việc xác định đƣờng bao và dùng cubic spline sẽ làm cho các thành phần biên độ không đều trở nên mịn hơn. Nhƣng nếu quá trình lặp của việc chọn lọc quá lâu sẽ làm mất đi trị trung bình vật lý của các biến điệu biên độ và IMF nhận đƣợc sẽ chứa thành phần hằng số về biên độ (DC). Do đó, để duy trì trị trung bình vật lý của một IMF, trong quá trình điều chế biên độ và tần số, ta đƣa ra thông số về độ lệch chuẩn dựa trên chuẩn ngừng (mức ngƣỡng dừng). Độ lệch chuẩn SD
(standard deviation) đƣợc tính toán từ hai kết quả chọn lọc liên tiếp và nếu SD nằm (3.4)
(3.5)
(3.6)
(3.7)
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
dƣới mức ngƣỡng quy định thì quá trình sẽ dừng lại, IMF đƣợc xác định, mức ngƣỡng thƣờng nằm trong khoảng 0.05 và 0.75.
∑ [| ( ) |
( )
]
IMF tiếp theo sẽ đƣợc xác định dựa trên tín hiệu vào là , quá trình thực hiện tƣơng tự cho đến khi thành phần còn lại quá nhỏ để phân tách tiếp hoặc dựa trên chuẩn ngừng SD
Tín hiệu khôi phục dựa trên mối liên hệ,
̂( ) ∑ (3.9) (3.10) (3.11) (3.12)
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
Hình 3.3: a-Dữ liệu gốc; b-Dữ liệu là đường liền nét mảnh với các đường bao trên và đường bao dưới là đường nét đứt, đường bao trung bình là đường liền nét đậm; c-
Phần còn lại sau khi trừ dữ liệu với trị trung bình.
Khoảng giữa của hai điểm 4.5 và 4.6 trên hình 3.3a tồn tại điểm uốn (điểm lồi), sau lần thứ nhất của quá trình lựa chọn, điểm lồi đó trở thành cực đại nội ở tại cùng vị trí thời gian nhƣ trong hình 3.3c. Cực trị mới đƣợc tạo ra theo cách này thực sự tái tạo lại các
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
mode bị mất trƣớc đó trong lần kiểm tra đầu tiên. Thực vậy, quá trình lựa chọn có thể khôi phục lại các sóng chồng lấn với biên độ thấp.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
dựa trên việc xác định các cực trị (thành phần tần số cao và tần số thấp của ảnh), và IMF kế tiếp đƣợc xác định dựa trên thành phần dƣ của IMF trƣớc đó, nên ta nhận thấy rằng, các IMFs đầu sẽ chứa các thành phần đƣờng nét, cạnh nổi bật của ảnh (chứa thông tin chi tiết) nhiều hơn, và các IMFs sau chỉ chứa thành phần nền của ảnh hay các đƣờng nét không rõ ràng.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
Hình 3.7: Các IMF từ 10 đến 15
3.1.4 Lọc ảnh dựa trên EMD
Nếu nhƣ ảnh có chứa nhiễu, thì quá trình chọn lọc của EMD sẽ phân tách thành phần tần số cao nhất trong mode 1 gần nhƣ tƣơng ứng với nhiễu. Thông tin của nhiễu đƣợc chứa trong mode đầu tiên và phần ảnh còn dƣ, ngƣợc lại các thành phần chính của ảnh chỉ chứa trong thành phần dƣ.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
Hình 3.8: Hình võng mạc mắt, tương ứng với các mode sau khi phân giải.
Chính vì thế, sau khi phân giải ảnh thành các mode (IMFs), việc lọc nhiễu đƣợc thực hiện một cách dễ dàng bằng cách trừ ảnh gốc với một hay một vài mode đầu, phần dƣ chính là ảnh sau khi lọc.
3.1.5 Sự gián đoạn của tín hiệu (Intermittence)
Tín hiệu hay dữ liệu luôn có sự can thiệp của nhiễu, hơn nữa hầu hết dữ liệu không có tính ổn định, đây chính là nguyên nhân gây ra sự gián đoạn của dữ liệu trong các scale
thời gian. Sự gián đoạn là nguyên nhân gây ra hiện tƣợng mode mixing (scale mixing),
nghĩa là trong một IMF tồn tại các kiểu dao động khác nhau, hay cùng một kiểu dao động mà tồn tại trong hai IMF, và hậu quả của nó là aliaxing và mất đi trị trung bình vật lý của tín hiệu.
Huang et al. (2003) đã giải quyết hiện tƣợng trên bằng cách giới hạn kích thƣớc của các scale. Một cách rõ ràng hơn thì đó chính là việc xem xét khoảng cách giới hạn của các cực đại liên tiếp trong một IMF, do đó, IMF chỉ kết hợp các sóng mà khoảng cách của các cực đại liên tiếp nằm trong giới hạn cho phép của chúng. Thực hiện tƣơng tự đối với chiều dài của các zero-crossings để hạn chế ảnh hƣởng của vấn đề gián đoạn trong tín hiệu.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
( ) { ( ) ( )
( )
Hình 3.9: Biểu diễn tín hiệu x(t) với , và các IMFs tương ứng.
IMF đầu tiên chứa thành phần scale tần số xuất hiện trong IMF thứ 2 giữa khoảng 1/30
và 2/30, do đó kết quả IMF xuất hiện mode mixing.
Với phƣơng pháp của Huang et al. (1998, 2003), các thành phần sóng mà khoảng cách của các zero-crossings lớn hơn 0.0007 trong IMF đầu tiên của x(t) sẽ bị loại đi trong quá trình phân giải. Dựa vào biểu đồ dƣới đây có thể chọn đƣợc khoảng cách thích hợp, loại bỏ các sóng có tần số thấp hơn trong IMF đầu tiên.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
Hình 3.10: Biểu đồ của quá trình phân hủy.
Sau khi xử lý hiện tƣợng gián đoạn thích hợp, kết quả của IMFs,
Hình 3.11: Phân giải tín hiệu x(t) thành hai IMFs sau khỉ xử lý thành phần gián đoạn.
3.2 Thực nghiệm phân hủy theo hai chiều BEMD
Có rất nhiều nghiên cứu phát triển EMD theo hai chiều (BEMD) và xa hơn nữa là đa chiều, và hƣớng xử lý đều áp dụng EMD trên từng chiều, sau đó kết hợp các IMF tƣơng ứng để thu đƣợc IMF cuối cùng của ảnh phân giải. Hầu hết các nghiên cứu về
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 3 THỰC NGHIỆM PHÂN HỦY THEO HAI CHIỀU
(3.14)
(3.15)
(3.16)
(3.17) lƣợng tính toán lớn và phụ thuộc rất lớn vào kích thƣớc của ma trận (kích thƣớc ảnh). Và BEMD không tránh khỏi hiện tƣợng mode mixing (scale mixing) và đây là khó khăn lớn nhất đối với BEMD và EMD.
Giả sử dữ liệu trong miền không gian- thời gian f( ⃗,t)
f(m,n)=(
)
Trong đó mỗi cột sẽ đƣợc xem nhƣ là dữ liệu ngõ vào của biến đổi EMD,
( ) (
)
Mỗi cột của dữ liệu gốc sau khi biến đổi EMD sẽ tạo ra một loạt các IMFs,
( ) ∑ ( ) ∑ ( )
Sau khi tất cả các cột của dữ liệu gốc đƣợc phân giải, ta sắp xếp lại các ngõ ra thành J ma trận, với ma trận thứ J, ( ) ( )
Theo cách này, ta đạt đƣợc J thành phần (ma trận) từ tín hiệu ban đầu f(m,n).
Hình (4.7) là kết quả phân giải theo phƣơng pháp BEMD theo chiều dọc và theo chiều ngang. Kết quả cho thấy việc phân giải theo hai chiều sẽ cho kết quả khác nhau, đặc biệt là một số cạnh nét nổi bật của ảnh mà phân giải theo chiều dọc thì thấy rõ ràng nhƣng phân giải theo chiều ngang thì không có và ngƣợc lại.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 4 TẬP HỢP CÁC THỰC NGHIỆM PHÂN HỦY …
CHƢƠNG 4
TẬP HỢP CÁC THỰC NGHIỆM PHÂN HỦY VỚI SỰ TRỢ GIÚP CỦA NHIỄU
(Noise-assisted data analysis method Ensemble-EMD)
4.1 Ensemble- Empirical mode decomposition (EEMD)
4.1.1 Mode mixing và giới hạn của phƣơng pháp kiểm tra sự gián đoạn
EMD có ƣu thế lớn đối với các tín hiệu không tuyến tính, không ổn định và là phƣơng pháp thích nghi cao. Tuy nhiên, một trong các hạn chế chính của EMD là sự xuất hiện thƣờng xuyên của hiện tƣợng mode mixing. Nhƣ định nghĩa ở trên, Mode mixing đƣợc định nghĩa nhƣ một IMF mà trong đó có chứa các thành phần scale với độ rộng khác nhau, hay cùng một dạng scale mà xuất hiện trong các IMFs khác nhau. Mode mixing
là kết quả của sự gián đoạn trong tín hiệu. Nhƣ trình bày ở trên, Huang et al. (1998 and 1999) đã chỉ ra rằng sự gián đoạn không chỉ gây ra hiện tƣợng aliasing mà còn làm cho một IMF riêng rẽ mất đi trị trung bình vật lý của nó. Và Huang et al. đã đƣa ra phƣơng pháp kiểm tra sự gián đoạn và loại bỏ một số thành phần tần số mà nằm ngoài giới hạn khoảng cách cho phép giữa các cực trị của nó, tuy nhiên chính phƣơng pháp này có một số vấn đề xuất pháp từ giải thuật của nó, đầu tiên là việc kiểm tra sự gián đoạn dựa trên việc lựa chọn scale một cách chủ quan, với sự can thiệp chủ quan này, EMD mất dần đi tính thích nghi tổng quát của nó; thứ hai là việc lựa chọn các scale
chỉ thực hiện nếu các scale thời gian của dữ liệu đƣợc xác định một cách rõ ràng và riêng biệt.
4.1.2 Ensemble- Empirical Mode Decomposition (EEMD)
EEMD đƣợc giới thiệu nhằm cải thiện EMD, đây là phƣơng pháp thực hiện quá trình lựa chọn trên tập hợp các tín hiệu chứa nhiễu mà đƣợc tạo ra từ tín hiệu ban đầu cộng với chuỗi nhiễu trắng (hay nhiễu Gaussian) với các hệ số khác nhau, do đó, mỗi IMF
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 4 TẬP HỢP CÁC THỰC NGHIỆM PHÂN HỦY …
(4.1)
(4.2)
EEMD đơn giản chỉ là phƣơng pháp dựa trên EMD với sự trợ giúp của nhiễu trắng với số lần thử đủ lớn. Nhiễu trắng đƣợc thêm vào sẽ phần bố đều trong toàn bộ miền thời gian- tần số của tín hiệu, Nhƣ đã nói phần trƣớc, EMD khi đƣợc thêm nhiễu trắng sẽ hoạt động nhƣ một cặp bộ hiệu quả trong việc tách các thành phần cấu trúc của các
scale khác nhau nhƣ một cặp bộ lọc thích nghi. Các scale sẽ tự động ƣớc lƣợng vào các scale tham khảo đƣợc tạo ra bởi nền nhiễu trắng. Tất nhiên đối với mỗi lần thử độc lập sẽ tạo ra kết quả bị ảnh hƣởng nặng bởi nhiễu, nhƣng vì các thành phần nhiễu trong mỗi lần thử là khác nhau và độc lập với các hệ số đƣợc tạo ra theo hàm ngẫu nhiên, nên chúng sẽ loại bỏ lẫn nhau trong tập hợp trung bình nếu số lần thử là đủ lớn, đây chính là đặc tính thống kê của nhiễu.
Nói cách khác, đặc tính nổi bật của EMD trong phƣơng pháp này chính là việc, nếu dữ liệu đƣợc thêm nhiễu trải đều trong các scale thời gian hay miền thời gian-tần số, EMD sẽ xử lý nhƣ một cặp bộ lọc. Tổng số IMFs của một bộ dữ liệu gần bằng , với N là tổng số điểm của dữ liệu (đối với ảnh thì là tổng số pixel).
Nhiễu trắng thêm vào đƣợc xem nhƣ là một nhiễu ngẫu nhiên xác định, do đó,
( ) ( ) ( ),
Nếu số tập hợp (số lần thử) là vô cùng thì kết quả các IMFs của EEMD ( )
( )
∑[ ( ) ( )]
Trong đó, ( ) ( ) là lần thử thứ k của IMF thứ j của tín hiệu đã đƣợc thêm nhiễu. Biên độ của nhiễu ( ) không cần nhỏ, nhƣng số lần thử N phải đủ lớn, điều này phụ thuộc vào quy tắc thống kê.
Việc thêm nhiễu vào có thể làm cho tỷ số tín hiệu trên nhiễu nhỏ hơn, nhƣng nhiễu trắng thêm vào sẽ cung cấp scale tham chiếu đều làm cho việc thực hiện EMD dễ dàng hơn.
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 4 TẬP HỢP CÁC THỰC NGHIỆM PHÂN HỦY …
Các IMFs tƣơng ứng với hệ số nhiễu trắng khác nhau thì không có sự tƣơng quan nào, do đó trung bình của các IMFs tƣơng ứng của dãy nhiễu trắng khác nhau gần nhƣ loại bỏ lẫn nhau nếu số lần thử đủ lớn.
Quá trình phân giải của EEMD gồm các bƣớc sau: 1. Cộng chuỗi nhiễu trắng vào dữ liệu
2. Phân giải dữ liệu đã cộng nhiễu thành các IMFs dựa trên EMD
3. Lập lại bƣớc 1 và 2 nhƣng với dãy nhiễu trắng khác trong mỗi lần, và sự lặp này phải đủ lớn để các thành phần nhiễu có thể loại bò lẫn nhau sau khi lấy trung bình của các IMFs tƣơng ứng
Hình 4.1: a-Tín hiệu ngõ vào với sự gián đoạn bởi các thành phần tần số cao; b-Các cực trị; c-Các đường bao, d-IMF đầu tiên
LUẬN VĂN TỐT NGHIỆP CHƢƠNG 4 TẬP HỢP CÁC THỰC NGHIỆM PHÂN HỦY …
Hình 4.2: Các IMF từ IMF1 đến IMF3 và thành phần dư.