(PT ——_— _
—— GÌ GGEEEÿZẸFÑ
NGÔ VĂN THÁI
NGHIÊN CỨU, UNG DUNG PHAN TÍCH THÀNH PHAN ĐỘC
Trang 2Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIÊN THÔNG
Người hướng dẫn khoa học: TS Đặng Hoài Bắc
Phản biện 1: TS Đinh Chí Hiếu
Phản biện 2: TS Nguyễn Quốc Khương
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: II giờ 45 ngày 20 tháng 9 năm 2015
Có thê tìm hiệu luận văn tại:
Trang 3MO DAU
Bài toán phân tách nguồn mù trong nhiều năm trở lại đây đã được nghiên cứu rat nhiều và áp dụng cho nhiều lĩnh vưc: viễn thông, y tế, quân sự Đây là một phương pháp được sử dụng phổ biến cho mục đích đánh giá các nguồn tín hiệu ban đầut ừ tập hợp các tín hiệu trộn của chúng, mà không có thông tin(hay có rat ít thông tin) về quá trình trộn cũng như là tín hiệu gốc Phương pháp được biết đến nhiều nhất và có tính ưu việt là phương pháp phân tích thành phần
độc lập (Independent Component Analysis).
Sau mot qua trinh tim hiéu va nghiên cứu em quyết định lựa chọn luận văn “Nghiên cứu,
ứng dụng phân tích thành phần độc lập vào hệ thống DS-CDMA” Luận văn tập trung nghiên
cứu bộ thu đa người sử dụng sử dụng phương pháp ICA phục vụ cho quá trình đánh giá kênh
truyền hướng xuống của hệ thống DS-CDMA Nghiên cứu bộ thu đa người sử dụng ICA, đề xuất bộ thu ICA-SUD để có được kết quả tốt nhất.
Bồ cục luận văn bao gồm ba chương:
Chương 1: Nghiên cứu chung về phân tích thành phần độc lập (ICA)
Nghiên cứu các cơ sở lý thuyết của phân bố Gauss và phi Gauss, khái niệm độc lập,
phương pháp phân tích thành phần độc lập (ICA)
Chương 2: Nghiên cứu về thuật toán FASTICA
Nghiên cứu hàm tối ưu Negentropy, phương pháp ICA bằng cực đại hóa Negentropy, thuật toán FastICA, kết quả mô phỏng tách nguồn mù, đánh giá chất lượng phân tách
Chương 3: Ứng dụng phương pháp ICA cho quá trình đánh giá kênh truyền hướng xuống của hệ thống DS-CDMA
Trình bày tổng quan về các công nghệ đa truy nhập, mô hình tín hiệu của hệ thống trải phô chuỗi trực tiếp (DSSS), mô phỏng bộ thu hướng xuống DS-CDMA nền tảng ICA
Trang 4CHƯƠNG 1: NGHIÊN CỨU CHUNG VỀ PHÂN TÍCH THÀNH PHẢN
ĐỘC LAP (ICA)
Phương pháp ICA giả định rằng các nguôn tín hiệu là độc lập với nhau và có tính phi
Gauss Khi mà gia thiết các thành phân nguồn độc lập được thỏa mãn, quá trình phân tách
nguồn mù sử dụng phương pháp ICA sẽ cho kết quả tốt Một điều kiện quan trọng là nếu có N nguồn tín hiệu, thì phải có ít nhất N tín hiệu trộn đề có thể đánh giá được các nguồn tín hiệu
ban đâu.
1.1 Phân bố Gauss và phi Gauss
Phân bố Gauss hay còn gọi là phân bố chuẩn là một phân bố xác suất cực ky quan trọng trong nhiều lĩnh vực Nó là họ phân bố có dạng tông quát giống nhau , chỉ khác tham số kỳ vọng p1 và phương sai ø? Một biến ngẫu nhiên X có kỳ vọng p và phương sai ổ2 được gọi là có
phân bô Gauss nêu hàm mật độ xác suât của nó dạng:
exp ( ) (1.1)202
[@) =
Supper Gauss
Ham phân bố dang Supper Gauss là hàm phân bố mật độ xác suất đặc biệt: hàm khá là lớn khi các biến có giá trị tương đối gần không hoặc là có giá trị lớn, tại các giá trị trung bình thì hàm mật độ xác suất khá là nhỏ Một ví dụ điển hình của Supper Gauss là phân bố Laplace Phân bố Laplace có công thức như sau:
p(x| ,b) =z-exp(——) (1.2)
Sub Gauss
Ham phân bố dang Sub Gauss có phân bố xác suất det, hàm phân bồ rất ít ở các gid trị lớn và giá trị gần 0, phân bố nhiều ở các giá trị trung bình Một ví dụ điển hình là phân bố uniform,
thường được dùng trong giả lập máy tính:
1 ¬
voi a<x<b
f@ =| (13)voi x<a hoặc x>b
Trang 51.2 Khái niệm độc lập
Khái niệm độc lập được định nghĩa bởi hàm mật độ xác suất (probability density function
- pdf) Các biến ngẫu nhiên s¿, s¿ , s„ là độc lập khi và chi khi:
ĐẤS, Sạ, , Sn) = Ð1(S1)P2 (S2) Pn (Sn) (1.4)
với p(S¡, 82, , s„) ham mật độ xác suất của $1, Sp, ,S, và ps; là hàm mật độ xác suất
riêng của Sj.
1.3 Phương pháp ICA
Nguyên lý thực hiện ICA v ới giả thiết là các thành phần độc lập với nhau, dựa trên
định lý giới hạn trung tâm , đó là “Ham phân bé của tông nhiều biến ngẫu nhiên độc lập luôn
hội tụ tới phân bô Gaussian”.
1.3.1 Định lý giới hạn trung tâm
Tín hiệu quan sát được= mICl + mIC2 + + m„ạÏCn
L4 N \: = , ' , w
Tiến tới Gauss phi Gauss phi Gauss phi Gauss
Hình 1.1- Minh họa định lý giới hạn trung tâm.
Dinh lý gi ới hạn trung tâm chỉ ra rằng : do x;,i = 1, N là tổ hợp tuyến tinh của các tin
và ngược lại s; sẽ có tính phi
hiệu nguồn %,ƒj = 1N, nên x; sẽ có tính Gaussian hon Sjs
Gaussian hơn x;.
1.3.2 Các giả thiết của phương pháp ICA
e Các nguồn nguyên thuỷ ban đầu phải độc lập thống kê với nhau
e Không có thành phan độc lập nào (nguồn) có phân bố Gaussian , hoặc tối đa chỉ có 1 nguồn có phân bố Gaussian.
e Ma trận trộn A là ma trận vuông (sô lượng tín hiệu nguồn và tín hiệu trộn băng nhau).
Trang 6Với các giả thiết trên , mục tiêu của bài toán phân tách nguồn mù là tìm ra các vector w
thoả mãn tô hợp tuyến tính y = w”x đạt tính phi Gaussian cực đại , khi đó y chính là một nguồn tín hiệu được mong đợi là tín hiệu ban đầu Tập hợp các vector w chính là ma trận tách
1.3.3 Một số bat định trong mô hình ICA tuyễn tính
e Không thê xác định lại được chính xác năng lượng ban đầu của của các nguồn tín hiệu nguyên thuỷ do cả s và 4 đều không biết nên:
x=As= (2) (ks) = (aA) (:) =e (1.5)
Do đó trong mô hình ICA người ta luôn giả thiết mọi nguồn tín hiệu nguyên thuy —s; đều
có năng lượng (phương sai) xác định, thoả mãn: E(sể) = 1 hay E(ss’) = I với I là ma trận
don vi.
e Không thê xác định được thứ tự ban đầu các thành phan độc lập khi phân tach do ca s và
A đều không biết nên khi đổi vị trí các hàng trong s và A m6 hình ICA không thay đôi.
e Không xác định được dấu của các thành phần độc lập ban đầu.
1.5 Kết luận chương
Một trong các phương pháp thông dụng nhất dé giải quyết bài toán phân tách nguồn tin hiệu mù chính là phương pháp phân tích các thành phần độc lập (Independent component Analys-ICA) Phương pháp ICA giả định rang các nguồn tín hiệu là độc lập với nhau và có tinh phi Gauss Khi mà giả thiết các thành phần nguồn độc lập được thỏa mãn, quá trình phân tách nguồn mù sử dụng phương pháp ICA sẽ cho kết quả tốt Ứng dụng đơn giản chính là van dé tách âm thanh tại một bữa tiệc, ta cần phải có giả thiết khi dùng ICA để giải quyết bài toán
này, đó là không có thời gian trễ cho các tín hiệu âm thanh cũng như không có độ vọng Và
một điều kiện quan trọng nữa là nếu có N nguồn tín hiệu, thì phải có ít nhất N tín hiệu trộn dé
có thê đánh giá được các nguôn tín hiệu ban đâu.
Trang 7CHƯƠNG 2: NGHIÊN CỨU VE THUẬT TOÁN FASTICA
Chương 2 của luận văn tôi sẽ trình bày về thuật toán FastICA, một thuật toán dựa vào hàm toi ưu Negentropy để ước lượng tính phi Gauss, và dùng thuật toán tối wu Newton dé giúp
thuật toán hội tụ nhanh.
2.1 Negentropy
Một kết quả cơ sở của lý thuyết thông tin là một biến với phân bố Gauss có entropy lớn
nhất trong tất cả các biến ngẫu nhiên của biển đổi cân bang Diéu nay co nghia 1a entropy vi
phân có thé được sử dụng như một phép do tính phi Gauss Cách do này có thé đưa ra sự khác nhau giữa entropy của một biến ngẫu nhiên Gauss y„„„;; và một biến phi Gauss y Phép do này
được gọi là negentropy, được biểu diễn là J, và được định nghĩa là :
JO) = Hsaus;) — HO) (2.1)
Trong đó H là ham entropy, yGauss là một vector ngẫu nhiên N chiều có phân bố Gaussian,
và có chung ma trận hiệp phương sai với vector y.
Vậy negentropy là một phương pháp đề đo tính phi Gauss của tín hiệu.
2.2 Phương pháp ICA bằng cực đại hóa Negentropy
Phương pháp này gồm 3 bước : Tiền xử ly dit liệu, xấp xỉ hóa negentropy, tối ưu hóa hàm
xap xi negentropy.
2.2.1 Quá trình tiền xử lý
Lua chọn những thuật toán cho ICA dùng qui tâm, trắng hóa và giảm chiều là những bước tiền xử lý để làm đơn giản và giảm tính phức tạp của vấn đề lặp thuật toán.
® Quy tâm
Đề không làm mat tính tổng quát, chúng ta có thể giả thiết rằng cả các biến trộn và các thành phần độc lập đều có trung bình bang 0 Giả thiết này làm đơn giản hóa các lý thuyết và
thuật toán rất nhiều.Nếu các tín hiệu chưa có giá trị trung bình bằng 0, chúng ta có thể thực
hiện quá trình tiền xử lý, gọi là phép quy tâm tức trừ phân bố của các biến được khảo sát với
các giá trị trung bình của chúng:
Xnew = x — E{x} (2.2)
Trang 8Trong đó x là vecto ngẫu nhiên chưa có trung bình là không Sau khi đã ước lượng ma
trận A và các thành phan s ta có thé thêm trở lại các trị trung bình của chúng:
E{s} = A TE{x} (2.3)
Khi vecto ngẫu nhiên x (hoặc s) có trị trung bình bằng không thi hiệp phương sai va tương quan của nó giống nhau.
° Trắng hóa
Sự trắng hoá với mục dich làm cho dir liệu trở nên bat tương quan Nếu ma trận vector có các vector thành phan x; đều thoả mãn điều kiện phương sai bằng 1 hay ma trận hiệp phương sai đồng nhất với ma trận đơn vị I: E{xxT = 1} thì ma trận vector x được xem là “trắng”.
Quá trình trắng hoá thự c chat là một phép biến đối tuyến tính : z =V.x Trong đó x là
dữ liệu cần làm trắng, V là ma trận trắng hoá, z là dit liệu đã trang hoá.
® Vai trò của quá trình trắng hod
Với một tín hiệu đã trắng hoá _, nhiệm vụ còn lại của ICA là tìm ra một vector w sao cho y¡ = wTz dat giá trị phi Gaussian cực đại dưới điều kiện ràng buộc E(y?) = 1 Khi đó y,
sẽ tương ứng với một nguôn tín hiệu ban đâu.
2.2.2 Xap xi hóa Negentropy
Đối với một biến ngẫu nhiên phân bố Gaussian, negentropy luôn bằng 0 và với tat cả các
loại biến còn lại (phi Gaussian) negentropy luôn có giá trị dương Tuy nhiên vấn đề ở chỗ
chúng ta không thể tính negentropy một cách trực tiếp, mà phải đánh giá negentropy thông qua
việc xâp xỉ hoá
2.3 Thuật toán FastICA
Thuật toán FastICA theo phương pháp tách nguồn tuần tự đối voi dir liệu đã trang hoá
được thực hiện theo như sau:
1 Chọn m là số nguồn tín hiệu cần đánh giá, gan p © 1.
2 Khởi tạo ngẫu nhiên giá trị vector đơn vị w, thoả man: \|w, lš =1
3.Gán w, — E{zg(w7z)} — E{g'(wjz)}w,
4 Thực hiện trực giao hoá theo phương pháp trực giao tuần tự (deflation)
Trang 96 Nếu thuật toán chưa hội tu:
|lewz*1,wz)| — 1| < €, trở lại bước 3.
7 Gắn p — p + 1 nếu p <m trở lại bước 2.
Sau đây là lưu đồ thuật toán cho quá trình mô phỏng thuật toán FastICA.
Trang 102.4 Kết quả mô phỏng
2.4.1 Mô phỏng tách nguồn mù âm thanh
2.4.2 Mô phóng tách mù hình ảnh
2.4.3 Mô phóng loại bó nhiễu trong ảnh 2.5 Đánh giá chất lượng phân tách
2.6 Kết luận chương
Phân tích thành phần độc lập (ICA) là một kỹ thuật thống kê tổng quát, ở đó đữ liệu độc lập được xem xét dé tách bang cach dua cac thanh phan độc lập lớn nhất, đã ước lượng được từ những thành phần khác nhau dưới giả thiết là không có hoặc có tối đa một nguồn có phân bố Gauss ICA được thực hiện với nhiều thuật toán khác nhau, nhưng nguyên tắc cơ bản của nó đều dựa vào sự bất tương quan phi tuyến bằng cực đại hoặc cực tiểu negentropy hoặc cực đại
thông tin tương hỗ.
Thuật toán FastlCA là một thuật toán đa nhiệm của ICA Đây là thuật toán dựa trên
phương pháp điểm cố định và có những ưu điểm sau:
e Hộitụnhanh
e Thich hợp cho cả Super-Gauss và Sub-Gauss.
ICA đã chứng minh được rằng nó hoàn toàn có thé giải quyết van dé bài toán Cocktail và
một số van dé BSS khác ICA có thé ứng dụng trong nhiều trường hợp đa dạng, ví dụ như phan tách mù trong điện não đồ (EEG) và trường não đồ (MEG), phân tích chuỗi thời gian kinh tế,
xử lý ảnh Mới đây, ICA đã được ứng dụng rộng dai trong viễn thông dé phân tách tín hiệu
của người sử từ nhiễu của những người sử dụng khác trong DS-CDMA Sử dụng ICA như là
một công cụ xử lý cho máy thu nối tiếp thông thường, ICA có khả năng làm giảm sóng
jamming liên tục trong hệ thong DS-CDMA ICA có tiềm năng sử dung rất lớn Vì vậy nghiên
cứu phân tách những tín hiệu trong tac động của tạp âm có thé được nghiên cứu.
Trang 11CHƯƠNG 3: ỨNG DỤNG PHƯƠNG PHÁP ICA CHO QUÁ TRÌNH ĐÁNH GIÁ KENH TRUYEN HUONG XUONG CUA HE THONG
Trong chương này, em xin được trình bày tổng quan về các công nghệ da truy nhập, mô hình tín hiệu của hệ thống DSSS và mô phỏng bộ thu SUD, bộ thu ICA và bộ thu kết hợp ICA-SUD Với kết quả thu được, chúng ta sẽ đánh giá dé tìm ra một bộ thu toi wu cho hệ thống.
3.1 Đa truy nhập
Đa truy nhập có thể hiểu là sự chia sẻ tài nguyên vô tuyến hoặc là sử dụng chung môi trường truyền dẫn chung (thời gian, tần số) giữa nhiều người sử dụng Các công nghệ đa truy nhập được phát triển với mục đích cải thiện hiệu suất sử dụng tài nguyên vô tuyến (vì tài
nguyên vô tuyến là giới hạn)
3.2 Mô hình tín hiệu của một hệ thống DSSS
Phan này sẽ giới thiệu mô hình tín hiệu của hệ thống DSSS sử dụng điều chế BPSK.
Trong hệ thống này dữ liệu b(t) được trải phổ bang tín hiệu PN c(t) nhờ việc nhân hai tin
hiệu nay với nhau Tín hiệu nhận được b(t)c(t) là tín hiệu nhị phân lưỡng cực biên độ +1 sau đó
sẽ dùng dé điều chế cho sóng mang sử dung BPSK, cho ta tín hiệu DSSS-BPSK s(t) Ta có thé thấy một bit bản tin bằng một chu kỳ của tín hiệu PN (trong tín hiệu này P=7).
Bộ điều chế
(BPS V
-—————— ;
Dữ liệu nhị Tín hiệu DSSS- BPSK
phân b(t) LÔ C1 U{)= ae cos(2nf,t+9)
Day PIN nhi Sóng mang Cw(t)= Ac cos(2nf,t+8)
phân a(t)
Hình 3.1- Sơ đồ khối máy phát DSSS-BPSK
Trang 12v(ĐofÐ Ị [| » t
PTo 2
Hình 3.2 —Sơ đồ tín hiệu bên phát 3.2.1 Điều chế tín hiệu
3.2.2 Giải điều chế tín hiệu
3.3 Mô phỏng bộ thu hướng xuống DS-CDMA nền tang ICA 3.3.1 Mô phỏng bộ thu DS-CDMA cổ điển
Chúng ta thực hiện mô phỏng giải điều chế DSSS có sự xuất hiện của nhiễu AWGN, và mô
hình mô phỏng đó được thê hiện ở hình 3.3
Trang 133.3.2 Mô phóng bộ thu cơ sở ICA
Trong phan này, chúng ta mô phỏng máy thu hướng xuống DS-CDMA nên tảng ICA (máy thu ICA) Đầu tiên, chúng ta thực hiện mô phỏng một máy thu cơ sở ICA, sau đó nghiên cứu kich thước vector được yêu cầu bởi thuật toán ICA, xem xét một số yếu tố khác như là giá trị khởi tạo của quá trình lặp, tiêu chuẩn hội tụ Cuối cùng mô phỏng máy thu liên kết
ICA-SUD để so sánh xác suất lỗi với máy thu ICA hoặc máy thu ICA-SUD thông thường.
Hình 3.4-Mô hình bộ thu ICA3.3.2.1 Bộ thu cơ sở ICA
3.3.2.2 Mô phỏng bộ thu ICA-SUD
Trang 143.3.3 Bộ thu ICA-SUD
3.4 Kết luận chương
Chương này nghiên cứu những khái niệm cơ bản của đa truy nhập và DSSS Cuối cùng là mô phỏng bộ thu hướng xuống DS-CDMA nền tang ICA, kết qua chỉ ra rằng bộ thu ICA có thê giải quyết van đề ước lượng kí tự với mã trải phổ được yêu cau, thông qua mã trải phô có thé dùng dé nhận ra mỗi người sử dung Do đó bộ thu ICA-SUD đã được đưa ra và tốc độ lỗi kí tự của nó thấp hơn bộ thu SUD qui chuẩn, điều này được kết luận từ số những thực nghiệm Thậm chí nếu công suất của tín hiệu là giống nhau, ICA còn có thể làm giảm nhỏ ảnh hưởng của nhiễu đa truy nhập, do đó cải thiện được hiệu suất của SUD.
Trang 15KET LUẬN
Đặc điểm nổi bật của ICA, phân tách nguồn bán mù tự nhiên, được sử dụng hữu hiệu trong giải điều chế CDMA Khi bên thu có nhiều hoặc ít hơn thông tin chỉ dẫn trong hệ thống truyền thông, điển hình khi mã trải phố của người sử dụng được biết ít nhất, thì ICA có thé bỏ qua quá trình nhận dạng người dùng và tập trung giải mã Thông tin ưu tiên này có thể được truyền theo một hướng thích hợp với công nghệ ICA mù nhằm đạt kết quả tối ưu nhất Đặc điểm thiết kế quan trọng mà những thuật toán khác trong thực tế không thé thực hiện được, đó là khả năng tính toán vượt quá yêu cau, dé có thé thực hiện trong thời gian thực, đây là cái ma
tương lai đang cần.
Đầu tiên chúng ta bắt đầu với những khái niệm cơ bản của ICA FastlCA được đưa vào
xem xét kĩ lưỡng FastICA là một thuật toán thực thi đa mục đích rất tốt của ICA Đây là thuật toán dựa trên phương pháp lặp điểm cố định, nó có một số những ưu điểm là hội tụ nhanh, thích hợp cho cả những thành phần super-Gauss và sub-Gauss Cuối cùng là mô phỏng bộ thu hướng xuống DS-CDMA nền tảng ICA, kết quả chi ra rang bộ thu ICA có thể giải quyết van dé
ước lượng kí tự với mã trải phổ được yêu cầu, thông qua mã trải phổ có thé dùng dé nhận ra
mỗi người sử dụng Do đó bộ thu ICA-SUD đã được đưa ra và tốc độ lỗi kí tự của nó thấp hơn bộ thu SUD qui chuẩn, điều này được kết luận từ số những thực nghiệm Thậm chí nếu công
suất của tín hiệu là giống nhau, ICA còn có thể làm giảm nhỏ ảnh hưởng của nhiễu đa truy
nhập, do đó cải thiện được hiệu suất của SUD.
Do thời gian có hạn và những hạn chế không tránh khỏi của việc hiểu biết các vấn đề dựa trên lý thuyết là chính nên báo cáo luận văn của tôi chắc chăn không tránh khỏi những thiếu sót.Tôi rat mong có được những ý kiến đánh giá, góp ý của các thầy và các bạn dé luận
văn thêm hoàn thiện.