1. Trang chủ
  2. » Công Nghệ Thông Tin

Đề xuất giải pháp tiền xử lý để tổng hợp dữ liệu nhiều cảm biến trong mạng cảm biến không dây

6 8 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Bài viết Đề xuất giải pháp tiền xử lý để tổng hợp dữ liệu nhiều cảm biến trong mạng cảm biến không dây đề xuất giải pháp tiền xử lý DP-DF nhằm loại bỏ dữ liệu thô, giữ lại dữ liệu có nhiều giá trị về tri thức tham gia tổng hợp dữ liệu.

Kỷ yếu Hội nghị Quốc gia lần thứ VIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR); Hà Nội, ngày 9-10/7/2015 ĐỀ XUẤT GIẢI PHÁP TIỀN XỬ LÝ ĐỂ TỔNG HỢP DỮ LIỆU NHIỀU CẢM BIẾN TRONG MẠNG CẢM BIẾN KHÔNG DÂY Dương Viết Huy1, Nguyễn Đình Việt2 Vụ Khoa học, Cơng nghệ Mơi trường - Bộ Văn hóa, Thể thao Du lịch Đại học Công nghệ, Đại học Quốc gia Hà Nội huy.duongviet@gmail.com, vietnd@vnu.edu.vn TÓM TẮT - Giải pháp chia mạng cảm biến không dây (WSNs - wireless sensor networks) thành nhiều cụm (cluster), cụm có nhiều nút cảm biến (multi-sensor) để tổng hợp liệu nút trung gian đường truyền từ nút cảm biến mục tiêu đến trạm đích (BS - base station) nhiều nhóm nghiên cứu Tổng hợp liệu nhằm hạn chế gói tin dư thừa nút cảm biến cụm cảm nhận đối tượng nên thường có thơng tin truyền liệu đến BS gây tổn hao lượng vơ ích đồng thời tăng nguy nghẽn đường truyền đến BS Tại cụm có nút cụm trưởng (CH- cluster head) chịu trách nhiệm tổng hợp liệu từ nút cụm gửi đến BS Một yếu tố định hiệu việc tổng hợp chất lượng liệu đầu vào mà CH nhận từ nút cụm gửi Do nút cảm biến thu phát tín hiệu sóng điện từ nên có nhiều yếu tố ảnh hưởng đến việc đo lường mục tiêu nhiễu, liệu Nếu CH sử dụng kết đo làm kiện đầu vào để tổng hợp liệu khơng phản ánh kiện diễn mục tiêu Bài báo đề xuất giải pháp tiền xử lý DP-DF nhằm loại bỏ liệu thơ, giữ lại liệu có nhiều giá trị tri thức tham gia tổng hợp liệu Từ khóa - Tổng hợp liệu, tiền xử lý, multi-sensor, data fusion, DP-DF, WSNs I GIỚI THIỆU Hiện nay, hệ thống giám sát mạng cảm biến ngày phát triển quy mô (số nút cảm biến, phạm vi giám sát) chất lượng (số tham số giám sát, độ mịn mức đo,…) Thông thường, nút cảm biến không dây “nuôi” nguồn pin hữu hạn, nghiên cứu WSNs vấn đề tiết kiệm lượng nút mạng ln đặt Một nhóm giải pháp nhiều nhóm nghiên cứu mạng có phân cụm (clusterbased network) Giải pháp phân cụm, điển hình cơng trình [1] với mục tiêu chia nhỏ mạng cảm biến thành mạng sở gọi cụm (cluster), giao tiếp cụm theo kiểu đơn chặng – singlehop đa chặng - multihop Nút trưởng cụm (CH - cluster head) chịu trách nhiệm tổng hợp liệu (data fusion data aggregation, sử dụng thuật ngữ data fusion - DF) đồng thời tham gia trình định tuyến Sau vòng, mạng phải phân chia lại thành cụm phải bầu CH để tiếp tục hoạt động Các nghiên cứu [2, 3] đề xuất giải pháp tổng hợp liệu nhiều cảm biến nút CH dựa vào bảng kiện thuộc tính ngữ nghĩa Tại thời điểm DF, liệu cảm nhận nút cảm biến cụm hệ thống hóa thành bảng thông tin ngữ nghĩa gồm ngữ nghĩa nút cảm biến (như khoảng cách, lượng lại, ) ngữ nghĩa liệu cảm nhận (như độ xác, số gói tin cần truyền,…) Từ kết luận ngữ nghĩa, CH lựa chọn nút cảm biến thỏa mãn điều kiện để chuyển tiếp liệu cảm nhận nút cảm biến đến BS Vì nút cảm biến thu phát tín hiệu sóng vơ tuyến nên chúng ln tiềm ẩn nhiều tình làm giảm chất lượng kiện đầu vào liệu không chắn, bị thiếu, liệu yếu, ảnh hưởng đến trình tổng hợp kết liệu đầu nút CH Do đó, trước lúc DF, liệu cần phải xử lý Giai đoạn tiền xử lý toán tổng hợp liệu nhiều cảm biến tính từ lúc nút cảm biến cụm cảm nhận mục tiêu gửi đến CH đến lúc CH đóng liệu thành khối kiện đầu vào để tiến hành tổng hợp trước gửi đến BS Trong báo này, đề xuất phương pháp tiền xử lý liệu với tên gọi DP-DF (Data Pre-processing for Data Fusion) việc áp dụng entropy thông tin lý thuyết tập thơ nhằm chuẩn hóa liệu đầu vào nút cảm biến cụm gửi CH phục vụ tổng hợp liệu nhiều cảm biến nút CH Nội dung báo giới thiệu kết luận có nội dung chính: Phân tích giai đoạn tiền xử lý liệu phục vụ tổng hợp liệu nhiều cảm biến; đề xuất giải pháp DP-DF ví dụ minh họa trình tiền xử lý đề xuất II TIỀN XỬ LÝ DỮ LIỆU CẢM BIẾN A Dữ liệu đầu vào tiền xử lý Giai đoạn tiền xử lý để tổng hợp liệu nhiều cảm biến (trong mạng cảm biến không dây) báo tính từ lúc nút cảm biến cụm cảm nhận mục tiêu gửi đến CH đến lúc CH đóng liệu thành khối kiện đầu vào để tiến hành tổng hợp liệu trước gửi đến BS Mục đích giai đoạn tiền xử lý hạn chế tối đa liệu thơ, có giá trị tri thức tham gia tổng hợp liệu Chúng tơi chia thời điểm để đóng gói kiện làm đầu vào để DF thành loại: Theo khung tin (frame) theo chu kỳ/vòng (T) Giả sử T có q frame (F), cụm có n nút cảm biến (S), S đo lường m tham số (P - parameter), biểu diễn Hình 166 ĐỀ XUẤT GIẢI PHÁP TIỀN XỬ LÝ ĐỂ TỔNG HỢP DỮ LIỆU NHIỀU CẢM BIẾN TRONG MẠNG CẢM BIẾN KHÔNG DÂY T F1 F2 F3 Fq S1 S2 S3 P1 P2 Sn Pm P1 P2 Pm P1 P2 Pm Hình Truyền liệu theo khung tin (frame) theo chu kỳ (T) Theo khung tin Tại CH, sau khung truyền F1, CH nhận bảng liệu n hàng, m cột Bảng Bảng Dữ liệu CH nhận khung truyền F1 F1-S1-P1 F1-S2-P1 F1-Sn-P1 F1-S1-P2 F1-S2-P2 F1-Sn-P2 Bảng Dữ liệu CH nhận khung truyền Fk F1-S1-Pm F1-S2-Pm F1-Sn-Pm Fk-S1-P1, Fk-S2-P1 Fk-Sn-P1 Fk-S1-P2 Fk-S2-P2 Fk-Sn-P2 Fk-S1-Pm Fk-S2-Pm Fk-Sn-Pm Kết thúc F1, CH, tập liệu để xử lý theo tham số Pj (1 ≤ j ≤ m) gồm phần tử cột j tập liệu để xử lý tham số Pj theo nút cảm biến Si (1 ≤ i ≤ n ) phần tử hàng thứ i Tổng quát, sau khung truyền Fk (với ≤ k ≤ q), CH nhận bảng liệu n hàng, m cột chứa liệu đo m tham số n nút cảm biến, khung truyền có bảng Mỗi phần tử bảng giá trị đo tham số Pj nút cảm biến Si, truyền đến CH khung truyền Fk chu kỳ truyền T, bảng liệu tổng quát Bảng Như vậy, với phương pháp xử lý này, sau nhận hết liệu truyền frame, CH xử lý với liệu nút cảm biến tham số tương ứng trước đó, tích lũy kết để sử dụng nhận hết frame liền sau Gọi Fk' kết đóng gói sau CH nhận hết frame Fk Fk' = Combine (Fk, Fk-1) (1) Fk' xem ma trận cỡ (n x m) kết hợp tích lũy ma trận cỡ Fk Fk-1 Các phần tử Fk' có giá trị là: Fk'-Si-Pj (Với ≤ k ≤ q, ≤ i ≤ n, ≤ j ≤ m) (2) Như vậy, đóng gói theo khung tin Fk' tập liệu đầu vào để CH đóng gói áp dụng giải pháp tiền xử lý Kết thúc vòng (T) k = q, lúc CH nhận hết liệu q khung tin vòng Theo chu kỳ/vòng (T) Tương tự cách diễn giải trên, với hình thức này, CH nhận lưu đủ liệu q khung tin tiến hành đóng gói Gọi Fblock kiện đầu vào để áp dụng giải pháp tiền xử lý, Fblock bao gồm q ma trận cỡ (n x m) B Phân tích tiền xử lý liệu cảm biến Sau CH đóng gói liệu cảm biến theo khung tin theo chu kỳ, CH sử dụng kiện làm đầu vào để áp dụng giải pháp tiền xử lý Tương tự kỹ thuật tiền xử lý khai phá liệu data mining [4], giai đoạn tiền xử lý nút CH báo gồm công đoạn thứ tự xử lý Hình 2: S1 S2 Sn Theo Tiếp khung nhận Theo liệu chu kỳ Đóng gói liệu cảm biến Xây dựng thuộc tính, hệ thống hóa liệu Xử lý liệu bị thiếu, yếu (nhiễu) Xử lý liệu dư thừa Entropy Lý thuyết tập thơ Dữ liệu chuẩn hóa Hình Q trình tiền xử lý liệu cảm biến nút CH giải pháp DP-DF - Xây dựng thuộc tính (attribute/feature construction): Là thuộc tính ngữ nghĩa nút cảm biến ngữ nghĩa liệu cảm nhận [2, 3] Thuộc tính cột bảng liệu cảm biến - Hệ thống hóa liệu: trình nhận diện đặc điểm chung liệu cảm biến diện liệu nhiễu, liệu thiếu phần tử kì dị (outliers) nút cảm biến đo lường; định lượng hóa thành giá trị để đưa vào bảng liệu gồm n hàng, m cột tương ứng với n nút cảm biến mạng m thuộc tính nút cảm biến Dương Viết Huy, Nguyễn Đình Việt 167 - Xử lý liệu bị thiếu (missing data): Khi CH không nhận đủ liệu từ nhiều nút nhóm để làm kiện cho q trình DF Dữ liệu bị thiếu liệu đo tất tham số đo mục tiêu vài tham số thành phần mục tiêu Do đó, xử lý liệu bị thiếu bước quan trọng giai đoạn tiền xử lý - Xử lý liệu bị nhiễu (noisy data): Khi nút cảm biến cảm nhận mục tiêu, tín hiệu bị nhiễu dẫn đến tính chân lý liệu truyền khơng bảo tồn Tiền xử lý CH xác định lại đắn liệu cảm nhận cách loại bỏ thông tin nhiễu, giữ lại thơng tin hữu ích, bị nhiễu để tiến hành DF - Xử lý liệu dư thừa (redundancy): Đây vấn đề quan trọng toán DF Khi nút cảm biến cảm nhận đối tượng truyền loại thơng tin trực tiếp đến BS qua nút cảm biến trung gian (là CH mạng có phân cụm) để truyền đến BS việc loại bỏ liệu dư thừa điều cần thiết Nghiên cứu [2] đề xuất giải pháp ứng dụng lý thuyết tập thô để xử lý liệu dư thừa III.GIẢI PHÁP DP-DF A Xử lý liệu thiếu, nhiễu Sau kết thúc q trình đóng gói liệu n nút cảm biến cụm gửi CH, xây dựng thuộc tính ngữ nghĩa, hệ thống hóa liệu cảm biến, giá trị ngữ nghĩa định lượng giá trị đo đưa vào bảng liệu, bảng xem hệ thống thông tin [5] cụm (có n nút cảm biến) ký hiệu IS bảng liệu gồm n hàng, m cột - cột thuộc tính, IS biểu diễn yếu tố [5]: IS = (3) Trong đó, U tập hữu hạn n nút cảm biến; Q tập hữu hạn thuộc tính; V tập giá trị tập thuộc tính; f giá trị thuộc tính nút cảm biến tương ứng Hệ thống thông tin IS tổng quát thời điểm bắt đầu tiền xử lý Bảng Gọi f (Si, Aj) giá trị f nút cảm biến Si thuộc tính Aj (1 ≤ i ≤ n, ≤ j ≤ m), f (Si, Aj) = VSiAj Số mức giá trị l thuộc tính Aj khác (như Bảng 4) tùy vào phương pháp định lượng hóa cho đảm bảo độ mịn tiệm cận với mức đo nhà sản xuất nút cảm biến Bảng Giá trị thuộc tính Aj Bảng IS thời điểm bắt đầu tiền xử lý U S1 S2 S2 Sn Q (tập thuộc tính) A1 VA1.S1 VA1.S2 VA1.S2 A2 VA2.S1 VA2.S2 VA2.S2 Am VAm.S1 VAm.S2 VAm.S2 VA1.Sn VA2.Sn VAm.Sn V X1 X2 Xl Q (tập thuộc tính) A1 X1.A1 X2.A1 Xl.A1 A2 X1.A2 X2.A2 Xl.A2 Am X1.Am X2.Am Xl.Am Dữ liệu thiếu Dữ liệu thu thập từ nút cảm biến truyền đến CH khơng đầy đủ, nghĩa CH không nhận đủ liệu đo nhiều tham số đo từ nhiều nút nhóm gửi để làm kiện cho trình DF Tình để liệu là: Lúc cần cảm nhận truyền liệu đến đích nút cảm biến trạng thái ngủ, lúc truyền liệu đến CH nút cảm biến hết lượng,… Dữ liệu bị thiếu toàn kết đo mà nút cảm biến ghi nhận từ mục tiêu chu kỳ T khung tin Fk phần khung tin (là nhiều tham số Pj Fk đó) tất yếu tố Khơng tính tổng qt, xem thời điểm CH đóng gói xong để tiền xử lý, liệu đo nút cảm biến Si (1 ≤ i ≤ n) với tham số đo Aj (1 ≤ j ≤ m) bị thiếu, ký hiệu f (Si, Aj) = ∅ (4) Mạng cảm biến không dây sử dụng giao thức IEEE 802.15.4 điều khiển việc lấy liệu theo chu kỳ thức-ngủ (active-sleep) nên liệu CH thu từ nút cảm biến có tính rời rạc, f (Si, Aj) tính thơng qua xác suất, giá trị có tính ngẫu nhiên miền giá trị đo Xl thuộc tính Aj Chúng tơi áp dụng Entropy Shannon [7] để tính xác suất xuất l khả (giá trị) thuộc tính Aj tương ứng Gọi Pr (Xt) xác suất xuất giá trị Xt (1 ≤ t ≤ l) thuộc tính Aj, Entropy Shannon (ES) tập U (nút cảm biến) Aj tính sau: ∑ log Gán f (Si, Aj).∅ = Max Pr(Xt) (5) (6) Trong f (Si, Aj).∅ liệu đo bị thiếu nút cảm biến Si thuộc tính Aj, Max Pr(Xt) giá trị Xt mà khả f (Si, Aj) nhận (hay Pr(Xt) lớn nhất) Biến ngẫu nhiên Xt nhận l mức, xác suất 1/l Thuộc tính Aj xem biến ngẫu nhiên với xác suất Dữ liệu nhiễu (yếu) Do nút cảm biến truyền liệu sóng vơ tuyến đến CH nên tín hiệu bị yếu (về cường độ) yếu tố gây nhiễu môi trường Trong báo này, giả sử phát nhiễu, tức xác định kết đo thuộc tính Aj nút cảm biến Si bị nhiễu, cần phải xử lý 168 ĐỀ XUẤT GIẢI PHÁP TIỀN XỬ LÝ ĐỂ TỔNG HỢP DỮ LIỆU NHIỀU CẢM BIẾN TRONG MẠNG CẢM BIẾN KHÔNG DÂY Gọi λ ngưỡng giá trị đo thuộc tính Aj (1 ≤ j ≤ m) Dữ liệu đo Si gọi nhiễu (yếu) f (Si, Aj) ≤ λ Gọi f noisy (Si, Aj) giá trị nhiễu Si đo tham số Aj, P.f noisy(Si, Aj) xác suất f noisy (Si, Aj) với f (Si, Aj) (là giá trị khơng nhiễu), P.f noisy(Si, Aj) ≤ sai số δ f noisy Si, Aj f Si, Aj (7) Nếu f noisy (Si, Aj) có P.f noisy(Si, Aj) ≥ 0.5 khả f noisy (Si, Aj) tín hiệu nhiễu lớn mức trung bình Giả sử giá trị nhiễu f noisy (Si, Aj) sau xử lý f fix (Si, Aj) với X1.Aj ≤ f fix (Si, Aj) ≤ Xl.Aj Để đảm bảo tính tồn vẹn (completeness) liệu cảm nhận giảm nguy sai số tích lũy sử dụng liệu làm đầu vào q trình DF, chúng tơi đề xuất mối quan hệ giá trị sau: f fix (Si, Aj) = f noisy (Si, Aj)/2 (8) Với giá trị ngưỡng λ, tùy theo thuộc tính để lựa chọn giá trị ngưỡng λ phù hợp sai số δ tương ứng Ví dụ cơng thức tính ngưỡng [3] trung bình cộng l mức giá trị đo thành phần thuộc tính tương ứng l điều kiện tiêu chuẩn thiết kế, ví dụ ngưỡng giá trị thuộc tính Aj λ = ⎛⎜ ∑ X t ⎞⎟ / l (9) Aj ⎝ t =1 ⎠ Giải thuật xử lý liệu thiếu, nhiễu Set n = num_nodes; set m = num_condi_attrib For {set i 1} {$i

Ngày đăng: 11/05/2021, 04:32

Xem thêm:

w