áp dụng Lý thuyết Dempster-Shafer cho quá trình trộn dữ liệu đa cảm biến ThS Phạm hải an Viện Tự động hoá kỹ thuật quân sự PGS. TS Lê hùng lân Trờng Đại học Giao thông Vận tải Tóm tắt: Trộn dữ liệu đa cảm biến l quá trình kết hợp dữ liệu v thông tin từ nhiều nguồn cảm biến khác nhau. L một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn đang đợc tiếp tục nghiên cứu v giải quyết. Bi báo đa ra các kỹ thuật trộn đã đợc đề xuất, trong đó đi sâu trình by kỹ thuật trộn theo lý thuyết Dempster-Shafer. Summary: Multi-sensor data fusion relates to the combination of data and information from different sensors. As a fairly new field, the techniques for fusing data have been studied and developed. The study deals with the techniques proposed, in particularly with the ones accordance to Dempster-shafer theory. * Tốt hơn trong việc đánh giá tình huống và ra quyết định, vì vậy phản ứng của hệ thống sẽ nhanh hơn. Từ các nguồn dữ liệu khác nhau và độ chính xác của các cảm biến, việc kết hợp và trộn dữ liệu sẽ đem lại một đánh giá tốt hơn về tình huống và do đó tăng độ chính xác khi kết luận và vì thế dễ dàng đa ra quyết định. Điều này là đặc biệt đúng trong các tình huống chiến tranh nơi mà độ chính xác của các cảm biến phát hiện mục tiêu sớm sẽ giúp cho ngời chỉ huy có phản ứng nhanh hơn để đa ra các biện pháp đối phó. CT 2 * Tăng độ chính xác của dữ liệu và giảm các dữ liệu không chắc chắn và mơ hồ. Tập hợp nhiều nguồn dữ liệu có thể giúp cho việc tăng độ chính xác dữ liệu và giảm thông tin không chắc chắn sau quá trình trộn thông minh và bỏ đi các dữ liệu mơ hồ. * Mở rộng thông tin về đối tợng. Nhiều nguồn dữ liệu sẽ cung cấp thêm thông tin về đối tợng hoặc sự kiện quan sát. Mở rộng thông tin có thể bao gồm cả không gian và thời gian. * Sự hiệu quả về chi phí. Với việc giảm về chi phí tính toán, truyền thông và tài nguyên mạng, vì vậy, trong trờng hợp tổng quát, hầu hết chi phí sẽ phụ thuộc vào nhiều nguồn dữ liệu đầu vào hơn là dựa vào một nguồn dữ liệu để cung cấp tất cả thông tin cần thiết. Ví dụ để xây dựng một cảm biến mà có thể thực hiện nhiều chức năng sẽ đắt hơn rất nhiều so với việc kết hợp một vài cảm biến đơn giản và rẻ tiền với một chức năng cụ thể. * Không có nguồn dữ liệu đơn hoàn chỉnh. Hầu hết các nguồn thu thập dữ liệu, ví dụ nh các cảm biến, chỉ thực sự hữu ích trong một môi trờng nhất định. Những thông tin thu nhận đợc từ một nguồn dữ liệu đơn có thể rất hạn chế và có thể không hoàn toàn đầy đủ và đáng tin cậy. Ví dụ nh cảm biến tiếp xúc chỉ có thể phát hiện một đối tợng khi tiếp xúc, cảm biến âm thanh chỉ phát hiện đợc đối tợng mà tín hiệu âm thanh đợc phát ra, cảm biến quang điện tử hoàn toàn phụ thuộc vào điều kiện ánh sáng ở môi trờng xung quanh và các cảm biến giám sát điện tử chỉ có thể phát hiện các đối tợng mà có sóng điện từ phát ra. Vì vậy, sẽ là rất khó khăn khi thiết kế một cảm biến cho nhiều mục đích. 2. Một số kỹ thuật trộn dữ liệu Là một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn đang đợc tiếp tục nghiên cứu và giải quyết. Do trộn dữ liệu đợc áp dụng trong rất nhiều lĩnh vực rộng lớn và rất khác nhau do vậy tuỳ theo từng bài toán cụ thể mà ta sẽ phải có một kỹ thuật trộn thích hợp. Lý thuyết Bayes dựa trên ý tởng về xác suất cổ điển có thể áp dụng rất hữu hiệu trong bài toán trộn dữ liệu, trong đó việc trộn dữ liệu đợc thực hiện theo thời gian. Các giá trị xác suất thu nhận đợc trong các bớc thời gian sẽ đợc kết hợp với nhau để đa ra một xác suất đánh giá mới về đối tợng đang xém xét. Cùng tồn tại với lý thuyết Bayes là lý thuyết Dempster-Shafer, đây là lý thuyết cho phép giải thích kỹ hơn sự kiện không chắc chắn sắp xảy ra là cái gì. Lý thuyết Dempster-Shafer xử lý các độ đo về niềm tin chứ không phải là xác suất. Lý thuyết Dempster-Shafer dựa trên ý tởng về khối lợng ngợc với xác suất theo lý thuyết Bayes; Để trộn dữ liệu, ta sẽ sử dụng các ý tởng mới trong lý thuyết này đó là mức độ hỗ trợ và mức độ đồng thuận. Trong một số bài toán mà các dữ liệu đầu từ các cảm biến có thể bị nhiễu đòi hỏi ta phải có một phơng pháp có khả năng xử lý vấn đề đặt ra: tức là đa ra các quyết định dựa trên các điều kiện không chắc chắn. Mục đích của các phơng pháp này đợc mở rộng từ việc đánh giá định lợng giá trị vật lý đến việc đánh giá theo xác suất xuất hiện trên kết quả tổng hợp của nhiều dữ liệu cảm biến trong không gian một và nhiều chiều. ở đây áp dụng kỹ thuật logic mờ là một phơng pháp rất hữu ích. CT 2 Khi các cảm biến là không tơng tự nhau, nhiều công việc cần phải thực hiện để thực hiện suy diễn trong bài toán trộn dữ liệu nhng chúng ta không thể luôn tạo ra đợc các quy tắc cụ thể để kết hợp dữ liệu từ các nguồn khác nhau. Một phơng pháp khác là sử dụng hệ thống có khả năng tự tạo ra các qui tắc của riêng nó để trộn dữ liệu. Khả năng học hỏi và thích nghi của mạng neuron có khả năng đợc sử dụng cho mục đích này. 3. Kỹ thuật trộn dữ liệu Dempster-Shafer Cả hai phơng pháp Bayes và Dempster-Shafer đều dựa trên khái niệm gắn các trọng lợng cho các trạng thái của hệ thống đang đợc khảo sát. Trong khi lý thuyết Bayes có ý nghĩa cổ điển hơn đứng về mặt ý tởng xác suất, lý thuyết của Dempster-Shafer cho phép sử dụng thêm các kịch bản khác, ví dụ ta có thể kết hợp các trạng thái đang có để tạo ra trạng thái mới tơng ứng với đại lợng cha biết. Khái niệm trọng lợng, chính là xác suất cổ điển trong lý thuyết Bayes thì không đợc dùng nhiều trong lý thuyết Dempster-Shafer. Các đại lợng tơng tự trong lý thuyết Dempster-Shafer đợc gọi là các khối lợng, và ít nhiều chúng cũng đợc hiểu là xác suất. Lý thuyết Dempster-Shafer gắn các khối lợng cho tất cả các tập con của các thực thể bao gồm trong hệ thống. Giả sử hệ thống có 5 thành viên. Ta sẽ đánh nhãn chúng và sẽ mô tả một tập con cụ thể bằng cách viết số 1 cạnh mỗi một phần tử nằm trong tập con này, và số 0 cạnh mỗi một phần tử mà không phụ thuộc vào tập con này. Nh vậy có thể thấy có 2 5 tập con phần tử. Nếu tập ban đầu gọi là tập S thì tập của tất cả các tập con đợc gọi là tập luỹ thừa ký hiệu là 2 S . Dempster-Shafer xem các tập con này là điểm bắt đầu. Một ví dụ về lý thuyết này đợc mô tả trong công trình của Zou và các cộng sự [1]. Robot của họ chia môi trờng xung quanh thành một lới, gán cho mỗi ô trong lới một khối lợng: Độ đo về niềm tin trong mỗi một sự kiện có thể thay thế cho nhau là: đã bị chiếm, trống hoặc cha biết. Mặc dầu khối lợng này không phải là xác suất nhng tổng khối lợng của tất cả các kết hợp của 3 trạng thái thay thế nhau này (tạo thành tập luỹ thừa) cần phải bằng 1. Trong trờng hợp này cha biết có thể là đã bị chiếm hoặc là trống. Ba trạng thái thay thế này cùng với tập rỗng có khối lợng bằng 0, tạo thành tập lũy thừa đầy đủ. Lý thuyết Dempster-Shafer cung cấp quy tắc để tính toán độ đo niềm tin của mỗi trạng thái dựa trên các dữ liệu cả cũ lẫn mới. Các phơng án thay thế mà Robot xây dựng trên đó là: {đã bị chiếm, trống, cha biết} đợc ký hiệu là {O, E, U}. Ta sẽ xét 3 khối lợng, khối lợng này là niềm tin trong mỗi phần tử của tập lũy thừa; độ đo niềm tin m s là các chứng cứ hiện thời nhận đợc từ các cảm biến; và độ đo niềm tin m o từ các chứng cứ cũ đã biết (chính là khối lợng m từ các hành trình trớc đó). Giả sử ta có tập luỹ thừa gồm 3 phần tử A, B, C, theo quy tắc Dempster-Shafer [2] ta có công thức sau: = == 0BA os CBA 0s )B(m)A(m1)B(m)A(m)C(m (1) áp dụng phơng trình này cho quá trình tìm kiếm các vùng đã bị chiếm trên lới ta đợc phơng trình sau: )O(m)E(m)E(m)O(m1 )O(m)U(m)U(m)O(m)O(m)O(m m(O) osos ososos ++ = (2) CT 2 Khi Robot khảo sát môi truờng xung quanh, nó tính m(O) cho mỗi điểm trên lới xung quanh vùng di chuyển của nó và vẽ ra một điểm nếu nh m(O) này lớn hơn một giá trị niềm tin định trớc. Và cuối cùng bức tranh mà nó vẽ ra sẽ là sơ đồ của các bức tờng của môi trờng xung quanh. 3.1. Trộn 02 cảm biến Giả sử ta có hai cảm biến đang quan sát 1 máy bay chuyển động, loại của máy bay này có thể là máy bay phản lực TU134, hoặc dạng tơng tự của TU là AN26 và có thể là máy bay MI8. Ta sẽ thêm 02 trạng thái trong cơ sở tri thức. 1. Trạng thái Unknown: là trạng thái khi mà việc đa ra quyết định máy bay thuộc loại nào là không thể thực hiện đợc. Điều này tơng đơng với tập con {TU134, AN26}. 2. Trạng thái Fast, ở đây ta không thể phân biệt giữa TU134 và AN26 về mặt tốc độ. Giả sử 02 cảm biến phân phối các khối lợng cho tập luỹ thừa nh trong bảng 1; cột thứ 3 là các khối lợng trộn cuối cùng mà ta sẽ tính toán. Trong số 8 tập con có thể đợc tạo thành từ 3 máy bay, chỉ có 5 tập là hữu ích, vì vậy chúng là những tập đợc phân phối khối lợng, Dempster-Shafer cũng yêu cầu tổng các khối lợng bằng 1 trên toàn bộ tập con luỹ thừa. Ví dụ nếu cảm biến 1 cho xác suất là máy bay là máy bay TU134 thì cách viết khác là khối lợng của nó là 30%, khi đó các xác suất đợc tính đối với máy bay TU134 qua các tập Fast và Unknown là không có ý nghĩa. Các khối lợng này đợc trộn sử dụng quy tắc kết hợp sử dụng quy tắc Dempster. Sử dụng chỉ số trên của khối lợng để chỉ số của cảm biến ta đợc: SUM/)B(m)A(m)C(m CBA 212,1 = = (3) ở đây SUM là tổng các khối lợng của các thành phần trong tập luỹ thừa. Bảng 1 Cảm biến 1 (khối lợng m 1 ) Cảm biến 2 (khối lợng m 2 ) Khối lợng trộn (khối lợng m 1,2 ) TU 134 30% 40% 55% AN26 15% 10% 16% MI8 3% 2% 0,4% Fast 42% 45% 29% Unknown 10% 3% 0,3% Tổng khối lợng 100% 100% 100% Ta sẽ trộn dữ liệu của bảng 1 sử dụng quy tắc (3) này. Ví dụ với máy bay TU134 ta đợc: .SUM/47.0 SUM/40.010.040.042.003.030.045.030.040.030.0 SUM/)]134TU(m)Unknown(m )134TU(m)Fast(m)Unknown(m)134TU(m )Fast(m)134TU(m)134TU(m)134TU(m[)134TU(m 21 2121 21212,1 = ì+ì+ì+ì+ì= + ++ += CT 2 Các đại lợng khác sẽ đợc tính tơng tự. Sau khi tính toán ta sẽ đợc các giá trị khối lợng mới sau khi trộn tại cột 3 của bảng 1. Việc trộn này củng cố thêm ý tởng cho rằng máy bay thuộc loại TU134 và cùng với niềm tin ban đầu nó thuộc loại máy bay nhanh, có nghĩa là ta chắc chắn hơn bao giờ hết rằng nó không phải là loại máy bay MI8. Mặc đầu vậy có một điều là mặc dù là phần lớn các khối lợng đợc gán cho 2 loại máy bay nhanh, nhng sau khi trộn, khối lợng mà gán cho Fast không nhiều nh ta tởng. Điều này là lý do rất tốt để không giải thích khối lợng Dempster-Shafer là các xác suất. Ta có thể làm sáng tỏ điều bất thờng này bằng cách sử dụng một tập các khối lợng mới nh trong bảng 2. Cảm biến 2 không gán khối lợng cho Fast. Ta có thể giải thích điều này nghĩa là nó không biết máy bay thuộc loại nhanh hay không. Nhng một trạng thái nh vậy thì không khác biệt gì về mặt số với việc gán cho nó khối lợng bằng 0. Ta trộn các khối lợng của 2 cột đầu tiên trong bảng 2 tạo ra cột thứ 3. Mặc dù trộn dữ liệu vẫn dẫn đến cùng một niềm tin nh trớc đây, nhng giá trị 2% của m 1,2 Fast có vẻ hơi bất thờng với kết luận là máy bay này rất có thể là máy bay TU134 hoặc AN26. Các khối lợng nh vậy chắc chắn không thể nào là xác suất đợc. Rất có thể là sự thiếu hiểu biết về một trạng thái sẽ dẫn đến việc gán cho nó một khối lợng lớn hơn 0, nhng khối lợng đó cần phải bằng bao nhiêu, khi mà xem xét tất cả các tập con, thì còn là một hớng mở cho việc nghiên cứu. Từ công thức (1) ta có thể viết lại quy tắc Dempster-Shafer khi trộn dữ liệu của hai cảm biến là: = = = = = CBA 21 CBA 21 0BA 21 CBA 21 2,1 )B(m)A(m1 )B(m)A(m )B(m)A(m )B(m)A(m )C(m (4) Bảng 2 Cảm biến 1 (khối lợng m 1 ) Cảm biến 2 (khối lợng m 2 ) Khối lợng trộn (khối lợng m 1,2 ) TU 134 30% 50% 63% AN26 15% 30% 31% MI8 3% 17% 3.5% Fast 42% 2% Unknown 10% 3% 0.5% Tổng khối lợng 100% 100% 100% 3.2. Ba hoặc nhiều hơn ba cảm biến Trong trờng hợp ba hoặc nhiều hơn ba cảm biến, quy tắc Dempster-Shafer có thể đợc áp dụng theo các cách khác nhau phụ thuộc vào thứ tự đợc chọn của các cảm biến nhng kết quả là quy tắc chỉ quan tâm đến các tập giao nhau, thứ tự trộn sẽ không quan trọng, nh vậy cho trờng hợp ba cảm biến ta đợc công thức (5): = = = == 0CBA 321 DCBA 321 0CBA 321 DCBA 321 3,2,1 )C(m)B(m)A(m1 )C(m)B(m)A(m )C(m)B(m)A(m )C(m)B(m)A(m )D(m (5) CT 2 và khi trộn nhiều cảm biến hơn ta có thể xây dựng công thức tơng tự nh công thức (5) ở trên. 4. Kết luận Trộn dữ liệu là một lĩnh vực mới đợc đa ra trong những năm gần đây, tuy nhiên các ứng dụng của nó trên thế giới đang đợc phát triển rất mạnh mẽ áp dụng vào mọi ngành và lĩnh vực khác nhau. Trong khuôn khổ bài báo có hạn, chúng tôi chỉ đi sâu trình bày một số phơng pháp cơ bản và đa ra một phơng pháp trộn ứng dụng quy tắc Dempster-Shafer. Tuy nhiên quá trình trộn dữ liệu đa cảm biến là một vấn đề phức tạp đặc biệt là khi ta phải giải quyết các bài toán yêu cầu cần nhiều loại cảm biến khác nhau. Các phơng pháp trộn dữ liệu đa cảm biến vẫn còn là một hớng mở cho chúng ta tiếp tục nghiên cứu. Tài liệu tham khảo [1] Zou Y, Ho Y K, Chua C S. Zhou X W. Multi-untrasonic sensor fusion for autonomous mobile robots. Proc SPIE 4051, 2000. [2] Elaine Rich, Kenvin Knight. Artificial Intelligence, McGraw-Hill, Inc 1991 [3] G. W. Ng. Intelligent Systems Fusion, Tracking and Control, UMIST, 2004. [4] CJ Harris, ZQ Wu. Inteligetn NeuroFuzzy Estimator & Multisensor Data Fusion, UK , 1999. [5] David L Hall. An Introduction to Multisensor Data Fusion, Proc.1997 IEEE, 1997. [6] http://en.wikipedia.org/wiki/Bayes%27_theorem [7] Nguyễn Đình Cử. Giáo trình Lý thuyết xác suất và thống kê toán, Nhà xuất bản Thống kê, Hà nội, 1991Ă . Tóm tắt: Trộn dữ liệu đa cảm biến l quá trình kết hợp dữ liệu v thông tin từ nhiều nguồn cảm biến khác nhau. L một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn đang đợc tiếp. áp dụng Lý thuyết Dempster-Shafer cho quá trình trộn dữ liệu đa cảm biến ThS Phạm hải an Viện Tự động hoá kỹ thuật quân sự. một cảm biến cho nhiều mục đích. 2. Một số kỹ thuật trộn dữ liệu Là một lĩnh vực tơng đối mới mẻ nên các kỹ thuật trộn dữ liệu vẫn còn đang đợc tiếp tục nghiên cứu và giải quyết. Do trộn dữ liệu