1 TÓM TẮT CHUYÊN ĐỀ CƠ SỞ DỮLIỆU TÊN CHUYÊN ĐỀ ỨNGDỤNGKHAIPHÁDỮLIỆUTỐIƯUHIỆUSUẤTLÒ HƠI CÔNG NGHIỆP I. Thông tin chung 1. Họ và tên: Nguyễn Minh Tâm. 2. Mã số sinh viên: CH0601062 3. Chuyên đề: Cơ sở dữliệu 4. Tên đề tài luận văn: “Ứng dụngkỹthuậtmạngNoron trong khaiphádữliệu tối ưuhiệusuấtlò hơi ở nhà máy Đạm Phú Mỹ” 5. Giảng viên hướng dẫn: TS Quản Thành Thơ, Khoa KH&KT Máy Tính, trường ĐH Bách Khoa thành phố HCM. II. Nội dung thực hiện 1. Tình hình nghiên cứu chuyên đề trong nước và ngoài nước Tình hình nghiên cứu trong nước: mạngnoron và khaiphádữliệu là hai lĩnh vực đã được nghiên cứu nhiều ở nước ta, tuy nhiên, việc ứngdụng cả hai kỹthuật này vào thực tế, nhất là trong lĩnh vực công nghiệp nặng, thì theo khảo sát hiện nay, chưa có một công trình nghiên cứu nào được công bố rộng rãi. Tình hình nghiên cứu nước ngoài: hiện tại, chuyên đề này rất được quan tâm, mới đây, trong hội thảo khách hàng của hãng General Electric vào tháng 08 năm 2008, Stephen Kwan đã giới thiệu phần mềm Kn3, phần mềm chuyên dụngtrongtốiưu nhà máy năng lượng và các ứngdụng khác nhằm làm tăng hiệu suất, giảm khí thải ô nhiễm môi trường. Phần mềm này có mô hình nghiên cứu 2 Với bộ quản trị dữliệu giúp khaiphádữ liệu, mạngnoron mô hình hóa đối tượng, bảng tập luật và các thuật toán di truyền xác định luật điều khiển, tạo tri thức, bộ điều khiển đa biến thực hiện tối ưu… Zhe Song and Andrew Kusiak trong hội thảo Constraint-Based Control of Boiler Efficiency: A Data-Mining Approach, FEBRUARY 2007. Andrew Kusiak, Zhe Song trong bài báo Combustion Efficiency Optimization and Virtual Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 2, NO. 3, AUGUST 2006. Xu hướng nghiên cứu thật ra là một dạng của phương pháp đ iều khiển công nghệ tiên tiến ( Advanced Process Control). APC hiện đang được áp dụng rất phổ biến trong các nhà máy lọc dầu, nhà máy Amonia và các nhà máy hóa chất. 2. Mục tiêu nghiên cứu và phương pháp thực hiện 2.1. Mục tiêu Tốiưuhiệusuấtlò hơi trong công nghiệp bằng phương pháp mạngnoron và gom cụm trong khaiphádữ liệu. 2.2. Nội dung thực hiện Khái quát quy trình khaiphádữliệu như sau: 3 Lưu đồ giải thuật của quá trình tốiưu 2.2.1 Tạo dấu hiệu điều khiển với thuật toán gom cụm K-means - Một trong các giải thuật K-means cải tiến được dùng để quyết định luật điều khiển, phân loại trọng tâm và các giá trị liên quan, để tốiưuhiệu suất. N Y Dữliệu vận hành của lò hơi lấy từ hệ thống DCS - Mô hình hoá lò hơi bằng hàm đa biến y=f(x1,x2,x3…) bằng mạng noron. - Xây dựng cơ sở tri thức chứa các mẫu dấu hiệu điều khiển bằng thuật toán khaiphádữliệu GIAI ĐOẠN HỌC - Hệ thống sẽ đưa ra thông số hiệu chỉnh cho nhân viên vận hành đặt lại vào hệ thống DCS, những thay đổi thông số này nằm trong khoảng rất nhỏ cho phép nhằm bảo đảm không gây thay đổi đột ngột cũng như luôn luôn kiểm soát được côn g n g hệ. GIAI ĐOẠN HIỆN THỰC -Các thông số tốiưu hệ thống được đưa vào hàm điều khiển để thực nghiệm kiểm tra tính chính xác cũng như tính toán hiệu quả. GIAI ĐOẠN KIỂM THỬ - Các thay đổi sau một khoảng thời gian nhất định, được kiểm tra bằng cách đánh giá lại hiệusuất và so sánh với tình t r ạ n g trước đó. KIỂM TRA KẾT QUẢ Y HOÀN THÀNH N 4 - Dấu hiệu điều khiển được xây dựng từ các trọng tâm và dùng cho tốiưu thời gian thực của quá trình cháy. Một dấu hiệu điều khiển bao gồm một tập giá trị của các thông số điều khiển được và không điều khiển được, hiệusuất cháy tương ứng, và các liệt kê liên quan như độ hỗ trợ ( số lượng các điểm trong cụ m…) và độ tin cậy (sự thay đổi của các điểm dữliệutrong cụm). - Phương pháp tốiưuhiệusuất sẽ điều chỉnh các thông số điều khiển được dựa trên các dấu hiệu điều khiển được lưu trong cơ sở tri thức. 2.2.2 Rời rạc dữ liệu: - Trong khi thực hiện quá trình tối ưu, để đạ t được kết quả tốt nhất, cần phải rời rạc hóa giá trị của hiệusuất thành các giá trị thuộc các mức. Ví dụhiệusuất hiện tại của lò hơi luôn dao động trong khoảng từ 86% đến 88%, thì ta sẽ chia các giá trị này thành mười mức. - Khi đó, một điểm vận hành trong thời gian thực P1 nào đó với hiệusuất e1 sẽ được hệ thống xem xét có trọ ng số khoảng cách Euclidean gần nhất với dấu hiệu điều khiển CS(i) nào đó theo công thức mà hiệusuất ei>e1 thì sẽ hiệu chỉnh bộ thông số điều khiển của P1 thành Pi. 2.2.3 Xây dựng dấu hiệu điều khiển: a. Chế độ học offline: - Trong chế độ này, dấu hiệu điều khiển được xây dựng trên dữliệu lịch sử. Việc học trải qua bốn bước cơ bản sau: • Bước 1: Tiền xử lý tín hi ệu thô: loại nhiễu, đổi thang đo, loại bỏ các giá trị sai, rời rạc hóa các giá trị hiệu suất. • Bước 2: Nhóm các điểm dữliệu tiền xử lý thành mười nhóm ứng với mười mức hiệu suất, kèm theo tập dữliệu liên quan (gồm các thông số điều khiển được và không điều khiển được). • Bước 3: Với mỗi tập dữliệu ở bước hai, dùngthuật toán gom cụm K-means để tạo tập trọng tâm. Giá trị của K được quyết định dựa vào số lượng các điểm của mức hiệusuất đó, ví dụ là 5% số lượng điểm. Ngoài ra, các phương pháp khác cũng có thể cân nhắc, ví dụ như độ lệch… • Bước 4: Lưu các dấu hiệu điều khiển đã tính toán trên vào bộ cơ sở tri thứ c, với điều kiện nó khác với những bộ dữliệu hiện hữu đã được lưu. Việc kiểm tra này được xác định bởi hệ số chấp nhận sự giống nhau do ta xác định. b. Chế độ học Online: - Trong chế độ này, dấu hiệu điều khiển có thể thu thập và cập nhật liên tục trong khi tốiưuhiệusuất quá trình cháy. Dữliệu vận hành thực tế được lựa chọn và tiền xử lý. Để lựa chọn cài đặt điều khiển run time, cơ sở tri thức sẽ tìm kiếm dấu hiệu điều khiển giống điểm đang xét nhất mà có cùng mứ c hiệu suất, nếu dấu hiệu gần nhất được tìm thấy, thì dấu hiệu tương ứng được thống kê, như độ lệch chuẩn, số lượng đại diện, trong cụm được cập nhật. 2.2.4 Xây dựng chiến lược điều khiển: - Để tăng hiệusuất vận hành, một điểm dữliệu i với tập dữliệu p(i) trongdữliệu vận hành run time được hệ thống xem xét tìm một dấu hiệu điều khiển trong cơ sở tri 5 thức CS i có thông số “gần giống” p(i) nhất mà hiệusuất cao hơn, sẽ tác động thay đổi thông số của p(i) bằng bộ thông số của chính nó. Và ngược lại, nếu p(i) có hiệusuất cao hơn thì tập dữliệu p(i) sẽ được cập nhật vào cơ sở tri thức CS(i) thay cho p(i), đây chính là tính năng tự học của hệ thống, luôn cập nhật tri thức để đáp ứng với thay đổi công nghệ - Có ba chiến lược điều khiển để chọn lựa dấu hiệu điều khiển như mong muốn được xác định: bảo thủ, trung hòa và cầu tiến. 2.2.5 Mô hình hóa lò hơi: Mặc dùmạngnơron thì không thích hợp lắm cho điều khiển quá trình cháy thời gian thực, nhưng rất hữu ích cho quá trình xấp xỉ các hàm phi tuyến có thứ nguyên cao. Ta xem lò hơi với các phương trình phản ứng bên trong như một h ộp đen, với các thông số công nghệ đầu vào và đầu ra Lò hơi này được mô hình thành một phương trình đa biến Y=f(x1, x2,…xj,….xn) với xi, i=(1 n) là các thông số công nghệ đầu vào. 2.2.6 Tốiưuhiệusuất cháy thời gian thực: - Vấn đề cơ bản là tốiưuhiệusuất thời gian thực với những chức năng thay đổi mục tiêu (2) và ràng buộc vận hành(3,4). Trong đó, E(t) là hiệusuấtlò hơi ở thời điểm t - Mạngnơron sẽ được huấn luyện trong một ngày, khoảng 1,1440 record (thời gian lấy mẫu là một phút). Mô hình mạngnơron được dùng để dự báo hiệusuấtlò hơi sau khi các thông số điều khiển được đã được cập nhật tùy thuộc vào những cài đặt điều khiển tốiưu đã sinh ra từ mô hình l ập trình tuyến tính. Với các thông số duy trì ổn định không đổi, hiệusuấtlò hơi dự báo bởi mạngnơron sẽ quay về lại thành đầu vào mạngnơron để dự báo hiệusuấtlò hơi ở mức kế tiếp. 3.Tài liệu tham khảo • Stephen Kwan, Kn3 – Power Plant Optimization and Other Applications, OC User Conference, Kuala Lumpur, August 2008 Các phản ứng công nghệ lò hơi Nước vào (T,P,F ) Fuel gas vào (T,P,F ) : Hơi ra (T,P,F) : Hiệusuấtlò hơi y x2 y1=f1(x1,x2 ,xi, xn) x1 : xn : Mô hình hóa 6 • Zhe Song and Andrew Kusiak,Constraint-Based Control of Boiler Efficiency: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 3, NO. 1, FEBRUARY 2007 • * Andrew Kusiak, Zhe Song, Combustion Efficiency Optimization and Virtual Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 2, NO. 3, AUGUST 2006. • TS Đỗ Phúc, Chuyên đề khai phádữliệu và nhà kho dữ liệu, Trường đại học CNTT, 2004. • Định nghĩa lò hơi http://en.wikipedia.org/wiki/Boiler . • Tài liệu hướng dẫn của phần mềm Matlab. III. Kết quả và kiến nghị 3.1. Kết quả đạt được (tham khảo bài báo) • Dự báo chính xác hiệusuất từ mạngNoron • Kết quả tốiưu nâng được hiệusuất từ 1 đến 1.5 % trong điều kiện test 3.2. Kiến nghị - Đề tài đang được xin làm đề tài nghiên cứu khoa học tại Nhà máy Đạm Phú Mỹ, KCN Phú Mỹ 1, Tân Thành, Bà Rịa Vũng Tàu với ứngdụng thực tiễn tốiưuhiệusuấtlò hơi Marchi công suất 140 tấn/giờ, được điều khiển hoàn toàn tự động bằng bộ điều khiển logic khả trình PLC và hệ điều khiển phân tán DCS - Hoàn thành luận văn tốt nghiệp “ ỨngdụngkỹthuậtmạngNoron trong khaiphádữliệu tối ưuhiệusuấtlò hơi ở nhà máy Đạm Phú Mỹ” . số sinh viên: CH0601062 3. Chuyên đề: Cơ sở dữ liệu 4. Tên đề tài luận văn: Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ” 5. Giảng viên. phương pháp thực hiện 2.1. Mục tiêu Tối ưu hiệu suất lò hơi trong công nghiệp bằng phương pháp mạng noron và gom cụm trong khai phá dữ liệu. 2.2. Nội dung thực hiện Khái quát quy trình khai phá. điều khiển phân tán DCS - Hoàn thành luận văn tốt nghiệp “ Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ”