Ứng dụng kỹ thuật mạng noron trong khai phá dữ liệu tối ưu hiệu suất lò

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	6
Dung lượng	312,69 KB

Nội dung

1 TÓM TẮT CHUYÊN ĐỀ CƠ SỞ DỮ LIỆU TÊN CHUYÊN ĐỀ ỨNG DỤNG KHAI PHÁ DỮ LIỆU TỐI ƯU HIỆU SUẤT LÒ HƠI CÔNG NGHIỆP I. Thông tin chung 1. Họ và tên: Nguyễn Minh Tâm. 2. Mã số sinh viên: CH0601062 3. Chuyên đề: Cơ sở dữ liệu 4. Tên đề tài luận văn: “Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ” 5. Giảng viên hướng dẫn: TS Quản Thành Thơ, Khoa KH&KT Máy Tính, trường ĐH Bách Khoa thành phố HCM. II. Nội dung thực hiện 1. Tình hình nghiên cứu chuyên đề trong nước và ngoài nước Tình hình nghiên cứu trong nước: mạng noron và khai phá dữ liệu là hai lĩnh vực đã được nghiên cứu nhiều ở nước ta, tuy nhiên, việc ứng dụng cả hai kỹ thuật này vào thực tế, nhất là trong lĩnh vực công nghiệp nặng, thì theo khảo sát hiện nay, chưa có một công trình nghiên cứu nào được công bố rộng rãi. Tình hình nghiên cứu nước ngoài: hiện tại, chuyên đề này rất được quan tâm, mới đây, trong hội thảo khách hàng của hãng General Electric vào tháng 08 năm 2008, Stephen Kwan đã giới thiệu phần mềm Kn3, phần mềm chuyên dụng trong tối ưu nhà máy năng lượng và các ứng dụng khác nhằm làm tăng hiệu suất, giảm khí thải ô nhiễm môi trường. Phần mềm này có mô hình nghiên cứu 2 Với bộ quản trị dữ liệu giúp khai phá dữ liệu, mạng noron mô hình hóa đối tượng, bảng tập luật và các thuật toán di truyền xác định luật điều khiển, tạo tri thức, bộ điều khiển đa biến thực hiện tối ưu… Zhe Song and Andrew Kusiak trong hội thảo Constraint-Based Control of Boiler Efficiency: A Data-Mining Approach, FEBRUARY 2007. Andrew Kusiak, Zhe Song trong bài báo Combustion Efficiency Optimization and Virtual Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 2, NO. 3, AUGUST 2006. Xu hướng nghiên cứu thật ra là một dạng của phương pháp đ iều khiển công nghệ tiên tiến ( Advanced Process Control). APC hiện đang được áp dụng rất phổ biến trong các nhà máy lọc dầu, nhà máy Amonia và các nhà máy hóa chất. 2. Mục tiêu nghiên cứu và phương pháp thực hiện 2.1. Mục tiêu Tối ưu hiệu suất lò hơi trong công nghiệp bằng phương pháp mạng noron và gom cụm trong khai phá dữ liệu. 2.2. Nội dung thực hiện Khái quát quy trình khai phá dữ liệu như sau: 3 Lưu đồ giải thuật của quá trình tối ưu 2.2.1 Tạo dấu hiệu điều khiển với thuật toán gom cụm K-means - Một trong các giải thuật K-means cải tiến được dùng để quyết định luật điều khiển, phân loại trọng tâm và các giá trị liên quan, để tối ưu hiệu suất. N Y Dữ liệu vận hành của lò hơi lấy từ hệ thống DCS - Mô hình hoá lò hơi bằng hàm đa biến y=f(x1,x2,x3…) bằng mạng noron. - Xây dựng cơ sở tri thức chứa các mẫu dấu hiệu điều khiển bằng thuật toán khai phá dữ liệu GIAI ĐOẠN HỌC - Hệ thống sẽ đưa ra thông số hiệu chỉnh cho nhân viên vận hành đặt lại vào hệ thống DCS, những thay đổi thông số này nằm trong khoảng rất nhỏ cho phép nhằm bảo đảm không gây thay đổi đột ngột cũng như luôn luôn kiểm soát được côn g n g hệ. GIAI ĐOẠN HIỆN THỰC -Các thông số tối ưu hệ thống được đưa vào hàm điều khiển để thực nghiệm kiểm tra tính chính xác cũng như tính toán hiệu quả. GIAI ĐOẠN KIỂM THỬ - Các thay đổi sau một khoảng thời gian nhất định, được kiểm tra bằng cách đánh giá lại hiệu suất và so sánh với tình t r ạ n g trước đó. KIỂM TRA KẾT QUẢ Y HOÀN THÀNH N 4 - Dấu hiệu điều khiển được xây dựng từ các trọng tâm và dùng cho tối ưu thời gian thực của quá trình cháy. Một dấu hiệu điều khiển bao gồm một tập giá trị của các thông số điều khiển được và không điều khiển được, hiệu suất cháy tương ứng, và các liệt kê liên quan như độ hỗ trợ ( số lượng các điểm trong cụ m…) và độ tin cậy (sự thay đổi của các điểm dữ liệu trong cụm). - Phương pháp tối ưu hiệu suất sẽ điều chỉnh các thông số điều khiển được dựa trên các dấu hiệu điều khiển được lưu trong cơ sở tri thức. 2.2.2 Rời rạc dữ liệu: - Trong khi thực hiện quá trình tối ưu, để đạ t được kết quả tốt nhất, cần phải rời rạc hóa giá trị của hiệu suất thành các giá trị thuộc các mức. Ví dụ hiệu suất hiện tại của lò hơi luôn dao động trong khoảng từ 86% đến 88%, thì ta sẽ chia các giá trị này thành mười mức. - Khi đó, một điểm vận hành trong thời gian thực P1 nào đó với hiệu suất e1 sẽ được hệ thống xem xét có trọ ng số khoảng cách Euclidean gần nhất với dấu hiệu điều khiển CS(i) nào đó theo công thức mà hiệu suất ei>e1 thì sẽ hiệu chỉnh bộ thông số điều khiển của P1 thành Pi. 2.2.3 Xây dựng dấu hiệu điều khiển: a. Chế độ học offline: - Trong chế độ này, dấu hiệu điều khiển được xây dựng trên dữ liệu lịch sử. Việc học trải qua bốn bước cơ bản sau: • Bước 1: Tiền xử lý tín hi ệu thô: loại nhiễu, đổi thang đo, loại bỏ các giá trị sai, rời rạc hóa các giá trị hiệu suất. • Bước 2: Nhóm các điểm dữ liệu tiền xử lý thành mười nhóm ứng với mười mức hiệu suất, kèm theo tập dữ liệu liên quan (gồm các thông số điều khiển được và không điều khiển được). • Bước 3: Với mỗi tập dữ liệu ở bước hai, dùng thuật toán gom cụm K-means để tạo tập trọng tâm. Giá trị của K được quyết định dựa vào số lượng các điểm của mức hiệu suất đó, ví dụ là 5% số lượng điểm. Ngoài ra, các phương pháp khác cũng có thể cân nhắc, ví dụ như độ lệch… • Bước 4: Lưu các dấu hiệu điều khiển đã tính toán trên vào bộ cơ sở tri thứ c, với điều kiện nó khác với những bộ dữ liệu hiện hữu đã được lưu. Việc kiểm tra này được xác định bởi hệ số chấp nhận sự giống nhau do ta xác định. b. Chế độ học Online: - Trong chế độ này, dấu hiệu điều khiển có thể thu thập và cập nhật liên tục trong khi tối ưu hiệu suất quá trình cháy. Dữ liệu vận hành thực tế được lựa chọn và tiền xử lý. Để lựa chọn cài đặt điều khiển run time, cơ sở tri thức sẽ tìm kiếm dấu hiệu điều khiển giống điểm đang xét nhất mà có cùng mứ c hiệu suất, nếu dấu hiệu gần nhất được tìm thấy, thì dấu hiệu tương ứng được thống kê, như độ lệch chuẩn, số lượng đại diện, trong cụm được cập nhật. 2.2.4 Xây dựng chiến lược điều khiển: - Để tăng hiệu suất vận hành, một điểm dữ liệu i với tập dữ liệu p(i) trong dữ liệu vận hành run time được hệ thống xem xét tìm một dấu hiệu điều khiển trong cơ sở tri 5 thức CS i có thông số “gần giống” p(i) nhất mà hiệu suất cao hơn, sẽ tác động thay đổi thông số của p(i) bằng bộ thông số của chính nó. Và ngược lại, nếu p(i) có hiệu suất cao hơn thì tập dữ liệu p(i) sẽ được cập nhật vào cơ sở tri thức CS(i) thay cho p(i), đây chính là tính năng tự học của hệ thống, luôn cập nhật tri thức để đáp ứng với thay đổi công nghệ - Có ba chiến lược điều khiển để chọn lựa dấu hiệu điều khiển như mong muốn được xác định: bảo thủ, trung hòa và cầu tiến. 2.2.5 Mô hình hóa lò hơi: Mặc dù mạng nơron thì không thích hợp lắm cho điều khiển quá trình cháy thời gian thực, nhưng rất hữu ích cho quá trình xấp xỉ các hàm phi tuyến có thứ nguyên cao. Ta xem lò hơi với các phương trình phản ứng bên trong như một h ộp đen, với các thông số công nghệ đầu vào và đầu ra Lò hơi này được mô hình thành một phương trình đa biến Y=f(x1, x2,…xj,….xn) với xi, i=(1 n) là các thông số công nghệ đầu vào. 2.2.6 Tối ưu hiệu suất cháy thời gian thực: - Vấn đề cơ bản là tối ưu hiệu suất thời gian thực với những chức năng thay đổi mục tiêu (2) và ràng buộc vận hành(3,4). Trong đó, E(t) là hiệu suất lò hơi ở thời điểm t - Mạng nơron sẽ được huấn luyện trong một ngày, khoảng 1,1440 record (thời gian lấy mẫu là một phút). Mô hình mạng nơron được dùng để dự báo hiệu suất lò hơi sau khi các thông số điều khiển được đã được cập nhật tùy thuộc vào những cài đặt điều khiển tối ưu đã sinh ra từ mô hình l ập trình tuyến tính. Với các thông số duy trì ổn định không đổi, hiệu suất lò hơi dự báo bởi mạng nơron sẽ quay về lại thành đầu vào mạng nơron để dự báo hiệu suất lò hơi ở mức kế tiếp. 3.Tài liệu tham khảo • Stephen Kwan, Kn3 – Power Plant Optimization and Other Applications, OC User Conference, Kuala Lumpur, August 2008 Các phản ứng công nghệ lò hơi Nước vào (T,P,F ) Fuel gas vào (T,P,F ) : Hơi ra (T,P,F) : Hiệu suất lò hơi y x2 y1=f1(x1,x2 ,xi, xn) x1 : xn : Mô hình hóa 6 • Zhe Song and Andrew Kusiak,Constraint-Based Control of Boiler Efficiency: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 3, NO. 1, FEBRUARY 2007 • * Andrew Kusiak, Zhe Song, Combustion Efficiency Optimization and Virtual Testing: A Data-Mining Approach, IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS, VOL. 2, NO. 3, AUGUST 2006. • TS Đỗ Phúc, Chuyên đề khai phá dữ liệu và nhà kho dữ liệu, Trường đại học CNTT, 2004. • Định nghĩa lò hơi http://en.wikipedia.org/wiki/Boiler . • Tài liệu hướng dẫn của phần mềm Matlab. III. Kết quả và kiến nghị 3.1. Kết quả đạt được (tham khảo bài báo) • Dự báo chính xác hiệu suất từ mạng Noron • Kết quả tối ưu nâng được hiệu suất từ 1 đến 1.5 % trong điều kiện test 3.2. Kiến nghị - Đề tài đang được xin làm đề tài nghiên cứu khoa học tại Nhà máy Đạm Phú Mỹ, KCN Phú Mỹ 1, Tân Thành, Bà Rịa Vũng Tàu với ứng dụng thực tiễn tối ưu hiệu suất lò hơi Marchi công suất 140 tấn/giờ, được điều khiển hoàn toàn tự động bằng bộ điều khiển logic khả trình PLC và hệ điều khiển phân tán DCS - Hoàn thành luận văn tốt nghiệp “ Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ” . số sinh viên: CH0601062 3. Chuyên đề: Cơ sở dữ liệu 4. Tên đề tài luận văn: Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ” 5. Giảng viên. phương pháp thực hiện 2.1. Mục tiêu Tối ưu hiệu suất lò hơi trong công nghiệp bằng phương pháp mạng noron và gom cụm trong khai phá dữ liệu. 2.2. Nội dung thực hiện Khái quát quy trình khai phá. điều khiển phân tán DCS - Hoàn thành luận văn tốt nghiệp “ Ứng dụng kỹ thuật mạng Noron trong khai phá dữ liệu tối ưu hiệu suất lò hơi ở nhà máy Đạm Phú Mỹ”

Ngày đăng: 22/04/2014, 20:42

Xem thêm