XÂY DỰNG HỆ PHƯƠNG PHÁP TRÍ TUỆ NHÂN TẠO – HỆ THƠNG TIN ĐỊA LÝ VÀ TỐN ĐỊA CHẤT KHOANH VÙNG TRIỂN VỌNG VÀ ĐÁNH GIÁ TIỀM NĂNG DẦU KHÍ BỂ CỬU LONG DỖN NGỌC SAN, ĐẠI HỌC DẦU KHÍ VIỆT NAM Tóm tắt Bể Cửu Long biết đến vùng có tiềm dầu khí lớn Việt Nam Các tài liệu địa chất – địa vật lý khu vực thu thập phân tích nhiều Để khoanh vùng triển vọng đánh giá tiềm tích tụ dầu khí cách xác cần phải có cơng cụ có khả 1>Quản trị, xử lý tổng hợp tất tài liệu đo đạc khảo sát dạng số (numerical) dạng mô tả ngữ nghĩa (semantic) 2>Mơ với độ xác cao qui luật phức tạp đa dạng tích tụ dầu khí môi trường địa chất vây quanh Nhiệm vụ nêu giải kết hợp Trí Tuệ Nhân Tạo (Artificial Intelligence, AI) hệ thơng tin địa lý (Geographical Information System, GIS) - tốn địa chất (Geomatics) Tổ hợp phương pháp AI – GIS – Geomatics trở thành cơng cụ có hiệu suất cao cơng tác tìm kiếm thăm dị khống sản có ích khác cho đất nước Abstract Cuu Long Basin is known as the largest oil and gas potential in Vietnam Geological and geophysical data in this area has been collected and analyzed quite a lot To prospect and assess the potential of oil and gas deposits accurately we need a new tool which can: Manage and process all data numerical as well as the semantic Simulate of complex rules between the accumulation of petroleum and the surrounding geological environment These tasks can be solved by a combination of Artificial Intelligence (AI) and Geographic Information System (GIS) - Geomatics The combination of AI - GIS - Geomatics will become a powerful tool in the prospecting and exploration not only for oil and gas but also for other mineral resources Keywords: AI, GIS, Geomatics, Cuu Long basin, ANN Giới thiệu Mỗi loại khống sản nói chung tích tụ dầu khí nói riêng tạo thành điều kiện thành tạo địa chất định Mối liên hệ chặt chẽ tích tụ dầu khí với môi trường địa chất vây quanh thể rõ nét thông qua trường đo đạc khảo sát (lớp thông tin, layer) phương pháp địa vật lý, địa hóa, liệu khảo sát thạch học, kiến tạo Các tài liệu khảo sát trường nêu chia làm hai dạng: 1) Dạng số hay số hóa số liệu đo đạc địa vật lý, địa hóa 2) Dạng mơ tả ngữ nghĩa mô tả địa tầng, thạch học, cấu trúc, kiến tạo Các dấu hiệu tích tụ dầu khí lớp thơng tin nêu tn theo qui luật định Tìm quy luật (tập hợp dấu hiệu) khoanh định xác vị trí đánh giá tiềm triển vọng chúng Tuy nhiên qui luật phức tạp, không tường minh, tản mạn rời rạc với nhiều qui luật xác suất thống kê khác Vì vậy, để khoanh vùng triển vọng đánh giá tiềm tích tụ dầu khí cách xác cần phải có cơng cụ có khả năng: Quản trị, xử lý tổng hợp tất tài liệu đo đạc khảo sát (lớp thông tin) dạng số (numerical) dạng mô tả ngữ nghĩa (nonnumerical) Mô với độ xác cao qui luật phức tạp đa dạng tích tụ dầu khí mơi trường địa chất vây quanh dựa tập hợp lớp thông tin nêu Qua tìm tập hợp dấu hiệu tích tụ dầu khí để khoanh vùng triển vọng đánh giá tiềm tích tụ dầu khí Để giải nhiệm vụ nêu có nhiều cơng trình nghiên cứu cố gắng xây dựng quan hệ "tích tụ dầu khí - thơng tin khảo sát địa chất" hàm tốn học hay hệ phương trình thống kê truyền thống dựa lớp thông tin dạng số Tuy nhiên hàm số hay hệ phương trình cho kết định tính Hơn nữa, yếu điểm toán truyền thống thực lớp thơng tin dạng số (numerical) sử dụng thông tin dạng mô tả ngữ nghĩa (semantic) tài liệu khảo sát quan trọng địa tầng, thạch học, cấu trúc, kiến tạo v.v Sự kết hợp Trí Tuệ Nhân Tạo (Artificial Intelligence, AI), hệ thơng tin địa lý (Geographical Information System, GIS) toán địa chất (Geomatics) phướng án nâng cao hiệu công tác tìm kiếm đánh giá tích tụ dầu khí, khắc phục nhược điểm phương pháp Toán học truyền thống nêu GIS xây dựng nhằm đưa đồ, hình ảnh liệu địa lý vào máy tính thành số để máy tính hiểu tính tốn GIS sử dụng rộng rãi cho công tác điều tra, quản lý tài nguyên thiên nhiên quản lý đô thị Hiện nay, Việt Nam, nghiên cứu địa chất môi trường, tổ hợp GIS - Geomatic ứng dụng rộng rãi đề tài nghiên cứu công tác sản xuất Trên giới việc ứng dụng AI cơng tác tìm kiếm thăm dị khống sản nói chung dầu khí nói riêng áp dụng nhiều nước hay nhiều hãng lớn BP Oil Expert System (1988), PROSPECTOR Mỹ Đặc biệt phân nhánh AI mạng nơron nhân tạo (Artificial Neuron Network, ANN), thuật toán mờ (Fuzzy Logic, FL) hay giải thuật gen (Genetic, GA) coi phương pháp tổng hợp minh giải tài liệu địa vật lý dầu khí Tại Việt Nam, lần hệ chuyên gia ANN áp dụng đánh giá tiềm trữ lượng quặng chì – kẽm vùng Chợ Đồn, Bắc Cạn sở tổng hợp tài liệu địa chất – địa vật lí – địa hóa - ảnh viễn thám tri thức chuyên gia đầu ngành (ĐT cấp Bộ KHCN, chủ biên TS Doãn Ngọc San, 2001) Kết dự báo tài nguyên khoanh vùng triển vọng khống sản chì - kẽm vùng Chợ Đồn, Bắc Cạn tổ hợp phương pháp GIS-AI đề tài giúp cho việc lựa chọn vùng tìm kiếm đánh giá có sở khoa học tin cậy Trên sở xử lý tài liệu địa chất - khống sản - địa vật lý- địa hóa viễn thám tổ hợp phương pháp nêu trên, đề tài [2]: - Sử dụng ANN – phân loại không kiểm định mỏ điểm quặng để nhận biết nhóm dấu hiệu khống hóa thể trường địa chất - khoáng sản - địa vật lý- địa hóa - viễn thám Kết tìm 08 nhóm dấu hiệu đặc trưng, phù hợp với nhóm thành hệ quặng mà nhà địa chất phân loại Trong có vài điểm quặng xác định lại thành hệ theo kết phân loại đề tài - Bằng ANN – phân loại có kiểm định khoanh định diện tích triển vọng chì - kẽm theo nhóm dấu hiệu khống hóa ANN xác định với mức: cao, trung bình triển vọng - Trên sở luyện mạng ANN mỏ điểm quặng đánh giá tài nguyên tính tài nguyên dự báo Pb+Zn toàn mỏ điểm quặng vùng Chợ Đồn, Bắc Cạn Đề tài bước đầu thành lập chương trình xử lý số liệu ANN, import/export data liên kết số liệu phần mềm MapInfo/ILWIS/ERRMAPER/SURFER module quản trị sở tri thức Đề tài đánh giá cao tổ hợp phương pháp tiếp tục áp dụng cơng tác đánh giá tài ngun khống sản dự báo tai biến môi trường Trong ngành cơng nghiệp dầu khí, kỹ thuật AI (ANN, FL, GA tổ hợp lai chúng) ứng dụng chấp nhận công cụ mạnh mẽ hữu ích việc giải vấn đề lĩnh vực dầu khí (Hình 1) Một số ứng dụng kỹ thuật AI ngành dầu khí kể đến phát triển giao diện cho trình mơ phỏng, minh giải đường log, chuẩn đốn trình vận hành bơm hay lựa chọn minh giải mơ hình thử vỉa v.v… Tuy nhiên tổ hợp AI - GIS - Geomatic chưa ứng dụng ngành dầu khí Việt Nam Hình Ứng dụng AI ngành dầu khí Vai trị phương pháp tổ hợp phương pháp AI – GIS - Geomath 2.1 GIS - Hệ thống quản lý thông tin dạng số số hóa Với vai trị quản lý thơng tin, GIS cơng cụ thích hợp hữu ích để quản lý đồ, hình ảnh, liệu địa lý thơng qua việc "số hóa (digitizer)" GIS hệ thống quản trị thơng tin dạng số hóa (digitized) hệ thống máy tính Các thơng tin địa chất đồ, hình ảnh hay liệu giấy ranh giới địa chất, đối tượng địa chất, điểm đo/giá trị trường địa vật lý hay địa hóa lưu trữ vào sở liệu (Database, DB) dạng lớp thông tin số (layers) với đầy đủ thông tin tọa độ địa lý, mơ tả, giá trị trường Đây bước chuẩn bị số liệu đầu vào mạng ANN bước 2.2 Geomath thuật toán truyền thống xử lý tổng hợp thông tin dạng số/số hóa Các thuật tốn truyền thống giữ vai trị quan trọng xử lý, tổng hợp thơng tin dạng số/số hóa bổ xung thơng tin vào DB đặc biệt thuật tốn nội ngoại suy tích hợp loại số liệu khác 2.3 Trí tuệ nhân tạo (Artificial Intelligence, AI) - Phương pháp mô quan hệ thuộc tính vỉa chứa dầu khí môi trường địa chất vây quanh ARTIFICIAL INTELLIGENCE NEURAL NETWORK Non-linear, multiregression classification and prediction EXPERT SYSTEM Determining rules heuristic on knowledge base FUZZY LOGIC, GENETIC processing unclear, non-numerical data Để nâng cao hiệu cơng tác tìm kiếm đánh giá dầu khí cần phải có cơng cụ tốn học phi truyền thống có khả mơ cao hơn, phù hợp với mơ hình đa nghiệm, đa chiều, phi hàm số, mô tả nặng ngữ nghĩa khơng tường minh mơ hình địa chất dầu khí Đó nhiệm vụ đặt cho khoa học Trí tuệ nhân tạo với chuyên ngành Hệ chuyên gia (Expert System, ES), Mạng thần kinh nhân tạo (ANN), Lý thuyết mờ (Fuzzy Logic, FL) hay Giải thuật di truyền (Genetic Algorithm, GA) [2] 2.3.1 Artificial Neuron Network (ANN), Fuzzy Logic Genetic Algorithm Dữ liệu địa chất thu mang tính tản mạn, rời rạc với nhiều qui luật xác suất thống kê khác ANN đặc biệt phát huy khả lĩnh vực Mạng NN sử dụng với mục đích (i) phân loại (unsupervisor classification), (ii) nhận dạng (supervisor classification) (iii) dự báo (prediction) lớp thông tin DB - Phân loại xác định thuộc tính đặc trưng vỉa chứa dầu khí Đầu vào (input layers) mạng NN nạp thông tin đặc trưng vỉa chứa dầu khí (Địa chấn, ĐVL giếng khoan, tài liệu địa chất, địa hóa ) Sau q trình phân loại, mạng NN chia đặc trưng vỉa chứa dầu khí thành nhóm có thuộc tính gần giống Đó NHĨM DẤU HIỆU ĐẶC TRƯNG VỈA CHỨA DẦU KHÍ mà chuyên gia dầu khí nhiều năm kinh nghiệm đúc kết Các tập hợp dấu hiệu nêu chắn có phần giống với đúc kết kinh nghiệm chuyên gia có tập hợp dấu hiệu mà chưa phát - Nhận dạng - Khoanh vùng dự báo đặc trưng địa chất dầu khí Mạng NN tiến hành "dạy (training)" "mẫu (sample)" đặc trưng thuộc tính nhóm phân chia bước Bước q trình "nhận dạng" theo diện tích nghiên cứu để khoanh vùng có đặc tính gần giống với mẫu học từ khoanh vùng dự báo đặc trưng địa chất dầu khí 2.3.2 Hệ chuyên gia - Công cụ quản trị xử lý thông tin dạng số hóa mơ tả ngữ nghĩa Hệ chun gia chương trình máy tính cho phép sử dụng tri thức lĩnh vực với thủ thuật suy diễn, nhằm giải tốn địi hỏi phải dựa vào tri thức chuyên gia lĩnh vực Tri thức cần để giải toán với thủ thuật suy diễn xem mơ hình tri thức chuyên gia người Giống người chuyên gia, ES ghi nhớ tri thức liên quan đến lĩnh vực vào sở tri thức (Knowledge Base, KB) Khi ES yêu cầu giải toán, kiện thu nạp vào vùng nhớ tạm thời, sau cách kết hợp kiện tri thức KB, ES suy diễn đến kết luận tốn đặt (Hình 2) Người dùng Chuyên gia người/ Kỹ sư tri thức Hội thoại với người dùng Học thu nạp tri thức Motor suy diễn Suy diễn Giải thích Điều khiển Cơsở tri thức Luật kiện Bộ nhớ làm việc Hình Cấu trúc tổng quát hệ chuyên gia [1] Hai thành phần định thành cơng HCG (i) Cơ sở tri thức (Knowledge Base, KB) (ii) phương pháp suy diễn (Inference Monitor) - Cơ sở tri thức Để xử lý tri thức, ES cần có kỹ thuật mã hóa tri thức Các kỹ thuật mã hóa tri thức khác nhiều so với cách thể liệu chương trình, thuật tốn xử lý liệu thường gặp Điểm then chốt để phát triển thành công hệ chuyên gia tính tập trung lĩnh vực KB thường xây dựng dạng (tree) với nốt đối tượng có đặc tính riêng thuộc đỉnh nhánh "lá cây" quan hệ với đối tượng khác nhánh "cành cây" (các luật, rule) Theo cấp độ phân nhánh "cành cây" (mức độ gần nốt đầu tiên) đối tượng chia làm bậc từ cao xuống thấp (ơng, cha, ) có tính kế thừa theo chiều ngược lại Ví dụ, tích tụ dầu khí A biểu diễn nốt A tri thức (gốc tri thức, lớp "ơng") yếu tố sinh, chứa, chắn, tạo bẫy dịch chuyển lớp "cha" nối với nốt A qua hệ thống nhánh "cành cây" thứ Tọa độ địa lý "thuộc tính" tích tụ dầu khí A kết nối vào nốt A qua hệ thống nhánh "lá cây" Các nốt lớp "cha" (sinh, chứa, chắn, tạo bẫy dịch chuyển) lại tiếp tục mơ tả thuộc tính quan hệ qua nhánh "lá" "cành" (thạch địa tầng, địa hóa, địa nhiệt, địa chấn, ĐVL giếng khoan, kiến tạo, tham số khác ) Như trình bày Hình 3, KB địa chất dầu khí với yếu tố tiên (sinh, chứa, chắn, dịch chuyển bẫy) thực chất CSTT tổng hợp nhiều chuyên ngành địa hóa, địa vật lý, thạch học, kiến tạo Dễ dàng nhận thấy việc xây dựng tri thức tỏa nhánh xây dựng tốn thuận hay mơ hình chuẩn/định nghĩa tích tụ dầu khí Khác với mơ hình tốn học truyền thống - mơ hình số (numerical), mơ hình tri thức có dạng ngơn ngữ - phi số hóa (nonnumerical) đáp ứng yêu cầu mô tả tài liệu khảo sát địa chất nặng mô tả ngữ nghĩa quan trọng thạch học, địa tầng, cấu trúc v.v Quy mơ mơ hình định số lượng "nhánh chuyên ngành" Hình 4.a ví dụ nhánh "cây tri thức" chuyên ngành, KB đá trầm tích Các nhánh KB phải đảm bảo mô tả đầy đủ loại đá, nhóm đá, theo tính chất, thành phần hóa học mối liên quan đá trầm tích với địa hóa mơi trường, kiến tạo Hình 4.b ví dụ nhánh mô tả "đá cát kết" Khi có thơng tin đầu vào "đá cát kết" ta kết luận kích thước hạt, màu sắc thành phần khống vật mơi trường thành tạo mẫu đá Ngược lại, ta có thơng tin đầu vào kích thước hạt, màu sắc thành phần khống vật mơi trường tạo thành mẫu đá ta xác định đá cát kết hay khơng ? Hình Sơ đồ tri thức mơ tả tích tụ dầu khí Tóm lại, tri thức mơ hình tích tụ dầu khí với đầy đủ đặc tính mơi trường địa chất mơ tả dạng nhánh chuyên ngành thạch học trầm tích, magma, kiến tạo, địa hóa, địa chấn, địa vật lý giếng khoan, từ, trọng lực Mỗi node đảm bảo tính thơng qua nhánh phụ Việc truy xuất xi ngược node để tìm kiếm thông tin, đánh giá thông tin nhiệm vụ phương pháp suy diễn trình bầy phần (a) (b) Hình Ví dụ nhánh tri thức CSTT đá trầm tích a) Sơ đồ gốc tri thức Đá trầm tích b) Sơ đồ nhánh đá cát kết - Phương pháp suy diễn (Inference Monitor) Bản chất phương pháp suy diễn xuất phát từ kiện đầu vào (input) sau trao đổi (duyệt qua nốt tri thức) luật có CSTT để đến kết luận tính đắn giả thiết đặt đồng thời luật xác định luật bổ xung vào CSTT Những luật không phù hợp bị loại bỏ khỏi CSTT Việc chọn phương pháp duyệt, phương pháp tìm kiếm hữu hiệu định hiệu HCG Các bước ứng dụng hệ phương pháp Để ứng dụng hệ phương pháp, đòi hỏi phải xây dựng DB KB phục vụ công tác nhập liệu thu nạp tri thức chuyên gia hàng đầu chuyên ngành địa chất, địa vật lý (địa chấn, ĐVL GK ), địa hóa nguồn tài liệu khác Đồng thời cần phát triển module cần thiết GIS, ES ANN phục vụ công tác xử lý số liệu tri thức phù hợp với DB KB nêu Các bước ứng dụng hệ phương pháp trình lặp nhiều lần với hiệu chỉnh lớp thông tin đầu vào ANN, tham số lớp, số nốt ANN hay luật tri thức KB theo kết suy diễn ES Quá trình tối ưu hóa mơ hình quan hệ dầu khí - mơi trường địa chất Chu trình lặp lại sau: a) Sử dụng ANN phân loại không kiểm định (unsupervisor classification) đặc trưng địa chất – địa vật lý biết lớp thơng tin DB để từ xác định nhóm thuộc tính có liên quan đến việc phân bố vỉa chứa b) Trên sở sử dụng nhóm thuộc tính xác định sử dụng ANN nhận dạng (supervisor classification) để khoanh định thuộc tính tương tự "mẫu nhóm thuộc tính" Sự phân bố đặc tính vỉa chứa đánh giá c) Các kết phân loại, nhận dạng dự báo sử dụng kiện cần kiểm chứng ES với luật - kiện (tri thức) có KB ES, FL GA Các luật/quan hệ bổ xung vào KB Các luật có khơng phù hợp loại bỏ Những tri thức mối quan hệ dầu khí mơi trường xung quanh cập nhật quay lại bổ sung cho việc phân loại, khoanh vùng phân bố vỉa chứa ANN bước (b) Quá trình lặp tiếp tục khơng cịn luật hay tri thức tìm Hình Sơ đồ tương tác GIS – ES - ANN Với mơ hình hoạt động hệ phương pháp xử lý nêu (Hình 5) có: CSDL CSTT đầy đủ nhằm phục vụ công tác dự báo phân bố vỉa chứa đặc trưng vỉa chứa bể Cửu Long Cấu trúc CSDL CSTT địa chất dầu khí mở rộng để sử dụng cho vùng nghiên cứu khác Bản đồ khoanh vùng dự báo phân bố vỉa chứa tham số vỉa chứa khu vực bể Cửu Long Kết kết luận Trong tổ hợp GIS - AI, vai trò quan trọng thuộc phân nhánh AI Hệ chuyên gia, Logic mờ, giải thuật gen mạng thần kinh nhân tạo Trong đó: ANN với giải thuật phân loại khơng kiểm định tập hợp tích tụ dầu khí biết xác định NHĨM DẤU HIỆU ĐẶC TRƯNG chúng lớp thông tin số/số hóa Các tập hợp dấu hiệu nêu chắn có phần giống với đúc kết kinh nghiệm chuyên gia có tập hợp dấu hiệu mà chưa phát Trên sở nhóm dấu hiệu đặc trưng này, giải thuật phân loại có kiểm định, ANN giúp khoanh vùng khu vực có triển vọng dầu khí đánh giá trữ lượng chúng FL GEN xử lý tài liệu dạng mô tả ngữ nghĩa để xác định qui luật phức tạp, không tường minh, tản mạn rời rạc ES đóng vai trò chuyên gia lãnh vực Địa chất –Địa vật lý tích tụ dầu khí sở tri thức chuyên ngành để phân tích tổng hợp kết xử lý ANN, FL GA lớp thông tin dạng số dạng mô tả ngữ nghĩa, đánh giá tính đắn tập hợp thuộc tính đặc trưng tích tụ dầu khí kiểm chứng phát quy luật Sự ưu việt tổ hợp phương pháp là: Khả xử lý tổng hợp thông tin tài liệu số liệu khảo sát tất chuyên ngành địa chất học (dạng số mô tả ngữ nghĩa) Khả tự học hỏi cập nhật sở tri thức chuyên gia người để phân loại, tìm quy luật từ đưa dự báo tin cậy khách quan Tri thức chuyên gia NGƯỜI địa chất dầu khí bị giới hạn vịng tuổi đời tri thức hệ chuyên gia MÁY bảo tồn liên tục cập nhật phát triển theo thời gian Tuy nhiên để triển khai ứng dụng hệ phương pháp AI - GIS cần phải có điều kiện tiên sau: Sự tham gia tích cực chuyên gia đầu ngành địa chất, địa vật lý, địa hóa để xây dựng sở trí thức địa chất dầu khí cho hệ chuyên gia dầu khí Các thơng tin, kết đo đạc xử lý liên quan đến địa chất dầu khí khu vực bể Cửu Long Các chuyên gia tin học trí tuệ nhân tạo lập trình cấp cao Hệ thống cluster Linux đủ mạnh (CPU nhanh, Network bandwidth RAID) để xử lý tiến trình song song lưu trữ CSDL CSTT lớn TÀI LIỆU THAM KHẢO Nguyễn Thanh Thủy, 1999 Trí tuệ nhân tạo Các phương pháp Giải vấn đề kỹ thuật xử lý tri thức Nxb Giáo dục (tái lần thứ ba) Doãn Ngọc San, 2003 Xây dựng hồn thiên cơng nghệ phân tích tổng hợp tài liệu hệ thông tin địa lý địa chất hệ chuyên gia địa chất ứng dụng thử nghiệm vùng Chợ Đồn Báo cáo đề tài NCKH, Bộ CN Doãn Ngọc San, 2003 Đánh giá tiềm chì-kẽm đới Lơ - Gâm sở tổng hợp xử lý tài liêu địa chất - khoáng sản tổ hợp phương pháp thông tin địa lý toán địa chất Luận án Tiến sỹ Địa chất Đỗ Trọng Tuấn, 1999 Trí tuệ nhân tạo Nxb Giáo dục, Hà Nội James P Ignizio, 1991 Introduction to Expert System The development and Implementation of Rulebased Expert System McGraw-Hill Yusuke Sugomori, Bostjan Kaluza, Fabio M Soares, Alan M F Souza Packt Publishing, 2017 Deep Learning: Practical Neural Networks with Java