Cấu trúc của luận văn Các kết quả chính được trình bày trong Luận văn gồm 3 chương, với phần mở đầu và kết luận Chương 1: Cơ sở lý thuyết xử lý tổ hợp số liệu địa vật lý Chương 2:
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
TRỊNH VIẾT DŨNG
NGHIÊN CỨU ÁP DỤNG CÁC PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA
CHỌN THÔNG TIN TRONG XỬ LÝ – PHÂN TÍCH
SỐ LIỆU ĐỊA VẬT LÝ
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2012
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
TRỊNH VIẾT DŨNG
NGHIÊN CỨU ÁP DỤNG CÁC PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA
CHỌN THÔNG TIN TRONG XỬ LÝ – PHÂN TÍCH
Trang 3MỤC LỤC
MỞ ĐẦU 6
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ 9
1.1 CÁC BƯỚC XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ 9
1.1.1 Xây dựng mô hình và xác định phương pháp nhận dạng 9
1.1.2 Ước lượng các đặc trưng thống kê và lượng tin của các dấu hiệu trên các đối tượng chuẩn .11
1.1.3 Nguyên tắc lựa chọn các thuật toán xử lý .12
1.1.4 Quyết định nghiệm về sự tồn tại của đối tượng cần tìm 13
1.1.5 Đánh giá chất lượng xử lý 14
1.2 CÁC THUẬT TOÁN NHẬN DẠNG .14
1.2.1 Các thuật toán nhận dạng có mẫu chuẩn .14
1.2.2 Các thuật toán nhận dạng không có mẫu chuẩn .18
CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ LỰA CHỌN THÔNG TIN TRONG XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ 20
2.1 TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC .20
2.1.1 Các phương pháp phân tích tài liệu địa vật lý máy bay trên thế giới .20
2.1.2 Các phương pháp phân tích tài liệu địa vật lý máy bay ở Việt Nam .23
2.2 NGHIÊN CỨU TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA CHỌN THÔNG TIN TRONG LÝ THUYẾT XỬ LÝ SỐ LIỆU 24
2.2.1 Phương pháp phân tích tần suất 25
2.2.2 Phương pháp phân tích khoảng cách khái quát 26
2.3 ỨNG DỤNG CÁC PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA CHỌN THÔNG TIN ĐỂ GIẢI QUYẾT CÁC BÀI TOÁN NHẬN DẠNG TRONG ĐỊA VẬT LÝ 28 2.3.1 Phương pháp đánh giá và phân loại cụm dị thường 28
2.3.2 Phương pháp Tần suất-Nhận dạng 30
2.3.3 Phương pháp Khoảng cách-Tần suất-Nhận dạng 33
Trang 4CHƯƠNG 3
ÁP DỤNG CÁC PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA CHỌN THÔNG TIN
TRONG XỬ LÝ PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ MÁY BAY VÙNG
TÂY NAM TUY HÒA 39
3.1 LỊCH SỬ NGHIÊN CỨU ĐỊA CHẤT–ĐỊA VẬT LÝ VÙNG TÂY NAM TUY HÒA39 3.1.1 Lịch sử nghiên cứu Địa chất 39
3.1.2 Lịch sử nghiên cứu Địa vật lý 40
3.2 ĐẶC ĐIỂM ĐỊA CHẤT- ĐỊA VẬT LÝ VÙNG TÂY NAM TUY HÒA 42
3.2.1 Đặc điểm địa chất 42
ĐỊA TẦNG 43
GIỚI PROTEROZOI 43
PALEOPROTEROZOI 43
GIỚI PALEOZOI 43
CARBON THƯỢNG – PERMI HẠ 43
GIỚI MESOZOI 44
TRIAS TRUNG 44
CRETA 46
GIỚI KAINOZOI 47
NEOGEN 47
ĐỆ TỨ 48
MAGMA 48
KIẾN TẠO 50
KHOÁNG SẢN 52
3.2.2 Đặc điểm Địa vật lý 52
3.3 DỰ BÁO TRIỂN VỌNG KHOÁNG SẢN 56
KẾT LUẬN 64
TÀI LIỆU THAM KHẢO 64
Trang 5DANH MỤC BẢNG BIỂU VÀ HÌNH DANH MỤC BẢNG
Bảng 2.1 Sơ đồ các bước thực hiện chương trình QTS 36
Bảng 2.2 Sơ đồ các bước thực hiện chương trình QKC 37
Bảng 3.1 Kết quả phân tích theo phương pháp Tần suất – Nhận dạng
và so sánh với kết quả kiểm tra mặt đất đối tượng mẫu - cụm 68 (K) 58
Bảng 3.2 Kết quả phân tích theo phương pháp Tần suất – Nhận dạng
và so sánh với kết quả kiểm tra mặt đất đối tượng mẫu - cụm 38 (Th-K)
58
Bảng 3.3 Kết quả phân tích theo phương pháp khoảng cách – tần suất –
nhận dạng và so sánh với kết quả kiểm tra mặt đất đối tượng mẫu: 68 và 88.
59
DANH MỤC HÌNH
Hình 3.1 Vị trí địa lý khu vực nghiên cứu 41
Hình 3.2.Bản đồ cường độ trường từ vùng Tây Nam Tuy Hòa 52
Hình 3.3 Bản đồ cường độ Gamma vùng Tây Nam Tuy Hòa 53
Hình 3.4 Bản đồ hàm lượng Kali vùng Tây Nam Tuy Hòa 53
Hình 3.5 Bản đồ hàm lượng Uran vùng Tây Nam Tuy Hòa 54
Hình 3.6 Bản đồ hàm lượng Thori vùng Tây Nam Tuy Hòa 54
Hình 3.7 Bản đồ đẳng trị T 55
Hình 3.8 Sơ đồ phân bố cụm dị thường phổ gamma hàng không 61
Hình 3.9 Sơ đồ dự báo triển vọng khoáng sản vùng Tây Nam Tuy Hòa 61
Hình 3.10 Sơ đồ giải đoán địa chất vùng Tây Nam Tuy Hoàn 62
Trang 6MỞ ĐẦU
1 Tính cấp thiết của đề tài
Công tác đo bay địa vật lý tỷ lệ lớn (từ - phổ gamma hàng không) ở nước ta
được đẩy mạnh và phát triển trong khoảng 25 năm trở lại đây Những kết quả đạt
được trong thời gian qua đã khẳng định vai trò và hiệu quả to lớn của công tác địa
vật lý máy bay trong việc tham gia giải quyết nhiều nhiệm vụ địa chất quan trong,
đặc biệt là trong việc tìm kiếm và tham dò khoáng sản có ích Tuy nhiên, trong thực
tế công tác địa vật lý máy bay cũng bộc lộ một số hạn chế, mà chủ yếu là ở khâu xử
lý và phân tích tài liệu, cần được đầu tư nghiên cứu khắc phục, nhằm không ngừng
nâng cao hiệu quả của phương pháp Đó là: Nguồn tài liệu của các phương pháp địa
vật lý máy bay là rất phong phú, khối lượng các tài liệu địa vật lý máy bay trong đó
tài liệu phổ gama đóng vai trò chủ đạo ở nước ta hiện nay là hết sức lớn Xử lý phân
tích tài liệu, khai thác triệt để thông tin đối với nguồn tài liệu hết sức phong phú này
phục vụ công tác điều tra địa chất và tìm kiếm thăm dò khoáng sản là nhiệm vụ hết
sức quan trọng Trong khi đó, do tính khẩn trương về mặt thời gian đối với các đề
án điều tra địa chất, chưa cho phép đầu tư thỏa đáng cho công tác xử lý phân tích tài
liệu làm hạn chế phần nào hiệu quả của phương pháp
Các phương pháp nhận dạng đóng vai trò hết sức quan trọng trong xử lý,
phân tích tài liệu địa vật lý, đặc biệt là đối với các dạng số liệu có đặc tính phân bố
ngẫu nhiên, như các số liệu địa hóa, phổ gamma v.v Hiện nay, trong địa vật lý có
rất nhiều thuật toán nhận dạng hiện đại, được tự động hóa bằng các hệ phần mềm
chuyên dụng mạnh, đáng chú ý có bộ chương trình phân tích phổ - thống kê do
GS.VS Nikitin cùng các đồng sự xây dựng Tuy nhiên, trên thực tế, khối lượng tài
liệu cũng như số lượng các chủng loại thông tin thu được trên các đối tượng địa chất
ngày càng rất lớn Trong khi đó, số lượng các tham số đầu vào của các chương trình
phân tích nhận dạng hiện có thường bị giới hạn Việc sử dụng các tổ hợp thông tin
khác nhau để tiến hành phân tích nhận dạng nhiều khi cho những kết quả rất khác
nhau Mặt khác, kể cả khi số lượng các tham số đầu vào của các chương trình phân
Trang 7tích nhận dạng được mở rộng thì việc sử dụng đồng thời tất cả các loại thông tin có
được để phân tích nhận dạng lại cho kết quả thiếu tin cậy hơn khi chỉ sử dụng một
tổ hợp thông tin nhất định trong đó có chất lượng cao Rõ ràng việc sử dụng những
thông tin thiếu độ tin cậy không những không có hiệu quả mà còn làm nhòa đi
những thông tin quan trọng khác, gây nên những nhận thức sai lệch về đối tượng
nghiên cứu Trong thực tế số lượng các chủng loại thông tin của các đối tượng địa
chất thu được ngày càng lớn Làm thế nào để đánh giá được chất lượng của từng
chủng loại thông tin, từ đó lựa chọn tổ hợp các thông tin tin cậy phục vụ cho từng
mục đích nghiên cứu Đây chính là nội dung của lớp các bài toán đánh giá lựa chọn
thông tin Với thực tế và cách đặt vấn đề trên cho thấy để nâng cao hơn nữa chất
lượng của các phương pháp phân tích nhận dạng, trước hết cần phải giải quyết tốt
bài toán đánh giá lựa chọn thông tin Theo hướng này, chúng tôi đã nghiên cứu tìm
hiểu và áp dụng phương pháp phân tích tần suất theo thuật toán Griffiths - Vinni và
phương pháp phân tích khoảng cách khái quát theo thuật toán Poguônôv trong đánh
giá và lựa chọn thông tin để xác định tổ hợp các chủng loại thông tin có độ tin cậy
cao phục vụ các mục đích nghiên cứu
2 Mục tiêu đề tài:
Nghiên cứu áp dụng một số phương pháp đánh giá, lựa chọn thông tin trong
xử lý số liệu địa vật lý máy bay phục vụ giải đoán địa chất, tìm kiếm và dự báo triển
vọng khoáng sản, góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lý
phân tích tài liệu địa vật lý máy bay ở nước ta hiện nay
3 Các nội dung nghiên cứu
- Nghiên cứu tìm hiểu các phương pháp đánh giá lựa chọn thông tin trong lý
thuyết xử lý số liệu
- Áp dụng một số phương pháp đánh giá và lựa chọn thông tin vào xử lý,
phân tích số liệu địa vật lý máy bay phục vụ giải đoán địa chất, tìm kiếm và dự báo
triển vọng khoáng sản
Trang 8- Đánh giá và dự báo triển vọng khoáng sản vùng Tây Nam Tuy Hòa trên cơ
sở áp dụng hệ phương pháp đánh giá lựa chọn thông tin
4 Cấu trúc của luận văn
Các kết quả chính được trình bày trong Luận văn gồm 3 chương, với phần
mở đầu và kết luận
Chương 1: Cơ sở lý thuyết xử lý tổ hợp số liệu địa vật lý
Chương 2: Các phương pháp đánh giá lưa chọn thông tin trong xử lý
và phân tích số liệu địa vật lý
Chương 3: Áp dụng các phương pháp đánh giá và lựa chọn thông tin
trong xử lý phân tích số liệu địa vật lý máy bay vùng Tây Nam Tuy Hòa
Trang 9CHƯƠNG 1
CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU
ĐỊA VẬT LÝ
1.1 CÁC BƯỚC XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ
Trong công tác xử lý tổ hợp số liệu địa vật lý, nhiệm vụ cơ bản và quan trọng
nhất là phân loại các điểm quan sát thành các diện tích hay các nhóm diện tích nhất
định Trong đó các diện tích được phân loại có các trường địa vật lý đặc trưng cho
các đối tượng địa chất tương ứng Để giải quyết nhiệm vụ trên, tương tự như nhiều
lĩnh vực khoa học kỹ thuật khác, trong địa vật lý người ta thường lý thuyết nhận
dạng – một lĩnh vực toán học đi sâu vào giải quyết các bài toán phân loại đối tượng
dựa vào mối quan hệ hữu cơ giữa các đối tượng cụ thể với các dấu hiệu trường đặc
trưng tương ứng cho đối tượng đó Xử lý tổ hợp số liệu địa vật lý là một quá trình
phức tạp phụ thuộc vào mục đích đối tượng nghiên cứu và các dạng số liệu khác
nhau Một cách khái quát có thể phân chia quá trình này theo các bước cơ bản sau
đây
- Xây dựng mô hình và xác định phương pháp nhận dạng
- Ước lượng các đặc trưng thống kê
- Chọn thuật toán xử lý và thực hiện quá trình xử lý
- Định nghiệm về sự tồn tại của các đối tượng
- Đánh giá chất lượng xử lý
1.1.1 Xây dựng mô hình và xác định phương pháp nhận dạng
Để xử lý số liệu Địa vật lý người ta chủ yếu sử dụng các mô hình thống kê vì
các đối tượng khảo sát cần nghiên cứu có vị trí, kích thước, tính chất vật lý không
biết trước nên chúng được xem như các đối tượng ngẫu nhiên Mặt khác, các trường
vật lý do các đối tượng địa chất tạo ra thường bị các loại nhiễu làm méo nên các dấu
hiệu trường Địa vật lý khảo sát cũng mang tính ngẫu nhiên Với mô hình để được
nhiệm vụ tiếp theo là lựa chọn các phương pháp nhận dạng tương ứng, tiến hành xử
lý theo mô hình và giải quyết các nhiệm vụ bài toán đặt ra
Trang 10Hiện nay có rất nhiều phương pháp nhận dạng hiện đại, được tự động hóa
bằng các phần mềm mạnh Tuy nhiên, có thể chia chúng thành hai nhóm: nhóm các
phương pháp nhận dạng theo đối tượng chuẩn và nhóm các phương pháp nhận dạng
không có đối tượng chuẩn
Nhóm các phương pháp nhận dạng theo đối tượng chuẩn được áp dụng khi
chúng ta biết được lớp các đối tượng và biết được đặc trưng thống kê của các
trường địa vật lý với từng lớp đối tượng
Khi xử lý số liệu địa vật lý bằng thuật toán nhận dạng có mẫu chuẩn, nhiệm
vụ đặt ra là cần xây dựng các thuật toán hay đề xuất các chỉ tiêu nhận dạng đảm bảo
để phân loại các đối tượng số liệu quan sát thành hai lớp (thí dụ lớp có quặng và lớp
không quặng) hoặc với số lớp nhiều hơn 2 khi có trước các đặc trưng thống kê của
mỗi loại dấu hiệu ứng với các đối tượng chuẩn
Vấn đề quan trọng, mang tính quyết định trong công tác xử lý số liệu địa vật
lý bằng thuật toán nhận dạng theo đối tượng chuẩn là lựa chọn đối tượng chuẩn,
trên đó tiến hành nghiên cứu các đặc trưng thống kê của các dấu hiệu (các trường
địa vật lý) Điều này đặc biệt quan trọng khi khảo sát các diện tích có cấu trúc địa
chất phức tạp, ở đó các trường địa vật lý quan sát được biến đổi mạnh ngay cả ở
những diện tích nhỏ
Nhóm các phương pháp nhận dạng không có đối tượng chuẩn được áp dụng
khi chúng ta không biết trước các đặc trưng thống kê của các dấu hiệu ứng với các
lớp đối tượng cần tìm Khi đó quá trình nhận dạng đơn thuần chỉ thực hiện nhiệm
vụ phân loại trường
Phương pháp xử lý số liệu bằng thuật toán nhận dạng không có đối tượng
chuẩn được thực hiện như sau: bằng thuật toán phân loại trường lựa chọn được, tiến
hành chia các điểm quan sát thành một số nhất định các diện tích đồng nhất về dấu
hiệu tổ hợp Bản chất địa chất của từng diện tích phân ra được có thể không xác
định được; để xác định chúng đòi hỏi phải có các số liệu khoan hoặc nghiên cứu bổ
xung về tính chất vật lý của đá [1,2]
Trang 111.1.2 Ước lượng các đặc trưng thống kê và lượng tin của các dấu hiệu trên các
đối tượng chuẩn
a Ước lượng các đặc trưng thống kê
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì
công việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định
các đặc trưng thống kê các trường địa vật lý của chúng
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của các đối tượng
gây ra trường địa vật lý Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các
đối tượng chuẩn được lựa chọn khác nhau Ví dụ khi mục đích nghiên cứu là tìm
kiếm khoáng sản thì đối tượng chuẩn có thể là một vùng quặng, một trường quặng,
một mỏ quặng hay một vỉa quặng Còn khi khảo sát địa vật lý phục vụ công tác đo
vẽ bản đồ địa chất thì các đối tượng mẫu có thể là diện tích phát triển một loại đá
nào đó
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta
tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng Các
đặc trưng này bao gồm:
- Đường cong biến phân (hàm phân bố mật độ xác suất thực nghiệm)
- Kỳ vọng và phương sai của trường (thông qua đường cong biến phân)
Ngoài ra khi cần người ta tính cả hệ số tương quan giữa các dấu hiệu,
phương chủ đạo của các dị thường…
Điều đặc biệt cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì
cần lựa chọn các đối tượng chuẩn sao cho các diện tích tồn tại đối tượng chuẩn phải
nằm xen kẽ với các phần diện tích khảo sát cần nhận dạng
Đối với nhóm các phương pháp nhận dạng không có đối tượng chuẩn để xác
định các đặc trưng thống kê của trường người ta chia khu vực khảo sát thành các
diện tích cơ sở - cửa sổ Kích thước của diện tích cơ sở hay số lượng điểm quan sát
trên mỗi diện tích cơ sở được lựa chọn dựa vào tỉ lệ bản đồ và kích thước dị thường
mà các đối tượng trường tạo ra Diện tích cơ sở có thể nhỏ nhất cần lựa chọn để
Trang 12trong tương lai có thể đề nghị (hoặc không đề nghị) đưa vào thăm dò hoặc khảo sát
chi tiết Diện tích cơ sở cũng có thể xem như cửa sổ trượt, các đặc trưng thống kê
của trường trong cửa sổ đó được gán cho điểm trung tâm cửa sổ
b Lượng tin của dấu hiệu
Lượng tin của dấu hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các
đối tượng khác nhau với nhau Khả năng này phụ thuộc vào việc các đối tượng của
cùng một lớp có thường xuyên cho những giá trị cố định của dấu hiệu đó hay không
và các giá trị đó có phân bố rộng ra ngoài giới hạn của đối tượng của lớp đó hay
không
Người ta đưa ra khái niệm lượng tin từng phần, lượng tin tổng (tích phân) và
lượng tin tổng hợp Lượng tin từng phần là lượng tin của những dải giá trị hay của
nhóm các giá trị riêng biệt của một dấu hiệu nhất định Lượng tin tổng là lượng tin
chứa toàn bộ các giá trị của một dấu hiệu (một loại trường) nào đó Cuối cùng lượng
tin tổng hợp là lượng tin tính cho những dạng kết hợp khác nhau của nhiều dấu
hiệu
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng
như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa
thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
các thông tin hữu ích Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không
làm tăng mà ngược lại làm giảm chất lượng nhận dạng đối tượng Chính vì vậy,
trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó
chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu có
lượng tin thấp [2]
1.1.3 Nguyên tắc lựa chọn các thuật toán xử lý
Các thuật toán được lựa chọn để xử lý sẽ ảnh hưởng tới chất lượng xử lý Để
chất lượng xử lý cao khi lựa chọn các thuật toán người ta dựa vào các yếu tố sau:
Trang 13a Nhiệm vụ địa chất đặt ra
Nếu nhiệm vụ của khảo sát địa vật lý là tìm kiếm mỏ thì thuật toán phải có
khả năng nhận dạng hai lớp đối tượng: lớp quặng và lớp không quặng Còn nếu
nhiệm vụ của khảo sát địa vật lý là phục vụ công tác đo vẽ bản đồ địa chất thì thuật
toán phải đảm bảo khả năng cùng một lúc nhận dạng được nhiều đối tượng liên
quan với nhiều loại đất đá và các yếu tố kiến tạo khác nhau
b Đặc điểm chứa thông tin của số liệu gốc
Nếu các số liệu địa vật lý chứa thông tin ở hai mức: mức “có” - mức dị
thường và mức “không” - mức phông thì người ta sử dụng các thuật toán logic
Trong trường hợp các số liệu địa vật lý chứa các thông tin định lượng thì người ta
sử dụng các thuật toán kiểm chứng thống kê
c Tính độc lập và tính không độc lập của các dị thường
Khi dấu hiệu trường địa vật lý độc lập nhau thì có thể sử dụng các thuật toán
đơn giản Còn trong trường hợp các dấu hiệu liên quan với nhau thì các thuật toán
được sử dụng phức tạp hơn Lưu ý là trong trường hợp các dấu hiệu trường không
độc lập nhau, để nhận dạng đòi hỏi các giá trị trường phải phân bố theo luật chuẩn
d Mức độ đầy đủ của các thông tin tiên nghiệm
Mức độ đầy đủ của các thông tin tiên nghiệm chính là mức độ hoàn chỉnh
của các mô hình vật lý địa chất Trong trường hợp tồn tại các đối tượng chuẩn,
nghĩa là khi biết rõ mô hình vật lý địa chất của các đối tượng thì để xử lý người ta
sử dụng các thuật toán nhận dạng có mẫu chuẩn để phân loại trường
1.1.4 Quyết định nghiệm về sự tồn tại của đối tượng cần tìm
Đối với các thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ
yếu dựa vào chỉ số tương đồng Chỉ số này xác định mức độ giống nhau hoặc khác
nhau giữa đối tượng nghiên cứu với đối tượng chuẩn theo lượng thông tin tổng hợp
của toàn bộ các dấu hiệu
Đối với các thuật toán nhận dạng không có mẫu chuẩn thì quá trình nhận
dạng chỉ đơn thuần thực hiện việc phân chia diện tích khảo sát thành các phần đồng
Trang 14nhất theo tổng hợp các dấu hiệu Việc phân loại ở đây được tiến hành dựa vào các
chỉ tiêu định nghiệm khác nhau Chỉ tiêu này phụ thuộc rất nhiều vào số lượng các
lớp đối tượng cần phân chia là bao nhiêu
1.1.5 Đánh giá chất lượng xử lý
Đối với các thuật toán nhận dạng có mẫu chuẩn, chất lượng xử lý được đánh
giá dựa vào sai số nhận dạng các đối tượng kiểm chứng (tỉ số các đối tượng kiểm
chứng được nhận dạng đúng so với tổng các đối tượng kiểm chứng được đưa ra
nhận dạng) Các đối tượng kiểm chứng là các đối tượng mà bản chất địa chất của
chúng đã được xác định rõ, song chúng không được chọn làm đối tượng mẫu mà là
đối tượng được dùng làm kiểm tra các kết quả nhận dạng
Đối với các thuật toán nhận dạng không đối tượng chuẩn người ta sử dụng
xác suất nhận dạng sai lầm để đánh giá chất lượng xử lý Xác suất này được tính
dựa vào việc phân hàm phân bố mật độ xác suất của một hệ số gọi là hệ số tương
thích Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp
một
1.2 CÁC THUẬT TOÁN NHẬN DẠNG
1.2.1 Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định
bản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địa
vật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đối
tượng nghiên cứu
Hiện nay tồn tại nhiều thuật toán nhận dạng khác nhau, chúng được xây dựng
dựa vào các công cụ toán học khác nhau như: toán logic, các hàm hồi quy và lý
thuyết định nghiệm thống kê… Dưới đây là một số thuật toán điển hình
a Thuật toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tính
lượng tin tổng, hoặc xác định khoảng cách tổng
Trang 15Công việc đầu tiên, người ta tiến hành mã hóa các dấu hiệu trường bằng mã
nhị phân gồm tập số 0 và 1
Nếu Xkl là giá trị trường thứ l của mẫu thứ k thì:
- Xkl = 0 khi mẫu k không chứa giá trị thứ l
- Xkl = 1 khi mẫu k chứa giá trị thứ 1
Bằng cách trên toàn bộ các mẫu được mã hóa
Tiếp theo dựa vào các tổ hợp số 0 và 1 (từ thông tin) xác lập trên các mẫu
chuẩn người ra ta xác định các từ thông tin chuẩn cho từng lớp đối tượng Từ thông
tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng chuẩn
của lớp đó và không gặp lần nào ở các đối tượng chuẩn thuộc lớp khác Đối với một
lớp đối tượng người ta có thể chọn vài từ thông tin chuẩn Các thông tin này được
gọi là tổ hợp dấu hiệu phức hợp Trong các tổ hợp dấu hiệu phức hợp đặc trưng cho
các đối tượng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trưng cho số
lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó sẽ là lượng tin lớn hơn
Cuối cùng là nhận dạng các đối tượng nghiên cứu Ở bước này người ta tiến
hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối
tượng nghiên cứu Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đó
nhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu
được xếp vào lớp đó [1]
b Thuật toán quy hồi
Thực chất của thuật toán này là xây dựng các hàm quy hồi xác định mối
quan hệ giữa tham số địa chất cần tìm với các số liệu địa vật lý quan sát được
Giả sử ta lập mối quan hệ giữa hàm số địa chất Y và các dấu hiệu địa vật lý
Trang 16i k
i
i x
Y 0
Với điều kiện:
Y L
1
2
( đạt cực tiểu
Trong đó Yj là giá trị quan trắc của biến Y tại quan trắc thứ j; xji là giá trị
quan trắc thứ j của biến xi
j
j i ij i
b a
i
Y
Trong đó Yl là giá trị quan trắc của biến Y tại quan trắc thứ l; xli là giá trị
quan trắc thứ l của biến xi
Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung
các số liệu của dấu hiệu mới bằng cách đưa thêm vào phương trình của hàm hồi
quy các số hạng mới Tuy nhiên thuật toán hồi quy cũng có được nhược điểm đó
là với một tập hợp số liệu nhất định ứng với một giá trị sai số cho trước có thể
xấp xỉ được nhiều hàm hồi quy Do vậy ta không thể đưa ra được các lý giải về ý
nghĩa vật lý của các hệ số của hàm số hồi quy [1,2]
c Thuật toán định nghiệm thống kê
Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong
phân tích số liệu địa vật lý thường sử dụng các thông số như: Tỉ số sự thật L(x) và
tổng lượng thông tin J(1:2,x)
Giá trị các thông số đó được tính theo công thức:
L(x) = P1(x)/P2(x)
J(1:2,x) = log[P1(x)/P2(x)]
Trang 17Trong đó:
P1(x), P2(x): là xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng
tương ứng của lớp 1 và lớp 2 (lớp quặng và lớp không quặng) Khi sử dụng đối
tượng chuẩn cho lớp 1(lớp quặng) thì trong các biểu thức P2(x) được thay thế là 1
X: là vectơ giá trị các dấu hiệu được sử dụng, x1, x2,…xk (ví dụ các hàm
lượng qU, qTh, qK…)
Khi các dấu hiệu x1, x2,…xk được xem là không phụ thuộc nhau thì xác suất
của đại lượng n chiều của tổ hợp n dấu hiệu được tính
P(x) = P(x1).P(x2)…P(xk)
)
L(x)
).L(xL(x
)(xP)(x).P(xP
)(xP)(x).P(xP)
k 2 2
2 1 2
k 1 2 1 1
Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tượng quặng và không quặng người ta thường
sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số x1, x2…
xn Các hàm này được biểu diễn như sau:
i n
j
k
i
i i j
i
b R
2
Trong đó các hệ số: ai, bij, ci được xác định từ các ma trận thông tin các dấu
hiệu của các đối tượng quặng và không quặng Thông qua các “diện tích đối tượng
chuẩn” người ta xác định được các vectơ giá trị các dấu hiệu sử dụng x (trong
trường hợp các dấu hiệu được xem là không phụ thuộc nhau) hoặc các hệ số ai, bij,
ci (trong trường hợp các dấu hiệu phụ thuộc nhau) Sau đó tính giá trị L(x), J(1:2,x)
hoặc R1, R2, phổ các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết
và khoanh định được các diện tích đồng dạng với đối tượng chuẩn Các dấu hiệu
được lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được [1,2]
Trang 181.2.2 Các thuật toán nhận dạng không có mẫu chuẩn
a Thuật toán kiểm chứng thống kê
Thuật toán này có tiến hành phân loại trường khi các dấu hiệu trường hoàn
toàn độc lập nhau Ban đầu người ta sử dụng các bộ lọc để tách các dị thường ra
khỏi phông nhiễu cho từng dấu hiệu trường Kết quả lọc cho phép nhận được các số
liệu trường chủ yếu gồm các dị thường Tiếp theo là phân loại các dị thường thành
các lớp dị thường Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê
giống nhau Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo
sát thành các diện tích cơ sở, sau đó dựa vào kết quả phân cấp các giá trị trường ở
mỗi cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó Cuối
cùng để phân lớp các dị thường người ta sử dụng chỉ tiêu 2 để so sánh và xếp loại
các đường cong biến phân Các diện tích có ước lượng phân bố mật độ xác suất
giống nhau được xếp vào một lớp
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn tiến hành xác định
số hiệu của lớp tổng hợp
Với mục đích này, dựa vào các đường cong biến thiên dựng được cho từng
dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị
trung bình theo thứ tự tăng dần Sau đó dựa vào chỉ tiêu xác suất hậu nghiệm cực
đại người ta quyết định xếp loại đối tượng khảo sát vào các lớp khác nhau Bằng
cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có hình dạng
bất kì, ở đó dị thường của các dấu hiệu khác nhau chồng lên nhau [2]
b Thuật toán K trung bình
Nội dung của thuật toán như sau: Giả sử tồn tại n đối tượng Nhiệm vụ đặt ra
là phân chia toàn bộ n đối tượng thành M lớp với M<<n
Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn ngẫu nhiên từ n đối tượng
ra k đối tượng, k đối tượng được chọn này được xem như là các mẫu chuẩn xuất
phát Tiếp theo là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn được bằng
Trang 19cách so sánh các mẫu chuẩn với các đối tượng còn lại Sau mỗi lần chọn tập hợp các
mẫu chuẩn Ev chọn được ở lần chọn thứ v sẽ thay cho các mẫu chuẩn chọn được ở
Các mẫu chuẩn này chính là các mẫu được chọn ra ở vòng đầu tiên (vòng số
không) của quá trình lặp Tiếp theo vòng số không thuật toán gọi tiếp số xk+1 và tìm
xem trong k mẫu e0
i, mẫu chuẩn nào gần với nó nhất Nếu tìm được, thì mẫu chuẩn thuộc tập hợp E0
tìm được này được thay thế bằng mẫu chuẩn mới Mẫu chuẩn mới này có giá trị e1
i được tính như giá trị trọng tâm giữa giá trị của mẫu chuẩn cũ và giá trị của đối tượng gắn kết với nó xk+1
Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán
sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho đến khi đối tượng cuối cùng được
gọi ra
Sau khi tập hợp các mẫu chuẩn được chính xác hóa, thuật toán tiến hành
phân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớp
dựa vào nguyên tắc khoảng cách tối thiểu
Hiện nay với sự phát triển mạnh mẽ của công nghệ tin học phần lớn các thuật
toán trình bày ở trên đều được tự động hóa với các hệ phần mềm mạnh, chuyên
dụng, được ứng dụng rộng rãi rất có hiệu quả trong công tác xử lý phân tích tài liệu
địa vật lý, địa chất, địa hóa ở Việt Nam cũng như những nước khác trên thế giới,
trong đó đáng chú ý là hệ chương trình phân tích phổ - thống kê COSCAD do giáo
sư viện sĩ A.A.nikitina cùng các cộng sự G.V Demury, V.M Bondarenko, O.A
Demidovicha, T.A Trofimovoj, O.P Lukinoj và một số tác giả khác xây dựng
[1,2]
Trang 20CHƯƠNG 2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ LỰA CHỌN THÔNG TIN
TRONG XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ
2.1 CÁC PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TÀI LIÊU ĐIẠZ VẬT LÝ MÁY
BAY HIỆN NAY
2.1.1 Các phương pháp phân tích tài liệu địa vật lý máy bay trên thế giới
Hiện nay trên thế giới, trong công tác phân tích tài liệu địa vật lý máy bay để
giải các nhiệm vụ địa chất và dự báo triển vọng khoáng sản người ta sử dụng rất
nhiều phương pháp khác nhau, trong đó có các phương pháp thống kê – nhận dạng
được áp dụng rộng rãi có hiệu quả hơn cả, các phương pháp đó được chia thành các
nhóm phương pháp chính sau
1 Các phương pháp tách trường
Sử dụng các phương pháp tách trường để phân chia các dị thường là nội
dung quan trọng trong phân tích tài liệu phổ gamma hàng không, nhằm khoanh định
và dự đoán về diện phân bố của các đối tượng địa chất gây dị thường Dị thường
phổ gamma là một phần địa phương của vỏ trái đất gây dị thường Dị thường phổ
gamma là một phần địa phương của vỏ trái đất được khác biệt bởi sự không đồng
nhất về địa chất và địa hóa, mà ở đó các trường phóng xạ ghi được cao hơn mức
phông, hoặc mối tương quan giữa các thành phần trường bị phá vỡ Diện phân bố
của dị thường này nói chung lớn hơn so với các dị thường điểm nó tương ứng với
các diện phân bố của các đối tượng địa chất gây dị thường
2 Các phương pháp thống kê nhận dạng
Các phương pháp nhận dạng không những được ứng dụng rất có hiệu quả
trong phân tích các số liệu địa chất, địa vật lý mà còn được áp dụng rộng rãi trong
nhiều lĩnh vực nghiên cứu khác Về nguyên lý, việc tìm kiếm các đối tượng tương
tự (đồng dạng) với các đối tượng mẫu đã biết thông qua các chủng loại thông tin thu
được trong quá trình nghiên cứu, khảo sát, đều có thể xếp vào lớp các bài toán nhận
dạng Các phương pháp phân tích nhận dạng đặc biệt có hiệu quả khi tiến hành trên
Trang 21các cơ sở dữ liệu có các chủng loại thông tin đa dạng, phong phú và tin cậy Hiện
nay có rất nhiều thuật toán nhận dạng hiện đại, được tự động hóa bằng các hệ phần
mềm mạnh, được áp dụng có hiệu quả trong phân tích tài liệu phổ gamma hàng
không ở nhiều nước trên thế giới Đề cập đến hướng nghiên cứu này có rất nhiều
công trình đã được công bố, theo đó các phương pháp nhận dạng theo đối tượng
chuẩn và nhóm các phương pháp nhận dạng không có đối tượng chuẩn
3 Các phương pháp thống kê thực nghiệm
Các phương pháp thống kê thực nghiệm được thiết lập trên cơ sở các quan
niệm lý thuyết, những kinh nghiệm thực tế, sự tự điều chỉnh để tìm kiếm lời giải
đúng trong quá trình phân tích Bằng mô hình toán học và thông qua chúng có thể
phân chia các lớp dấu hiệu đối với các dị thường quặng và không quặng Các thông
số (được biểu diễn qua các biểu thức toán học) thường được sử dụng đó là:
- Các thông số Dominal
Quá trình phân bố lại các nguyên tố phóng xạ nhất thiết sẽ làm cho ít nhất
một nguyên tố được trội lên, và các thông số Dominal phản ánh đặc tính đó, chúng
được biểu diễn theo công thức:
) 1 ( x Th K
/ )
Các hàm tương quan (trong đó có các hệ số tương quan bậc 1 Rij) phản ánh
mức độ quan hệ về đặc điểm phân bố của các trường phóng xạ U, Th, K Quá trình
phân bố lại các nguyên tố phóng xạ sẽ làm cho mối tương quan bình thường trước
đó giữa chúng bị phá vỡ, do vậy các hàm tương quan cũng là một dấu hiệu phản ánh
đặc điểm phân bố cảu các trường phóng xạ
Trang 22Các hàm xác suất thống kê phản ánh xác suất bắt gặp của các đặc tính phóng
xạ nào đó (theo nguyên tắc xác suất nhỏ) Về nguyên tắc, xác suất bắt gặp các dị
thường sẽ là rất nhỏ so với toàn diện tích khảo sát Do vậy nếu lựa chọn được các
dấu hiệu phản ánh thích hợp thì thông qua chúng theo nguyên tắc xác suất nhỏ
người ta cũng có thể khoanh định các diện tích có đặc tính phân bố không bình
thường của các trường phóng xạ
Các tỉ số hàm lượng các nguyên tố người ta cũng thường sử dụng các tỉ số
hàm lượng như: qTh/qU, qTh/qK, (qU.qK)/qTh, (qU + qK)/ qTh làm các dấu hiệu để tìm
hiểu về đặc điểm phân bố của các trường phóng xạ
Trong các đá không biến đổi của vỏ trái đất các tỉ số này thường khá ổn định
và chỉ thay đổi trong các dải khá hẹp Ở những đới đá biến đổi, giá trị của các tỉ số
này sẽ vượt ra khỏi các dải đó, do vậy thông qua các dấu hiệu này cũng có thể
khoanh định và dự báo các đới đá biến đổi
Các phương pháp thống kê thực nghiệm, thông qua các thông số nói trên
được áp dụng khá rỗng rãi và có hiệu quả trong phân tích tài liệu phổ gamma hàng
không, đặc biệt là trong việc phát hiện và khoanh định các đới biến đổi có thể liên
quan với khoáng sản [2,8]
4 Các phương pháp khác
Ngoài một số phương pháp phân tích mang tính chuyên dụng thường được
áp dụng trong phân tích tài liệu phổ gamma hàng không như đã trình bày ở trên
trong thực tế người ta còn sử dụng nhiều phương pháp khác theo hướng khai thác và
sử dụng triệt để thông tin như các phương pháp đạo hàm, phương pháp phân tích
các thành phần chính, các phương pháp phân tích bản đồ bóng, các phương pháp
chồng chập thông tin
Hiện nay, với sự phát triển mạnh mẽ của công nghệ thông tin, các phương
pháp xử lý phân tích số liệu hiện đại ngày càng được ứng dụng rộng rãi thay thế các
phương pháp thủ công, trực quan, định tính Phần lớn các thuật toán trình bày ở trên
đều được tự động hóa với các hệ phần mềm mạnh, chuyên dụng Đáng chú ý là Bộ
chương trình phân tích phổ - thống kê COSCAD do GS VS NiKiTin đề xuất xây
dựng hệ phần mềm mạnh ERMAPPER
Trang 232.1.2 Các phương pháp phân tích tài liệu địa vật lý máy bay ở Việt Nam
Công tác phân tích tài liệu địa vật lý hàng không ở nước ta trong những năm
gần đây cũng đã có được những bước tiến đáng kể Trong tổ hợp các phương pháp
phân tích tài liệu đang được sử dụng trong các đề án bay đo ngoài một số phương
pháp định tính với các thuật toán tương đối đơn giản căn cứ trực tiếp vào đặc điểm
hình thái của các bản đồ trường thì một số phương pháp phân tích hiện đại như:
Dominnal, tương quan, nhận dạng v.v…cũng đã được đưa vào áp dụng
Thông qua các đề tài nghiên cứu, một số tập thể tác giả cũng đã tiến hành
những nghiên cứu, phân tích thử nghiệm trên các tài liệu thực tế bằng nhiều phương
pháp khác nhau, đặc biệt là nhóm các phương pháp thống kê- nhận dạng và đã thu
được những kết quả tốt Đóng góp vào hướng nghiên cứu này có thể kể đến các
công trình của các tác giả như: TSKH Tăng Mười, TS Nguyễn Tài Thinh, GS Lê
Khánh Phồn, TS.Võ Thanh Quỳnh, TS Vũ Thu Hương, TS Nguyển Thế Hùng, TS
Nguyển Tuấn Phong và của nhiều nhà khoa học khác
Trong các công trình trên các tác giả đã sử dụng một số phần mềm được xây
dựng trong nước, đồng thời khai thác một số phương pháp trong hệ chương trình
phân tích phổ - thống kê COSCAD và hệ chương trình ERMAPPER
Tuy nhiên, những nghiên cứu theo hướng này thường mới chỉ thu được kết
quả tốt với mục đích nghiên cứu cấu trúc, phục vụ công tác lập bản đồ; còn với mục
đích tìm kiếm và dự báo triển vọng khoáng sản thì các kết quả thu được còn hạn
chế Hầu hết các phương pháp phân tích tài liệu phổ gamma hàng không hiện có
(đặc biệt là các phương pháp nhận dạng) đều phân tích trên các số liệu trường liên
tục theo diện, nghĩa là chỉ tập trung đối với các bản đồ trường Còn trên các điểm dị
thường đơn ( “ Bản đồ phân bố dị thường phổ gamma” - một tài liệu đặc biệt quan
trọng trong dự báo triển vọng khoáng sản) thì thường mới chỉ có một số các phương
pháp thống kê thực nghiệm đơn giản Ngoài ra khi tiến hành các phương pháp phân
tích nhận dạng đối với tài liệu phổ gamma hàng không thường gặp một số khó khăn
Đó là: khối lượng tài liệu cũng như số lượng các chủng loại thông tin là rất lớn,
trong khi số lượng các tham số đầu vào của các chương trình phân tích nhận dạng
Trang 24hiện có thường bị giới hạn.Việc sử dụng các tổ hợp chủng loại thông tin khác nhau
đẻ tiến hành phân tích nhận dạng nhiều khi cho những kết quả rất khác nhau Trong
khi đó việc đánh giá, lựa chọn tổ hợp thông tin trước khi tiến hành phân tích nhận
dạng thường dựa nhiều vào kinh nghiệm mang tính chủ quan, chưa có được những
phương pháp mang tính toán học chặt chẽ Đề tài ra đời nhằm từng bước góp phần
giải quyết các tồn tại nói trên [13]
2.2 NGHIÊN CỨU TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA
CHỌN THÔNG TIN TRONG LÝ THUYẾT XỬ LÝ SỐ LIỆU
Hiện nay trong công tác phân tích tổ hợp các tài liệu địa vật lý người ta sử
dụng rất nhiều loại phương pháp khác nhau, trong đó nhóm các phương pháp thống
kê - nhận dạng được ứng dụng rộng rãi và rất có hiệu quả Tuy nhiên trên thực tế khi
tiến hành các phương pháp phân tích nhận dạng đối với nhiều loại tài liệu địa vật lý,
đặc biệt là các tài liệu địa vật lý máy bay ở nước ta, một số hạn chế vẫn đang gặp
phải, cần được nghiên cứu khắc phục Đó là: Khối lượng tài liệu cũng như số lượng
các chủng loại thông tin rất lớn, trong khi đó số lượng các tham số đầu vào của các
chương trình phân tích nhận dạng hiện có thường bị giới hạn Việc sử dụng các tổ
hợp thông tin khác nhau để tiến hành phân tích nhận dạng cho những kết quả rất
khác nhau Mặt khác, kể cả khi số lượng các tham số đầu vào của các chương trình
phân tích nhận dạng được mở rộng thì việc sử dụng đồng thời tất cả các loại thông
tin có được để phân tích nhận dạng lại cho kết quả thiếu tin cậy hơn khi chỉ sử dụng
một tổ hợp thông tin nhất định trong đó có chất lượng cao Rõ ràng việc sử dụng
những thông tin thiếu độ tin cậy không những không có hiệu quả mà còn làm nhòa
đi những thông tin quan trọng khác, gây nên những nhận thức sai lệch về đối tượng
nghiên cứu Trong thực tế số lượng các chủng loại thông tin của các đối tượng địa
chất thu được ngày càng lớn Làm thế nào để đánh giá được chất lượng của từng
chủng loại thông tin, từ đó lựa chọn tổ hợp các thông tin tin cậy phục vụ cho từng
mục đích nghiên cứu Đây chính là nội dung của lớp các bài toán đánh giá lựa chọn
thông tin Với thực tế và cách đặt vấn đề trên cho thấy để nâng cao hơn nữa chất
Trang 25lượng của các phương pháp phân tích nhận dạng, trước hết cần phải giải quyết tốt
bài toán đánh giá lựa chọn thông tin Theo hướng này, chúng tôi đã nghiên cứu tìm
hiểu và áp dụng phương pháp phân tích tần suất theo thuật toán Griffiths - Vinni và
phương pháp phân tích khoảng cách khái quát theo thuật toán Poguônôv trong đánh
giá và lựa chọn thông tin để xác định tổ hợp các chủng loại thông tin có độ tin cậy
cao phục vụ các mục đích nghiên cứu
2.2.1 Phương pháp phân tích tần suất
Hiện nay, trong lớp các bài toán đánh giá-lựa chọn thông tin có rất nhiều
phương pháp để xác định giá trị của loại thông tin thứ “i” trong tập hợp nhiều chủng
loại thông tin nhận được của đối tượng nghiên cứu Phương pháp phân tích tần suất
với việc sử dụng tần suất trung bình của sự xuất hiện đồng thời các tính chất do
Griffiths và Vinni đưa ra có dội dung tóm tắt như sau:
Giả sử ta có ma trận thông tin các tính chất của đối tượng nghiên cứu:
k k
d t j i
k – số loại tính chất của ma trận thông tin
n – số lượng mẫu chứa các thông tin về các tính chất của đối tượng ij - được biểu diễn bằng các khái niệm logic: “yes” hoặc “no” hoặc
bằng các số 1 hoặc 0
Theo Griffiths-Vinin, tỉ trọng thông tin tương đối của tính chất thứ “i” được
xác định theo công thức sau:
và thứ “j”
(2.1)
Trang 26Có thể viết lại công thức (2.2) cụ thể hơn như sau:
k n
Sắp xếp các tính chất của đối tượng theo thứ tự giảm dần của tỉ trọng thông
tin tương đối và gọi tập mới sắp xếp theo luật đó là [Ii
i
i
I
I P
1 2 1 2
*
*
(2.5)
Pm là cơ sở để lựa chọn tập hợp các tính chất đủ chứa tải những thông tin cần
thiết theo yêu cầu nghiên cứu, nghĩa là khi cho Pm một giá trị tỉ lệ % nào đó ta sẽ tìm
được tập hợp m tính chất tương ứng
Như vậy bản chất của phương pháp phân tích tần suất theo thuật toán Giffiths
- Vinni là đưa ra được một cách đánh giá về chất lượng của từng chủng loại thông
tin trong nhận thức đối tượng, trên cơ sở đó lựa chọn tập hợp các chủng loại thông
tin có giá trị cao phục vụ các mục đích nghiên cứu [9]
2.2.2 Phương pháp phân tích khoảng cách khái quát
Phương pháp phân tích khoảng cách khái quát do Paguônôp đề xuất nhằm
xác định mức độ thông tin của các tính chất có khả năng phân biệt đối tượng thông
qua độ dài khoảng cách khái quát trong không gian dấu hiệu giữa 2 loại đối tượng
mẫu đối nghịch nhau Nội dung phương pháp được tóm tắt như sau:
Giả sử ta có 2 đối tượng mẫu đối nghịch nhau (ví dụ quặng và không quặng
Sau đây ta gọi chúng là đối tượng quặng và không quặng) có k loại dấu hiệu (k tính
Trang 27chất) mỗi dấu hiệu có n giá trị (với đối tượng quặng) và m giá trị (với đối tượng
không quặng) đã biết Khi đó ta có các ma trận thông tin của các đối tượng mẫu như
sau:
Đối tượng quặng:
q nk n
n
k k
q j i
2 22
21
1 12
m
k k
kq j i
2 22
21
1 12
11
Các ma trận này phải có cùng số loại tính chất, nghĩa là có số cột bằng nhau,
còn số hàng tùy ý
Theo Paguônôp lượng thông tin của tính chất thứ “i” được đánh giá theo bình
phương khoảng cách khái quát giữa trọng tâm các đám mây trong không gian dấu
i 2
2 2
m n
ikq iq
i
2 2
Trang 28Sắp xếp { i2} theo thứ tự giảm dần và gọi nó là {*2i} Khi đó thông tin
tổng của j tính chất đầu trong toàn bộ k tính chất được tính theo công thức:
P
1 i
2
2
*
(2.10) Trị số Pj2 có quan hệ với sai số nhận biết, phân biệt đối tượng m như sau:
22
1
2 2
j P
dt
t e
Nội dung phương pháp phân tích tần suất như đã trình bày ở mục 2.2.1
Từ nội dung của 2 phương pháp phân tích như đã nêu (Phương pháp Phân
tích Khoảng cách khái quát và Phương pháp Phân tích Tần suất), cho thấy về bản
chất chúng là các phương pháp đánh giá chất lượng của từng chủng loại thông tin
dựa trên cơ sở dữ liệu và cách đánh giá khác nhau, từ đó lựa chọn tổ hợp các chủng
loại thông tin có giá trị cao phục vụ các mục đích nghiên cứu [11]
2.3 ỨNG DỤNG CÁC PHƯƠNG PHÁP ĐÁNH GIÁ VÀ LỰA CHỌN THÔNG
TIN TRONG XỬ LY PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ MÁY BAY
2.3.1 Ứng dụng trong phương pháp đánh giá và phân loại cụm dị thường
Phương pháp phân tích tần suất theo thuật toán Griffiths - Vinni được được
đưa vào áp dụng trong lựa chọn tổ hợp thông tin phục vụ công tác đánh giá và phân
loại cụm dị thường phổ gamma hang không
Hiện nay trong công tác xử lý - phân tích tài liệu phổ gamma hàng không, bản
đồ dị thường phổ gamma đóng vai trò quan trọng, đặc biệt là trong việc tìm kiếm và
dự báo các khoáng sản có ích Tuy nhiên, trên thực tế khi tiến hành khai thác sử
dụng loại tài liệu này vẫn gặp phải một số hạn chế, cần được nghiên cứu khắc phục
- Bản đồ dị thường phổ gamma được thành lập dựa theo kết quả phân loại bản
chất phóng xạ của dị thường điểm đơn lẻ (dị thường đơn) với một số lượng rất lớn
(hàng nghìn dị thường đối với mỗi đề án bay đo) Trong khi đó công tác kiểm tra
mặt đất các dị thường, bao gồm kiểm tra sơ bộ và kiểm tra chi tiết chỉ có thể được
Trang 29thực hiện với một số lượng rất hạn chế những dị thường tiêu biểu mà việc lựa chọn,
xác định chúng gặp nhiều khó khăn
- Trên thực tế các dị thường phổ gamma thường tập trung thành cụm hoặc dải
(gọi chung là cụm), bao gồm nhiều tập hợp dị thường đơn phân bố gần nhau trên
một đối tượng địa chất nào đó Trên mỗi yếu tố địa chất gây dị thường các dị
thường mang một đặc tính phóng xạ chung, liên quan với một loại hình khoáng sản
nếu có Do vậy, việc lựa chọn tiến hành kiểm tra mặt đất, cũng như việc dự báo các
diện tích triển vọng khoáng sản ở các bước phân tích tiếp theo thường được tiến
hành theo cụm Trong khi đó, thực tế ta chỉ có bản đồ phân bố các dị thường đơn
Rõ ràng là căn cứ trên bản đồ này rất khó có được một cách nhìn đầy đủ và khái
quát về đặc điểm phóng xạ chung của toàn cụm Do đó việc lựa chọn các cụm dị
thường tiêu biểu đại diện cho từng nhóm bản chất phóng xạ để tiến hành kiểm tra
mặt đất và đặc biệt là việc dự báo các diện tích triển vọng khoáng sản liên quan với
các cụm dị thường gặp nhiều khó khăn Thực tế công việc này còn dựa nhiều vào
kinh nghiệm, mang tinh chủ quan, chưa dựa trên những tiêu chuẩn mang tính định
lượng, có cơ sở khoa học chặt chẽ
Để góp phần khắc phục khó khăn nói trên theo hướng từng bước nâng cao hơn
nữa hiệu quả khai thác sử dụng thông tin, các nhà địa vật lý Việt Nam đã đề xuất và
xây dựng một phương pháp phân tích bổ sung mới với tên gọi “Phương pháp đánh
giá và phân loại cụm dị thường” theo cách sau:
- Xem một cụm dị thường bao gồm tập hợp nhiều dị thường đơn với các tham
số phóng xạ khác nhau như là một dị thường duy nhất với các tham số phóng xạ đặc
trưng chung nào đó
- Các cụm dị thường được đánh giá và phân loại bản chất phóng xạ qua rất
nhiều tham số chỉ tiêu: ΔJ, T(1/2), ΔU/ΔK, ΔTh/ΔU, Ju, JTh, JK, F, hàm lượng
các nguyên tố RU/Th, RU/K , RK/Th v.v…
Các tham số phóng xạ đặc trưng của cụm kể trên được xác định bằng cách xây
dựng các đường cong mật độ phân bố từ tập hợp số liệu trên các dị thường đơn, từ
đó xác định giá trị có tần suất lớn nhất làm giá trị đặc trưng chung của cụm
Trang 30Các hệ số tương quan hàm lượng các nguyên tố được xác định như sau:
Chúng ta biết hệ số tương quan của hai đại lượng ngẫu nhiên bất kỳ được xác
N
i
N
i i i
N
i
N
i N
i i i i
i y
x
N
Y Y
N
X X
N
Y X Y
X R
1
2 1 2 1
2 1 2
1
,
)(
)(
Từ bản chất toán học của hệ số tương quan nếu sử dụng chúng để phản ánh
đặc điểm phân bố của các nguyên tố phóng xạ U, Th, K trong đất đá có thể thấy: khi
hệ số tương quan hàm lượng càng có giá trị nhỏ thì mức độ “dị thường” của các
trường phóng xạ càng lớn và ngược lại Nếu trong 3 nguyên tố phóng xạ U, Th, K
có một nguyên tố nào đó phân bố không bình thường thì 2 hệ số tương quan có nó
tham gia sẽ có giá trị nhỏ Do vậy, các hệ số tương quan hàm lượng không chỉ là
những tham số chỉ tiêu xác định bản chất phóng xạ, mà còn nói lên mức độ “dị
thường”, từ đó liên quan đến việc đánh giá mức độ triển vọng khoáng sản của cụm
Các kết quả phân tích thử nghiệm trên tài liệu thực tế cho thấy đây là những tham số
chỉ tiêu rất tốt trong việc tham gia đánh giá và phân loại bản chất phóng xạ của cụm
mà khi xử lý trên các dị thường đơn không thể có được
Tuy nhiên việc lựa chọn các tham số chỉ tiêu trước đây dựa chủ yếu vào kinh
nghiệm Chúng tôi đã đưa vào áp dụng các phương pháp đánh giá lựa chọn thông
tin để lựa chọn tổ hợp thông tin có chất lượng cao góp phần nâng cao độ tin cậy của
các kết quả phân tích [10]
2.3.2 Ứng dụng trong phương pháp Tần suất-Nhận dạng
Phương pháp đánh giá, lựa chon thông tin theo thuật toán phân tích tần suất
của Griffiths - Vinni được đưa vào áp dụng trong phương pháp - Tần suất - Nhận
dạng với các nội dung chính như sau:
(2.12)
Trang 31- Xây dựng ma trận thông tin của đối tượng mẫu
- Đánh giá, lựa chọn tổ hợp thông tin
- Phân tích đối sánh, xác định các đối tượng đồng dạng
- Xây dựng chương trình và phân tích thử nghiệm
1 Phương pháp xây dựng ma trận thông tin của đối tượng mẫu
Để đánh giá và lựa chọn tổ hợp thông tin theo thuật toán Griffiths-Vinni,
trước hết cần có ma trận thông tin của đối tượng mẫu Ma trận này được xây dựng
theo cách như sau:
Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu xây dựng
các đường cong biến phân (đường cong mật độ phân bố) Từ các đường cong biến
phân xác định khoảng giá trị đặc trưng cho từng tham số Sau khi có được các
khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tin
cho từng chủng loại thông tin của từng phần tử Đối với mỗi phần tử của mỗi chủng
loại thông tin, nếu nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm
ngoài sẽ nhận giá trị là 0 Bằng cách này sẽ chuyển được một ma trận thông tin với
các số liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu của
thuật toán với các phân tử là các giá trị 1 hoặc 0
2 Phương pháp đánh giá lựa chọn tổ hợp thông tin
Để tiến hành phân tích đối sánh, xác định các đối tượng đồng dạng, trước hết
cần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các chủng
loại thông tin có được về đối tượng nghiên cứu
Nội dung này được thực hiện theo đúng phương pháp phân tích tần suất như
đã trình bày ở mục II Số lượng chủng loại thông tin m được lựa chọn tùy thuộc vào
giá trị ngưỡng của Pm cho trước (Ví dụ Pm >= 80%)
3 Phương pháp phân tích đối sánh, xác định các đối tượng đồng dạng
Phân tích đối sánh, xác định đối tượng đồng dạng là nội dung chính của một
thuật toán nhận dạng
Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng với
đối tượng mẫu hay không được thực hiện như sau:
Trang 32- Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với
đối tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu
- Tiến hành đánh giá tỉ trọng thông tin cho tất cả các tính chất của đối tượng
đối sánh bằng phương pháp phân tích tần suất như trên
- Tính tỉ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng
mẫu cho đối tượng đối sánh Có thể xem giá trị này tương tự như hệ số đồng dạng,
ta gọi nó là chỉ số đồng dạng, kí hiệu P*
m
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P*
m có giá trị đạt mức quy định nào đó Ví dụ P*
m >= 75%
4 Xây dựng chương trình và phân tích thử nghiệm
Theo các bước nội dung của phương pháp như đã nêu, chúng tôi đã xây dựng
chương trình xử lí trên máy tính (chương trình QTS) Các bước thực hiện của
chương trình được thể hiện trên sơ đồ (Bảng 2.1)
Đây là một phương pháp phân tích tổ hợp, cho phép xử lí đối với mọi dạng số
liệu địa chất, địa vật lý bất kỳ với số lượng tham số đầu vào tuỳ ý và đã tiến hành
phân tích thử nghiệm trên tài liệu thực tế vùng Tây Nam Tuy Hòa
Từ các kết quả đo vẽ tỉ lệ lớn dưới mặt đất cũng như công tác kiểm tra mặt
đất các dị thường cho thấy: Khoáng sản trên vùng biểu hiện khá phong phú, đáng
chú ý là vàng, thiếc, volfram, trong đó nổi bật nhất là vàng với nhiều điểm quặng đã
được phát hiện Trong số 28 cụm dị thường được lựa chọn từ 120 cụm để tiến hành
kiểm tra mặt đất có 16 cụm được đánh giá là rất có triển vọng 12 cụm được đánh
giá là ít hoặc không có triển vọng Chúng tôi đã tiến hành phân tích bằng phương
pháp Tần suất – Nhận dạng cho toàn bộ số liệu của 120 cụm dị thường với đối
tượng mẫu là các cụm trùng với các điểm quặng đã biết Đó là cụm 68 Xuân Sơn –
Suối Cái được đánh giá tài nguyên dự báo cấp P ước khoảng 5000 kg vàng, và cụm
38 được đánh giá triển vọng thiếc
Với 2 cụm đối tượng mẫu đã xác định được 23 cụm đồng dạng (16 của cụm
68 và 7 của cụm 38) Trong số 23 cụm đồng dạng, có 9 cụm đã tiến hành công tác
Trang 33kiểm tra mặt đất kết quả 8 cụm được đánh giá là triển vọng loại 1 và loại 2, chỉ có 1
cụm được đánh giá là ít triển vọng(Bảng 3.1, Bảng 3.2, Hình 3.9)
Đây là một phương pháp phân tích nhận dạng mới được xây dựng trên cơ sở
ứng dụng phương pháp phân tích tần suất trong lớp bài toán đánh giá lựa chọn
thông tin Những kết quả đạt được đã nói lên độ tin cậy cũng như ý nghĩa thực tiễn
của phương pháp
Phương pháp này hoàn toàn có thể ứng dụng tham gia giải quyết nhiệm vụ
tìm kiếm và dự báo triển vọng khoáng sản trong xử lý, phân tích tài liệu địa vật lý
máy bay, một nguồn tài liệu đồ sộ hết sức phong phú ở nước ta hiện nay Về nguyên
tắc phương pháp này có thể mở rộng phân tích cho các tài liệu địa vật lý khác nhau
Tuy nhiên hiện chưa có kết quả phân tích trên các dạng tài liệu địa vật lý khác Đây
cũng là hướng nghiên cứu tiếp theo để hoàn thiện hơn nữa nội dung của phương
pháp Những kết quả đạt được cũng mở ra hướng nghiên cứu tiếp cận mới giải
quyết bài toán nhận dạng trong địa vật lý trên cơ sở khai thác ứng dụng lớp các bài
toán đánh giá lựa chọn thông tin
2.3.3 Ứng dụng trong phương pháp Khoảng cách-Tần suất-Nhận dạng
Các phương pháp đánh giá, lựa chon thông tin theo thuật toán phân tích tần
suất của Griffiths - Vinni và thuật toán phân tích khoảng cách khái quát của
Paguônôv cũng đã được đưa vào áp dụng trong phương pháp Khoảng cách - Tần
suất - Nhận dạng với các nội dung tương tự phương pháp Tần suất-Nhận dạng:
- Xây dựng ma trận thông tin của đối tượng mẫu (đối tượng chuẩn)
- Đánh giá, lựa chọn tổ hợp thông tin
- Phân tích đối sánh, xác định các đối tượng đồng dạng
- Xây dựng chương trình và phân tích thử nghiệm
1 Phương pháp xây dựng ma trận thông tin đối tượng mẫu
Các ma trận thông tin của đối tượng mẫu (quặng và không quặng) theo
phương pháp phân tích khoảng cách khái quát dễ dàng có được trực tiếp từ số liệu
địa vật lý trên các đối tượng mẫu đó Ma trận thông tin của đối tượng mẫu trong