2.1. Phƣơng pháp nghiên cứu
2.1.2. Mạng thần kinh nhân tạo (AN N Artificial Neural Networks)
Xuất phát điểm nghiên cứu mạng thần kinh nhân tạo đƣợc hình thành từ hiểu biết về cấu trúc mạng thần kinh sinh học của con ngƣời (hệ thống thần kinh trong
bộ não của con ngƣời có khoảng 100 tỷ (1011) tế bào thần kinh (neuron - Nơ-ron) và
khoảng 100 nghìn tỷ (1014) khớp thần kinh (xi-náp - synaptic) để liên kết với nhau.
Mỗi khớp thần kinh khi có đủ năng lƣợng - “phát sáng” sẽ có khả năng truyền tiếp dữ liệu, hay có thể gọi đây là q trình “suy nghĩ”.
Mạng thần kinh nhân tạo mô phỏng mạng thần kinh và cách làm việc của các neuron thần kinh trong bộ não nhằm ứng dụng giải quyết các bài toán phức tạp do hai nhà nghiên cứu McCulloch và Pitts lần đầu tiên giới thiệu vào năm 1943. Sau đó các nhà khoa học nghiên cứu ứng dụng vào nhiều lĩnh vực kỹ thuật khác nhau.
Hình 2.2 Mơ tả mạng thần kinh tự nhiên hoạt động (nguồn wikipedia về mạng thần kinh)
Mạng neuron trong những năm gần đây đƣợc nhiều nhà khoa học ứng dụng quan tâm, đã có những nghiên cứu ứng dụng thành công ở nhiều lĩnh vực khác nhau với các bài toán liên quan tới dự báo/dự đoán, nhận dạng, phân loại hay điều khiển tự động, khai phá dữ liệu. Nhƣ chúng ta đƣợc biết tới khả năng nhận dạng mặt ngƣời trong thiết bị di động, nhận dạng giọng nói, phân loại tự động v.v. ứng dụng trong điện tử, kinh tế, quân sự, nghiên cứu. Nhƣ vậy phƣơng pháp ứng dụng mạng ANN đã đạt đƣợc độ tin cậy ngày càng cao và dần tiếp cận gần gũi với cuộc sống của con ngƣời hơn.
Từ nguyên tắc hoạt động của các tế bào thần kinh trong não bộ con ngƣời, các nhà khoa học đã nghiên cứu ra mạng thần kinh nhân tạo, có khả năng học tập, dự đốn các dữ liệu chƣa biết với tính chính xác đáng tin cậy. Có thể hiểu mạng thần kinh sinh học hoạt động nhƣ sau: Các neurons lấy tổng tất cả các điện thế vào khi nó nhận đƣợc, sau đó sẽ phát ra một xung điện thế nếu tổng điện thế lớn hơn một ngƣỡng nào đó. Các neurons nối với nhau ở các xi-náp, xi-náp mạnh khi nó cho phép truyền dẫn dễ dàng tín hiệu qua các neurons khác, ngƣợc lại một xi-náp yếu sẽ truyền dẫn tín hiệu rất khó khăn. Do vậy có thể thấy các xi-náp đóng vai trị rất quan trọng trong q trình học, lúc đó các xi-náp đƣợc tăng cƣờng, tạo nên nhiều liên kết mạnh giữa các neurons. Hay hiểu đơn giản, ngƣời nào học càng giỏi thì càng có
nhiều xi-náp và các xi-náp ấy càng mạnh, các liên kết giữa các neurons càng nhiều, càng nhạy bén.
Hình 2.3 Q trình xử lý thơng tin của một ANN
Theo hoạt động của mạng thần kinh sinh học, mạng thần kinh nhân tạo có các neurons đƣợc gắn kết để xử lý thông tin, thơng qua huấn luyện ANN có thể học hỏi kinh nghiệm. Mỗi neuron nhận các dữ liệu vào (inputs) sau đó xử lý và đƣa ra một kết quả đầu ra (output) duy nhất, kết quả output đó có thể sẽ làm đầu vào cho các neuron khác.
Tính chất chung của một ANN gồm có 3 thành phần: Lớp đầu vào (input layer), lớp ẩn (hidden layer) và lớp đầu ra (output layer). Trong một ANN có thể có 1 hoặc nhiều lớp ẩn.
Mỗi đầu vào tƣơng ứng với 1 thuộc tính của dữ liệu, ví dụ nhƣ trong đề tài nghiên cứu này đầu vào sẽ là thuộc tính của điều kiện tự nhiên nhƣ lƣợng mƣa, độ ẩm, độ cao … Đầu ra là giải pháp cho vấn đề, nhƣ đầu ra sẽ là Co (có) hoặc Khong (khơng) xuất hiện sốt rét. Ngồi ra trong mơ hình ANN cịn có các trọng số liên kết (w - connection weights) thể hiện mức độ quan trọng hay độ mạnh/yếu của dữ liệu đầu vào với q trình xử lý thơng tin phía sau, giá trị điều chỉnh hay độ lệch (bias).
Giả sử có bộ dữ liệu với các tham số đầu vào khác nhau, qua quá trình lặp đi lặp lại mạng thần kinh nhân tạo sẽ xác định đƣợc trọng số tƣơng đối tốt nhất và điều
huống mới với các trọng số đã xác định mạng thần kinh nhân tạo sẽ cho kết quả đầu ra là một dự đoán đáng tin cậy. Hoạt động này đƣợc coi là quá trình huấn luyện hay là học (learning processing) - cụ thể là sự lan truyền ngƣợc (back propagation) trong phân nhóm học có giám sát (supervised learning).
Về nguyên tắc huấn luyện, mạng neuron có 3 cách là on-line training, stochastic training và batch training. Đối với on-line training thì các trọng số của mạng (w) đƣợc cập nhật ngay lập tức sau khi một mẫu input đƣợc đƣa vào. Với stochastic training cũng giống nhƣ on-line training nhƣng việc chọn các mẫu input để đƣa vào mạng từ training set đƣợc thực hiện ngẫu nhiên. Cịn lại batch training thì tất cả các mẫu input đƣợc đƣa vào mạng cùng lúc và sau đó các trọng số mạng đƣợc cập nhật đồng thời.
Trong q trình huấn luyện mạng, “epoch” là giá trị mơ tả quá trình khi tất cả các mẫu input của training set đƣợc đƣa vào để huấn luyện mạng. Vì vậy giá trị của “epoch” xác định số lần mạng đƣợc huấn luyện (hay hiểu là số lần đƣa tất cả các dữ liệu trong training set vào mạng).
Có thể miêu tả cơ bản q trình học, hay huấn luyện mạng như sau:
Các mẫu lần lƣợt đƣợc đƣa vào mạng huấn luyện gọi là Xi, ban đầu các trọng số (w) đƣợc khởi tạo ngẫu nhiên và chúng sẽ đƣợc điều chỉnh sau mỗi vòng lặp. Bƣớc này sẽ đƣợc lặp lại cho đến khi các trọng số hội tụ đƣợc các giá trị cho phép mạng xác định chính xác đƣợc các mẫu. Gọi giá trị đầu ra output là Y (Yj) và giá trị mong đợi đã biết trƣớc là (Zj - Designed Result), sau mỗi vòng sẽ xuất hiện giá trị lỗi gọi là delta (delta = Zj-Yj), mục đích của mạng huấn luyện là delta càng nhỏ càng tốt (delta = 0 là hoàn hảo). Nhƣ vậy trọng số sau mỗi vòng sẽ đƣợc hiệu chỉnh theo cơng thức sau:
Trong đó, LR - Learning rate đƣợc gọi là tham số kiểm soát tốc độ học của mạng, lựa chọn đƣợc tham số kiểm soát tốc độ học phù hợp sẽ làm tăng độ chính xác.
Tuy nhiên trong q trình huấn luyện mạng, khơng phải tất cả neuron có thể sinh ra output, hay nói cách khác là khi input không đủ mạnh (thông tin đầu vào yếu) thì kết quả đầu ra output sẽ khơng đƣợc chuyển tiếp sang lớp (layer) tiếp theo. Việc có đƣợc chuyển tiếp hay không phụ thuộc vào hàm chuyển đổi (YT-Transfer Function) thơng qua khả năng kích hoạt bên trong (phụ thuộc hàm tổng là Summation Function và kết quả đầu ra output).
Hàm chuyển đổi phi tuyến đƣợc sử dụng phổ biến trong huấn luyện mạng là sigmoid (logical activation) funcion, mang giá trị thuộc khoảng [0,1]. Nếu đầu ra output của một neuron nhỏ hơn giá trị ngƣỡng của nó, thì coi nhƣ khơng đủ mạnh để đƣợc chuyển đến layer tiếp theo.
Từ mạng huấn luyện cơ bản phát triển thành mơ hình mạng huấn luyện trong nghiên cứu dự đoán nguy cơ sốt rét, cụ thể gồm 3 lớp (3 layers), trong đó dữ liệu đầu vào mơ hình là các yếu tố, các neurons, trọng số và hàm tốn học tƣơng ứng.
Hình 2.5 Mơ hình mạng huấn luyện ANN trong nghiên cứu
Mơ hình mạng thần kinh có thể sử dụng kết hợp nhiều hàm toán học khác nhau để xây dựng nhằm giải quyết các vấn đề riêng biệt. Dƣới đây là các hàm toán học sử dụng trong nghiên cứu đƣa vào mạng huấn luyện cụ thể gồm: Tangent, sigmoid, activation,… Kết quả của mơ hình cho từng điểm là khả năng có hay không xuất hiện dịch bệnh sốt rét tại điểm đó. Sự kết hợp mạng lƣới điểm nghiên cứu tạo ra bản đồ kết quả về nguy cơ dịch bệnh sốt rét trên toàn địa bàn nghiên cứu.
2.1.3. Tối ƣu hóa dựa trên khái niệm địa lý sinh học (BBO - Biogeography- based optimization)
Địa lý sinh học đã đƣợc nghiên cứu từ thế kỷ thứ 19, đến những năm 1960 Robert MacArthur và Edward Wilson bắt đầu làm việc cùng nhau trên các mơ hình tốn học về địa lý sinh học, cơng trình của họ phát triển đỉnh điểm với ấn bản năm 1967 có tên “The Theory of Island Biogeography”. Những năm gần đây Địa lý sinh
học đƣợc nghiên cứu cùng các thuật tốn và dần hình thành nên khái niệm Tối ƣu hóa dựa trên địa lý sinh học (BBO), hay đƣợc hiểu là thuật tốn tính tốn tiến hóa đƣợc thúc đẩy bởi một quá trình tự nhiên (địa lý sinh học) do Dan Simon giới thiệu vào đầu vào năm 2008.
Địa lý sinh học tự nhiên mô tả cách các loài trong tự nhiên di cƣ từ đảo này sang đảo khác, cách lồi mới phát sinh và lồi nào đó trở nên tuyệt chủng nhƣ thế nào. Khái niệm “Đảo” đƣợc hiểu là một môi trƣờng sống chung chung trong tự nhiên đặc trƣng và tách biệt về mặt địa lý với môi trƣờng sống khác. Mỗi đảo có các điều kiện để quyết định tính phù hợp cho các lồi cƣ trú, chỉ số phù hợp môi trƣờng sống đƣợc gọi là HSI (Habitat Suitability Index), cịn các điều kiện của mơi trƣờng sống đó đƣợc coi là các biến chỉ số phù hợp SIV (Suitability Index Variables). SIV có thể đƣợc coi là các biến độc lập của mơi trƣờng sống cịn HSI là các biến phụ thuộc.
Một mơi trƣờng sống có chỉ số HSI cao sẽ có số lƣợng lồi lớn và ngƣợc lại mơi trƣờng có chỉ số HSI thấp sẽ có số lƣợng lồi nhỏ. Đặc điểm của mơi trƣờng sống có HSI cao cịn thể hiện ở tỷ lệ nhập cƣ thấp vì mơi trƣờng gần nhƣ bão hịa với các lồi, sẽ có nhiều lồi di cƣ đến mơi trƣờng sống lân cận gần đó (điều này khơng có nghĩa là một lồi di cƣ hồn tồn biến mất khỏi mơi trƣờng sống đó mà chỉ một vài đại diện của lồi đó di cƣ). Khi số lƣợng di cƣ của các loài tới một môi trƣờng sống tăng lên sẽ làm tăng chỉ số HSI của mơi trƣờng đó vì sự phù hợp của môi trƣờng sống tỷ lệ thuận với sự đa dạng sinh học của nó. Tuy nhiên, nếu HSI của một mơi trƣờng sống thấp thì các lồi cƣ trú ở đó sẽ có xu hƣớng tuyệt chủng, điều này sẽ tiếp tục mở đƣờng cho việc nhập cƣ bổ sung. Do đó, mơi trƣờng sống có HSI thấp sẽ năng động hơn trong phân bố lồi của chúng so với mơi trƣờng sống có chỉ số HSI cao.
Trên đây là cách phân bố loài trong tự nhiên, xét tƣơng tự với các giải pháp vấn đề có thể bất kỳ trong lĩnh vực nào và mỗi giải pháp đƣợc định lƣợng sự phù hợp của nó. Một giải pháp tốt tƣơng tự nhƣ một mơi trƣờng có chỉ số HSI cao,
ngƣợc lại một giải pháp kém thể hiện nhƣ một mơi trƣờng có chỉ số HSI thấp. Nhƣ vậy có thể thấy, các giải pháp có HSI cao chống lại sự thay đổi nhiều hơn các giải pháp HSI thấp và các giải pháp HSI cao có xu hƣớng chia sẻ các tính năng (features) của chúng cho giải pháp có HSI thấp (điều này cũng có ý nghĩa tƣơng tự nhƣ trong địa lý sinh học tự nhiên là các tính năng sẽ khơng biến mất khỏi giải pháp có HSI cao mà các tính năng mới sẽ xuất hiện trong các giải pháp có HSI thấp). Các giải pháp kém sẽ có nhiều tính năng từ giải pháp tốt. Việc bổ sung các tính năng mới vào các giải pháp có HSI thấp có thể nâng cao chất lƣợng của các giải pháp đó. Đây đƣợc hiểu là phƣơng pháp giải quyết vấn đề tối ƣu hóa dựa trên địa lý sinh học (BBO) [35].
BBO tối ƣu hóa một vấn đề nhất định bằng cách kết hợp một giải pháp ứng viên hiện có với một giải pháp ứng viên mới đƣợc tạo ra theo một công thức đơn giản. Đây là thuật tốn tiến hóa, có khả năng tối ƣu hóa một hàm bằng cách ngẫu nhiên và lặp đi lặp lại cải thiện các giải pháp.
Hình 2.6 Mơ hình minh họa về phong phú lồi với một mơi trƣờng sống
Tỷ lệ di cƣ và nhập cƣ các lồi của một mơi trƣờng ảnh hƣởng tới số lƣợng các lồi trong mơi trƣờng đó thể hiện cụ thể trong mơ hình trên với 2 trục là trục tỷ lệ (rate) và trục số lƣợng loài (K). Đồ thị minh họa cơ bản về cơ chế và mối quan hệ giữa đƣờng nhập cƣ và đƣờng di cƣ. Hai đƣờng chéo tƣơng ứng là tỷ lệ di cƣ (emigration rate) và nhập cƣ của các loài (immigration rate), trong thực tế 2 đƣờng chéo này có thể là những đƣờng cong phức tạp, trên đây là mơ hình giản lƣợc. I
(Immigration Max) là tỷ lệ nhập cƣ tối đa, E (Emigration Max) là tỷ lệ di cƣ tối đa. Ko, Kmax tƣơng ứng là số lƣợng cân bằng của các loài và số lƣợng loài tối đa.
Tỷ lệ nhập cƣ tối đa khi khơng có lồi nào sống trong mơi trƣờng đó, khi các lồi nhập cƣ vào mơi trƣờng, mơi trƣờng sống sẽ trở nên đơng đúc hơn lúc đó một số lồi khó tồn tài hơn trong mơi trƣờng đó nên tỷ lệ nhập cƣ giảm và bắt đầu xuất hiện di cƣ tìm nơi cƣ trú mới, tỷ lệ di cƣ cao nhất khi số lƣợng lồi trong mơi trƣờng ở mức tối đa. Số lƣợng loài cân bằng khi 2 tỷ lệ trên đạt ngƣỡng tại điểm giao nhau trong mơ hình. Trong tự nhiên với mỗi mơi trƣờng sống có thể xảy ra các biến động nhƣ thiên tai, ảnh hƣởng xấu của mơi trƣờng hay xuất hiện lồi ăn thịt sẽ tác động tới sự cân bằng tỷ lệ di cƣ và nhập cƣ, khi đó môi trƣờng sẽ cần thêm khoảng thời gian để dần trở về trạng thái cân bằng.
Phƣơng pháp BBO thƣờng đƣợc sử dụng để tối ƣu hóa các hàm giá trị đa chiều. BBO mô phỏng sự phân bố địa lý các điều kiện tự nhiên - kinh tế - xã hội trong vùng nghiên cứu.