CHUÔNG 2 CƠ SỞ LÝ THUYẾT CỦA PHẦN MỀM WATERGEMS
2.4. Cơ sở lý thuyết tính toán tối ưu của phần mềm WaterGEMS
2.4.2. Thuật toán di truyền (Genetic Algorithm) : M
Với khả năng hiện nay, máy tính đã giúp giải được rất nhiều bài toán khó mà trước đây thường bó tay. Mặc dù vậy, vẫn có một số lớn các bài toán thú vị mà chưa có giải thuật hợp lý để giải chúng. Trong đó các bài toán tối ưu là những bài toán thường gặp trong thực tiễn.
Nói chung, bài toán tối ưu có thể xem như bài toán tìm kiếm giải pháp (tốt nhất) trong không gian (vô cùng lớn) các giải pháp. Khi không gian tìm kiếm nhỏ, những phương pháp cổ điển cũng đủ thích hợp, nhưng khi không gian tìm kiếm lớn phải dùng đến kỹ thuật Trí Tuệ Nhãn Tạo đặc biệt. Thuật toán di truyền (TTDT) là một trong những kỹ thuật đó. TTDT là một loại thuật toán mô phỏng các hiện tượng tự nhiên: kế thừa và đấu tranh sinh tồn để cải tiến lời giải và khảo sát không gian lời giải. Khái niệm kế thừa và đẩu tranh sinh tồn được giải thích qua thí dụ về sự tiến hóa của một quần thể thỏ như sau :
Có một quần thể thỏ. Trong đó có một số con nhanh nhẹn và thông minh hơn những con khác. Những chú thỏ nhanh nhẹn và thông minh có xác suất bị chồn cáo ăn thịt nhỏ hơn, do đó chúng tồn tại để làm những gì tốt nhất có thể : Tạo thêm nhiều thỏ tốt. Dĩ nhiên, một số thỏ chậm chạp đần độn cũng sống sót chỉ vì may mắn. Quần thể những chú thỏ còn sống sót sẽ bắt đầu sinh sản. Việc sinh sản này sẽ tạo ra một hỗn hợp tốt về "nguyên liệu di truyền thỏ". Một số thỏ chậm chạp có con với những con thỏ nhanh, một số nhanh nhẹn có con với thỏ nhanh nhẹn, một số thông minh với thỏ 24
25
đần độn,... Và trên tất cả, thỉnh thoảng thiên nhiên lại ném vào một con thỏ "hoang dã"
bằng cách làm đột biến nguyên liệu di truyền thỏ. Những chú thỏ con, do kết quả này, sẽ nhanh hơn và thông minh hơn những con thỏ trong quần thể gốc vì có nhiều bố mẹ nhanh nhẹn và thông minh hơn đã thoát chết khỏi chồn cáo.
Khi tìm kiếm lời giải tối ưu, TTDT cũng thực hiện các bước tương ứng với câu chuyện đấu tranh sinh tồn của loài thỏ.
TTDT sử dụng các thuật ngữ vay mượn của di truyền học. Ta có thể nói về các cá thể (hay kiểu gen, cấu trúc) trong một quần thể; những cá thể này cũng còn được gọi là chuỗi hay các nhiễm sắc thể.
Mỗi kiểu (nhóm) gen (ta gọi là một nhiễm sắc thể) sẽ biểu diễn một lời giải của bài toán đang giải (ý nghĩa của một nhiễm sắc thể cụ thể được người sử dụng xác định trước);
một tiến trình tiến hóa được thực hiện trên một quần thể các nhiễm sắc thể tương ứng với một quá trình tìm kiếm lời giải trong không gian lời giải. Tìm kiếm đó cần cân đối hai mục tiêu : Khai thác những lời giải tốt nhất và khảo sát không gian tìm kiếm. TTDT là phương pháp tìm kiếm (độc lập miền) tạo được sự cân đối đáng kể giữa việc khai thác và khảo sát không gian tìm kiếm.
Thực ra, TTDT thuộc lớp các thuật giải xác suất, nhưng lại rất khác những thuật toán ngẫu nhiên vì chúng kết hợp các phần tử tìm kiếm trực tiếp và ngẫu nhiên. Khác biêt auan trong giữa tìm kiếm của TTDT và các nhương nhán tìm kiếm khác là TTDT cả các phương pháp khác chỉ xử lý một điểm trong không gian tìm kiếm. Chính vì thế, TTDT mạnh hơn các phương pháp tìm kiếm hiện có (như Leo đồi và Mô phỏng luyện thép) rất nhiều. TTDT thực hiện tiến trình tìm kiếm lời giải tối ưu theo nhiều hướng, bằng cách duy trì một quần thể các lời giải, thúc đẩy sự hình thành và trao đổi thông tin giữa các hướng này. Quần thể trải qua tiến trình tiến hóa : ở mỗi thế hệ lại tái sinh các lời giải tương đối
“tốt”, trong khi các lời giải tương đối “xấu” thì chết đi. Để phân biệt các lời giải khác nhau, hàm mục tiêu được dùng để đóng vai trò môi trường.
Một TTDT giải một bài toán cụ thể phải gồm 5 thành phần:
a. Cách biểu diễn di truyền cho lời giải bài toán :
Một cấu trúc dữ liệu biểu diễn không gian lời giải của bài toán.
b. Khởi tạo quần thể ban đầu (initialpopulation) :
Quần thể đầu tiên được khởi tạo một cách ngẫu nhiên từ tập hợp những cá thể riêng lẻ. Kích cỡ của quần thể đầu tiên (population size) phụ thuộc vào yếu tố tự nhiên của bài toán, nhưng nhìn chung thì một bài toán có đến hàng trăm hay hàng nghìn giải pháp hợp lý. Tập hợp những giải pháp hợp lý cho vấn đề được gọi là không gian tìm kiếm (search space). Trước một bài toán áp dụng TTDT,
26
ta cần phải xác định rõ nhiễm sắc thể và cá thể cho vấn đề, và thông thường đó sẽ là kết quả cuối cùng. Mỗi lời giải được đánh giá "độ thích nghi" hay độ "tốt"
của lời giải.
c. Một hàm lượng giá đóng vai trò môi trường, đánh giá các lời giải theo mức độ
‘‘thích nghỉ’’ của chúng:
Dựa trên một hàm lượng giá, ta sẽ xác định được một giá trị có độ thích nghi (Fitness). Giá trị này, để đơn giản chính là độ "tốt" của lời giải. Vì phát sinh ngẫu nhiên nên độ "tốt" của lời giải hay tính thích nghi của cá thể trong quần thể ban đầu là không xác định.
d. Các phép toán di truyền :
Để cải thiện tính thích nghi của quần thể người ta tìm cách tạo ra quần thể mới.
Có hai cách thao tác trên thế hệ hiện tại để tạo ra một thế hệ khác với độ thích nghi tốt hơn :
■ Thao tác đầu tiên là sao chép (selection) nguyên mẫu một nhóm các cá thể tốt từ thế hệ trước rồi đưa sang thế hệ sau. Thao tác này đảm bảo độ thích nghi của thế hệ sau luôn được giữ ở một mức độ hợp lý. Các cá thể được chọn thông thường là các cá thể có độ thích nghi cao nhất.
Phép chọn là quá trình loại bỏ các cá thể xấu trong quần thể để chỉ giữ lại trong quần thể các cá thể tốt. Phép chọn được mô phỏng: sắp xếp quần thể theo thứ tự độ thích nghi giảm dần. Loại bỏ các cá thể cuối dãy để chỉ giữ lại n cá thể tốt nhất. Giả sử ở đây quần thể có kích thước cố định n. Có nhiều phương pháp chọn lọc nhiễm sắc thể:
s Chọn lọc Roulette (Roulett Wheel Selection).
•S Chọn lọc xếp hạng (Rank Selection).
Chọn lọc cạnh tranh (Tournament Selection).
■ Thao tác thứ hai là tạo ra cá thể mới bằng cách thực hiện các thao tác sinh sản trên một số cá thể được chọn từ thế hệ trước, thông thường cũng là những cá thể có độ tương thích cao. Có hai loại thao tác sinh sản: lai tạo, đột biến
Phép lai tạo (Crossover): là quá trình hình thành nhiễm sắc thể mới trên cơ sở nhiễm sắc thể cha mẹ bằng cách ghép một hay nhiều đoạn gen của hai hay nhiều nhiễm sắc thể cha mẹ với nhau. Tuy nhiên, nhiều khi do thế hệ khởi tạo ban đầu có đặc tính chưa phong phú và chưa phù hợp nên các cá thể không rải đều được không gian của bài toán. Có những phương pháp lai ghép sau:
o Lai ghép ánh xạ từng phần (PMX Partial Mapped Crossover).
o Lai ghép có trật tự (OX order Crossover).
27
o Lai ghép dựa trên vị trí (Position Based Crossover).
o Lai ghép dựa trên thứ tự (Order Base Crossover).
o Lai ghép có chu trình (CX cycle Crossover).
o Lai ghép thứ tự tuyến tính (LOX Linear order Crossover).
sPhép đột biến (mutation): Phép đột biến là hiện tượng cá thể con mang một (hoặc một số) tính trạng có trong mã di truyền của cha mẹ, tức là sự sửa đổi một hoặc một vài gen của một nhiễm sắc thể chọn bằng cách thay đổi ngẫu nhiên với xác suất là tỷ lệ đột biến (mutation rate). Nhưng thao tác này chỉ được phép xảy ra với tần suất rất thấp (thường dưới 0.01), vì thao tác này có thể gây xáo trộn và làm mất đi những cá thể chọn lọc và lai tạo có tính thích nghi cao, dẫn đến thuật toán không còn hiệu quả. Không ai có thể đánh giá được phương pháp đột biến nào tốt hơn, do đó có một vài phương pháp đơn giản, cũng có vài trường hợp khá phức tạp. Người ta thường chọn một trong những phương pháp sau : o Đột biến đảo ngược (Inversion Mutation).
o Đột biến chèn (Insertion Mutation)
o Đột biến thay thế (Displacement Mutation), o Đột biến tương hỗ (Reciprocal Exchange), o Đột biến chuyển dịch (Shift Mutation).
e. Các tham số sử dụng trong TTDT (kích thước quần thể; xác suất lai, đột biến...)
■ Kích thước quần thể (Population Size):
Kích thước quần thể cho biết có bao nhiêu cá thể trong một quần thể (trong mỗi thế hệ). Các thử nghiệm đã cho thấy kích thước quần thể không nên quá lớn cũng như quá nhỏ. Nếu có quá ít cá thể thì sẽ làm giảm không gian tìm kiếm của giải thuật và dễ rơi vào các cục bộ địa phương, như vậy sẽ dễ xảy ra trường hợp bỏ qua các lời giải tốt. Tuy nhiên, nếu có quá nhiều cá thể cũng sẽ làm cho giải thuật chạy chậm đi, ảnh hưởng đến hiệu quả tính toán của giải thuật. Các nghiên cứu cũng đã chỉ ra không có lợi khi tăng kích thước quần thể lên quá một giới hạn cho phép.
■ Xác suất lai ghép (Splice Probability):
Xác suất lai ghép cho biết tính thường xuyên của việc lai ghép tạo ra thế hệ mới được thực hiện như thế nào. Nếu không thực hiện lai ghép, con sinh ra sẽ hoàn toàn giống bố hoặc hoàn toàn giống mẹ. Nếu được lai ghép, con sinh ra sẽ có một phần giống bố và một phần giống mẹ.
■ Xác suất đột biến (Mutation Rate) :
Xác suất đột biến cho biết tính thường xuyên của việc các các gen của nhiễm sắc thể (NST) thay đổi thế nào. Tác dụng của toán tử đột biến là ngăn ngừa
28
giải thuật di truyền rơi vào tình trạng cực trị địa phương, tuy nhiên nếu thực hiện đột biến với xác suất quá cao sẽ biến giải thuật di truyền thành giải thuật tìm kiếm ngẫu nhiên.
Điều kiện kết thúc, thoát ra quá trình tiến hóa quần thể : dựa vào từng bài toán mà có các cách kết thúc vấn đề khác nhau, khi đã đạt đến mức yêu cầu. Một vài trường hợp thông thường như sau:
• Kết thúc theo kết quả : một khi đạt đến mức giá trị yêu cầu thì chấm dứt ngay quá trình thực hiện.
• Kết thúc theo số thế hệ (Generations): chọn số thế hệ, quá trình sẽ dừng lại đúng ngay số thế hệ đã qui định trước, không cần biết kết quả như thế nào.
• Tính theo thời gian : Không cần biết đã tiến hóa bao nhiêu thế hệ hay kết quả thế nào, chỉ cần dựa vào số giờ qui định mà kết thúc.
• Tổ hợp : dùng nhiều phương án khác nhau cho vấn đề, chẳng hạn như : chạy theo số thế hệ xong sau đó đánh giá cho chạy theo kết quả, hoặc ngược lại.
29
CHƯƠNG 3 : ÚNG DỤNG PHẦN MỀM WATERGEMS VÀO TÍNH TOÁN TÓI ƯU MẠNG LƯỚI CẤP NƯỚC VÙNG 1 - TP. HCM
3.1. Giói thiệu mạng lưới cấp nước vùng 1 - TP. HCM
• Giới thiệu hệ thống cáp nước và các dự án giảm thất thoát nước ở TP. HCM :
Tuyến ống truyền tải nước sạch bê tông cốt thép dự ứng lực DN2000 đưa nước từ nhà máy nước Thủ Đức về trung tâm thành phố (cầu Điện Biên Phủ) là nguồn cung cấp nước chính cho thành phố nói chung và cho vùng 1 nỏỉ riêng.
Dự án giảm thất thoát nước thành phố Hồ Chí Minh đã tính toán và phân chia thành phố thành 6 vùng (zone) (hình 1). Mỗi vùng lại được chia nhỏ thành nhiều DMA (District Metered Area). Mỗi DMA cỏ trung bình từ 1000 đến 2000 đấu nối. Tại các điểm nước vào hoặc ra khỏi DMA đều được lắp đặt đồng hồ đo, thiết bị điều khiển áp suất, thiết bị ghi nhận và truyền dữ liệu về trung tâm. Các DMA hoạt động độc lập, khép kín để xác định lượng nước rò rỉ, lên kế hoạch dò tìm và sửa bể, hạn chế tối đa lượng nước rò rỉ trong từng DMA.
Water Mí
Hình 1: Sư đồ phân vùng (zone) trong dự án giảm thất thoát nước TP. HCM
30
• Giới thiệu sơ bộ về vùng 1 [ltì]:
Hình 2 : Sơ đồ phân vùng trong dự án giảm that thoát nước vùng 1
Vùng 1 (hình 2) cỏ tổng diện tích khoảng 23 km2 và số dân khoảng 800.000 (năm 2013).
Theo nghiên cứu trước đây và đảnh giá giảm thất thoát, vùng 1 cố tiềm năng giảm rò ri cao nhất, chiếm khoảng 98.000 m3/ngày đêm, so với lưu lượng được cấp cho vùng là 203.000 m3/ngày đêm, chiếm tỉ lệ khoảng 48%, chủ yếu là do có nhiều kết nối phụ. Theo nghiên cứu khả thi[16], cỏ trên 126.000 kết nối phụ trong vùng 1.
• Giới thiệu sơ bộ về mạng lưới cấp nước vùng 1:
J Tuyến ống bê tông cốt thép dự ứng lực DN2000 truyền tải nước sạch chính từ nhà máy nước Thủ Đức về trung tâm thành phố, sau khỉ băng qua cầu Điện Biên Phủ vào địa bàn vùng 1 được tách ra làm hai:
* Tuyến D1200 đi theo đường Điện Biên Phủ - Đinh Tiên Hoàng - Võ Thị Sáu - Ba Tháng Hai cung cấp nước về phía quận 3, quận 10, quận 11, quận 6.
* Tuyến DI500 đi theo đường Nguyễn Bỉnh Khiêm - Nguyễn Hữu Cảnh - Lê Thánh Tôn. Tuyến này khi đến đường Pasteur thì giảm còn DI200 - DI050 đi dọc theo đường Lê Lợi - Trần Hưng Đạo - Châu Văn Liêm - Hải Thượng Lãn Ông - Tháp Mười cấp nước cho quận 1, quận 5, quận 6, quận 8.
Ngoài ra, tại Pasteur còn cỏ một nhánh rẽ D900 đi dọc theo Pasteur cung cấp nguồn cho D500 Nguyễn Công Trứ và băng sông đưa nước qua quận 4 và tại Tản Đà có một nhánh rẽ D600 băng kênh đưa nước từ quận 5 qua quận 8.
31
Chừa trổng 1 trang để dành kẹp hình 3 : họa đồ zone 1 (acad) ỉn màu A3 landscape
Hình 3 : Sơ đồ mạng lưới cấp nước vùng 1
32
3.2. Thu thập và phân tích số liệu mạng lưới cấp nước vùng 1- TP. HCM
- Thu thập và phân tích các số liệu về mạng lưới đường ống hiện hữu (chiều dài, đường kính, ...), số liệu về địa hình (cao độ nút), số liệu theo dõi lưu lượng và áp suất,...
của mạng lưới đường ống truyền tải ở vùng 1 - TP. HCM.
- Chiều dài của 52 đoạn ống chính được ghi trong bảng 3; còn cao trình, lưu lượng tiêu thụ và vị trí của các nút được trình bày trong bảng 4; chi phí xây lắp mạng lưới cấp nước vùng 1 hiện hữu được trình bày trong bảng 5.
Bảng 3 : Chỉều dàỉ các đoạn ống
Ong Chiều dãi (m) Ong Chiêu dai (m) Ông Chiêu dãi (m)
1 200 19 5SĐ 3Ẽ 650
2 300 20 400 37 550
3 300 21 050 30 06
4 300 22 500 39 750
6 700 23 110 40 400
6 550 24 300 41 130
7 190 25 350 42 350
8 400 26 130 43 190
9 1 27 600 44 290
10 20 140 46 270
11 120 29 550 4-6 200
12 350 30 750 47 210
13 750 31 1SŨ 46 52
14 iỌ 32 140 49 350
16 400 33 360 60 400
16 17Õ 34 230 51 340
17 43 35 800 52 350
u 300 Tống cộng : 13441m
33
Bảng 4: Cao trình và lưu lượng tiêu thụ tại các nút
Nút Cao trtnh Lưu lưprtỊ Eiéu thu
Vlirt Nũt Cao trinh (m)
Lưu lượng liồu
thụ ilia} Ỵ| |r|
Ị - - caụ OBPHu. 27 10 27$.ẽ TMus - NNTinh
2 7 0.0 DSPhU - NBKhhMì 23 11 153.6 Patìíur - NCTru 3 9 40 1 NBKhisrn - NDChiru 29 & 267.1 pôsi<ur- WKwt 4 11 79.1 NBKhiem - NTMKhai 30 12 113.7 VT&au - DTHoang s 12 22.S NBKhiem - Nũu 31 11 20 7 VT&au - PNTracn 6 13 74 1 LTTOÍÌ - TDTnang 32 9 302.9 VĨSau - Pasteur 7 10 05.0 LTTcn - HBThmn 33 11 151.6 VTSaữ - KKKNgíita 8 13 0,0 LTTCrtì - DKhqi 3-1 10 167.S VTS3J - TQTKạo
9 19 192 LLoi ■ Pssleur 35 ã 14 1 VTS*J - TEinh
10 1ô 102 3 LLoi ■ NKKNgHa 36 10 368.0 3TT2-CMT8
11 9 89.8 LLoi" THDao 37 s 116.1 3T2-CThang
12 10 116.Ề THD-ao - PNLao 3 = 10 0.0 3fĩ2 - TMŨuỳen 13 10 ưs.Ề THDao - BVien 39 10 159.6 ỈT2-LrlPnóng
14 6 757 THDtìũ-HHHủtì 40 11 194.2 3T2 - NTPnuúríg
15 10 106 4 THDM - NGChao 41 13 8.6 3T2 - NQUytn
16 9 61 1 THDaP- NVCU 42 12 119.6 3T2 ■ NL#n
17 9 38.6 THD-ao ■ NBeu 43 8 437.2 3T2-LTKĨBt
18 9 21.7 699 THDac 44 ã 260.4 TDa - VVKiet
19 s 66.1 801 THJac 45 8 S3.& DBPhL - TMQuyen
20 lũ 55.0 THDã - NTởíiì ■i=. 11 496 DBPhu - LTTo
21 10 85.5 THOăủ - ABirih 47 9 20 4 LTTo - HTK/
22 7 09 4 THDae - TDa 46 9 7.9 166 LLTộ
23 9 42 3 THC'an • LNHOG 49 8 183 LTTQ- NDChiru
24 12 -110 THD-ao - CVLiem 50 10 75.6 LTTc - HTMKhai 25 11 92.8 HTLŨng - PHung rj- 9 39.1 N‘ưCu - ADVucng
26 1! 13.0 HTLCnq - GCc-nq 52 9 65.6 MVCu- NTrai
Tdr^ỉóng :4BSGr7l/si
34
Bảng 5: Chỉ phi xây ỉẳp của mạng lưới vùng 1 hiện hữu
Ống Chiều dải (m)
Đường kính (rom}
Đơn giả (5/mJ
Chi phí xây dụng
(ế
1 200 1981 SOI 160157
2 ỈOO 1524 578 173541
ỉ 300 1524 578 173541
4 300 1524 578 17354Ỉ
5 700 1524 578 404928
5 550 1524 578 3ỈS-15E
ĩ 19Ữ 1524 578 109909
8 400 1524 578 231387
9 170 1219 43,9 74554
10 350 1219 439 153494
11 120 1219 439 52626
12 350 1219 439 153494
13 750 1219 439 3:28916
14 55Q 1'567 372 204487
15 400 1067 372 148718
16 170 1067 63205
17 43 1067 372 15987
1S 300 1067 372 111538
19 550 1067 372 204487
20 400 1067 372 140718
21 850 1067 372 316025
22 500 1067 372 185897
23 110 1067 4Ũ897
24 300 1067 372 111538
25 350 1067 372 130128
26 130 914 307 39893
đng Chiều dải (mỉ ữưỡng kính (mm)
Dơn giã
(S/m) Chi phí xây dựng (SI
27 r.F:7 914 307 184121
28 140 914 307 42962
29 550 1219 439 241205
30 750 1219 439 328916
31 180 1219 439 7894Ũ
32 140 1219 439 6139S
33 350 1219 439 ĩ53494
34 230 1067 372 85513
35 600 1067 372 223076
36 650 1067 372 241666
37 550 1067 372 204487
38 86 1067 372 31974
39 750 1067 372 2.78845
40 400 914 307 122747
41 130 914 307 39893
42 350 914 307 IŨ74O4
43 190 6ŨỮ 1S2 34597
44 290 SDữ 145 42121
45 270 50Q 145 39216
46 200 500 145 29049
47 210 500 145 30501
48 52 500 145 7553
49 Sũử 145 S08Ỉ6
50 4Ũ0 5ŨỮ 145 58098
51 340 Sũữ 145 49383
52 350 500 145 50836
Chỉ phi ($): 7048592
Chi phí xây lắp mỗi đơn vị chiều dài ống tương ứng với kích thước ống được tính toán theo công thức :Í6Ĩ
= E™; =
0,06537O‘j=l M
với: - fcost(D) : chi phí xây lắp mỗi đơn vị chiều dài ống ($/m), - Dj : đường kính của ổng thứ j (mm).
- K : hằng số phụ thuộc vào điều kiện địa phương (K= 0,06537).
- n : hằng số phụ thuộc vào điều kiện địa phương (1 < n = 1,24 < 2).
35
- Lưu lượng tiêu thụ tại các nút là số liệu kết quả đo đếm của các đồng hồ tổng và các đồng hồ DMA được lắp đặt tại các nút. số liệu lưu lượng tính toán dùng cho
nghiên cứu này được ghi nhận vào ngày 20/12/2014.
Hình 4: Tủ tin hiệu đồng hồ DMA 5L01B tại Trần Hưng Đạo - Lương Nhữ Học
Hình 5: Bộ cảm biến của đồng hồ đo lưu lượng dạng điện từ mặt bích
36
3.3. Trình tự tính toán với WaterGEMS
Thiết lập và cân chỉnh mô hình thủy lực phù hợp với áp lực mạng hiện hữu
Ghi chú : “ > “ : lớn hơn
Giá trị áp lực tfajp như và lưu the cao nhất của mạng hiện hữu
Nhập bảng đường kính lựa chọn và chi phí XL mỗi đơn vị chiều dài ống
tương ứng (bảng 6)
Công cụ phân tích Darwin Designer (tối thiểu chi phí)
Chọn thông số của thuật toán di truyền cho phân tích tối ưu (bảng 7)
ị
Chạy mô phỏng
I
So sánh tổng chi phí XL của giải pháp với tổng chi phí XL
của mạng lưới hiện hữu