Chương 1 CÁC CƠ SỞ NGHIÊN CỨU CỦA LUẬN ÁN
1.3. Kỹ thuật đánh giá kết quả thực nghiệm và tính tốn
Kỹ thuật CNLS (Complex Nonlinear Least Squares Fitting) được Macdonald và Garber đưa ra vào năm 1977. Người ta sử dụng Kỹ thuật CNLS để mơ hình hóa dữ liệu sau khi thu được tập hợp các giá trị thực nghiệm. Kỹ thuật được thực hiện như sau: Dữ liệu thực nghiệm bao gồm phần thực và phần ảo (hoặc biên độ trở kháng và góc pha) được sử dụng để “fit” (khớp) một tập dữ liệu gồm M “quan sát” (số điểm dữ liệu) với một mơ hình phi tuyến có N tham số chưa được xác định (M > N). Mục đích là tìm các
tham số sao cho tổng S, được xác định bởi phương trình dưới đây, là tối thiểu [65, 66]: 𝑆 =�{�𝑍𝑖′ − 𝑍𝑖,𝑐𝑎𝑙𝑐′ �2𝑤𝑖′ + �𝑍𝑖′′− 𝑍𝑖,𝑐𝑎𝑙𝑐′′ �2𝑤𝑖′′} 𝑀 𝑖=1 (1.11) Trong đó:
- 𝑍𝑖 ′và 𝑍𝑖 ′′là các giá trị phần thực và phần ảo tương ứng tại các tần số 𝑓𝑓i.
- 𝑍𝑖,𝑐𝑎𝑙𝑐 ′ và 𝑍𝑖,𝑐𝑎𝑙𝑐 ′′ là các giá trị phần thực và phần ảo, tương ứng, được tính tốn từ mơ hình.
- 𝑤𝑖 ′và 𝑤𝑖 ′′ là các hệ số trọng số phần thực và phần ảo tương ứng.
Trong bất kỳ phương pháp “Bình phương cực tiểu phi tuyến” nào thì một vấn đề cần phải đảm bảo đó là giá trị cực tiểu trong khơng gian tham số là giá trị cực tiểu tuyệt đối. Quá trình tối thiểu tổng S, phương trình (3.1), thường được thực hiện bằng thuật toán Levenberg-Marquardt [65].
1.3.2. Thuật toán Levenberg–Marquardt
Thuật toán Levenberg-Marquardt (viết tắt là LMA hay LM), cịn được gọi là phương pháp bình phương nhỏ nhất, được sử dụng để giải các bài tốn “bình phương tối thiểu phi tuyến”. Những vấn đề tối thiểu này được sinh ra khi thực hiện các cơng việc như “khớp đường cong bình phương nhỏ nhất” (least squares curve fitting).
Bài toán tổng quát cần giải quyết là tìm tập các tham số 𝛽𝛽 = (𝛽𝛽1, 𝛽𝛽2, 𝛽𝛽3… ) của mơ hình (đường cong) có phương trình 𝑓𝑓(𝑥,𝛽𝛽) sao cho tổng bình phương độ lệch 𝑆(𝛽𝛽)là tối thiểu [67, 68]:
𝑚𝑖𝑛(𝛽𝛽) = �[𝑦𝑖 − 𝑓𝑓(𝑥𝑖,𝛽𝛽)]2 𝑀
𝑣̇=1
(1.12)
Trong đó: M là số lượng điểm thực nghiệm, mỗi điểm thực nghiệm có giá trị là (xi, yi). So sánh giữa phương trình (1.11) và phương trình (1.12), ta
thấy phương trình (1.11) sử dụng hai phương trình 𝑓𝑓(𝑥𝑖,𝛽𝛽) tương ứng với phương trình phần thực và phương trình phần ảo, đồng thời có sự xuất hiện của “hệ số trọng số” sẽ được thảo luận vào phần tiếp theo; trong đó 𝑤𝑖′và 𝑤𝑖′′chỉ phụ thuộc vào điểm thực nghiệm mà không phụ thuộc vào tập tham số. Như vậy, thuật tốn hồn tồn có thể áp dụng được cho phương trình (1.11). Để giải bài tốn ở phương trình (1.12), thì một thủ tục lặp được thực hiện. Các giá trị của tham số trong tập tham số 𝛽𝛽 sẽ được thay đổi cho đến khi tìm được tối thiểu của tổng bình phương. Trước đó, các tham số trong tập tham số𝛽𝛽 sẽđược gán mác giá trị ban đầu (initial guess), ví dụ 𝛽𝛽𝑁 = (1, 1, … , 1) với N là số lượng các tham số.
Một điểm cần lưu ý là trong trường hợp chỉ có duy nhất một giá trị cực tiểu, thì tập giá trị ban đầu 𝛽𝛽𝑁 = (1, 1, …, 1) “hoạt động” tốt. Cịn trong trường hợp có nhiều điểm cực tiểu, thuật toán sẽ hội tụ tới điểm “cực tiểu toàn cục” hay giá trị “cực tiểu tuyệt đối” chỉ nêu các giá trị ban đầu của tham số gần với kết quả cuối cùng hay còn gọi là “đáp số” của bài toán.
Trong mỗi lần lặp, vector tham số 𝛽𝛽 (hay tập tham số 𝛽𝛽) sẽ được thay thế bởi một giá trị mới là 𝛽𝛽+𝛿. Để xác định 𝛿 thì hàm số 𝑓𝑓(𝑥𝑖,𝛽𝛽+ 𝛿) được triển khai theo công thức [68]:
𝑓𝑓(𝑥𝑖,𝛽𝛽+𝛿)≈ 𝑗(𝑥𝑖,𝛽𝛽) +𝐽𝑖𝛿 (1.13) Trong đó: 𝐽𝑖 là gradien của hàm 𝑓𝑓 đối với 𝛽𝛽, được xác định bởi công thức (1.14): 𝐽𝑖 = 𝜕𝑓𝑓(𝑥𝜕𝛽𝛽𝑖,𝛽𝛽) (1.14) Từ (1.12) và (1.13), ta có: 𝑆(𝛽𝛽+𝛿) = �[𝑦𝑖 − 𝑓𝑓(𝑥𝑖,𝛽𝛽+𝛿)]2 𝑀 𝑖=1 ~ �[𝑦𝑖 − 𝑓𝑓(𝑥𝑖,𝛽𝛽)− 𝐽𝑖𝛿]2 𝑀 𝑖=1 (1.15)
Lấy đạo hàm 𝑆(𝛽𝛽+𝛿) theo 𝛿 và cho bằng 0, kết quả thu được phương trình viết dưới dạng ma trận như sau:
(𝐽𝑇𝐽)𝛿 =𝐽𝑇[𝑦 − 𝑓𝑓(𝛽𝛽)] (1.16) Trong đó: - 𝐽 là ma trận Jacobi với hàng thứ i bằng: 𝐽𝑖. - 𝐽𝑇 là ma trận chuyển vị của ma trận 𝐽 - 𝑦 và 𝑓𝑓(𝛽𝛽) là các vector, có các phần tử thứ i tương ứng là 𝑦𝑖 và 𝑓𝑓(𝑥𝑖,𝛽𝛽).
Phương trình (1.16) là một hệ phương trình tuyến tính và từ đó có thể tính được giá trị 𝛿. Đóng góp của Levenberg là thay thế phương trình (1.16) bằng phương trình sau:
(𝐽𝑇𝐽+𝜆𝐼)𝛿 =𝐽𝑇[𝑦 − 𝑓𝑓(𝛽𝛽)] (1.17) Với 𝜆 là hệ số suy giảm (the damping factor, 𝜆 ≥ 0), được điều chỉnh ở mỗi lần lặp và 𝐼 là ma trận đơn vị.
Nhược điểm của phương trình (1.17) là khi hệ số 𝜆 có giá trị lớn, để khắc phục điều này Marquardt sửa đổi phương trình (3.7) bằng cách thay ma trận đơn vị bằng một ma trận đường chéo, kết quả thu được:
[𝐽𝑇𝐽+𝜆.𝑑𝑖𝑎𝑔(𝐽𝑇𝐽)]𝛿 =𝐽𝑇[𝑦 − 𝑓𝑓(𝛽𝛽)] (1.18) Ưu điểm của thuật toán LM là một thuật toán mạnh mẽ (robust algorithm) trong nhiều trường hợp có thể tìm được đáp án khi điểm ban đầu, 𝑆(𝛽𝛽0) (phương trình (1.12)), ở rất xa điểm cực tiểu. Tuy nhiên, kết quả tập tham số trả về còn phụ thuộc vào nhiều yếu tố như số lượng tham số hay giá trị ban đầu của tham số. Các giá trị ban đầu được khuyến nghị là các giá trị gần với thực nghiệm, như vậy thì khả năng 𝑚𝑖𝑛𝑆(𝛽𝛽) sẽ trả về điểm “cực tiểu toàn cục” hay “cực tiểu tuyệt đối” dễ dàng hơn.
1.3.3. Hệ số trọng số
Một yếu tố cũng rất quan trọng tác động tới kết quả của phương pháp CNLS đó là hệ số trọng số 𝑤𝑖′và 𝑤𝑖′′trong phương trình (1.11). Hệ số trọng số hay có một tên gọi khác là hệ số thống kê, thông thường được chia thành ba trường hợp: Trường hợp đơn giản nhất là 𝑤𝑖′= 𝑤𝑖′′ = 1, trường hợp này còn được gọi là unweighted hay unity-weighted. Điểm bất lợi khi chọn hệ số trọng số này là trong hầu hết các trường hợp, giá trị của 𝑍𝑖′ và 𝑍𝑖′′ thay đổi theo một vài bậc trở kháng (ví dụ 101, 102, 103 Ohm…) thì chỉ thành phần lớn hơn đóng góp chủ yếu vào trong tổng S phương trình (1.11), trong khi đó thành phần nhỏ hơn xem như là khơng đáng kể và có thể bỏ qua (chẳng hạn, 𝑍𝑖′= 10 và 𝑍𝑖′′= 1000 thì có thể bỏ qua 𝑍𝑖′).
Nói chung, q trình lặp lại thực nghiệm cho phép chúng ta xác định được độ lệch chuẩn của mỗi điểm 𝜎′ và 𝜎′′, từ đó trọng số thống kê thu được là 𝑤𝑖′ = (𝜎𝑖′)−2 và 𝑤𝑖′′ = (𝜎𝑖′′)−2. Mặc dù, đây là hướng tiếp cận tốt, tuy nhiên thủ tục này tốn thời gian và hiếm khi được sử dụng trọng thực tế. Một hệ số trọng số khác thay thế cho trường hợp thứ nhất là “hệ số tỷ lệ” hay là “hệ số cân bằng” được Macdonald đưa ra, mỗi trọng số tỷ lệ nghịch với trởkháng đo được hoặc trở kháng được tính tốn từ mơ hình [69].
𝑤𝑖 = 𝑧1
𝑖2 ℎ𝑜ặ𝑐 𝑤𝑖 = 𝑧 1
𝑖,𝑐𝑎𝑙𝑐2
Phương pháp trọng số như trên có nghĩa là các phần thực và ảo của trở kháng có thể được xác định một cách độc lập và độ chính xác của chúng là độc lập. Tuy nhiên trong thực tế, các thông số này thường được đánh giá bởi “độ nhạy” của cả hai thành phần, gồm phần thực và phần ảo. Do đó, khi mà cả phần thực và phần ảo có mối tương quan chặt chẽ với nhau thì hệ số trọng số mơ-đun (Modulus Weighting – MWT) nên được sử dụng [53,70,71].
𝑤𝑖 = (𝑧 1
𝑖′)2 + (𝑧𝑖′′)2 (1.19)
Trọng số mô-đun được sử dụng trong luận án để thực hiện khớp dữ liệu thực nghiệm vào mơ hình cải tiến được đề xuất.