Các định nghĩa

Một phần của tài liệu Ứng dụng hệ thống nhận dạng miễn dịch nhân tạo mờ trong chẩn đoán ung thư (FULL TEXT) (Trang 48 - 51)

Để áp dụng cho thuật toán Hệ thống miễn dịch nhân tạo (Artificial Immune Regconition System – AIRS), một số định nghĩa về các thuật ngữ và khái niệm chính được sử dụng xuyên suốt như sau:

Độ tương đồng (affinity): độ đo tính tương tự giữa hai kháng thể hoặc kháng nguyên, được tính bằng khoảng cách Euclidean giữa hai vectơ đặc trưng cho hai đối tượng, và có giá trị nằm trong khoảng [0, 1]. Do đó, giá trị của độ tương đồng càng nhỏ thì độ tương đồng càng lớn.

Ngưỡng tương đồng (affinity threshold – AT): giá trị độ tương đồng trung bình của tất cả các kháng thể trong tập huấn luyện hoặc trong tập con các kháng nguyên huấn luyện được chọn.

Ngưỡng tương đồng vô hướng (affinity threshold scalar – ATS): một giá trị nằm trong khoảng [0, 1], khi nhân với ngưỡng tương đồng sẽ cho giá trị ngưỡng thay thế tế bào nhớ trong thủ tục huấn luyện AIRS;

Kháng thể (antibody): một vectơ đặc trưng kết hợp với dữ liệu xuất hay lớp; sự kết hợp vectơ đặc trưng – dữ liệu xuất được xem như một kháng thể khi nó thuộc một ARB hay tế bào nhớ.

Kháng nguyên (antigen): có cấu trúc giống kháng thể, nhưng sự kết hợp vectơ đặc trưng – dữ liệu xuất được xem như một kháng nguyên khi nó biểu diễn những ARB kích hoạt và / hoặc phản ứng.

Hệ thống nhận dạng miễn dịch nhân tạo (Artificial Immune Recognition System – AIRS): thuật toán phân lớp khởi nguồn từ hệ thống miễn dịch tự nhiên.

Quả cầu nhận dạng nhân tạo (Artificial Recognition Ball – ARB): hay còn được xem là tế bào B. Nó bao gồm 1 kháng nguyên, một số lượng tài nguyên được giữ bởi tế bào, và giá trị kích hoạt hiện tại của tế bào.

Tế bào B (B cell): nhìn chung là một ARB

Tế bào nhớ ứng viên (candidate memory cell): kháng thể của một ARB, có cùng lớp với kháng nguyên huấn luyện, được kích hoạt sau khi tiếp xúc kháng nguyên xâm nhập.

Lớp (class): phân loại của vectơ đặc trưng đã cho, và cũng chính là dữ liệu xuất của tế bào.

Tỷ lệ dòng (clonal rate): số nguyên được dùng để xác định số lượng dòng đột biến mà một ARB được phép sản xuất. Một ARB được chọn có thể sản xuất (Tỷ lệ dòng * Giá trị kích hoạt) dòng đột biến sau khi phản ứng kháng nguyên. Tích này sử dụng trong việc phân phối tài nguyên cho một ARB. Do đó, tỷ lệ dòng cung cấp một vai trò kép trong nhân tố định vị tài nguyên và nhân tố độ đột biến dòng cho quần thể tế bào.

Tế bào nhớ thiết lập (established memory cell): kháng thể của một ARB vượt qua được sự cạnh tranh tài nguyên và một kháng nguyên huấn luyện bị kích thích, và được thêm vào tập tiến hóa của tế bào nhớ.

Vectơ đặc trưng (feature vector): một trường hợp của dữ liệu biểu diễn một dãy các giá trị. Mỗi vị trí trong dãy số là một đặc trưng khác nhau và có khoảng giá trị phù hợp.

Tỷ lệ tăng đột biến (hyper – mutation rate): số nguyên xác định số lượng dòng đột biến mà tế bào nhớ đã cho được phép tiêm vào quần thể tế bào. Tế bào nhớ được chọn tiêm ít nhất (Tỷ lệ tăng đột biến * Tỷ lệ dòng * Giá trị kích hoạt) dòng đột biến vào quần thể tế bào tại thời điểm giới thiệu kháng nguyên.

K láng giềng gần nhất (K nearest neighbor – KNN): k điểm dữ liệu gần nhất chính là k tế bào nhớ kích hoạt nhất với kháng nguyên kiểm nghiệm.

Giá trị k (k value): tham số xác định có bao nhiêu tế bào nhớ được dùng để xác định phân lớp của tập kiểm nghiệm.

Tế bào nhớ (memory cell – mc): kháng thể của một ARB bị kích thích bởi kháng nguyên huấn luyện vào giai đoạn cuối trong quá trình tiếp xúc với kháng nguyên đó. Nó được dùng khi xuất hiện tăng đột biến trong phản ứng với kháng nguyên huấn luyện xâm nhập. Tuy nhiên, một tế bào nhớ có thể bị thay thế. Điều này chỉ xuất hiện khi một tế bào nhớ ứng viên bị kích thích bởi một kháng nguyên huấn luyện nhiều hơn một tế bào thiết lập và độ tương đồng giữa tế bào nhớ thiết lập và tế bào nhớ ứng viên ít hơn tích của Ngưỡng tương đồng và Ngưỡng tương đồng vô hướng.

Tỷ lệ đột biến (mutation rate): tham số giữa khoảng [0, 1] xác định xác suất mà bất cứ đặc trưng đã cho nào (hay dữ liệu xuất) của một ARB sẽ đột biến. Dữ liệu xuất (output): loại phân lớp của một tế bào. Cũng giống như lớp của vectơ đặc trưng tương ứng tế bào.

Tài nguyên (resources): tham số giới hạn số lượng ARB cho phép trong hệ thống. Mỗi ARB được phân phối một số lượng tài nguyên dựa trên giá trị

kích hoạt và tỷ lệ dòng. Tổng số lượng tài nguyên trên toàn hệ thống được đặt ở giới hạn nhất định. Nếu nhiều tài nguyên bị tiêu hủy hơn là thừa nhận, thì các tài nguyên bị loại bỏ từ ARB kích hoạt ít nhất cho đến khi số lượng tài nguyên trong hệ thống bằng số lượng được thừa nhận. Nếu tất cả tài nguyên của ARB đã cho bị loại bỏ thì ARB đó sẽ bị loại khỏi tập tế bào. Tế bào giống (seed cell): một kháng thể từ tập huấn luyện, được dùng để khởi tạo tế bào nhớ và tập ARB tại thời điểm bắt đầu huấn luyện.

Hàm kích hoạt (stimulation function): hàm dùng để đo độ phản ứng của một ARB đối với một kháng nguyên hoặc một ARB khác. Trong công thức phân lớp của thuật toán AIRS, hàm này trả về giá trị trong khoảng [0, 1]. Ở đây, hàm kích hoạt tỷ lệ nghịch với khoảng cách Euclidean giữa vectơ đặc trưng của ARB và kháng nguyên.

Giá trị kích hoạt (stimulation value): giá trị trả về của hàm kích hoạt.

Ngưỡng kích hoạt (stimulation threshold): tham số thuộc khoảng [0, 1] được xem như tiêu chuẩn ngừng huấn luyện một kháng nguyên cụ thể. Chỉ khi giá trị kích hoạt trung bình của các ARB trong từng lớp cao hơn, ngưỡng kích hoạt thực hiện huấn luyện phản tác dụng với sự dừng kháng nguyên.

Tập kiểm nghiệm (test set): tổng hợp các kháng nguyên được dùng để đánh giá khả năng thực hiện phân lớp của bộ phân lớp AIRS đã huấn luyện.

Tập huấn luyện (training set): tổng hợp các kháng nguyên được dùng cho bộ phân lớp AIRS.

Một phần của tài liệu Ứng dụng hệ thống nhận dạng miễn dịch nhân tạo mờ trong chẩn đoán ung thư (FULL TEXT) (Trang 48 - 51)