ÁP DỤNG CÁC THUẬT TOÁN CHO BÀI TOÁN PHÁT HIỆN

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc (Trang 45 - 47)

CHƯƠNG 1 : GIỚI THIỆU

3.1. ÁP DỤNG CÁC THUẬT TOÁN CHO BÀI TOÁN PHÁT HIỆN

HIỆU

3.1.1. Áp dụng thuật toán Apriori cho bài toán phát hiện tín hiệu ADR

Để giải quyết bài toán phát hiện tích hiệu ADR từ tập dữ liệu báo cáo về phản ứng thuốc bằng phương pháp khai phá luật kết hợp Apriori. Chúng ta quy về bài toán tìm luật kết hợp giữa thuốc và phản ứng ADR, cụ thể như sau:

- Cơ sở dữ liệu giao dịch (Transaction Database): là một tập các giao dịch D = {t1, t2, .. tn}, trong đó mỗi giao dịch ti tương ứng với 1 báo cáo ADR.

- Tập đối tượng trong mỗi giao dịch (itemset): là một tập đối tượng chỉ gồm các cặp (thuốc R, phản ứng T), (thuốc R kết hợp với thông tin tuổi của bệnh nhân, phản ứng T), (thuốc R kết hợp với thông tin giới tính của bệnh nhân, phản ứng T) và cặp (thuốc R kết hợp với thông tin tuổi và giới tính của bệnh nhân, phản ứng T).

Do tính chất đặc thù của bộ dữ liệu thu thập là mỗi một giao dịch chỉ gồm một cặp (Thuốc R, Phản ứng T) nên khi áp dụng thuật toán Apriori cho bài toán này sẽ đơn giản hơn rất nhiều, bài toán trở thành tìm các tập mục thường xuyên gồm 2 thành phần thuốc R kết hợp với các thông tin tuổi, giới tính và phản ứng ADR T, cụ thể với 2 tham số min-support và confidence được nhập vào bởi người sử dùng, hãy tìm kiếm trong CSDL cặp (thuốc R, phản ứng T) thỏa mãn điều kiện số lần xuất hiện cặp (thuốc R, phản ứng T) lớn hơn tham số min-support và có số lượng cặp (thuốc R, phản ứng T)/số lượng báo cáo ADR có thuốc R lớn hơn confidence. Các tập thuộc tính thường xuyên (thuốc R, phản ứng T) thỏa mãn điều kiện trên sẽ là các thuốc R có thể xảy ra phản ứng T.

3.1.2. Áp dụng phương pháp FDA cho bài toán phát hiện tín hiệu ADR

Sử dụng phương pháp FDA trong việc phát hiện tín hiệu ADR là phương pháp sử dụng chỉ số RR để đánh giá qua đó xác định thuốc khả năng thuốc có các phản ứng có hại. Chỉ số RR chỉ ra thuốc R có phản ứng có hại T thường xuyên hơn so với các thuốc khác. Mối quan hệ giữa thuốc R và phản ứng có hại thuốc thuốc T trong cơ sở dữ liệu của các báo cáo ADR như sau:

- Giá trị a là số trường hợp thuốc R có phản ứng T.

- Giá trị b là số trường hợp thuốc R không có phản ứng T.

- Giá trị c là số trường hợp thuốc khác R có phản ứng T.

- Giá trị d là số trường hợp thuốc khác R không có phải ứng T. Dựa vào Giải thuật tính chỉ số RR và khoảng tin cậy thu được kết quả và căn cứ vào giá trị của chỉ số RR và khoảng tin cậy ta có kết luận:

- Nếu giá trị RR = 1 thì không có mối liên hệ trong thống kê giữa thuốc R và phản ứng có hại T

- Nếu giá trị RR < 1 thì thuốc R có mối quan hệ làm giảm phản ứng phản ứng ADR T, có nghĩa là thuốc R không có phản ứng ADR T.

- Nếu giá trị RR > 1 và khoảng tin cậy chứa 1 thì thuốc R và phản ứng ADR T có mối tương quan nhưng không có ý nghĩa thống kê.

- Nếu giá trị RR > 1 và khoảng tin cậy không chứa 1 thì thuốc R có quan hệ làm tăng phản ứng ADR T, có nghĩa là thuốc R có khả năng xảy ra phản ứng ADR T.

3.1.3. Áp dụng phương pháp WHO_UCM cho bài toán phát hiện tín hiệu ADR

Phương pháp WHO-UCM sử dụng chỉ số OR để xác định mối quan hệ giữa thuốc và phản ứng ADR. Mối quan hệ giữa thuốc R và phản ứng có hại thuốc thuốc T trong cơ sở dữ liệu của các báo cáo ADR như sau:

- Giá trị a là số trường hợp thuốc R có phản ứng có hại T.

- Giá trị b là số trường hợp thuốc R không có phản ứng có hại T.

- Giá trị c là số trường hợp thuốc khác R có phản ứng có hại T.

- Giá trị d là số trường hợp thuốc khác R không có phải ứng có hại T.

Dựa vào Giải thuật tính chỉ số OR và khoảng tin cậy thu được kết quả và căn cứ vào giá trị của chỉ số OR và khoảng tin cậy ta có kết luận:

- Nếu giá trị OR = 1 thì không có mối liên hệ trong thống kê giữa thuốc R và phản ứng có hại T

- Nếu giá trị OR < 1 thì thuốc R có mối quan hệ làm giảm phản ứng phản ứng ADR T, có nghĩa là thuốc R không có phản ứng ADR T.

- Nếu giá trị OR > 1 và khoảng tin cậy chứa 1 thì thuốc R và phản ứng ADR T có mối tương quan không có ý nghĩa thống kê.

- Nếu giá trị OR > 1 và khoảng tin cậy không chứa 1 thì thuốc R có quan hệ làm tăng phản ứng ADR T, có nghĩa là thuốc R có khả năng xảy ra phản ứng ADR T.

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu một số phương pháp khai phá dữ liệu phát hiện phản ứng có hại của thuốc (Trang 45 - 47)