Cây quyết định trong trích chọn đặc tính gen cho phân loại ung thư sử dụng dữ liệu biểu hiện gen DNA Microarray

6 687 2
Cây quyết định trong trích chọn đặc tính gen cho phân loại ung thư sử dụng dữ liệu biểu hiện gen DNA Microarray

Đang tải... (xem toàn văn)

Thông tin tài liệu

Microarray hiện là một trong những công cụ hữu hiệu trong chẩn đoán bệnh do dữ liệu từ các thí nghiệm này chứa các thành phần gen đặc trưng cho một bệnh cụ thể. Tuy nhiên, đặc điểm của loại dữ liệu này là chứa hàng nghìn gen khác nhau trong khi số lượng mẫu lại rất ít nên cần thiết phải có phương pháp lựa chọn các gen phù hợp cho quá trình phân tích và chẩn đoán. Có rất nhiều phương pháp lựa chọn gen đã được nghiên cứu và phát triển. Bài báo này sẽ giới thiệu phương pháp cây quyết định để lựa chọn các gen chứa thông tin đặc trưng. Các giá trị đặc trưng này được tiếp tục xử lý bằng một mô hình phi tuyến để đưa ra được kết quả về phân loại dữ liệu biểu hiện gen để có kết luận về phân loại bệnh ung thư.

Hội nghị toàn quốc lần thứ Điều khiển Tự động hoá - VCCA-2015 DOI: 10.15625/vap.2015.0009 Cây định trích chọn đặc tính gen cho phân loại ung thư sử dụng liệu biểu gen DNA Microarray Decision Tree Based Feature Selection for Tumor Classification using DNA Microarray Gene Expression Data Phạm Trung Dũng Khoa Kỹ thuật Điều khiển Học viện Kỹ thuật Quân e-mail : Đặng Thúy Hằng Khoa Kỹ thuật Điều khiển Học viện Kỹ thuật Quân e-mail : Trần Hoài Linh Viện Điện Trường ĐHBK Hà Nội e-mail: thchdung@yahoo.com hangdtys@gmail.com linh.tranhoai@hust.edu.vn Tóm tắt Giới thiệu Microarray công cụ hữu hiệu chẩn đoán bệnh liệu từ thí nghiệm chứa thành phần gen đặc trưng cho bệnh cụ thể Tuy nhiên, đặc điểm loại liệu chứa hàng nghìn gen khác số lượng mẫu lại nên cần thiết phải có phương pháp lựa chọn gen phù hợp cho trình phân tích chẩn đoán Có nhiều phương pháp lựa chọn gen nghiên cứu phát triển Bài báo giới thiệu phương pháp định để lựa chọn gen chứa thông tin đặc trưng Các giá trị đặc trưng tiếp tục xử lý mô hình phi tuyến để đưa kết phân loại liệu biểu gen để có kết luận phân loại bệnh ung thư Từ khóa: Microarray, ung thư, định, mạng MLP Abstract: Microarray experiments are becoming a powerful tool for clinical diagnosis, as they have the potential to discover gene expression pattern obtaining characteristics of a certain disease However, the microarray data have thousands of genes within a few samples, it is crucial to develop techniques to effectively gene selection for analysis In this paper, Decision Tree Algorithmhas been proposed to detect information gene for Multi Layer Perceptron for efficient tumor classification Keywords: Microarray, cancer, Decision tree, Multi Layer Perceptron Chữ viết tắt BL cDNA DNA EST EWS MPSS MLP NB RMS RT-PCR SRBCT SAGE Burkitt Lymphoma complement Deoxyribo Nucleic Acid Deoxyribo Nucleic Acid Expressed Sequence Tag Ewing family of tumors Massively Parallel Signature Sequencing Multi Layer Perceptron Neuroblastoma Rhabdomyosarcoma Real-time principal component analysis Small Round Blue Cell Tumor Serial Analysis of Gene Expression VCCA-2015 Ung thư bệnh nguy hiểm với tỷ lệ tử vong cao Kết điều trị phụ thuộc nhiều vào việc chẩn đoán bệnh Hiện nay, microarray công cụ hữu hiệu giúp cho việc chẩn đoán điều trị bệnh ung thư hiệu Tuy nhiên, nhược điểm phương pháp lượng liệu đầu vào lớn nhiều chiều khiến cho việc xử lý phân tích phức tạp Để giải vấn đề này, nhiều phương pháp giảm chiều liệu lựa chọn gen đặc trưng đề xuất sử dụng Cùng chung mục đích đó, báo đề cập đến thuật toán định (Decision Tree - DT) để tìm mẫu gen đặc trưng cho nhóm bệnh ung thư Các mẫu gen lựa chọn sau đưa vào mạng nơ-rôn (cụ thể báo mạng nơ- rôn nhiều lớp MLP) để phân loại kiểm chứng cho chất lượng giải pháp đề xuất kết tính toán kiểm nghiệm chứng minh giải pháp đề xuất báo có triển vọng việc phân loại mẫu bệnh ung thư từ liệu thu nhận thí nghiệm Micrroarray Cơ sở sinh học microarray Cơ thể người có nhiều loại gen khác Các gen khác “bật” “tắt” tồn loại tế bào khác Một cách để phát xem gen có hoạt động hay không việc tìm thành phần mang thông tin mRNA, hay ta gọi gen có “biểu hiện” Nếu đo số lượng mRNA tất gen có mặt tế bào hay mẫu mô sinh học ta tạo bảng loại gen “bật” hay gen biểu tế bào Nếu so sánh liệu gen biểu hai loại tế bào khác ta biết nguyên nhân tạo khác biệt tế bào [1] Bảng minh họa số gen biểu tế bào tế bào Insulin Qua bảng nhận thấy 51 Hội nghị toàn quốc lần thứ Điều khiển Tự động hoá - VCCA-2015 gen Myosin biểu tế bào không biểu tế bào Insulin Ngược lại, gen Insulin lại biểu tế bào Insulin lại không biểu tế bào Dựa vào điểm đặc trưng đó, ta phân biệt hai loại tế bào với Bảng 1: So sánh biểu gen tế bào tế bào insulin [2] Tế bào ON Tế bào Insulin ON MYOSIN ON OFF INSULIN OFF ON MELANIN OFF OFF CYCLIN ON ON VIBIQUITIN ON ON HISTONE 2B ON ON Tên Gen ACTIN Ngày nay, có nhiều phương pháp ứng dụng chương trình máy tính sử dụng để đo mức biểu gen Một số phương pháp phổ biếnđược sử dụng kể đến Northern blots, RT-PCR, Macroarray, Microarrays, phân tích chuỗi gen SAGE, so sánh EST MPSS [3] Với đặc tính vượt trội gắn hàng nghìn phân tử DNA khác lên mảng nên đo biểu hàng nghìn gen cách đồng thời chi phí phù hợp nên Microarray tỏ công cụ phân tích hiệu thiếu sinh học DOI: 10.15625/vap.2015.0009 DNA mẫu sinh học cần kiểm tra lai với DNA vi mảng microarray thông qua ghép cặp theo nguyên lý Watson-Crick nhận biết thông qua việc đánh dấu Điểm mạnh microarray gắn hàng nghìn phân tử DNA khác lên mảng ta đo biểu hàng nghìn gen cách đồng thời Điều cho phép phân tích thông tin gen nhanh xác [4] Từ tiến tới nghiên cứu để xác định gen có biểu khác nhau, phân loại tế bào, xác định loại bệnh đưa tương tác điều hòa gen [5] Quá trình thí nghiệm minh họa H.2 Với mẫu RNA cần kiểm tra, chuỗi phản ứng hóa sinh thực để tạo đầu dò cRNA cDNA bổ sung đánh dấu huỳnh quang Đầu dò lai với microarray quét chùm tia Laser Các mức biểu đo thông qua việc đánh giá cường độ huỳnh quang phát từ lỗ microarray H Thí nghiệm Microarray Dữ liệu hình ảnh thu gọi liệu thô Để đạt thông tin mức độ mô tả gene liệu hình ảnh cần phải phân tích bao gồm: xác định spot mảng sau đo so sánh cường độ spot với giá mang Đây trình lượng hóa hình ảnh Sau trình lượng hóa hình ảnh ta thu liệu mô tả gen H Các lỗ chip microarray Microarray gồm bề mặt rắn, thường miếng kính hiển vi, phân tử DNA Oligonucleotide gắn cố định Mục đích microarray phát biểu số lượng DNA đánh dấu mẫu sinh học Các VCCA-2015 Thuật toán định lựa chọn đặc tính Thuật toán định (Decision Tree) mô hình phân lớp nhận dạng phân loại liệu [6,7] Một mô hình đơn giản nhị phân, sử dụng điều kiện đơn đơn giản “if xiop A” nút Trong đó, op phép toán so sánh =, >, =,

Ngày đăng: 11/07/2016, 10:34

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan