5. Quá trình thực hiện microarray
5.1.3. Xác định sự biểu hiện của mẫu
Trong phân tích microarray, người ta tiến hành tìm kiếm các gen chuyên biệt và nghiên cứu sự biểu hiện của các mẫu liên quan tới trạng thái các bệnh lý hay có sự tương đồng với các mẫu có cùng sự biểu hiện. Hoặc là các mẫu được tìm kiếm với các gen có sự biểu hiện tương tự nhau. Chẳng hạn như một phép phân tích mà phụ thuộc vào một tiêu chuẩn để so sánh sự giống nhau trong sự biểu hiện, và mỗi thông số đều liên quan đến các đặc điểm khác nhau trong các dữ liệu thu thập được. Lúc này hai tiêu chuẩn thường được dùng để so sánh “euclidean distances” và “Pearson’s correlation coefficient distances”. “Euclidean distance” được ưu tiên sử dụng trong trường hợp khi nghiên cứu một cỡ mẫu rất lớn và sự biểu hiện gen rất quan trọng, trong khi Pearson’s correlation coefficient distances được sử dụng trong mô hình mẫu nghiên cứu với sự biểu hiện của gen hay mẫu là tương đối quan trọng. Nói chung, khi ứng dụng microarray trong việc phân loại các khối u thì sử dụng Pearson’s correlation coefficient distances sẽ thích hợp hơn.
Sau khi dữ liệu đã được ghi nhận, tiêu chuẩn hóa, chọn lọc và một phương tiện cho việc so sánh sự giống nhau được chọn, một loạt các phương pháp khác được tiến hành ứng dụng cho việc phân tích sau này. Các phương pháp cho việc phân tích sau này được nhóm thành hai nhóm chung: phương pháp “supervised” và “unsupervised”. Phương pháp “supervised” phụ thuộc vào các kiến thức trước đây về các mẫu bệnh nhằm tìm kiếm các gen có liên quan đến trạng thái bệnh lý, và chúng rất hữu dụng cho các nghiên cứu phân loại. Phương pháp “unsupervised” không phụ thuộc vào các kiến thức đã có trước đây, và chúng được ứng dụng cho việc xác định các phân nhóm (subgroup) của mẫu đặc trưng cho các bệnh chưa được nghiên cứu.