Bài tốn Protein Folding

Một phần của tài liệu NGHIÊN cứu THUẬT TOÁN PHÂN LỚPNHỊ PHÂN và ỨNG DỤNG CHOBÀI TOÁN PROTEIN FOLDING” (Trang 87 - 89)

Ngày nay, các nhà sinh vật học đã xác định được rằng cơ sở vật chất chủ yếu của sự sống gồm hai loại hợp chất hữu cơ là protein và axit nucleic. Protein là hợp phần cấu tạo chủ yếu của chất nguyên sinh và là thành phần chức năng trong cấu tạo của các enzim và hoocmon, đĩng vai trị xúc tác và điều hịa. Protein thuộc loại đại phân tử, cĩ kích thước và khối lượng lớn. Phân tử protein lớn nhất dài 0,1 micromet, khối lượng phân tử cĩ thể tới 150 triệu đơn vị cacbon. Protein là chất cao phân tử được cấu tạo theo nguyên tắc đa phân, mà đơn phân là axit amin. Mỗi phân tử protein gồm trung bình 100 – 30000 phân tử axit amin liên kết với nhau. Các axit min liên kết với nhau bằng liên kết peptit, tạo nên chuỗi polypeptit. Cĩ hơn hai mươi loại axit amin khác nhau, được đặt tên là A, C, G, T,… đã tạo ra vơ số loại protein khác nhau ở số lượng, thành phần, trật tự sắp xếp các axit amin. Protein cĩ bốn bậc cấu trúc cơ bản.

• Cấu trúc bậc một là thứ tự sắp xếp các axit amin trong chuỗi polypeptit.

CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING

• Cấu trúc bậc hai do chuỗi polypeptit bậc một xoắn hình lị xo hay hình xoắn ốc, giữa các vịng xoắn cĩ các liên kết hydro làm cho cấu trúc protein được bền vững.

• Cấu trúc bậc ba chuỗi polypeptit xoắn hình lị xo uốn vịng trong khơng gian, nhờ cấu trúc bậc ba mà protein thường cĩ dạng hình cầu, giữa các vịng uốn cũng cĩ các liên kết hydro làm cho cấu trúc protein được bền vững hơn.

• Cấu trúc bậc bốn gồm nhiều cấu trúc bậc ba kết hợp lại.

Hình 4-10: Các bậc cấu trúc khác nhau của phân tử protein a) Cấu trúc bậc một c) Cấu trúc bậc ba b) Cấu trúc bậc hai d) Cấu trúc bậc bốn

CÀI ĐẶT THUẬT TỐN VÀ ÁP DỤNG CHO BÀI TỐN PROTEIN FOLDING

Cấu trúc của protein được sử dụng trong dự đốn và phân lớp cho protein, nên cịn được gọi là phân lớp cấu trúc protein. Phân lớp protein sẽ hỗ trợ cho việc xác định chức năng của protein dễ dàng và nhanh chĩng hơn. Protein folding là bài tốn phân lớp cấu trúc khơng gian ba chiều của protein. Một protein được xếp vào một trong bốn lớp cấu trúc, phụ thuộc vào thành phần cấu trúc phụ đĩ là : hồn tồn xoắn ốc (gọi là all-α), hồn tồn hình sợi (gọi là all-β), α /β, α +β. Trong những năm gần đây cĩ rất nhiều sự nghiên cứu về bài tốn phân lớp cấu trúc protein, nhưng đến nay nĩ vẫn là một bài tốn mở. Ngày nay bài tốn này được tiếp cận bởi nhiều hướng khác nhau và nĩ được chia thành các nhiệm vụ nhỏ hơn như dự đốn cấu trúc bậc hai, xác định lớp cấu trúc, dự đốn bề mặt tiếp xúc…

Trong đề tài này, phân lớp cấu trúc protein dựa vào sự tổng hợp các axit amin (Amino Acid Composition - ACC), ACC là một vector 20 chiều tương ứng với 20 loại axit amin khác nhau, vector này chỉ rõ tỷ lệ của mỗi loại axit amin trong sự tổng hợp của 20 loại axit amin khác nhau. Sử dụng hệ thống phân lớp đã được cài đặt theo thuật tốn điều chỉnh sự quá khớp và quá khái quát dữ liệu để phân lớp và dự đốn cho một số protein trong một số tập dữ liệu về protein. Qua đĩ đánh giá được thuật tốn đồng thời cĩ thể áp dụng cho việc phân lớp cấu trúc protein trong thực tế.

Một phần của tài liệu NGHIÊN cứu THUẬT TOÁN PHÂN LỚPNHỊ PHÂN và ỨNG DỤNG CHOBÀI TOÁN PROTEIN FOLDING” (Trang 87 - 89)