Nguồn dữ liệu - Góp phần nghiên cứu cơ chế phản ứn- 123docz.net

Protein Data Bank (PDB) là kho lưu trữ dữ liệu cấu trúc 3-D của các phân tử

sinh học lớn như là protein và axit nucleic. Các file dữ liệu cấu trúc được đưa lên bởi các nhà sinh học và hóa sinh từ khắp thế giới, có thể truy cập và tải về miễn phí qua các trang web thành viên PDBe, PDBj, RCSB. Dữ liệu đưa lên Protein Data Bank được kiểm tra lại bằng phần mềm PDB Validation Suite.

Các phương pháp thườngđược sử dụngđể xác định cấu trúc trên PDB là xác

định cấu trúc tinh thể dùng tia X, phương pháp phổ cộng hưởng từ NMR, và phương pháp hiển vi điện tử nhiệt độ thấp. Các cấu trúc sử dụng trong luận văn đều

thu được bằng phương pháp nhiễu xạ tia X. Mỗi cấu trúc đều ghi chú rõ ràng độ

phân giải của dữ liệu.

Độ phân giải là thướcđo chất lượng của dữ liệu được tập hợp. Nếu tất cả các protein ở nhữngđiểm tương đương trong các tinh thể định hướng giống nhau thì ta sẽ thu được tinh thể hoàn hảo, khi đó tất cả các protein sẽ phân tán tia X cùng một

kiểu như nhau và nhiễu xạ đồ thu được sẽ thể hiện được thông tin chi tiết về tinh thể, vị trí của các nguyên tử có thể xác định được rõ ràng. Nhưng nếu không có

được tinh thể hoàn hảo, do tính mềm dẻo của từng phần trong protein và do các phân tử protein lớn, khi kết tinh không định hướng như nhau thì nhiễu xạ đồ sẽ thể

hiện thông tin cấu trúc kém chi tiết hơn. Nói cách khác, độ phân giải là thước đo mức độ thể hiện chi tiết của nhiễu xạ đồ và do đó là thước đo mức độ chi tiết khi tính mật độ electron. Với độ phân giải cao thì có thể nhìn thấy ngay vị trí của mọi

nguyên tử từ bản đồ mật độ electron, còn với độ phân giải thấp thì chỉ thấy được

khung của chuỗi protein. Từ nhiễu xạđồ có thể lập được bản đồ mậtđộ electron và dự đoán được vị trí của các nguyên tử. Từ cấu trúc dự đoán tính ngược lại mật độ

electron để khớp với bản đồ mậtđộ electron từ nhiễu xạđồ. Quy trình này được lặp đi lặp lại cho đến khi có độ phù hợp mong muốn. Độ phân giải xác định giới hạn

Nếu độ phân giải lớn hơn 4.0 Ǻ thì không thể xác định được tọa độ riêng rẽ

của các nguyên tử.

Độ phân giải trong khoảng 3.0 – 4.0 Ǻ: cấu trúc bộ khung có thểđúng nhưng phần mạch nhánh có cấu dạng không đáng tin cậy.

Độ phân giải trong khoảng 2.5 – 3.0 Ǻ: bộ khung có thể xác định đúng, với

các nhánh dài và mảnh của một số aminoaxit như Lys, Glu, Gln, ... và các nhánh nhỏ của Ser, Val, Thr, ... có cấu dạng không đáng tin cậy.

Độ phân giải trong khoảng 2.0 – 2.5 Ǻ: số nhánh có cấu dạng sai ít hơn đáng

kể. Có thể xác địnhđược các phân tử nước và các phối tử nhỏ.

Độ phân giải trong khoảng 1.5 – 2.0 Ǻ: chỉ còn lỗi nhỏ về cấu dạng.

Độ phân giải trong khoảng 0.5 – 1.5 Ǻ: tọa độ của các nguyên tử được xác

định vớiđộ tin cậy cao.

Hình 2. 1 Ảnh hưởng của độ phân giải đến khả năng xác định chính xác cấu trúc từ nhiễu xạ đồ

Ở hình 2.1, các đường màu xanh và màu vàng bao quanh vùng có mật độ

electron lớn. Với độ phân giải 1.0 Å, bản đồ mật độ thể hiện ngay vị trí các nguyên

tử. Với độ phân giải 2.0 Å có thể xác định được các cấu trúc vòng, dự đoán được các đơn vị aminoaxit. Với độ phân giải 2.7 Å có thể dự đoán được cấu trúc vòng,

mạch nhánh khó xác định. Còn với độ phân giải 3.0 Å, mật độ có dạng hình ống, khó xác định cấu trúc chính xác.

Cấu trúc 2ACE xác định bằng phương pháp nhiễu xạ tia X vớiđộ phân giải 2.5 Ǻ, bản đồ mậtđộ electron và cấu trúc dựđoán được ghi lại trong file 2ACE.pdb thể hiện trong hình 2.2.

Hình 2. 2 Bản đồ mật độ electron và cấu trúc dự đoán của 2ACE

Từ hình trên ta thấy trên cơ chất acetylcholine có một số nguyên tử không xác định được chính xác vị trí từ nhiễu xạ đồ. Cấu trúc trên được dựđoán và tinh chỉnh cho khớp với bản đồ mậtđộ electron và không thể tránh khỏi sai số.

Dữ liệu cấu trúc của protein còn được lấy từ PDBsum, UniProt. UniProt cung cấp thông tin chi tiết về cấu trúc sơ cấp, thứ cấp và ghi chú về chức năng sinh học, hoạt tính xúc tác, các tâm hoạtđộng.

Đối chiếu với thứ tự các aminoaxit, cấu trúc 2ACE thiếu các aminoaxit từ

485 đến 489. Đoạn còn thiếu và một số sai sót ở các nhánh cũng được chỉnh sửa

dùng phần mềm Alcelrys MS Modeling 4.0, Acelrys Discovery Studio Visualizer

2.5 và GaussView 3.0 dựa vào cấu trúc thứ cấp và tham khảo cấu trúc 1CFJ.