Acid deoxyribonucleic (ADN), được phát hiện vào năm 1869 bởi Friedrich Miescher, là một phân tử acid nucleic có vai trò là vật chất mang thông tin di truyền. Năm 1953, hai nhà khoa học James Waston (nhà Sinh vật học người Mỹ) và Francis Crick (nhà Vật lý người Anh) công bố phác thảo về mô hình cấu trúc xoắn kép của phân tử ADN trên tạp chí Nature. Nhờ phát minh vĩ đại đó, Waston và Crick cùng chia sẻ với Wilkins giải thưởng Nobel năm 1962.
Phân tử ADN được tạo thành bởi hai mạch đơn polynucleotide liên kết với nhau qua liên kết hydro giữa các nucleotide đối diện trên hai mạch [1]. Mỗi nucleotide gồm ba thành phần cơ bản:
+ Base (bazơ nitơ): là các dẫn xuất hoặc của purine, gồm adenine (A) và guanine (G); hoặc của pyrimidine, gồm thymine (T) và cytosine (C).
+ Đường pentose là deoxyribose. Vị trí các nguyên tử cacbon trên mạch vòng của đường pentose được đánh số từ C-1’ đến C-5’.
Hình 2.1. Cấu trúc của nucleotide
Hình 2.2. Cấu trúc của deoxyribose Hình 2.3. Cấu trúc các base trong ADN Có bốn loại nucleotide trong thành phần cấu tạo ADN. Chúng khác nhau về loại base (A, G, T, C), còn giống nhau về cấu trúc đường pentose và nhóm phosphate. Trong thực tế, tên của các base cũng được dùng để gọi loại nucleotide tương ứng.
Các nucleotide nằm liền kề trên chuỗi polynucleotide nối với nhau thành mạch dài qua liên kết phosphodieste giữa nhóm hydroxyl ởđầu C-5’ của đường pentose của nucleotide này với nhóm phosphate tại đầu C-3’ của nucleotide nằm ở vị trí kế tiếp. Mỗi mạch polynucleotide của phân tử acid nucleic mang tính phân cực: một đầu C-5’ mang nhóm phosphate (hoặc đôi khi là hydroxyl), còn đầu kia (C-3’) luôn mang nhóm hydroxyl.
Hình 2.4. Liên kết giữa các nucleotide trong chuỗi polynucleotide của ADN
Liên kết hydro trong ADN hình thành giữa hai mạch polynucleotide theo
nguyên tắc bổ sung, hay nguyên tắc Chargaff (do Erwin Chargaff phát hiện đầu tiên năm 1950), đó là A liên kết với T bằng hai liên kết hydro (A T= ), G liên kết với C bằng ba liên kết hydro (G C≡ ).
Để có cấu trúc hai mạch polynucleotide liên kết bổ sung với nhau suốt dọc chiều dài phân tử ADN, các nucleotide của một mạch phải quay 1800 so với các nucleotide của mạch đối diện khi quá trình tổng hợp ADN diễn ra. Đặc điểm quay như vậy là cần thiết để các liên kết hydro có thể hình thành. Vì lý do này mà cấu trúc ADN sợi kép luôn gồm một mạch chạy theo chiều 5' → 3', còn mạch kia chạy theo chiều ngược lại là 3' → 5', gọi là cấu trúc song song ngược chiều (hay đối song song).
Hình 2.5. Cấu trúc đối song của ADN liên kết theo nguyên tắc bổ sung
Trong mô hình của Watson và Crick (cũng là mô hình cấu trúc ADN phổ biến ở phần lớn các loài sinh vật), hai mạch đơn của phân tử ADN sợi kép xoắn xung quanh nhau, quay về phía phải. Cấu trúc xoắn đều đặn như vậy tạo ra hai khe trong mỗi vòng xoắn gọi là khe chính và khe phụ (khe chính rộng hơn khe phụ).
Tùy thuộc vào một số yếu tố môi trường xung quanh nhưđộ pH, độ ẩm, tính ưa nước, lực ion hóa,… mà phân tử ADN sợi kép có thể xuất hiện ở một số dạng cấu hình không gian khác nhau, như cấu hình dạng A, B, Z… Trong đó, dạng cấu hình phổ biến nhất là dạng B (viết tắt là B-ADN), đây chính là mô hình được Watson và Crick mô tả. Trong mô hình ADN dạng B, mỗi vòng xoắn gồm 10 base có chiều dài xấp xỉ 3,4 nm (khoảng cách giữa hai base kế tiếp là xấp xỉ 0,34 nm).
Hình 2.6. Cấu trúc không gian của ADN dạng B theo Watson và Crick