Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 412 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
412
Dung lượng
6,21 MB
Nội dung
VIỆN CÔNG NGHỆ SINH HỌC BÁO CÁO TỔNG KẾT ĐỀ TÀI XÂY DỰNG CƠ SỞ KHOA HỌC CHO DỰ ÁN KHẢ THI GIẢI TRÌNH TỰ VÀ PHÂN TÍCH BỘ GEN NGƯỜI VIỆT NAM CNĐT : NÔNG VĂN HẢI 9175 HÀ NỘI – 2011 ĐẶT VẤN ĐỀ Bộ gen hay gọi hệ gen (toàn tập hợp gen) người có cấu trúc tinh vi phức tạp, gồm thành phần: i) Bộ gen nhân: kích thước khoảng 3,2 tỷ đơn vị chiều dài, gọi nucleotide cặp bazơ (base pairs, bp; 1000 bp= kilobazơ, kb) ii) Bộ gen ty thể có kích thước 16 kb Mọi biểu sống, bao gồm yếu tố định sức khỏe người (khỏe mạnh hay ốm đau…) liên quan đến chức gen Vì vậy, việc nghiên cứu cấu trúc chức toàn gen thể vấn đề khoa học có định hướng ứng dụng quan trọng - Dự án Hệ gen người (Human Genome Project, HGP), thời gian thực hiện: ~15 năm (1989-2003), Nhóm quan khoa học nhà nước Mỹ đứng đầu với khoảng 20 nước vùng lãnh thổ tham gia Dự án chi 3-4 tỷ USD tiền ngân nhà nước cho giải mã hoàn chỉnh hệ gen người (~3,2 tỷ bp), với DNA lấy từ cá thể đại diện chủng tộc người giới Đồng thời, việc giải mã hệ gen người Công ty tư nhân Celera Genomics Mỹ tiến hành (số tiền chi ước tính phải hàng tỉ USD) Kết nhóm giải mã hồn chỉnh hệ gen người, đồng thời công bố “bản nháp” tạp chí khoa học danh tiếng Nature, Anh (McPherson et al., 2001), Science, Mỹ (Venter et al., 2001) Trình tự Nhóm tài trợ từ ngân sách phủ cơng khai, liệu thơng tin hệ gen cho tồn giới sử dụng, gọi “trình tự chuẩn” hay “trình tự tham chiếu” (reference sequence) Kết quan trọng sau có đồ gen người “chi tiết” (2003) cho thấy, chủng tộc, cá thể người giống đến 99,9% khác tỷ lệ nhỏ (0,1%) cấu trúc hệ gen (hay ~3 triệu/ ~3,2 tỷ bp cấu trúc toàn bộ/ hệ gen) Tuy nhiên, phần khác biệt nhỏ lại có ý nghĩa định đặc điểm nhân chủng học dân tộc, yếu tố di truyền liên quan đến sức khỏe dân tộc cá thể Bước phát triển logic cơng trình giải mã hệ gen người hình thành sau: Trên sơ sở liệu hệ gen (trình tự chuẩn) công bố sử dụng miễn phí, quốc gia sâu nghiên cứu đặc điểm gen dân tộc, cá thể khỏe mạnh mắc bệnh khác nước mình; Thu nhận vật liệu gen (DNA) sản phẩm gen (protein) đại điện dân tộc, cá thể để nghiên cứu sâu cấu trúc, chức chúng theo hướng nghiên cứu ứng dụng chẩn đoán điều trị Một thành tựu nghiên cứu hệ gen người việc giải mã xong hệ gen thành viên gia đình (gồm bố mẹ, trai gái) Viện Sinh học Hệ thống, Seatle (Hoa Kỳ) phối hợp với số quan khác Qua đó, người ta phát gen ứng cử viên liên quan đến hội chứng Miller - bệnh di truyền có tính chất gia đình (Roach et al., 2010) Tin sinh học môn khoa học liên ngành sinh học tin học, trung tâm tính toán hiệu cao, sở liệu gen khổng lồ thiết lập, phần mềm, cơng cụ tính tốn phát triển để phân tích, xử lý số liệu sinh học, mơ hình hóa, mơ để nghiên cứu chức gen protein… Bộ gen người, trước hết hệ gen ty thể số gen chức hệ gen nhân, nhà khoa học Việt Nam quan tâm nghiên cứu từ đầu năm 2000 trở lại Đặc biệt, sau Nhà nước phê duyệt chương trình cơng nghệ sinh học đầu tư số phịng thí nghiệm trọng điểm, nghiên cứu theo hướng đạt kết bước đầu - Giải mã gen, biết đặc điểm cấu trúc gen người khỏe mạnh làm sở tham chiếu cho nghiên cứu đa hình/ đột biến gen người bệnh; - Giải mã hệ gen người bệnh (ung thư, tim mạch, tiểu đường, Alzheimer ) giúp tìm chất di truyền yếu tố liên quan; tìm thị chẩn đoán phát triển dược phẩm cho điều trị; - Làm chủ việc giải mã hệ gen người, áp dụng cho việc giải mã tác nhân gây bệnh cho người thể sinh vật khác; qua phát triển ứng dụng nhiều lĩnh vực khác - Các chuyên ngành khoa học sống (sinh học) công nghệ sinh học đại: sinh học phân tử, công nghệ gen, hệ gen học cấu trúc chức năng, hệ protein học, tin sinh học, hệ gen học người, di truyền phân tử, công nghệ protein enzyme, tiến hóa phân tử người, nhân học phân tử… - Các chuyên ngành y học, dược học, khoa học hình sự, quốc phịng-an ninh: Y học phân tử, di truyền y học phân tử, dịch tễ học phân tử, bệnh học phân tử, hệ gen y học, hệ protein y học, liệu pháp gen, miễn dịch học phân tử, hệ gen học cá thể người, di truyền quần thể người, pháp y, giám định gen, y-dược học quân sự… - Công nghệ thông tin (các trung tâm/ hệ thống tính tốn hiệu cao, phần mềm chuyên dụng phân tích gen protein, hệ thống mơ hình, mơ phỏng, xây dựng sở liệu…) Nhu cầu phát triển khoa học đạt trình độ khu vực quốc tế: công bố khoa học có trình độ cao (các có hệ số ảnh hưởng - IF cao, ví dụ nhóm tạp chí Nature); xây dựng tiềm lực (cơ sở vật chất, đội ngũ cán bộ…) có khả hội nhập quốc tế Nhu cầu phát triển đất nước: Như trình bày, chủng tộc, cá thể khác cấu trúc ~0,1% (hay ~3 triệu/ ~3,2 tỷ bp cấu trúc toàn bộ/ hệ gen), phần khác biệt nhỏ lại có ý nghĩa định đặc điểm nhân chủng học, giống nòi dân tộc, yếu tố di truyền liên quan đến sức khỏe cá thể Vì vậy, việc nghiên cứu hệ gen cá thể thuộc dân tộc vấn đề cấp bách giai đoạn phát triển Bộ gen học người (Human Genomics) Đặc biệt, cần lưu ý nước phải đầu tư giải mã gen cho người dân tộc khơng thể có làm hộ, làm thay Việt Nam, quốc gia với 86 triệu dân (đứng thứ 13 giới dân số) với 54 dân tộc anh em, cần có chiến lược lâu dài chương trình cấp bách cụ thể nghiên cứu bản, nhằm định hướng ứng dụng, liên quan đến hệ gen người Việt Nam Tuy nhiên, việc nghiên cứu đồng hệ gen người Việt Nam (với trang thiết bị tầm trung có) khó khăn, tốn thời gian chi phí khơng khả thi Vì vậy, cần có dự án (chương trình) mang tầm cỡ quốc gia hội nhập quốc tế thực A NỘI DUNG BẢN THẢO DỰ ÁN NGHIÊN CỨU KHOA HỌC CƠ BẢN (BÁO CÁO CƠ SỞ KHOA HỌC CHO DỰ ÁN GIẢI TRÌNH TỰ VÀ PHÂN TÍCH HỆ GEN NGƯỜI VIỆT NAM) DỰ ÁN NGHIÊN CỨU KHOA HỌC CƠ BẢN (GIAI ĐOẠN I: 2012-2015; GIAI ĐOẠN II: 2016 – 2020, TẦM NHÌN ĐẾN 2030) I THƠNG TIN CHUNG (TĨM TẮT DỰ ÁN) 1.1 Tên Dự án: Giải mã/ đọc trình tự hệ gen (Genome) người Việt Nam Tên tiếng Anh: Vietnam Human Genome Sequencing Project Tên viết tắt: Tiếng Việt - HGNV (Hệ gen Người Việt) Tiếng Anh - VHGP 1.2 C an h ì hự Viện Nghiên cứu Hệ gen (Genome) Viện Khoa học Công nghệ Việt Nam 1.3 C an h n Viện hoa học Công nghệ Việt Nam 1.4 Ch nhiệ ự n G T Nông Văn Hải, NCVCC 1.5 Đ a hự 18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội 1.6 hời gian hự năm (2011-2020), chia thành giai đoạn (2012-2015 2016-2020) 1.7 Mục tiêu c a Dự án Mục tiêu chung: Giải mã hoàn chỉnh hệ gen (genome) người Việt Nam, làm sở cho nghiên cứu ứng dụng y-dược lĩnh vực khác ây dựng tập thể khoa học mạnh có đủ lực trang thiết bị người để thực dự án giải mã genome người sinh vật đặc hữu Việt Nam Mục tiêu cụ thể: - Giải mã hệ gen số cá thể người VN (thành viên số gia đình) làm ình ự h n (reference sequence) cho nghiên cứu lâu dài hệ gen người Việt Nam; - hân tích đặc điểm đa hình cấu trúc phân tử (đa hình nucleotide đơn, N s) tồn hệ gen cá thể đại điện cho nhóm dân tộc cơng đồng người Việt Nam, qua xác định nguồn gốc dân tộc, quan hệ chủng loại phát sinh tiến hóa nhân chủng học tiến hóa người Việt; - Giải mã, so sánh tồn hệ gen biểu (exome) số người mắc bệnh: di truyền, ung thư, tiểu đường, tim mạch… Việt Nam nhằm phát thị phân tử cho chẩn đoán điều trị - Xây dựng tập thể khoa học mạnh, liên ngành để giải vấn đề khoa học công nghệ giải mã gen người; Đào tạo nguồn nhân lực có lực để thực dự án giải mã toàn hệ gen sinh vật đặc hữu (cây trồng, vật ni, vi sinh vật) có giá trị cho khoa học giá trị thực tiễn Việt Nam - Tham gia đào tạo hợp tác quốc tế với Trung tâm/ Viện nghiên cứu genome hàng đầu giới 1.8 Nội dung, tổ chức tiến độ thực 1.8.1 Nội dung 1.8.1.1 Các nội dung khoa học dự án -2015): trình tự ộ ộ ể ự : Giải trình tự tồn hệ gen – gia đình (10-15 cá thể) với mức độ bao phủ 30 d ng làm trình tự chuẩn ự ộ ể (exome) 50 cá thể (với độ bao phủ 30 ) mắc số bệnh di truyền, ung thư, tiểu đường, tim mạch…ở Việt Nam nhằm phát thị phân tử cho chẩn đoán điều trị ộ ủ ể ộ 2-3 dân tộc sinh sống Việt Nam, dân tộc khoảng 15 - 20 cá thể, với độ bao phủ từ 30 o sánh khác biệt trình tự toàn hệ gen cá thể thuộc 2-3 dân tộc nghiên cứu, từ tìm hiểu mối quan hệ di truyền dân tộc cộng đồng dân tộc Việt Nam G -2020): ự ộ ể (exome) 50 cá thể (với độ bao phủ 30x) mắc số bệnh di truyền, ung thư, tiều đường, tim mạch…Tìm hiểu khác biệt tồn trình tự người bệnh so với người thường, từ định hướng cho việc tiên lượng điều trị bệnh nói ộ ể ủ ộ đại diện cho nhóm ngơn ngữ sinh sống Việt Nam, dân tộc khoảng 50-60 cá thể, với độ bao phủ từ 30 lần o sánh khác biệt trình tự tồn hệ gen cá thể thuộc dân tộc nghiên cứu, từ tìm hiểu mối quan hệ di truyền dân tộc cộng đồng dân tộc Việt Nam Tầ ế v x - Thực giải mã so sánh hệ gen người với số lượng lớn Tập trung vào nghiên cứu so sánh hệ gen số nhóm bệnh xuất với tần số cao bệnh có tính chất di truyền với nhóm người bình thường cộng đồng, kết hợp với sở nghiên cứu y – dược để tìm phương pháp điều trị thuốc điều trị cho nhóm bệnh - Thực nghiên cứu hậu hệ gen: proteome, transcriptome, metagenome… - Nghiên cứu so sánh hệ gen nhóm dân tộc để nghiên cứu đa dạng di truyền người Việt Nam - Giải mã phân tích hệ gen sinh vật có giá trị kinh tế, đặc hữu Việt Nam Từ đó, tìm khả nâng cao chất lượng tăng khả chống chịu với điều kiện bất lợi bệnh tật, điều kiện môi trường… 1.8.1.2 Yêu cầ ầ ết bị xây dự h tầng Tổng đầu tư trang thiết bị cho dự án Viện Nghiên cứu Hệ gen (Genome) chia thành giai đoạn, giai đoạn I 2012 đến 2015, giai đoạn II từ 2016-2020 Trong giai đoạn I, có phương án lựa chọn, tuỳ thuộc vào nguồn kinh phí lựa chọn phương án I, II III - Phương án I phương án tối thiểu, có 01 thiết bị giải trình tự hệ mới, 01 hệ thống siêu máy tính tối thiểu (512 CPU cores, 1,4 TB RAM 500 TB storage) Mục tiêu phương án giải trình tự phân tích hệ gen người Việt Nam với quy mơ từ 100 – 500 cá thể - Trong phương án II, tăng thêm 01 thiết bị giải trình tự hệ Roche 01 máy khối phổ để phân tích cấu trúc chức protein Thiết bị giải trình tự Roche giải trình tự đoạn DNA có kích thước đến 800 nucleotide Ngồi mục tiêu giải trình tự phân tích hệ gen người, với thiết bị giải trình tự hệ Roche, thực giải trình tự sinh vật có giá trị khác Cùng với thiết bị giải trình tự hệ hệ thống phân tích hệ protein (máy khối phổ) cho phép tiến hành phân tích sâu hệ protein học người, từ tìm thị sinh học giúp chẩn đoán điều trị bệnh người (truyền nhiễm, ung thư, tim mạch…) - Phương án III phương án tối ưu Viện nghiên cứu hệ gen hậu hệ gen Tổng mức đầu tư tăng lên 1,5 lần so với phương án I ố thiết bị giải trình tự phương án – máy (có máy dự phịng, phịng trường hợp máy gặp trục trặc), khả tính tốn lưu trữ hệ thống siêu máy tính tăng lên gấp đôi 1.8.2 Tổ chức thực Hiện nay, Viện Công nghệ sinh học quan chủ trì Phịng thí nghiệm trọng điểm Cơng nghệ gen thực nhiệm vụ theo hướng nghiên cứu hệ gen học, tin sinh học, hệ protein học Tuy nhiên, Phòng thí nghiệm trọng điểm Cơng nghệ gen đơn vị hoạt động theo chế mở, cho phép tất nhà khoa học nước có nhu cầu đến làm việc Quy mơ phịng thí nghiệm nhỏ, quy chế hoạt động theo chế độ hạch tốn phụ thuộc Viện Cơng nghệ sinh học Trong đó, để thực mục tiêu nhiệm vụ nói trên, đơn vị chủ trì nghiên cứu dự án hệ gen phải Viện nghiên cứu quốc gia có tầm cỡ lớn so với Phịng thí nghiệm trọng điểm Đây đơn vị nghiên cứu chuyên hệ gen người sinh vật khác Việt Nam, phải hoạt động độc lập, với chế đảm bảo tính bảo mật thơng tin cao Chính vậy, dự án đầu tư đồng trang thiết bị phương án thành lập viện nghiên cứu chuyên ngành chuyên hệ gen cấp bách cần thiết Ngoài việc thực dự án giải trình tự hệ gen người Việt Nam, trang thiết bị dự án thực dự án giải trình tự phân tích hệ gen thể sinh vật khác Khi dự án xem xét phê duyệt đầu tư, cần triển khai đồng thời việc thành lập Viện Nghiên cứu Hệ gen (Genome) Dự án Viện Nghiên cứu Hệ gen (Genome) quản lý thực điều hành, giám sát Viện Khoa học Công nghệ Việt Nam Ban Quản lý dự án Viện Nghiên cứu Hệ gen (Genome) định thành lập, có nhiệm vụ điều hành tồn q trình thực hiện, từ giai đoạn đầu tư Dự án chia thành giai đoạn: giai đoạn I (2012-2015) giai đoạn II (2016-2020), định hướng phát triển đến 2030 Ở giai đoạn 2012-2013: Đề nghị Viện Khoa học Công nghệ Việt Nam cho phép tạm thời sử dụng số diện tích đơn vị chức giải phóng nhà A2 tịa nhà khác, sau nhà điều hành Viện đưa vào sử dụng Nếu cần thiết, xin thuê thêm 80 – 100 m2 Khu nhà Ứng dụng - Triển khai Viện KH&CNVN (18 –Hoàng Quốc Việt); Lập kế hoạch xin cấp đất xây dựng Dự án nhà làm việc Viện Nghiên cứu Hệ gen Từ 20132016: xây dựng khu nhà làm việc với mặt từ 500-1000m2 (có thể liên kết với đơn vị khác Viện Khoa học Công nghệ Việt Nam) Giai đoạn I, thành lập tổ chức nghiên cứu Viện Nghiên cứu Hệ gen (Genome) Chủ tịch Viện Khoa học Công nghệ Việt Nam định thành lập, với quy mô nhân sự, từ 20-30 (chủ yếu xin Chủ tịch Viện điều động người từ Phịng Cơng nghệ ADN ứng dụng, Viện Cơng nghệ sinh học) Đầu tư trang thiết bị ban đầu cần thiết để thực việc giải mã phân tích hệ gen người Việt, với mục tiêu kết thúc giai đoạn I giải mã 100 hệ gen người Việt Nam Đào tạo nguồn nhân lực cần thiết để thực dự án giải mã hệ gen người sinh vật có giá trị kinh tế khoa học Việt Nam Thực việc giải mã toàn hệ gen 100+ người Việt Nam Giai đoạn II, nâng cấp Viện nghiên cứu Hệ gen (Genome) thành đơn vị nghiên cứu Quốc gia (Nghị định phủ) thuộc Viện Khoa học Công nghệ Việt Nam, đạt trình độ khu vực quốc tế, với quy mơ nhân lực từ 50 – 70 người Tiếp tục đầu tư, nâng cấp trang thiết bị phục vụ việc giải mã hệ gen người, nghiên cứu chức gen giải mã thể sinh vật có giá trị khoa học kinh tế Việt Nam Tiếp tục đào tạo (trong nước) đủ nguồn nhân lực để thực dự án giải mã hệ gen Tiến hành giải mã hệ gen người Việt Nam, với mục tiêu kết thúc giai đoạn II giải mã 1000+ hệ gen người Việt Nam Thực nghiên cứu hậu giải mã nghiên cứu transcriptomics, proteomics… thực dự án giải mã thể sinh vật có giá trịnh khoa học kinh tế Việt Nam Tầm nhìn đến năm 2030 xa hơn: Nâng quy mô Viện Nghiên cứu Hệ gen (Genome) lên mức 150 – 180 người, với chuyên gia đạt trình độ quốc tế lĩnh vực hệ gen học (genomics), tin sinh học (bioinformatics), hệ protein học (proteomics)…Đầu tư thêm trang thiết bị hệ phục vụ dự án Viện Tiếp tục giải mã phân tích hệ gen người Việt Nam với số lượng lớn Tiến hành nghiên cứu hậu giải mã nghiên cứu giải mã sinh vật khác 1.9 S n h ự iến 1.9.1 Giai đoạn I (2012- 2015): “100 genome người Việt” Giải mã hoàn chỉnh hệ gen số phả hệ (“trios”, – phả hệ, bao gồm 2-3 hệ, 10 -15 cá thể khỏe mạnh) giải mã với số lần lặp lại cao (30 ) Qua chọn 1-2 hệ gen làm “trình tự chuẩn” người Việt Nam: Lựa chọn lấy 1-2 trình tự làm “trình tự chuẩn” người Việt Nam số liệu sau làm chuẩn tham chiếu 50 hệ gen hoàn chỉnh (lặp lại cao, 30X) cá thể thuộc 2-3 dân tộc khác người Việt Nam, dân tộc ~15-20 cá thể dân tộc cho nghiên cứu mối quan hệ, đa dạng di truyền tiến hóa phân tử 50 hệ gen biểu (exome, lặp lại cao, 30 ) bệnh nhân mắc bệnh di truyền, ung thư, tiểu đường, tim mạch trình tự EST Assembler MiRanalyzer MiRDeep MiRNAkey Dịch vụ Web cho phát phân tích miRNA cơng nghệ GTT Tìm miRNA đa biết phá từ trình tự miRNAkey gói phần mềm thiết kế thiết kế để sở cho phân tích liệu trình tự miRNA Là gói cơng cụ chung để phân tích liệu hay thêm đăc trưng thống kê giữ liệu xác định đa điểm đọc, phát sinh sở cho phân tích miRNA SNP discovery RNA-Seq Alignment Unix Mac OS X miRNA miRNA miRNA MirTools Mạng cung cấp chế biến RNA phát dựa trình tự thơng tần cao Small RNA transcriptome miRNA MMSEQ Phương pháp học đường truyền cho đánh giá đồng thời biểu đồng dạng quan hệ allen không cân sinh vật lưỡng bội sử dụng liệ RNA-seq Allele-specific transcription MochiView Bộ duyệt tìm hệ gen lai dạng trực quan/phân tích/phần mềm quản lý /management desktop software MOM Chương trình dùng để thiết kế indel nhỏ dữa liệu phương pháp GTT hệ Lập đồ đoạn đọc ngắn MOSAIK Genomics ChIP-Seq ChIP-Chip RNA-Seq Motif Genomics InDel discovery Genomics Reference guided aligner/assembler MoDIL MPscan MrCaNaVaR MPscan (quét đa mẫu ) chương trình lập đồ đoạn đọc ngắn (