bắt cặp trình tự cục bộ trên hệ thống gpu cluster

24 285 0
bắt cặp trình tự cục bộ trên hệ thống gpu cluster

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CễNG NGHỆ THễNG TIN VÀ TRUYỀN THễNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC NGÀNH CễNG NGHỆ THễNG TIN BẮT CẶP TRèNH TỰ CỤC BỘ TRấN HỆ THỐNG GPU CLUSTER Sinh viên thực hiện : Tạ Minh Ngọc Lớp HTTT – K50 Giáo viên hướng dẫn : TS. Nguyễn Hữu Đức HÀ NỘI 6 - 2010 Tạ Minh Ngọc – K50 - HTTT 64 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP 1. Thông tin về sinh viên Họ và tên sinh viên: Tạ Minh Ngọc Điện thoại liên lạc: 0904.80.62.62 Email: ngoctm255@gmail. com Lớp: Hệ thống thông tin Hệ đào tạo: Đại học Đồ án tốt nghiệp được thực hiện tại: Trung tâm tính toán hiệu năng cao, Đại học Bách Khoa Hà Nội Thời gian làm ĐATN: Từ ngày 01/03/ 2010 đến 31/05/ 2010 2. Mục đích nội dung của ĐATN Triển khai thành công bài toán bắt cặp trình tự cục bộ trên hệ thống GPU Cluster. 3. Các nhiệm vụ cụ thể của ĐATN • Tìm hiểu giải tin sinh học và bài toán bắt cặp trình tự cục bộ. • Tìm hiểu công nghệ tính toán đa dụng trên GPU và mô hình lập trình CUDA. • Triển khai bắt cặp trình tự trên hệ thống GPU Cluster. 4. Lời cam đoan của sinh viên: Tôi –Tạ Minh Ngọc - cam kết ĐATN là công trình nghiên cứu của bản thân tôi dưới sự hướng dẫn của TS. Nguyễn Hữu Đức. Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất kỳ công trình nào khác. Hà Nội, ngày tháng năm Tác giả ĐATN Tạ Minh Ngọc 5. Xác nhận của giáo viên hướng dẫn về mức độ hoàn thành của ĐATN và cho phép bảo vệ: Hà Nội, ngày tháng năm Giáo viên hướng dẫn TS. Nguyễn Hữu Đức Tạ Minh Ngọc – K50 - HTTT 2 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster MỤC LỤC LỜI MỞ ĐẦU 10 TểM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 11 ABSTRACT OF THESIS 11 Chương 1. GIỚI THIỆU CHUNG 11 1.1. Tin sinh học và ứng dụng 12 1.2. Bài toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3. Nhiệm vụ của đồ án 12 1.4. Giới thiệu nội dung đồ án 12 Chương 2. TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP TRèNH TỰ 13 2.1. Tin sinh học 13 2.2. Định dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả giải thuật 17 2.4.2. Vấn đề hiệu năng 19 Chương 3. GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA DỤNG TRấN GPU 19 3.1. Bộ xử lý đồ họa đa lõi NVIDIA 20 Kiến trúc tính toán trên Tesla 21 3.2. Môi trường lập trình CUDA 25 Kernel 25 Phân cấp thread 26 Phân cấp bộ nhớ 30 Lập trình không đồng nhất 31 Những mặt hạn chế của CUDA 32 Thiết lập môi trường tính toán CUDA 33 Chương 4. TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN HỆ TH ỐNG GPU CLUSTER 34 4.1. Hệ thống GPU Cluster 35 4.1.1. Phần cứng 35 4.1.2. Phần mềm 36 4.2. Thiết kế giải thuật bắt cặp trình tự Smith- Watermantriển khai trên hệ thống GPU Cluster 37 4.2.1. Giải thuật Smith-Waterman trên GPU 37 4.2.2. Phương pháp song song húa trên GPU Cluster 44 4.2.3. Cài đặt trên hệ thống GPU Cluster 45 4.3. Kết quả thử nghiệm 49 Cơ sở dữ liệu 49 Môi trường thử nghiệm 50 Kết quả 50 Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 60 Phụ lục 60 Chương trình chính (swGPUCluster.cu) 60 TÀI LIỆU THAM KHẢO 64 Tạ Minh Ngọc – K50 - HTTT 10 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster MỤC LỤC LỜI MỞ ĐẦU 10 TểM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 11 ABSTRACT OF THESIS 11 Chương 1. GIỚI THIỆU CHUNG 11 1.1. Tin sinh học và ứng dụng 12 1.2. Bài toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3. Nhiệm vụ của đồ án 12 1.4. Giới thiệu nội dung đồ án 12 Chương 2. TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP TRèNH TỰ 13 2.1. Tin sinh học 13 2.2. Định dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả giải thuật 17 2.4.2. Vấn đề hiệu năng 19 Chương 3. GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA DỤNG TRấN GPU 19 3.1. Bộ xử lý đồ họa đa lõi NVIDIA 20 Kiến trúc tính toán trên Tesla 21 3.2. Môi trường lập trình CUDA 25 Kernel 25 Phân cấp thread 26 Phân cấp bộ nhớ 30 Lập trình không đồng nhất 31 Những mặt hạn chế của CUDA 32 Thiết lập môi trường tính toán CUDA 33 Chương 4. TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN HỆ TH ỐNG GPU CLUSTER 34 4.1. Hệ thống GPU Cluster 35 4.1.1. Phần cứng 35 4.1.2. Phần mềm 36 4.2. Thiết kế giải thuật bắt cặp trình tự Smith- Watermantriển khai trên hệ thống GPU Cluster 37 4.2.1. Giải thuật Smith-Waterman trên GPU 37 4.2.2. Phương pháp song song húa trên GPU Cluster 44 4.2.3. Cài đặt trên hệ thống GPU Cluster 45 4.3. Kết quả thử nghiệm 49 Cơ sở dữ liệu 49 Môi trường thử nghiệm 50 Kết quả 50 Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 60 Phụ lục 60 Chương trình chính (swGPUCluster.cu) 60 TÀI LIỆU THAM KHẢO 64 Tạ Minh Ngọc – K50 - HTTT 10 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster MỤC LỤC LỜI MỞ ĐẦU 10 TểM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 11 ABSTRACT OF THESIS 11 Chương 1. GIỚI THIỆU CHUNG 11 1.1. Tin sinh học và ứng dụng 12 1.2. Bài toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3. Nhiệm vụ của đồ án 12 1.4. Giới thiệu nội dung đồ án 12 Chương 2. TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP TRèNH TỰ 13 2.1. Tin sinh học 13 2.2. Định dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả giải thuật 17 2.4.2. Vấn đề hiệu năng 19 Chương 3. GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA DỤNG TRấN GPU 19 3.1. Bộ xử lý đồ họa đa lõi NVIDIA 20 Kiến trúc tính toán trên Tesla 21 3.2. Môi trường lập trình CUDA 25 Kernel 25 Phân cấp thread 26 Phân cấp bộ nhớ 30 Lập trình không đồng nhất 31 Những mặt hạn chế của CUDA 32 Thiết lập môi trường tính toán CUDA 33 Chương 4. TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN HỆ TH ỐNG GPU CLUSTER 34 4.1. Hệ thống GPU Cluster 35 4.1.1. Phần cứng 35 4.1.2. Phần mềm 36 4.2. Thiết kế giải thuật bắt cặp trình tự Smith- Watermantriển khai trên hệ thống GPU Cluster 37 4.2.1. Giải thuật Smith-Waterman trên GPU 37 4.2.2. Phương pháp song song húa trên GPU Cluster 44 4.2.3. Cài đặt trên hệ thống GPU Cluster 45 4.3. Kết quả thử nghiệm 49 Cơ sở dữ liệu 49 Môi trường thử nghiệm 50 Kết quả 50 Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 60 Phụ lục 61 Chương trình chính (swGPUCluster.cu) 61 TÀI LIỆU THAM KHẢO 64 Tạ Minh Ngọc – K50 - HTTT 10 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster MỤC LỤC LỜI MỞ ĐẦU 10 TểM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 11 ABSTRACT OF THESIS 11 Chương 1. GIỚI THIỆU CHUNG 11 1.1. Tin sinh học và ứng dụng 12 1.2. Bài toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3. Nhiệm vụ của đồ án 12 1.4. Giới thiệu nội dung đồ án 12 Chương 2. TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP TRèNH TỰ 13 2.1. Tin sinh học 13 2.2. Định dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả giải thuật 17 2.4.2. Vấn đề hiệu năng 19 Chương 3. GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA DỤNG TRấN GPU 19 3.1. Bộ xử lý đồ họa đa lõi NVIDIA 20 Kiến trúc tính toán trên Tesla 21 3.2. Môi trường lập trình CUDA 25 Kernel 25 Phân cấp thread 26 Phân cấp bộ nhớ 30 Lập trình không đồng nhất 31 Những mặt hạn chế của CUDA 32 Thiết lập môi trường tính toán CUDA 33 Chương 4. TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN HỆ TH ỐNG GPU CLUSTER 34 4.1. Hệ thống GPU Cluster 35 4.1.1. Phần cứng 35 4.1.2. Phần mềm 36 4.2. Thiết kế giải thuật bắt cặp trình tự Smith- Watermantriển khai trên hệ thống GPU Cluster 37 4.2.1. Giải thuật Smith-Waterman trên GPU 37 4.2.2. Phương pháp song song húa trên GPU Cluster 44 4.2.3. Cài đặt trên hệ thống GPU Cluster 45 4.3. Kết quả thử nghiệm 49 Cơ sở dữ liệu 49 Môi trường thử nghiệm 50 Kết quả 50 Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 60 Phụ lục 61 Chương trình chính (swGPUCluster.cu) 61 TÀI LIỆU THAM KHẢO 64 Tạ Minh Ngọc – K50 - HTTT 10 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster MỤC LỤC LỜI MỞ ĐẦU 10 TểM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 11 ABSTRACT OF THESIS 11 Chương 1. GIỚI THIỆU CHUNG 11 1.1. Tin sinh học và ứng dụng 12 1.2. Bài toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3. Nhiệm vụ của đồ án 12 1.4. Giới thiệu nội dung đồ án 12 [...]... query Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster score: 1241 | s| p| || P| 1| 2| 8| 2| 5| || R| A| S| N| _| C| A| V| P| O| GTPase NRas OS = Cavia porcellus GN = NRAS PE = Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster score: 2458 | s| p| || Q| 5| R| B| P| 7| || A| D| H| 1| A| _| P| O| N| A| B| Alcohol dehydrogenase 1A OS = Pongo abelii GN Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster. .. M| O| U| S| E| Kinesin - like protein KIF11 OS = Mus musculus GN Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster score: 11489 | s| p| || P| 3| 5| 4| 9| 8| || S| C| N| 1| A| _| H| U| M| A| N| Sodium channel protein type 1 subunit alpha OS = Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster ... ký tự trong một chuỗi được giới hạn lại lưu trữ trong cùng một cột từ trên xuống dưới và tất cả các chuỗi được sắp xếp theo độ dài tăng dần từ trái qua phải và từ trên xuống dưới trong mảng Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster Hệ thống Cluster sử dụng một thư mục dữ liệu chung được đồng bộ húa giữa các máy Thư mục này lưu trữ dữ liệu chuỗi sinh học Bắt cặp trình tự cục bộ trên hệ thống GPU. .. toán bắt cặp trình tự và vấn đề hiệu năng cho các giải thuật bắt cặp trình tự 12 1.3 Nhiệm vụ của đồ án 12 1.4 Giới thiệu nội dung đồ án 12 Chương 2 TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP TRèNH TỰ 13 Chương 3 DỤNG TRấN GPU 2.1 Tin sinh học 13 2.2 Định dạng FASTA 14 2.3 Bắt cặp trình tự 15 2.3.1 Bắt cặp cục bộ 16 2.3.2 Bắt cặp toàn cục 16 2.3.3 Bắt cặp đa chuỗi 16 2.4 Giải thuật Smith-Waterman cho bài toán bắt. ..Chương 2 TRèNH TỰ TIN SINH HỌC VÀ BÀI TOÁN BẮT CẶP 13 Chương 3 DỤNG TRấN GPU 2.1 Tin sinh học 13 2.2 Định dạng FASTA 14 2.3 Bắt cặp trình tự 15 2.3.1 Bắt cặp cục bộ 16 2.3.2 Bắt cặp toàn cục 16 2.3.3 Bắt cặp đa chuỗi 16 2.4 Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1 Mô tả giải thuật 17 2.4.2 Vấn đề hiệu năng 19 GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA 19 3.1 Bộ xử lý đồ họa đa lõi... DỤNG TRấN GPU 2.1 Tin sinh học 13 2.2 Định dạng FASTA 14 2.3 Bắt cặp trình tự 15 2.3.1 Bắt cặp cục bộ 16 2.3.2 Bắt cặp toàn cục 16 2.3.3 Bắt cặp đa chuỗi 16 2.4 Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1 Mô tả giải thuật 17 2.4.2 Vấn đề hiệu năng 19 GPU VÀ CễNG NGHỆ TÍNH TOÁN ĐA 19 3.1 Bộ xử lý đồ họa đa lõi NVIDIA Kiến trúc tính toán trên Tesla 21 3.2 Môi trường lập trình CUDA... tự cục bộ trên hệ thống GPU Cluster externconstint amino_acids_trans[256]; FastaDB * openFastaDB(char *file); FastaDB * openFastaDB(char *file, longint offset); voidcloseFastaDB(FastaDB *lib); voidcloseFastaDB(FastaDB *lib, longint *offset_cur); Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster device(0) Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster ******************************... TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN 20 25 33 TH ỐNG GPU CLUSTER 34 4.1 Hệ thống GPU Cluster 35 4.1.1 Phần cứng 35 4.1.2 Phần mềm 36 4.2 Thiết kế giải thuật bắt cặp trình tự SmithWatermantriển khai trên hệ thống GPU Cluster 37 4.2.1 Giải thuật Smith-Waterman trên GPU 37 Cơ sở của phương pháp song song húa 37 Phương pháp song song húa 38 Sắp xếp các chuỗi đối tượng hợp nhất 39 Truy cập bộ nhớ toàn cục hợp... 28 Bắt cặp trình tự cục bộ trên hệ thống GPU Cluster Hình 7 Phân cấp bộ nhớ Lập trình không đồng nhất Như minh họa ở Hình 2-3, mô hình lập trình CUDA cho phép các tiến trình CUDA thực hiện trên một thiết bị (device) vật lý tách rời và có thể hoạt động như một bộ đồng xử lý với tiến trình chủ (host) chạy chương trình C Trong trường hợp này, ví dụ, khi các kernel thực hiện trên một GPU và phần chương trình. .. Phân cấp bộ nhớ 30 Lập trình không đồng nhất 31 Những mặt hạn chế của CUDA 32 Thiết lập môi trường tính toán CUDA Môi trường phần cứng 33 Bộ công cụ phát triển phần mềm 34 20 25 33 Chương 4 HỆ TRIỂN KHAI BẮT CẶP TRèNH TỰ TRấN TH ỐNG GPU CLUSTER 34 4.1 Hệ thống GPU Cluster 35 4.1.1 Phần cứng 35 4.1.2 Phần mềm 36 4.2 Thiết kế giải thuật bắt cặp trình tự SmithWatermantriển khai trên hệ thống GPU Cluster . bài toán bắt cặp trình tự cục bộ trên hệ thống GPU Cluster. 3. Các nhiệm vụ cụ thể của ĐATN • Tìm hiểu giải tin sinh học và bài toán bắt cặp trình tự cục bộ. • Tìm hiểu công nghệ tính toán. dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả. dạng FASTA 14 2.3. Bắt cặp trình tự 15 2.3.1. Bắt cặp cục bộ 16 2.3.2. Bắt cặp toàn cục 16 2.3.3. Bắt cặp đa chuỗi 16 2.4. Giải thuật Smith-Waterman cho bài toán bắt cặp cục bộ 17 2.4.1. Mô tả

Ngày đăng: 07/01/2015, 20:21

Mục lục

  • Chương 1.                   GIỚI THIỆU CHUNG

    • 1.1.          Tin sinh học và ứng dụng

      • Lập trình không đồng nhất

      • 2.1.          Hệ thống GPU Cluster

        • 2.1.1.     Phần cứng

          • Sắp xếp các chuỗi đối tượng hợp nhất

Tài liệu cùng người dùng

Tài liệu liên quan