1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu giải pháp công nghệ tính toán hiệu năng cao với bộ xử lý đồ họa GPU và ứng dụng (tt)

14 147 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 1,65 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN ĐỨC MINH NGHIÊN CỨU GIẢI PHÁP CÔNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ ĐỒ HỌA GPU ỨNG DỤNG LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN ĐỨC MINH NGHIÊN CỨU GIẢI PHÁP CƠNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ ĐỒ HỌA GPU ỨNG DỤNG Ngành: Công nghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS LÊ QUANG MINH Hà Nội 2016 LỜI CAM ĐOAN Với mục đích học tập, nghiên cứu để nâng cao kiến thức trình độ chun mơn nên tơi làm luận văn cách nghiêm túc hoàn toàn trung thực Trong luận văn, tơi có sử dụng tài liệu tham khảo số tác giả Tôi nêu phần tài liệu tham khảo cuối luận văn Tôi xin cam đoan chịu trách nhiệm nội dung trung thực luận văn tốt nghiệp Thạc sĩ mình! Hà Nội, tháng 05 năm 2016 Học viên Nguyễn Đức Minh LỜI CẢM ƠN Những kiến thức luận văn kết ba năm (20132016) tơi có may mắn thầy cô giáo Trường Đại học Công Nghệ Đại học Quốc Gia Hà Nội, thầy cô giáo thầy cô giáo Trường Đại học, Viện nghiên cứu trực tiếp giảng dạy, đào tạo dìu dắt Tơi xin bày tỏ lời cảm ơn chân thành tới thầy cô giáo Bộ môn Kỹ Thuật Phần Mềm – Khoa Công nghệ thông tin – Đại học Cơng Nghệ - ĐHQG Hà Nội, Phòng đào tạo sau đại học – Đại học Công Nghệ - ĐHQG Hà Nội tạo điều kiện thuận lợi cho thời gian học tập tạitrường Tôi xin bày tỏ lòng biết ơn chân thành, lời cảm ơn sâu sắc thầy giáo TS Lê Quang Minh trực tiếp hướng dẫn, định hướng cho giải vấn đề luậnvăn Tôi xin cảm ơn anh chị em đồng nghiệp Trường ĐH Cơng Nghệ Thơng Tin & Truyền Thơng Phòng Lab khoa Điện tử - Trường ĐH Kỹ Thuật Công Nghiệp Thái Nguyên ủng hộ giúp đỡ trình thực luận văn Luận văn xin lời chia vui với người thân, đồng nghiệp, bạn bè bạn đồng môn lớp cao học K20 Hà Nội, tháng 05 năm 2016 Học viên Nguyễn Đức Minh Mục lục LỜI CAM ĐOAN _ LỜI CẢM ƠN MỞ ĐẦU DANH MỤC THUẬT NGỮ _ DANH MỤC HÌNH VẼ Chương 1.1 Tổng quan tính tốn song song _5 1.1.1 1.1.2 1.1.3 1.1.4 1.2 Tổng quan tính tốn song song GPU _ Tổng quan tính tốn song song Mơ hình máy tính song song _ Mơ hình lập trình song song 11 Nguyên thiết kế giải thuật song song _ 13 Tổng quan GPU 16 1.2.1 1.2.2 1.2.3 1.2.4 Lịch sử phát triển GPU _ Kiến trúc GPU Tính tốn GPU _ Môi trường phần mềm Chương 16 19 23 26 Tính tốn song song GPU CUDA 30 2.1 Giới thiệu môi trường phát triển CUDA 30 2.2 Mơi trường lập trình chế hoạt động chương trình CUDA _ 32 2.2.1 2.2.2 2.2.3 2.2.4 2.3 32 32 33 36 Lập trình ứng dụng với CUDA _ 37 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.4 Mơi trường lập trình Cơ chế hoạt động chương trình CUDA Mô hình lập trình _ Mơ hình nhớ CUDA mở rộng ngôn ngữ lập trình C _ Những mở rộng CUDA so với ngơn ngữ lập trìnhC _ Các biến Built-in Biên dịch với NVCC _ Ví dụ tính tốn song song bằngCUDA _ 37 38 40 41 41 Ứng dụng CUDA lĩnh vực công nghệ _ 45 2.4.1 2.4.2 CUDA cho ngành cơng nghiệp trò chơi 45 CUDA cho ứng dụng video số 46 Chương Tăng tốc độ tính toán số toán sử dụng GPU 47 3.1 Giới thiệu số toán _ 47 3.2 Biến đổi FFT GPU _ 47 3.2.1 3.2.2 3.3 Phân tích Fourier _ 47 Phép biến đổi Fourier _ 48 Phân tích biến đổi FFT GPU 48 3.3.1 3.3.2 Chương trình thử nghiệm 49 Kết thử nghiệm _ 51 3.4 Phát biên ảnh _ 52 3.4.1 3.4.2 3.4.3 3.5 Phương pháp phát biên _ 52 Thực thuật toán phát biên ảnh GPU 53 Kết thử nghiệm _ 55 Tạo ảnh sơn mài _ 56 3.5.1 3.5.2 3.5.3 Cài đặt thuật toán tạo ảnh sơn mài GPU 56 Kết thử nghiệm _ 58 Đánh giá hiệu xuất tính tốn 59 Hướng phát triển 60 Kết luận _ 61 Tài liệu tham khảo 62 MỞ ĐẦU Sự bùng nổ Internet, bùng nổ xu thiết bị kết nối (Internet of thing - IOT), bùng nổ nhu cầu thưởng sản phẩm âm đồ họa độ phân giải cao chất lượng cao, bùng nổ dịch vụ lưu trữ đám mây, dịch vụ trực tuyến, khiến cho khôi lượng liệu mà vi xử (CPU) phải tính tốn ngày lớn thực vượt nhanh so với phát triển tốc độ CPU Không người muốn có nhiều thơng tin hơn, thơng tin phải tốt lại muốn tốc độ xử phải nhanh hơn, điều làm cho nhu cầu tính tốn lĩnh vực khoa học, cơng nghệ trở thành thách thức lớn Từ giải pháp nhằm tăng tốc độ tính toán đời Từ năm 2001 đến 2003 tốc độ Pentium tăng gấp đôi từ 1.5GHz lên đến 3GHz Tuy nhiên hiệu CPU không tăng tương xứng mức gia tăng xung nhịp CPU việc tăng xung nhịp đạt tới giới hạn cơng nghệ Cụ thể tính đến 2005 xung nhịp Pentium tăng lên 3.8GHz Việc tăng xung nhịp CPU dẫn đến việc tăng nhiệt độ làm việc CPU Các công nghệ làm mát khơng đáp ứng bề mặt tiếp xúc CPU ngày nhỏ Trước tình hình nhà nghiên cứu vi xử chuyển sang hướng phát triển công nghệ đa lõi nhằm song song hóa q trình tính tốn để tăng tốc độ tiết kiệm điện Một công nghệ đa lõi xử song song đời xử đồ họa GPU (Graphic Processing Unit) GPU ban đầu đời phục vụ cho mục đích xử đồ họa, ngành cơng nghiệp Game Tuy nhiên ngày với công nghệ CUDA phát triển hãng NVIDIA từ năm 2007 cho phép thực tính tốn song song với phép tính phức tạp dấu chấm động Với hiệu suất ngàn lệnh thời điểm Chính xu hướng nghiên cứu đời phát triển thuật toán song song thực GPU Với CUDA lập trình viên nhanh chóng phát triển ứng dụng tính tốn song song cho nhiều ứng dụng khác như: Điện tốn, xếp, tìm kiếm, xử tín hiệu số, ảnh,… Việc nghiêp cứu áp dụng CUDA để tăng tốc độ tính tốn cho tốn mà cần phải xử khối liệu đầu vào khổng lồ tốn u cầu tính thời gian thực thực trở thành vấn đề cấp thiết thực tế Xuất phát từ cầu mà tơi chọn đề tài: NGHIÊN CỨU GiẢI PHÁP CƠNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ ĐỒ HỌA GPU ỨNG DỤNG Luận văn gồm chương chính: Chương 1: Tổng quan tính tốn song song GPU, chương giới thiệu kiến thức tổng quan tính tốn song song, từ tìm hiểu kiến thức xử đồ họa GPU cách thức ứng dụng tính tốn 2 Chương 2: Tính tốn song song GPU CUDA Chương cung cấp kiến thức mơi trường lập trình, ngơn ngữ lập trình, cách thiết lập chương trình dẫn hiệu cài đặt ứng dụng tính tốn GPU Chương 3:Tăng tốc độ tính tốn số tốn sử dụng GPU Trên cở kiến thức trình bày chương trên, tác giả luận văn tiến hành cài đặt thử nghiệm mô tốn CPU GPU Từ có so sánh, nhận xét lực tính tốn vượt trội GPU so với CPU truyền thống 3 DANH MỤC THUẬT NGỮ Tiếng Anh Tiếng Việt API Application Program Interface: API định nghĩa giao diện chuẩn để triệu gọi tập chức 2coproccessor đồng xử 3gpgpu tính tốn thơng dụng GPU 4GPU Bộ xử đồ họa 5kernel hạt nhân 6MIMD Multiple Instruction Multiple Data: đa lệnh đa liệu 7primary surface Bề mặt chính, khái niệm dùng kết cấu 8proccessor Bộ xử 9Rasterization Sự quét mành hình 1SIMD Single Instruction Multiple Data: đơn lệnh đa liệu 1stream 1streaming processor 1texture Dòng 1texture fetches 1texture reference 1warp Hàm đọc kết cấu Bộ xử dòng Kết cấu: cấu trúc đối tượng, xem mơ hình thu nhỏ đốitượng Tham chiếu kết cấu Mỗi khối tách thành nhóm SIMD luồng 4 DANH MỤC HÌNH VẼ Hình 1.1 Mơ tả kiến trúc Von Neumann Hình 1.2 Máy tính song song có nhớ chia sẻ Hình 1.3 Máy tính song song có nhớ phân tán Hình 1.4 Mơ hình kiến trúc máy SISD 10 Hình 1.5 Mơ hình kiến trúc máy SIMD 10 Hình 1.6 Mơ hình kiến trúc máy MISD 11 Hình 1.7 Mơ hình kiến trúc máy MIMD 11 Hình 1.8 Mơ hình lập trình trun thơng hai tác vụ hai máy tính 13 Hình 1.9 Mơ hình lập trình song song liệu 13 Hình 1.10 Ảnh chụp 3dfx Voodoo3 17 Hình 1.11 Kiến trúc GPU NVIDIA AMD có lượng đồ sộ đơn vị lập trình tổ chức song song thống 23 Hình 2.1 Kiến trúc phần mềm CUDA 30 Hình 2.2 Các thao tác thu hồi cấp phát nhớ 31 Hình 2.3 Vùng nhớ dùng chung mang liệu gần ALU 32 Hình 2.4 Sơ đồ hoạt động truyền liệu Host Device 33 Hình 2.5 Khối luồng 35 Hình 2.6 Mơ hình nhớ GPU 36 Hình 2.7 lưới khối với số khối luồng 41 Hình 2.8 Phương pháp đánh số luồng 44 Chương Tổng quan tính tốn song song GPU 1.1 Tổng quan tính tốn song song 1.1.1 Tổng quan tính tốn song song 1.1.1.1 Lịch sử đời tính tốn song song Trong thập niên 60, tảng để thiết kế máy tính dựa mơ hình John Von Neumann , với đơn vị xử nối với vùng lưu trữ làm nhớ vàtại thời điểm có lệnh thựcthi Hình 1.1 Mơ tả kiến trúc Von Neumann Với tốn u cầu khả tính tốn lưu trữ lớn mơ hình kiến trúc hạn chế Để tăng cường sức mạnh tính tốn giải tốn lớn có độ tính tốn cao, người ta đưa kiến trúc mới, với ý tưởng kết hợp nhiều xử vào máy tính, mà hay gọi xử song song (Multiprocessor) kết hợp sức mạnh tính tốn nhiều máy tính dựa kết nối mạng (máy tính song songmulticomputer) Kể từ lúc này, để khai thác sức mạnh tiềm tàng mơ hình máy tính nhiều xử song song, mơ hình mạng máy tính xử song song giải thuật khơng phù hợp việc xây dựng thiết kế giải thuật song song điều quan trọng Giải thuật song song phân rã cơng việc phần tử xử khác 6 1.1.1.2 Tại phải tính tốn song song Theo xu hướng phát triển công nghệ thông tin, xử đa nhân, đa lõi (multiple processor) thay xử đơn lõi (single processor) nhiên với lối lập trình truyền thống (lập trình tuần tự), câu lệnh, trình xử thực hịên cách lần lượt, không phát huy hết công năng, hiệu vi xử đa nhân, đa lõi (multiple processor) Lập trình, tính tốn song song đời lời giải cho yêu cầu, thách thức đặt làm để phát huy công năng, hiệu đa xử (multiple processor) Trên thực tế, có nhiều tốn với liệu lớn, độ phức tạp tính tốn cao mà đòi hỏi thời gian xử ngắn độ xác cao Ví dụ toán liên quan tới xử ảnh, xử tín hiệu, dự báo thời tiết, mơ giao thông, mô chuyển động phân tử, nguyên tử, mô đồ gen, toán liên quan đến sở liệu khai thác sở liệu,… với xử đơn lõi khó thực cho kết mong muốn Lập trình, tính tốn song song lời giải đáp cho toán tăng hiệu xử đồng thời rút ngắn thời gian xử tính tốn người dùng 1.1.1.3 Một số khái niệm xử song song  Định nghĩa xử song song Xử song song trình xử gồm nhiều tiến trình kích hoạt đồng thời tham gia giải toán Nói chung, xử song song thực hệ thống đa xử  Phân biệt xử song song xử Trong tính tốn với xử thời điểm thực phép tốn Trong tính tốn song song nhiều xử kết hợp với để giải toán giảm thời gian xử thời điểm thực đồng thời nhiều phép toán Dưới bảng so sánh khác lập trình lập trình song song 62 Tài liệu tham khảo Tài liệu tiếng việt [1] Trương Văn Hiệu (2011), “Nghiên cứu giải thuật song song hệ thống xử đồ họa GPU đa lõi”, luận văn thạc sĩ, trường Đại học Đà Nẵng [2] Nguyễn Việt Đức – Nguyễn Nam Giang (2012), ”Xây dựng thuật tốn song song tìm đường ngắn với CUDA”, luận văn thạc sỹ, trường Đại học Cơng nghệ Hồ Chí Minh [3] Nguyễn Thị Thùy Linh (2009), “Tính tốn hiệu cao với xử đồ họa GPU ứng dụng”, luận văn thạc sĩ, trường Đại học Công nghệ Hà Nội Tài liệu tiếng anh [4] Jason Sanders, Edward Kandrot, “CUDA by example”, an introduction to GeneralPurpose GPU programming [5] Maciej Matyka, “GPGPU programming on example of CUDA”, Institute of Theoretical Physics University of Wroclaw [6] NVIDIA, “High performance computing with CUDA”, Users Group Conference San Diego, CA June 15, 2009 [7] N K Govindaraju, B Lloyd, W Wang, M Lin, and D Manocha, “Fast computation of database operations using graphics processors,” in Proceedings of the 2004 ACM SIGMOD International Conference on Management of Data, Jun 2004, pp 215–226 [8] "N K Govindaraju, M Henson, M C Lin, and D Manocha, “Interactive visibility ordering of geometric primitives in complex environments,” in Proceedings of the 2005 Symposium on Interactive 3D Graphics and Games, Apr 2005, pp 49– 56." [9] Bustos, O Deussen, S Hiller, and D Keim, “A graphics hardware accelerated algorithm for nearest neighbor search,” in Proceedings of the 6th International Conference on Computational Science, ser Lecture Notes in Computer Science Springer, May 2006, vol 3994, pp 196– 199 [10] Blythe, “The Direct3D 10 system,” ACM Transactions on Graphics, vol 25, no 3, pp 724–734, Aug 2006 [11] Horn, “Stream reduction operations for GPGPU applications,” in GPU Gems 2, M Pharr, Ed Addison Wesley, Mar 2005, ch 36, pp 573–589 [12] Tarditi, S Puri, and J Oglesby, “Accelerator: Using data-parallelism to program GPUs for general-purpose uses,” in Proceedings of the Twelfth International Conference on Architectural Support for Programming Languages and Operating Systems, Oct 2006, pp 325–335 63 Tài liệu mạng [13] PADE, http://math.nist.gov/mcsd/savg/pade/ [14] P-GRADE, http://www.lpds.sztaki.hu/pgrade/ [15] wikipedia http://en.wikipedia.org/wiki/Graphics_processing_unit [16] http://gpgpu.org/ [17] http://ati.amd.com/technology/streamcomputing/gpgpu_history.html (GPGPU history from AMD) [18] http://gpgpu.org/oldsite/data/history.shtml [19] http://www.techradar.com/news/computing-components/processors/world-sfastest-cpu-clocked-at-128-gigaflops-599433 [20] http://www.tomshardware.com/reviews/nvidia-cuda-gpu,1954-2.html [21] http://www.vizworld.com/2009/06/nvidia-and-pgi-partner-to-bring-cuda-tofortran/ [22] http://penstarsys.com/previews/graphics/nvidia/tesla/tesla_2.htm [23] http://www.tomshardware.com/news/Tesla-C1060-S1070,5672.html [24] http://hothardware.com/News/NVIDIA-Unveils-Next-Generation-Fermi-GPUArchitecture/ ... QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN ĐỨC MINH NGHIÊN CỨU GIẢI PHÁP CÔNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ LÝ ĐỒ HỌA GPU VÀ ỨNG DỤNG Ngành: Công nghệ thông tin Chuyên ngành: Kỹ... điện Một công nghệ đa lõi xử lý song song đời xử lý đồ họa GPU (Graphic Processing Unit) GPU ban đầu đời phục vụ cho mục đích xử lý đồ họa, ngành công nghiệp Game Tuy nhiên ngày với công nghệ CUDA... vào khổng lồ tốn u cầu tính thời gian thực thực trở thành vấn đề cấp thiết thực tế Xuất phát từ cầu mà chọn đề tài: NGHIÊN CỨU GiẢI PHÁP CƠNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ LÝ ĐỒ HỌA GPU

Ngày đăng: 11/11/2017, 09:47

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w