Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
1,65 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNGNGHỆ NGUYỄN ĐỨC MINH NGHIÊNCỨUGIẢIPHÁPCÔNGNGHỆTÍNH TỐN HIỆUNĂNGCAOVỚIBỘXỬLÝĐỒHỌAGPUVÀỨNGDỤNG LUẬN VĂN THẠC SĨ CÔNGNGHỆ THÔNG TIN Hà Nội – 2016 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNGNGHỆ NGUYỄN ĐỨC MINH NGHIÊNCỨUGIẢIPHÁPCƠNGNGHỆTÍNH TỐN HIỆUNĂNGCAOVỚIBỘXỬLÝĐỒHỌAGPUVÀỨNGDỤNG Ngành: Côngnghệ thông tin Chuyên ngành: Kỹ thuật phần mềm Mã số: 60480103 LUẬN VĂN THẠC SĨ CÔNGNGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS LÊ QUANG MINH Hà Nội 2016 LỜI CAM ĐOAN Với mục đích học tập, nghiêncứu để nângcao kiến thức trình độ chun mơn nên tơi làm luận văn cách nghiêm túc hoàn toàn trung thực Trong luận văn, tơi có sử dụng tài liệu tham khảo số tác giả Tôi nêu phần tài liệu tham khảo cuối luận văn Tôi xin cam đoan chịu trách nhiệm nội dung trung thực luận văn tốt nghiệp Thạc sĩ mình! Hà Nội, tháng 05 năm 2016 Học viên Nguyễn Đức Minh LỜI CẢM ƠN Những kiến thức luận văn kết ba năm (20132016) tơi có may mắn thầy cô giáo Trường Đại học CôngNghệ Đại học Quốc Gia Hà Nội, thầy cô giáo thầy cô giáo Trường Đại học, Viện nghiêncứu trực tiếp giảng dạy, đào tạo dìu dắt Tơi xin bày tỏ lời cảm ơn chân thành tới thầy cô giáo Bộ môn Kỹ Thuật Phần Mềm – Khoa Côngnghệ thông tin – Đại học CơngNghệ - ĐHQG Hà Nội, Phòng đào tạo sau đại học – Đại học CôngNghệ - ĐHQG Hà Nội tạo điều kiện thuận lợi cho thời gian học tập tạitrường Tôi xin bày tỏ lòng biết ơn chân thành, lời cảm ơn sâu sắc thầy giáo TS Lê Quang Minh trực tiếp hướng dẫn, định hướng cho giải vấn đề luậnvăn Tôi xin cảm ơn anh chị em đồng nghiệp Trường ĐH CơngNghệ Thơng Tin & Truyền Thơng Phòng Lab khoa Điện tử - Trường ĐH Kỹ Thuật Công Nghiệp Thái Nguyên ủng hộ giúp đỡ trình thực luận văn Luận văn xin lời chia vui với người thân, đồng nghiệp, bạn bè bạn đồng môn lớp cao học K20 Hà Nội, tháng 05 năm 2016 Học viên Nguyễn Đức Minh Mục lục LỜI CAM ĐOAN _ LỜI CẢM ƠN MỞ ĐẦU DANH MỤC THUẬT NGỮ _ DANH MỤC HÌNH VẼ Chương 1.1 Tổng quan tính tốn song song _5 1.1.1 1.1.2 1.1.3 1.1.4 1.2 Tổng quan tính tốn song song GPU _ Tổng quan tính tốn song song Mơ hình máy tính song song _ Mơ hình lập trình song song 11 Nguyên lý thiết kế giải thuật song song _ 13 Tổng quan GPU 16 1.2.1 1.2.2 1.2.3 1.2.4 Lịch sử phát triển GPU _ Kiến trúc GPUTính tốn GPU _ Môi trường phần mềm Chương 16 19 23 26 Tính tốn song song GPU CUDA 30 2.1 Giới thiệu môi trường phát triển CUDA 30 2.2 Mơi trường lập trình chế hoạt động chương trình CUDA _ 32 2.2.1 2.2.2 2.2.3 2.2.4 2.3 32 32 33 36 Lập trình ứngdụngvới CUDA _ 37 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.4 Mơi trường lập trình Cơ chế hoạt động chương trình CUDA Mô hình lập trình _ Mơ hình nhớ CUDA mở rộng ngôn ngữ lập trình C _ Những mở rộng CUDA so với ngơn ngữ lập trìnhC _ Các biến Built-in Biên dịch với NVCC _ Ví dụ tính tốn song song bằngCUDA _ 37 38 40 41 41 Ứngdụng CUDA lĩnh vực côngnghệ _ 45 2.4.1 2.4.2 CUDA cho ngành cơng nghiệp trò chơi 45 CUDA cho ứngdụng video số 46 Chương Tăng tốc độtínhtoán số toán sử dụngGPU 47 3.1 Giới thiệu số toán _ 47 3.2 Biến đổi FFT GPU _ 47 3.2.1 3.2.2 3.3 Phân tích Fourier _ 47 Phép biến đổi Fourier _ 48 Phân tích biến đổi FFT GPU 48 3.3.1 3.3.2 Chương trình thử nghiệm 49 Kết thử nghiệm _ 51 3.4 Phát biên ảnh _ 52 3.4.1 3.4.2 3.4.3 3.5 Phương pháp phát biên _ 52 Thực thuật toán phát biên ảnh GPU 53 Kết thử nghiệm _ 55 Tạo ảnh sơn mài _ 56 3.5.1 3.5.2 3.5.3 Cài đặt thuật toán tạo ảnh sơn mài GPU 56 Kết thử nghiệm _ 58 Đánh giá hiệu xuất tính tốn 59 Hướng phát triển 60 Kết luận _ 61 Tài liệu tham khảo 62 MỞ ĐẦU Sự bùng nổ Internet, bùng nổ xu thiết bị kết nối (Internet of thing - IOT), bùng nổ nhu cầu thưởng sản phẩm âm đồhọađộ phân giảicao chất lượng cao, bùng nổ dịch vụ lưu trữ đám mây, dịch vụ trực tuyến, khiến cho khôi lượng liệu mà vi xửlý (CPU) phải tính tốn ngày lớn thực vượt nhanh so với phát triển tốc độ CPU Không người muốn có nhiều thơng tin hơn, thơng tin phải tốt lại muốn tốc độxửlý phải nhanh hơn, điều làm cho nhu cầu tính tốn lĩnh vực khoa học, cơngnghệ trở thành thách thức lớn Từ giảipháp nhằm tăng tốc độtínhtoán đời Từ năm 2001 đến 2003 tốc độ Pentium tăng gấp đôi từ 1.5GHz lên đến 3GHz Tuy nhiên hiệu CPU không tăng tương xứng mức gia tăng xung nhịp CPU việc tăng xung nhịp đạt tới giới hạn cơngnghệ Cụ thể tính đến 2005 xung nhịp Pentium tăng lên 3.8GHz Việc tăng xung nhịp CPU dẫn đến việc tăng nhiệt độ làm việc CPU Các côngnghệ làm mát khơng đáp ứng bề mặt tiếp xúc CPU ngày nhỏ Trước tình hình nhà nghiêncứu vi xửlý chuyển sang hướng phát triển côngnghệ đa lõi nhằm song song hóa q trình tính tốn để tăng tốc độ tiết kiệm điện Một côngnghệ đa lõi xửlý song song đời xửlýđồhọaGPU (Graphic Processing Unit) GPU ban đầu đời phục vụ cho mục đích xửlýđồ họa, ngành cơng nghiệp Game Tuy nhiên ngày vớicôngnghệ CUDA phát triển hãng NVIDIA từ năm 2007 cho phép thực tính tốn song song với phép tính phức tạp dấu chấm động Vớihiệu suất ngàn lệnh thời điểm Chính xu hướng nghiêncứu đời phát triển thuật toán song song thực GPUVới CUDA lập trình viên nhanh chóng phát triển ứngdụngtính tốn song song cho nhiều ứngdụng khác như: Điện tốn, xếp, tìm kiếm, xửlý tín hiệu số, ảnh,… Việc nghiêp cứu áp dụng CUDA để tăng tốc độtính tốn cho tốn mà cần phải xửlý khối liệu đầu vào khổng lồ tốn u cầu tính thời gian thực thực trở thành vấn đề cấp thiết thực tế Xuất phát từ cầu mà tơi chọn đề tài: NGHIÊNCỨUGiẢIPHÁPCƠNGNGHỆTÍNH TỐN HIỆUNĂNGCAOVỚIBỘXỬLÝĐỒHỌAGPUVÀỨNGDỤNG Luận văn gồm chương chính: Chương 1: Tổng quan tính tốn song song GPU, chương giới thiệu kiến thức tổng quan tính tốn song song, từ tìm hiểu kiến thức xửlýđồhọaGPU cách thức ứngdụngtính tốn 2 Chương 2: Tính tốn song song GPU CUDA Chương cung cấp kiến thức mơi trường lập trình, ngơn ngữ lập trình, cách thiết lập chương trình dẫn hiệu cài đặt ứngdụngtính tốn GPU Chương 3:Tăng tốc độtính tốn số tốn sử dụngGPU Trên cở kiến thức trình bày chương trên, tác giả luận văn tiến hành cài đặt thử nghiệm mô tốn CPU GPU Từ có so sánh, nhận xét lực tính tốn vượt trội GPU so với CPU truyền thống 3 DANH MỤC THUẬT NGỮ Tiếng Anh Tiếng Việt API Application Program Interface: API định nghĩa giao diện chuẩn để triệu gọi tập chức 2coproccessor đồng xửlý 3gpgpu tính tốn thơng dụngGPU 4GPU Bộxửlýđồhọa 5kernel hạt nhân 6MIMD Multiple Instruction Multiple Data: đa lệnh đa liệu 7primary surface Bề mặt chính, khái niệm dùng kết cấu 8proccessor Bộxửlý 9Rasterization Sự quét mành hình 1SIMD Single Instruction Multiple Data: đơn lệnh đa liệu 1stream 1streaming processor 1texture Dòng 1texture fetches 1texture reference 1warp Hàm đọc kết cấu Bộxửlý dòng Kết cấu: cấu trúc đối tượng, xem mơ hình thu nhỏ đốitượng Tham chiếu kết cấu Mỗi khối tách thành nhóm SIMD luồng 4 DANH MỤC HÌNH VẼ Hình 1.1 Mơ tả kiến trúc Von Neumann Hình 1.2 Máy tính song song có nhớ chia sẻ Hình 1.3 Máy tính song song có nhớ phân tán Hình 1.4 Mơ hình kiến trúc máy SISD 10 Hình 1.5 Mơ hình kiến trúc máy SIMD 10 Hình 1.6 Mơ hình kiến trúc máy MISD 11 Hình 1.7 Mơ hình kiến trúc máy MIMD 11 Hình 1.8 Mơ hình lập trình trun thơng hai tác vụ hai máy tính 13 Hình 1.9 Mơ hình lập trình song song liệu 13 Hình 1.10 Ảnh chụp 3dfx Voodoo3 17 Hình 1.11 Kiến trúc GPU NVIDIA AMD có lượng đồ sộ đơn vị lập trình tổ chức song song thống 23 Hình 2.1 Kiến trúc phần mềm CUDA 30 Hình 2.2 Các thao tác thu hồi cấp phát nhớ 31 Hình 2.3 Vùng nhớ dùng chung mang liệu gần ALU 32 Hình 2.4 Sơ đồ hoạt động truyền liệu Host Device 33 Hình 2.5 Khối luồng 35 Hình 2.6 Mơ hình nhớ GPU 36 Hình 2.7 lưới khối với số khối luồng 41 Hình 2.8 Phương pháp đánh số luồng 44 Chương Tổng quan tính tốn song song GPU 1.1 Tổng quan tính tốn song song 1.1.1 Tổng quan tính tốn song song 1.1.1.1 Lịch sử đời tính tốn song song Trong thập niên 60, tảng để thiết kế máy tính dựa mơ hình John Von Neumann , với đơn vị xửlý nối với vùng lưu trữ làm nhớ vàtại thời điểm có lệnh thựcthi Hình 1.1 Mơ tả kiến trúc Von Neumann Với tốn u cầu khả tính tốn lưu trữ lớn mơ hình kiến trúc hạn chế Để tăng cường sức mạnh tính tốn giải tốn lớn có độtính tốn cao, người ta đưa kiến trúc mới, với ý tưởng kết hợp nhiều xửlý vào máy tính, mà hay gọi xửlý song song (Multiprocessor) kết hợp sức mạnh tính tốn nhiều máy tính dựa kết nối mạng (máy tính song songmulticomputer) Kể từ lúc này, để khai thác sức mạnh tiềm tàng mơ hình máy tính nhiều xửlý song song, mơ hình mạng máy tínhxửlý song song giải thuật khơng phù hợp việc xây dựng thiết kế giải thuật song song điều quan trọng Giải thuật song song phân rã cơng việc phần tử xửlý khác 6 1.1.1.2 Tại phải tính tốn song song Theo xu hướng phát triển côngnghệ thông tin, xửlý đa nhân, đa lõi (multiple processor) thay xửlý đơn lõi (single processor) nhiên với lối lập trình truyền thống (lập trình tuần tự), câu lệnh, trình xửlý thực hịên cách lần lượt, không phát huy hết công năng, hiệu vi xửlý đa nhân, đa lõi (multiple processor) Lập trình, tính tốn song song đời lời giải cho yêu cầu, thách thức đặt làm để phát huy công năng, hiệu đa xửlý (multiple processor) Trên thực tế, có nhiều tốn với liệu lớn, độ phức tạp tính tốn cao mà đòi hỏi thời gian xửlý ngắn độ xác cao Ví dụ toán liên quan tới xửlý ảnh, xửlý tín hiệu, dự báo thời tiết, mơ giao thông, mô chuyển động phân tử, nguyên tử, mô đồ gen, toán liên quan đến sở liệu khai thác sở liệu,… vớixửlý đơn lõi khó thực cho kết mong muốn Lập trình, tính tốn song song lời giải đáp cho toán tăng hiệuxửlý đồng thời rút ngắn thời gian xửlýtính tốn người dùng 1.1.1.3 Một số khái niệm xửlý song song Định nghĩa xửlý song song Xửlý song song trình xửlý gồm nhiều tiến trình kích hoạt đồng thời tham gia giảitoán Nói chung, xửlý song song thực hệ thống đa xửlý Phân biệt xửlý song song xửlý Trong tính tốn vớixửlý thời điểm thực phép tốn Trong tính tốn song song nhiều xửlý kết hợp với để giảitoán giảm thời gian xửlý thời điểm thực đồng thời nhiều phép toán Dưới bảng so sánh khác lập trình lập trình song song 62 Tài liệu tham khảo Tài liệu tiếng việt [1] Trương Văn Hiệu (2011), “Nghiên cứugiải thuật song song hệ thống xửlýđồhọaGPU đa lõi”, luận văn thạc sĩ, trường Đại học Đà Nẵng [2] Nguyễn Việt Đức – Nguyễn Nam Giang (2012), ”Xây dựng thuật tốn song song tìm đường ngắn với CUDA”, luận văn thạc sỹ, trường Đại học Cơngnghệ Hồ Chí Minh [3] Nguyễn Thị Thùy Linh (2009), “Tính tốn hiệucaovớixửlýđồhọaGPUứng dụng”, luận văn thạc sĩ, trường Đại học Côngnghệ Hà Nội Tài liệu tiếng anh [4] Jason Sanders, Edward Kandrot, “CUDA by example”, an introduction to GeneralPurpose GPU programming [5] Maciej Matyka, “GPGPU programming on example of CUDA”, Institute of Theoretical Physics University of Wroclaw [6] NVIDIA, “High performance computing with CUDA”, Users Group Conference San Diego, CA June 15, 2009 [7] N K Govindaraju, B Lloyd, W Wang, M Lin, and D Manocha, “Fast computation of database operations using graphics processors,” in Proceedings of the 2004 ACM SIGMOD International Conference on Management of Data, Jun 2004, pp 215–226 [8] "N K Govindaraju, M Henson, M C Lin, and D Manocha, “Interactive visibility ordering of geometric primitives in complex environments,” in Proceedings of the 2005 Symposium on Interactive 3D Graphics and Games, Apr 2005, pp 49– 56." [9] Bustos, O Deussen, S Hiller, and D Keim, “A graphics hardware accelerated algorithm for nearest neighbor search,” in Proceedings of the 6th International Conference on Computational Science, ser Lecture Notes in Computer Science Springer, May 2006, vol 3994, pp 196– 199 [10] Blythe, “The Direct3D 10 system,” ACM Transactions on Graphics, vol 25, no 3, pp 724–734, Aug 2006 [11] Horn, “Stream reduction operations for GPGPU applications,” in GPU Gems 2, M Pharr, Ed Addison Wesley, Mar 2005, ch 36, pp 573–589 [12] Tarditi, S Puri, and J Oglesby, “Accelerator: Using data-parallelism to program GPUs for general-purpose uses,” in Proceedings of the Twelfth International Conference on Architectural Support for Programming Languages and Operating Systems, Oct 2006, pp 325–335 63 Tài liệu mạng [13] PADE, http://math.nist.gov/mcsd/savg/pade/ [14] P-GRADE, http://www.lpds.sztaki.hu/pgrade/ [15] wikipedia http://en.wikipedia.org/wiki/Graphics_processing_unit [16] http://gpgpu.org/ [17] http://ati.amd.com/technology/streamcomputing/gpgpu_history.html (GPGPU history from AMD) [18] http://gpgpu.org/oldsite/data/history.shtml [19] http://www.techradar.com/news/computing-components/processors/world-sfastest-cpu-clocked-at-128-gigaflops-599433 [20] http://www.tomshardware.com/reviews/nvidia-cuda-gpu,1954-2.html [21] http://www.vizworld.com/2009/06/nvidia-and-pgi-partner-to-bring-cuda-tofortran/ [22] http://penstarsys.com/previews/graphics/nvidia/tesla/tesla_2.htm [23] http://www.tomshardware.com/news/Tesla-C1060-S1070,5672.html [24] http://hothardware.com/News/NVIDIA-Unveils-Next-Generation-Fermi-GPUArchitecture/ ... QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN ĐỨC MINH NGHIÊN CỨU GIẢI PHÁP CÔNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ LÝ ĐỒ HỌA GPU VÀ ỨNG DỤNG Ngành: Công nghệ thông tin Chuyên ngành: Kỹ... điện Một công nghệ đa lõi xử lý song song đời xử lý đồ họa GPU (Graphic Processing Unit) GPU ban đầu đời phục vụ cho mục đích xử lý đồ họa, ngành công nghiệp Game Tuy nhiên ngày với công nghệ CUDA... vào khổng lồ tốn u cầu tính thời gian thực thực trở thành vấn đề cấp thiết thực tế Xuất phát từ cầu mà chọn đề tài: NGHIÊN CỨU GiẢI PHÁP CƠNG NGHỆ TÍNH TỐN HIỆU NĂNG CAO VỚI BỘ XỬ LÝ ĐỒ HỌA GPU