Khai phá dữ liệu và học máy với dữ liệu lớ n

Một phần của tài liệu Mô phỏng song song sử dụng khối xử lý đồ họa GPGPU (Trang 32 - 33)

Về sau này, dữ liệu lớn thu hút được sự quan tâm lớn bởi thông tin và tri thức được ẩn giấu trong dữ liệu lớn là chìa khóa cho việc phát triển lợi nhuận kinh doanh và thế giới công nghệ tương lai. Luôn là một thách thức trong việc xử lý với các tập dữ liệu lớn và trích rút các giá trị thông tin ở khía cạnh thời gian. Do đó, việc tăng tốc độ xử lý là một vấn đề được quan tâm lớn. Tất nhiên khai phá dữ liệu và học máy với dữ liệu lớn đã thấy được những triển vọng với kiến trúc GPGPU.

Weinman [22] đã phát triển một thuật toán học máy GPU có thể chạy nhanh hơn 30 lần thuật toán CPU trên cùng một máy tính. Map reduce là một thuật toán phổ thông để xử lý tập dữ liệu online lớn, và được kế thừa bởi Google và Facebook để xử lý một lượng dữ liệu người dùng siêu lớn trên Internet. Map reduce có thể thực hiện trên các máy tính được phân cụm hoặc trên các GPGPU. Stuart [23] đã chỉ ra rằng các cụm máy GPGPU dựa trên map reduce có thể làm tăng tốc tới 8 lần so với hiệu năng tốt nhất của gói map reduce trên CPU.

28 Nằm trong số những lĩnh vực tận dụng kỹ thuật khai phá dữ liệu để

phân tích dữ liệu, ngành tài chính có những yêu cầu và đặc điểm riêng của nó. Ngành tài chính phụ thuộc trầm trọng vào tốc độ cũng như sự chính xác của việc xử lý và tính toán dữ liệu tài chính. Rất nhiều các ứng dụng trong ngành này cần phải xử lý ở thời gian thực. GPGPU lại thấy được vai trò quan trọng trong việc giải quyết những thách thức trong các nhiệm vụ xử lý và phân tích dữ liệu tài chính. Preis và Tobias [24] đã sử dụng GPU để thực hiện chức năng tự tương quan trong phân tích dao động thị trường tài chính và đã tăng tốc tới 40 lần với mô hình của họ. Đây là một cải tiến có ý nghĩa vô cùng quan trọng trong môi trường tài chính cạnh tranh khốc liệt như ngày nay.

Một phần của tài liệu Mô phỏng song song sử dụng khối xử lý đồ họa GPGPU (Trang 32 - 33)

Tải bản đầy đủ (PDF)

(87 trang)