1. Trang chủ
  2. » Công Nghệ Thông Tin

TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO Massive Parallel Processing for Large Scale Database

18 436 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • Massive Parallel Processing for Large Scale Database

  • Các nội dung trình bày

  • Sự cần thiết của MPP và Large Scale Database

  • Phương hướng thực thi MPP

  • MapReduce

  • Ví dụ MapReduce

  • Một số hệ thống cơ sở dữ liệu thực thi MPP

  • HadoopDB

  • Kiến trúc của HadoopDB

  • Truy vấn dữ liệu trên HadoopDB

  • Aster Data Database

  • Slide 12

  • Slide 13

  • SQL-MapReduce Function

  • SQL-MapReduce Function

  • Slide 16

  • Tham khảo

  • Slide 18

Nội dung

1 Massive Parallel Processing for Large Scale Database Giảng viên : Nguyễn Hà Nam Nhóm 12 : Lê Hồng Hà Đào Thị Thu Hiền 2 Các nội dung trình bày  Sự cần thiết của MPP và Large Scale Database  Phương hướng thực thi MPP  Một số hệ thống cơ sở dữ liệu thực thi MPP hiện nay 3 Sự cần thiết của MPP và Large Scale Database  Có rất nhiều những dịch vụ trên thế giới cho phép người dùng có thể truy cập bất cứ nơi đâu, bất cứ lúc nào.  Công nghệ Web Service phát triển nhanh chóng.  DBMS sử dụng đơn CPU không thể xử lý hiệu quả lượng dữ liệu cỡ terabyte ở tốc độ hàng chục nghìn TPS.  Dễ dàng mở rộng lên tới hàng nghìn node 4 Phương hướng thực thi MPP  Kiến trúc Share-nothing  Parallel DBMS  Mô hình lập trình MapReduce 5 MapReduce  Là một mô hình lập trình được giới thiệu bởi Google  Dùng để xử lý, phân tích song song lượng dữ liệu lớn, phân tán trên hàng nghìn máy khác nhau  Cấu trúc gồm có hàm Map và Reduce 6 Ví dụ MapReduce 7 Một số hệ thống cơ sở dữ liệu thực thi MPP  HadoopDB  Aster Data Database 8 HadoopDB  Dựa trên SQL và hệ thống Hadoop (MapReduce)  Sử dụng RDBMS  Sử dụng Hive để thực thi pseudo-SQL trên HDFS (Hadoop Distributed File System)  Có khả năng mở rộng tốt giống như Hadoop trong khi vẫn đảm bảo được hiệu năng tốt trong phân tích dữ liệu 9 Kiến trúc của HadoopDB 10 Truy vấn dữ liệu trên HadoopDB [...]... WordCount ( ON (select line from book_table) ) GROUP BY word 16 Tham khảo     http://www.asterdata.com/ http://db.cs.yale.edu/hadoopdb/hadoopd b.html http://www.cubrid.org/blog/devplatform /database- technology -for- largescale-data/ http://hadoop.apache.org/ 17 Xin chân thành cảm ơn! 18 ...Aster Data Database 11 Aster Data Database   Aster Data Database hỗ trợ SQLMapReduce và SQL chuẩn Các hàm MapReduce có thể tích hợp vào trong SQL SELECT FROM functionname( ON table-or-query [ PARTITION BY expr ] [ ORDER BY expr ] [ clausename ( arg ) ] ) 12 Aster Data Database 13 SQL-MapReduce Function 14 SQL-MapReduce Function 15 SQL-MapReduce . 1 Massive Parallel Processing for Large Scale Database Giảng viên : Nguyễn Hà Nam Nhóm 12 : Lê Hồng Hà Đào Thị Thu Hiền 2 Các nội dung trình bày  Sự cần thiết của MPP và Large Scale Database  Phương. được hiệu năng tốt trong phân tích dữ liệu 9 Kiến trúc của HadoopDB 10 Truy vấn dữ liệu trên HadoopDB 11 Aster Data Database 12 Aster Data Database  Aster Data Database hỗ trợ SQL- MapReduce và. lượng dữ liệu lớn, phân tán trên hàng nghìn máy khác nhau  Cấu trúc gồm có hàm Map và Reduce 6 Ví dụ MapReduce 7 Một số hệ thống cơ sở dữ liệu thực thi MPP  HadoopDB  Aster Data Database 8 HadoopDB  Dựa

Ngày đăng: 08/07/2015, 16:08

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w