Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
248,03 KB
Nội dung
MAPREDUCE GVHD: TS. Hồ Bảo Quốc Nhóm học viên thực hiện: • Dương Hữu Thành – 1212035 • Phạm Ngọc Vân Anh – 1212001 • Nguyễn Thanh Tòng – 1212039 Nội dung • Giới thiệu MapReduce • Ví dụ cụ thể • Kiến trúc và cách thức hoạt động • Khả năng chịu lỗi (Fault Tolerance) Giới thiệu về MapReduceMapReduce • Là một mô hình lập trình được đề xuất trong các ngôn ngữ lập trình hàm như Lisp, ML. • Một trong những tính năng nổi bật của các ngôn ngữ lập trình hàm là các higher-order function. • Higher-order function là dạng function mà chấp nhận một function khác như là tham số của nó. MapReduce (cont.) • 2 higher-oder function được dùng nhiều trong Lisp là map and fold. • Map và fold thường được dùng kết hợp với nhau MapReduce (cont.) map và fold trong Lisp • (map square ‘(1 2 3 4)) ▫ (1 4 9 16) • (reduce + ‘(1 4 9 16)) ▫ 30 MapReduce (cont.) Map và reduce do Goole đề xuất • map(key, val) ▫ Tạo ra new-key / new-val pairs • reduce(key, vals) ▫ Tạo ra kết quả cuối cùng ▫ Với key/vals là giá trị tạo ra bởi map function. MapReduce (cont.) VÍ DỤ CỤ THỂ Đếm số lần xuất hiện của mỗi từ trong tập các documents [...]... thất bại, master chọn một worker khác để thực hiện lại task Master Failure • Tất cả các map/ reduce task sẽ thất bại • Giải pháp: ▫ Đặt các checkpoint để có thể khởi động lại tại các checkpoint đó Tài liệu tham khảo • Data-Intensive Text Processing with MapReduce Jimmy Lin The iSchool University of Maryland • MapReduce: Simplified Data Processing on Large Clusters - Jeffrey Dean and Sanjay Ghemawat...Đếm số lần xuất hiện của mỗi từ trong tập các documents (cont.) KIẾN TRÚC VÀ CÁCH THỨC HOẠT ĐỘNG Kết hợp giữ Map/ Reduce và GFS • Cách worker lấy dữ liệu để xử lý? ▫ Dữ liệu cần truy xuất lớn ▫ Không đủ memory để load tất cả dữ liệu • Giải pháp: ▫ Don’t move data to workers… Move workers to the data! ▫ Worker sẽ . của nó. Map Reduce (cont.) • 2 higher-oder function được dùng nhiều trong Lisp là map and fold. • Map và fold thường được dùng kết hợp với nhau Map Reduce (cont.) map và fold trong Lisp • (map square. square ‘(1 2 3 4)) ▫ (1 4 9 16) • (reduce + ‘(1 4 9 16)) ▫ 30 Map Reduce (cont.) Map và reduce do Goole đề xuất • map( key, val) ▫ Tạo ra new-key / new-val pairs • reduce( key, vals) ▫ Tạo ra kết quả. MAP REDUCE GVHD: TS. Hồ Bảo Quốc Nhóm học viên thực hiện: • Dương Hữu Thành – 1212035 • Phạm Ngọc Vân Anh – 1212001 • Nguyễn Thanh Tòng – 1212039 Nội dung • Giới thiệu Map Reduce •