1. Trang chủ
  2. » Công Nghệ Thông Tin

Xây dựng các dịch vụ tin sinh học trên nền tảng điện toán đám mây

67 266 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 3,33 MB

Nội dung

Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng MỤC LỤC MỤC LỤC L I M ĐO N .3 L I CẢM ƠN .4 DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC HÌNH VẼ DANH MỤC CÁC BẢNG PHẦN MỞ ĐẦU Lý chọn đề tài .9 Mục tiêu nhiệm vụ nghiên cứu 10 Bố cục luận v n .10 HƢƠNG TỔNG QUAN VỀ TIN SINH VÀ ĐIỆN TOÁN ĐÁM MÂY 11 1.1 Tổng quan điện toán đám mây 11 1.1.1 Khái niệm 11 1.1.2 Các mơ hình dịch vụ triển khai 13 1.2 Tổng quan toán tin sinh học 18 1.2.1 Khái niệm 18 1.2.2 Các mơ hình tin sinh truyền thống 21 1.3 Nhiệm vụ luận v n 22 HƢƠNG DỊCH VỤ, ỨNG DỤNG TRONG MÔI TRƢ NG Đ ĐÁM MÂY25 2.1 Môi trƣờng đa đám mây 26 2.1.1 Khái niệm 26 2.1.2 Mô hình đa đám mây .28 2.1.3 Mơ hình đa đám mây triển khai thực tiễn 32 2.2 Các yếu tố cần thiết thiết kế môi trƣờng điện tốn đa đám mây 35 2.2.1 Tính khả mở (scalability) 36 2.2.2 Tính khả chuyển (portability) 36 2.2.3 Tính chuẩn hoá (standarization) 37 2.3 Hƣớng tiếp cận 42 HƢƠNG MÔ HÌNH ĐỀ XUẤT CHUYỂN DỊCH ỨNG DỤNG TIN SINH TRÊN MÔI TRƢ NG Đ ĐÁM MÂY 43 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật 3.1 GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Kiến trúc tổng quan 43 3.1.1 Mơ hình thành phần 44 3.1.2 Luồng nghiệp vụ 47 3.2 Bài toán tối ƣu tài nguyên sử dụng 48 3.2.1 Mơ tả tốn 48 3.2.2 Tiền đề .49 3.2.3 Mô hình, giải thuật đề xuất 50 3.3 Thử nghiệm 54 3.3.1 Giao diện tin sinh đám mây 54 3.3.2 Kết thử nghiệm mơ hình tối ƣu tài ngun 58 KẾT LUẬN .62 A Kết luận .62 B Hƣớng phát triển đề tài 63 TÀI LIỆU THAM KHẢO 64 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng LỜI CAM ĐOAN Tác giả luận v n xin cam đoan cơng trình nghiên cứu riêng tác giả luận v n; đúc kết trình nghiên cứu từ việc tập hợp nguồn tài liệu, kiến thức học đến việc tự thu thập thông tin liên quan liên hệ thực tế t i đơn vị công tác Các số liệu, kết nêu luận v n trung thực chƣa đƣợc công bố cơng trình khác Tác giả luận v n xin cam đoan giúp đỡ cho việc thực Luận v n đƣợc cảm ơn thơng tin trích dẫn Luận v n đƣợc rõ nguồn gốc Tác giả luận v n xin chịu trách nhiệm nghiên cứu H cv Giảng viên hƣớng dẫn Nguyễn Hữu Đức t c ệ uậ v Lê Quang Hiếu H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng LỜI CẢM ƠN Trƣớc tiên, – tác giả luận v n xin đƣợc gửi lời cảm ơn đến Q Thầy/Cơ giảng d y chƣơng trình đào t o th c sỹ, Viện Công Nghệ Thông Tin Truyền Thông, Đ i học Bách Khoa Hà Nội, ngƣời tận tình truyền đ t kiến thức q trình tơi học tập Đây vốn kiến thức thực hữu ích, khơng làm tảng cho q trình nghiên cứu khóa luận, mà cịn hành trang giúp vững bƣớc đƣờng ho t động l nh vực Công nghệ thông tin nói riêng sống nói chung Với tất lịng kính trọng biết ơn, tơi xin đƣợc gửi lời cảm ơn chân thành tới TS Nguyễn Bình Minh, TS Nguyễn Hữu Đức TS Dỗn Trung Tùng – ngƣời định hƣớng, hƣớng dẫn cho ngày đầu thực luận v n Mặc dù q trình thực luận v n, có giai đo n khó kh n khơng thuận lợi, nhƣng lời động viên, hƣớng dẫn quý báu thầy giúp tơi vƣợt qua hồn thành luận v n Cuối xin gửi lời biết ơn sâu sắc đến gia đình, b n bè, cộng đồng nguồn mở Vietnam OpenStack – ngƣời bên c nh giúp đỡ t o điều kiện tốt cho tơi suốt q trình học tập nhƣ thực luận v n Do thời gian có h n kinh nghiệm nghiên cứu khoa học chƣa nhiều nên luận v n nhiều thiếu sót, mong nhận đƣợc ý kiến góp ý Quý Thầy ô b n học viên H c viên th c luậ v Lê Quang Hiếu H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Diễn giả ý g ĩa ĐTĐM Điện toán đám mây IaaS Infrastructure as a Service – H tầng nhƣ dịch vụ PaaS Platform as a Service – Nền tảng nhƣ dịch vụ SaaS Software as a Service – Phần mềm nhƣ dịch vụ EGI European Grid Infrastructure – Tổ chức phi lợi nhuận quản lý h tầng m ng lƣới Châu Âu OCCI Open Cloud Computing Interface – Chuẩn giao diện quản trị h tầng điện toán đám mây CDMI Cloud Data Management Interface – Chuẩn giao diện quản trị liệu đám mây OVF Open Virtualization Format – Chuẩn định d ng ổ đ a ảo SSO Single Sign-On – Cách thức đ ng nhập đồng cho nhiều dịch vụ EIRO European Intergovernmental Research Organisation – Tổ chức nghiên cứu liên quốc gia Châu Âu GLUE2 Grid Laboratory for Uniform Environment – Chuẩn giao tiếp lƣới OSS Open Source Software – Phần mềm mã nguồn mở HPC High Performance Computing – Tính toán hiệu n ng cao AWS Amazon Web Service – Dịch vụ ĐTĐM công cộng Amazon API Application Program Interface – Giao diện ứng dụng chƣơng trình CAL Cloud Abstract Layer – Lớp trừu tƣợng hoá ĐTĐM OPS OpenStack SDK Software Development Kit – Bộ công cụ phát triển phần mềm ACS Apache Cloud Stack – tảng ĐTĐM mã nguồn mở BIMI Bio Informatic Management Interface – Chuẩn giao diện quản trị tin H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng sinh SNIA Storage Networking Industry Association – Tổ chức công nghiệp lƣu trữ truyền dẫn XML eXentensible Markup Language OOP Object Oriented Programming – Lập trình hƣớng đối tƣợng CLI Command Line Interface – Giao diện dòng lệnh GA- Genetic Algorith – Back Propagation Neural Network: M ng nơ-ron lan BPNN truyền ngƣợc kết hợp giải thuật di truyền PD- Periodicity Detection - Genetic Algorith Back Propagation: Giải thuật GABP phát chu kỳ sử dụng lan truyền ngƣợc kết hợp giải thuật di truyền DFT Discrete Fourier Transform – Biến đổi rời r c Fourier JSON Java Script Object Notation – Định d ng liệu Java Script H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Dỗn Trung Tùng DANH MỤC HÌNH VẼ Hình Mơ hình điện tốn đám mây 15 Hình Quy trình nghiên cứu dự án Metagenomics 19 Hình Mơ hình điện tốn đa đám mây 28 Hình Mơ hình chức n ng mơ hình đa đám mây 29 Hình Mơ hình đa đám mây EGI 34 Hình Mơ hình thử nghiệm đa đám mây Nimbus Grid'5000 35 Hình Vai trị, vị trí OCCI kiến trúc .38 Hình Vai trị DMI mơ hình lƣu trữ phân tán .39 Hình Định d ng OVF 40 Hình 10 Mơ hình thành phần ứng dụng tin sinh 45 Hình 11 Luồng nghiệp vụ ứng dụng tin sinh 47 Hình 12 Mơ hình m ng nơ-ron nhiều tầng .51 Hình 13 Đ ng nhập vào giao diện Web 55 Hình 14 Giao diện Web Tin sinh .55 Hình 15 Khởi t o luồng nghiệp vụ 56 Hình 16 Cấu hình cho cơng cụ tin sinh .56 Hình 17 Đặc tả JSON luồng nghiệp vụ tin sinh 57 Hình 18 Thông báo hệ thống bắt đầu ch y luồng tin sinh 57 Hình 19 Thơng báo hệ thống luồng tin sinh hoàn thành 57 Hình 20 Thơng báo hệ thống luồng tin sinh gặp lỗi 58 Hình 21 Dữ liệu đầu bƣớc lƣu môi trƣờng đám mây 58 Hình 22 Kết dự báo mơ hình BPNN với kích thƣớc vùng trƣợt 59 Hình 23 Kết dự báo GA-BPNN với p=4 59 Hình 24 So sánh tỉ lệ lỗi MEAN GA-BPNN BPNN 60 Hình 25 Kết dự đốn PD-GABP với p=4 60 Hình 26 So sánh tỉ lệ lỗi MEAN GA-BPNN PD-GABP 60 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng DANH MỤC CÁC BẢNG Bảng Định d ng SCUFL2 .42 Bảng Trừu tƣợng hoá đối tƣợng máy ảo .43 Bảng Trừu tƣợng hoá đối tƣợng cụm máy ảo .44 Bảng Mô tả BIMI API 46 Bảng So sánh độ xác BPNN GA-BPNN với giá trị vùng trƣợt khác 60 Bảng So sánh độ xác GA-BPNN PD-GABP với giá trị vùng trƣợt khác 61 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng PHẦN MỞ ĐẦU Lý c đề tà Trong vài n m qua, ông nghệ thông tin bắt đầu mẫu hình – Cloud computing (điện toán đám mây - ĐTĐM) Mặc dù ĐTĐM cách khác để cung cấp tài nguyên máy tính, khơng phải cơng nghệ hồn tồn mới, nhƣng châm ngịi cách m ng cách cung cấp thông tin dịch vụ tổ chức Tuy nhiên, cách m ng này, giống nhƣ cách m ng, có thành phần khứ mà từ phát triển lên Trong giới ĐTĐM, có chỗ cho cộng tác sang t o công nghệ đám mây, cho tiện ích qua thử thách hệ thống tiền thân thống trị cơng nghệ thơng tin, ví dụ nhƣ máy tính lớn m nh mẽ (mainframe) Sự thay đổi thực cách tính tốn mang l i hội to lớn cho nhân viên công nghệ thơng tin để kiểm sốt thay đổi sử dụng chúng cho lợi ích cá nhân tổ chức họ Các toán tin sinh, cụ thể toán Metagenomics l nh vực nghiên cứu tƣơng đối mẻ t i Việt Nam Tuy nhiên, trung tâm nghiên cứu nhƣ nhà khoa học Việt Nam bƣớc tiếp cận với công nghệ giải trình tự hệ Các nhóm nghiên cứu tin sinh học tiếp tục đƣợc thành lập phát triển t i viện nghiên cứu trƣờng đ i học lớn t i Việt Nam nhƣ Đ i học công nghệ, ĐHQGHN, Học viện bƣu viên thơng, Đ i học sƣ ph m Hà Nội, Viện Công nghệ thông tin Những nghiên cứu thực chủ yếu tập trung vào nhóm tồn cho đơn hệ gen (genomics) Tuy nhiên, vấn đề tảng h tầng môi trƣờng phục vụ nghiên cứu tin sinh khiến cho việc nghiên cứu cơng nghệ trở nên khó kh n Bởi vậy, việc đƣa công cụ tin sinh chuyên biệt lên đám mây thành dịch vụ giúp cho nhiều chuyên gia Việt Nam sử dụng vào nghiên cứu tốn cần tính tốn nhu cầu chia sẻ liệu sinh học nhằm thúc đẩy phát triển ngành tin sinh học nƣớc H cv Lê Quang Hiếu Luận v n th c s kỹ thuật Mục t u ệm vụ g GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng cứu Mục tiêu đề tài xây dựng tảng đám mây cung cấp dịch vụ tin sinh học cụ thể cho toán tin sinh siêu gen địi hỏi khối lƣợng tính tốn liệu cực lớn Các dịch vụ ch y độc lập phối hợp với luồng cơng việc Dữ liệu đƣợc bảo mật đƣợc chia sẻ dịch vụ ngƣời sử dụng dịch vụ Ngoài ra, đề tài đề xuất cách tiếp cận giúp cải thiện toán tối ƣu hoá tài nguyên sử dụng Bố cục uậ v Luận v n gồm 03 chƣơng:  hƣơng 1: Tổng quan tin sinh điện toán đám mây  hƣơng 2: Dịch vụ, ứng dụng môi trƣờng đa đám mây  hƣơng 3: Mơ hình đề xuất chuyển dịch ứng dụng tin sinh môi trƣờng đa đám mây 10 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật  GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Lựa chọn cá thể xuất sắc sử dụng phƣơng pháp lựa chọn Roulette để xác định xác suất cá thể dƣợc chọn Xác suất lựa chọn đƣợc tính s kích thƣớc quần thể, fi giá trị theo công thức nghịch đảo giá trị mục tiêu cá thể 3.2.3.2 Giải thuật PD-GABP Giải thuật GA-BPNN có hƣớng tiếp cận cải thiện độ xác phƣơng pháp truyền thống BP GA, nhiên thực nghiệm hiệu n ng thực thi giải thuật chƣa cao, vậy, luận v n hƣớng tới sử dụng phƣơng pháp xác định chu kỳ lặp liệu (Period Detection – PD) nhằm t ng hiệu n ng cho giải thuật GA-BPNN PD sử dụng phƣơng pháp UTOPERIOD [15] để ƣớc lƣợng chu kỳ lặp tập liệu Phƣơng pháp bao gồm hai bƣớc: thứ nhất, sử dụng hàm tính biểu đồ chu kỳ (periodogram) để xác định điểm điểm dừng chu kỳ, đƣợc gọi hints Hàm biểu đồ chu kỳ đƣợc tính sử dụng DFT (biến đổi Fourier rời r c) theo công thức: Trong P hàm biểu đồ chu kỳ, X biến đổi Fourier rời r c chuỗi x(n), n = 0, N − Sau đó, dự đốn hint khơng xác, giá trị dự đốn đƣợc đƣợc kiểm chứng sử dụng hàm tƣơng quan tự động ACF (Auto-Correlation Function) Nếu giá trị nằm đƣờng ACF, giá trị đƣợc xác thực Hàm ACF với chuỗi x(n) đƣợc xác định công thức: 53 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Dỗn Trung Tùng độ phức t p tính tốn ACF P sử dụng DFT Nếu có tồn t i giá trị hợp lệ, nhƣ tập liệu có chu kỳ, khơng tồn t i tập liệu đƣợc xác định khơng có chu kỳ Trong trƣờng hợp tập liệu có chu kỳ, giả sử T1 T2,…, Tr tập giá trị xác định pha xác định chu kỳ lặp liệu, ta định ngh a véc-tơ đầu vào gồm p phần từ liên tục khứ y(t), y(t−1),…, y(t−p) vùng trƣợt Các giá trị m chu kỳ y(t+k-T1), y(t+k-2T1),… y(t+k-mT1), y(t+k-T2), y(t+k-2T2),… y(t+k-mT2), , y(t+k-Tr), y(t+k-2Tr),… y(t+k-mTr) đƣợc gọi giá trị đầu vào theo chu kỳ Khi đó, m ng nơ-ron thực hàm ánh x phi tuyến sau: Giải thuật PD-GABP bao gồm bƣớc mô tả giả mã sau: Algorithm: PD-GABP 1: 2: 3: 4: 5: 6: 7: 8: Tính tốn chu kỳ sử dụng phƣơng pháp UTOPERIOD if chuỗi liệu đƣợc xác định có chu kỳ then Xác định véc-tơ đầu vào cho m ng: y(t), y(t−1),…, y(t−p), y(t+k-T1), y(t+k2T1),… y(t+k-mT1), y(t+k-T2), y(t+k-2T2),… y(t+k-mT2), , y(t+k-Tr), y(t+k2Tr),… y(t+k-mTr) else Xác định véc-tơ đầu vào cho m ng: y(t), y(t−1),…, y(t−p) end if Xác định giá trị đầu m ng: y(t+k) Huấn luyện m ng sử dụng giải thuật GA-BP 3.3 T g ệm 3.3.1 Giao diện tin sinh đám mây Môi trƣờng thử nghiệm với L BIMI nhƣ sau:  Nền tảng: OpenStack Kilo  Workflow engine: sử dụng OpenStack Mistral engine tự phát triển  Ảo hoá: Docker Container 1.8  Điều phối: OpenStack Heat 54 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật  GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Giao diện ngƣời dùng: OpenStack Horizon thƣ viện gojs Dƣới hình ảnh bƣớc thực hiện: Hình 13 Đ g ập vào g ao d ệ Web Hình 14 G ao d ệ Web T s 55 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Dỗn Trung Tùng Hình 15 K tạo uồ g g ệp vụ mớ Hình 16 Cấu ì c o g cụ t s Việc cấu hình công cụ tin sinh giao diện Web tƣơng tự nhƣ PI BIMI đƣợc mô tả phần 56 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Dỗn Trung Tùng Hình 17 Đặc tả JSON uồ g g ệp vụ t s Giao diện cung cấp chế lƣu tái luồng nghiệp vụ tin sinh dựa vào liệu đặc tả JSON nhƣ hinh Sau cấu hình xong, ngƣời dùng lựa chọn khởi ch y (RUN) Hình 18 T ô g báo ệ t ố g k bắt đầu c ạy uồ g t Hình 19 T ô g báo ệ t ố g k uồ g t 57 s H cv s oà t ành Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Hình 20 T g báo ệ t ố g k uồ g t Hình 21 Dữ ệu đầu từ g bƣớc ƣu tr s gặp ỗ mô trƣờ g đám mây 3.3.2 Kết thử nghiệm mô hình tối ưu tài ngun Mơi trƣờng thử nghiệm sử dụng liệu giám sát tài nguyên website World Cup 1998 [23] Tập liệu thời gian bao gồm số lƣợng request gửi tới website 10 phút Luận v n tính tốn dự đốn số lƣợng request 10 phút dựa vào liệu khứ Tập liệu huấn luyện m ng từ ngày 40 đến ngày thứ 46, liệu từ ngày 46 đến 47 đƣợc dự báo so sánh Cấu hình cho GA BP nhƣ sau: kích thƣớc tập Psize=225, tỉ lệ lai ghép PC=0.9, tỉ lệ đột biến PM=0.01, tỉ lệ học η=0.000001 Dữ liệu đầu vào m ng đƣợc chuẩn hoá [16] theo công thức sau: 58 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật đó, GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng giá trị nguyên giá trị chuẩn hoá Độ xác mơ hình dự báo đƣợc đánh giá giá trị:  Root mean square error (RMSE): [21] [24]  Mean absolute percentage error (MAPE): [21]  Mean absolute error (MAE): [24] Kết thực nghiệm nhƣ sau: Hình 22 Kết d báo mơ ì BPNN vớ kíc t ƣớc vù g trƣợt Hình 23 Kết d báo GA-BPNN vớ p=4 59 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Hình 24 So sá tỉ ệ ỗ MEAN g ữa GA-BPNN BPNN Hình 25 Kết d đố PD-GABP vớ p=4 Hình 26 So sá tỉ ệ ỗ MEAN g ữa GA-BPNN PD-GABP BPNN p=2 p=4 p=6 RMSE 328554.33 120275.67 328554.33 MAE 210424.84 69521.13 210425.17 MAPE 1.65 0.13 1.63 GA BPNN p=2 p=4 p=6 RMSE 328552.29 104314.704 297306.04 MAE 210383.97 65649.54 175616.01 MAPE 1.63 0.12 0.98 Bả g So sá độ c í xác g ữa BPNN GA-BPNN vớ g trị vù g trƣợt k ác au 60 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Dỗn Trung Tùng Có thể thấy, GA-BPNN cung cấp giá trị dự báo sát so với phƣơng pháp BPNN thông thƣờng Thêm nữa, bảng giá trị lỗi GA-BPNN nhỏ BPNN với kích thƣớc vùng trƣợt thử nghiệm khác GA-BPNN p=2 p=4 p=6 RMSE 328552.29 104314.704 297306.04 MAE 210383.97 65649.54 175616.01 MAPE 1.63 0.12 0.98 PD-GABP p=2 p=4 p=6 RMSE 70656.17 47109.41 60548.61 MAE 33742.82 23425.64 31186.69 MAPE 0.07 0.06 0.07 Bả g So sá độ c í xác g ữa GA-BPNN PD-GABP vớ g trị vù g trƣợt k ác au Tƣơng tự, độ xác q trình dự báo PD-GABP cho thấy sát nhiều so với hai phƣơng pháp Thêm nữa, nhƣ giá trị lỗi so sánh BPNN GA-BPNN không chênh lệch PD-G BP bé nhiều so với GA-BPNN Điều chứng tỏ PD-GABP có cải thiện so với hai phƣơng pháp 61 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng KẾT LUẬN A Kết uậ Luận v n tốt nghiệp tác giả với đề tài: Xây dựng dịch vụ tin sinh mơi trƣờng điện tốn đám mây giải đƣợc vấn đề sau: Chuyển dịch ứng dụng tin sinh truyền thống lên môi trƣờng đa đám mây dựa phƣơng pháp tổng quát Thiết kế giải thuật PD-GABP cải thiện hiệu n ng độ xác tốn tối ƣu tài nguyên sử dụng chuyển dịch ứng dụng, dịch vụ lên mơi trƣờng điện tốn đa đám mây Tiến hành thử nghiệm mơ hình chuyển dịch đánh giá giải thuật đề xuất Các kết đ t đƣợc đề tài: Đề xuất mơ hình chứng minh tính phù hợp thiết kế hệ thống tin sinh môi trƣờng đa đám mây Xây dựng hệ thống thử nghiệm h tầng LAB Trung tâm tính tốn hiệu n ng cao, Đ i học Bách Khoa Hà Nội Giải thuật PD-GABP tối ƣu, so sánh với GA-BPNN BPNN Nhữ g k ó k gặp phải trình th c hiệ đề tài:  Đề tài đƣa mơ hình phƣơng pháp tổng quát để chuyển dịch ứng dụng, dịch vụ truyền thống lên môi trƣờng đa đám mây, thử nghiệm trƣớc mắt với toán tin sinh Tuy nhiên, mơi trƣờng thử nghiệm đa đám mây đa phần đƣợc xây dựng từ tảng ĐTĐM nội nhƣ OpenStack, kết thử nghiệm chƣa chứng minh đƣợc hồn tồn tính tổng qt hố  Đối với toán tối ƣu hoá tài nguyên sử dụng môi trƣờng ĐTĐM, liệu thử nghiệm sử dụng tập request tới máy chủ dịch vụ web World Cup 1998 Tuy nhiên, tập liệu gồm tham số đặc trƣng request khoảng thời gian cố định Trong thực tế với môi trƣờng điện toán đa đám mây, liệu tài nguyên sử dụng máy chủ thƣờng gồm 62 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng nhiều tham số nhƣ PU, R M liệu thời gian thực, tính theo đơn vị giây, với tập liệu liên tục nhƣ cần kiểm chứng l i phƣơng pháp đề xuất Hiện nay, liệu thử nghiệm liên tục nhƣ chƣa có đơn vị cung cấp Hƣớng giải quyết:  Để tổng qt hố mơ hình đề xuất, cần thử nghiệm với môi trƣờng đa đám mây đa d ng Hiện thời, tảng nguồn mở OpenStack sử dụng để triển khai ĐTĐM nội hỗ trợ nhiều d ng API khác ngo i trừ novaapi, hƣớng giải cài đặt sử dụng OpenStack với nhiều máy, máy sử dụng lo i API cần kiểm thử để mô môi trƣờng đa đám mây  Phối hợp với số đơn vị t i Việt Nam triển khai đám mây nội bộ, hợp tác để đơn vị cung cấp liệu giám sát h tầng vòng vài tháng Hiện nay, luận v n thu thập đƣợc liệu thử nghiệm VNPT, thử nghiệm cách bóc tách liệu chuẩn cho nghiên cứu sau B Hƣớ g p át tr ể đề tà Đối với mơ hình tổng qt hố đƣợc đề xuất luận v n, cần thử nghiệm mơ hình d ng tốn chuyển dịch khác, ví dụ nhƣ IoT (Internet of Thing), xử lý liệu lớn (Big Data Analytics) phát triển hoàn thiện L với mục đích dễ dàng thích nghi với nhiều d ng toán chuyển dịch khác sau Đối với mơ hình giải thuật dự đốn, luận v n hoàn thành bƣớc đầu tốn tối ƣu tài ngun sử dụng Để hồn thiện mơ hình giải thuật đề xuất giải đƣợc toán tối ƣu nhất, cần đƣa chế để lƣu trữ, thực thi quản lý kho tài nguyên tri thức Bƣớc tiếp theo, sau pha dự đoán liệu khoảng thời gian tƣơng lai nghiên cứu mơ hình hệ chun gia, gợi ý ngƣời sử dụng hành vi phù hợp với ngữ cảnh xảy dự báo 63 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng TÀI LIỆU THAM KHẢO [1] Nguyen, Binh Minh; Tran, Dinh Viet and Hluchý, Ladislav Abstraction Layer for Development and Deployment of Cloud Services In: Computer Science Journal, 2012, vol 3, no 3, p 80-88, ISSN 1508-2806 [2] Nguyen, Binh Minh; Dao, Quang Minh Towards a Semantic Model of Resource in Cloud Environment In proceeding of 5th International Symposium on Information and Communication Technology (SOICT), ACM, Hanoi, 2014, p 271279, ISBN: 978-1-4503-2930-9 [3] Nguyen, Binh Minh; Tran, Dinh Viet and Hluchý, Ladislav Programmable Workflow Composition In proceeding of 2nd International Conference on Next Generation Information Technology, IEEE, Gyeongju, 2011, p 86-89, ISBN 97889-88678-38-1 [4] Islam, Sadeka, et al "Empirical prediction models for adaptive resource provisioning in the cloud." Future Generation Computer Systems 28.1 (2012): 155162 [5] Huang, Jinhui, Chunlin Li, and Jie Yu "Resource prediction based on double exponential smoothing in cloud computing." Consumer Electronics, Communications and Networks (CECNet), 2012 2nd International Conference on IEEE, 2012 [6] Vazquez, Carlos, Ram Krishnan, and Eugene John "Time series forecasting of cloud data center workloads for dynamic resource provisioning." Journal of Wireless Mobile Networks, Ubiquitous Computing, and Dependable Applications (JoWUA) 6.3 (2015): 87-110 [7] Roy, Nilabja, Abhishek Dubey, and Aniruddha Gokhale "Efficient autoscaling in the cloud using predictive models for workload forecasting."Cloud Computing (CLOUD), 2011 IEEE International Conference on IEEE, 2011 64 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng [8] Hornik, Kurt, Maxwell Stinchcombe, and Halbert White "Multilayer feedforward networks are universal approximators." Neural networks 2.5 (1989): 359-366 [9] Venkatesan, D., K Kannan, and R Saravanan "A genetic algorithm-based artificial neural network model for the optimization of machining processes."Neural Computing and Applications 18.2 (2009): 135-140 [10] Ding, Shifei, Chunyang Su, and Junzhao Yu "An optimizing BP neural network algorithm based on genetic algorithm." Artificial Intelligence Review36.2 (2011): 153-162 [11] Fu, Zemin, et al "Using genetic algorithm-back propagation neural network prediction and finite-element model simulation to optimize the process of multiplestep incremental air-bending forming of sheet metal." Materials & design 31.1 (2010): 267-277 [12] Huang, Yuansheng, Yufang Lin, and Zilong Qiu "Freight prediction model based on GABP neural network." Computational Intelligence and Design, 2008 ISCID'08 International Symposium on Vol IEEE, 2008 [13] Ali-Eldin, Ahmed, et al "Workload classification for efficient auto-scaling of cloud resources." Department of Computer Science, Umea University, Umea, Sweden, Tech Rep (2013) [14] [2002-53.pdf] Berberidis, Christos, et al "Multiple and partial periodicity mining in time series databases." ECAI Vol 2002 [15] Vlachos, Michail, S Yu Philip, and Vittorio Castelli "On Periodicity Detection and Structural Periodic Similarity." SDM Vol 2005 [16] Zhang, Guoqiang, B Eddy Patuwo, and Michael Y Hu "Forecasting with artificial neural networks:: The state of the art." International journal of forecasting 14.1 (1998): 35-62 65 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật [17] GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Montana, David J., and Lawrence Davis "Training Feedforward Neural Networks Using Genetic Algorithms." IJCAI Vol 89 1989 [18] Rumelhart, D.E., and J.L McClelland, eds., 1986 Parallel Distributed Processing: Explorations in the Microstructure of Cognition, vol 1, Cambridge, MA: MIT Press [19] Faraway, Julian, and Chris Chatfield "Time series forecasting with neural networks: a comparative study using the airline data." Applied statistics(1998): 231-250 [20] Kihoro, J M., R O Otieno, and C Wafula "Seasonal time series forecasting: A comparative study of ARIMA and ANN models." AJST 5.2 (2004) [21] Armstrong, J Scott, and Fred Collopy "Error measures for generalizing about forecasting methods: Empirical comparisons." International journal of forecasting 8.1 (1992): 69-80 [22] Hamzaỗebi, okun "Improving artificial neural networks performance in seasonal time series forecasting." Information Sciences 178.23 (2008): 4550-4559 [23] Arlitt, Martin, and Tai Jin "A workload characterization study of the 1998 world cup web site." Network, IEEE 14.3 (2000): 30-37 [24] Hyndman, Rob J., and Anne B Koehler "Another look at measures of forecast accuracy." International journal of forecasting 22.4 (2006): 679-688 [25] Nguyen, Minh Binh, Viet Tran, and Ladislav Hluchy "A generic development and deployment framework for cloud computing and distributed applications." Computing and Informatics 32.3 (2013): 461-485 [26] Nguyen, Binh Minh; Tran, Dang; Nguyen, Quynh, "A Strategy for Server Management to Improve Cloud Service QoS," in Distributed Simulation and Real Time Applications (DS-RT), 2015 IEEE/ACM 19th International Symposium on , vol., no., pp.120-127, 14-16 Oct 2015 66 H cv Lê Quang Hiếu Luận v n th c s kỹ thuật [27] GVHD: TS Nguyễn Hữu Đức – TS Doãn Trung Tùng Hipel, Keith W., and A Ian McLeod Time series modelling of water resources and environmental systems Vol 45 Elsevier, 1994 [28] Engle, Robert F "Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation." Econometrica: Journal of the Econometric Society (1982): 987-1007 [29] H Tong, Threshold Models in Non-Linear Time Series nalysis , Springer-Verlag, New York, 1983 67 H cv Lê Quang Hiếu ... 1.1.2.2 Các mơ hình dịch vụ Khái niệm điện toán đám mây đƣợc xây dựng tầng, tầng cung cấp chức n ng riêng Sự phân tầng cung cấp sở để điện toán đám mây định lƣợng đƣợc dịch vụ cung cấp Dịch vụ mà điện. .. đa đám mây tính chuẩn hố ứng dụng, dịch vụ Đối với toán tin sinh, đặc thù toán luồng xử l nghiệp vụ tin sinh dựa nhiều thƣ viện, công cụ tin sinh nhƣ BL ST, lustal Khi xây dựng chuyển dịch toán. .. ích mà điện toán đám mây đem l i to lớn áp dụng nhiều l nh vực, từ học tập nghiên cứu đến kinh doanh Trong d ng dịch vụ cung cấp điện tốn đám mây SaaS dịch vụ hƣớng đến ngƣời dùng cá nhân Các phần

Ngày đăng: 25/07/2017, 21:57

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Nguyen, Binh Minh; Tran, Dinh Viet and Hluchý, Ladislav. Abstraction Layer for Development and Deployment of Cloud Services. In: Computer Science Journal, 2012, vol. 3, no. 3, p. 80-88, ISSN 1508-2806 Sách, tạp chí
Tiêu đề: Computer Science Journal
[2] Nguyen, Binh Minh; Dao, Quang Minh. Towards a Semantic Model of Resource in Cloud Environment. In proceeding of 5th International Symposium on Information and Communication Technology (SOICT), ACM, Hanoi, 2014, p. 271- 279, ISBN: 978-1-4503-2930-9 Sách, tạp chí
Tiêu đề: 5th International Symposium on Information and Communication Technology (SOICT)
[3] Nguyen, Binh Minh; Tran, Dinh Viet and Hluchý, Ladislav. Programmable Workflow Composition. In proceeding of 2nd International Conference on Next Generation Information Technology, IEEE, Gyeongju, 2011, p. 86-89, ISBN 978- 89-88678-38-1 Sách, tạp chí
Tiêu đề: 2nd International Conference on Next Generation Information Technology
[4] Islam, Sadeka, et al. "Empirical prediction models for adaptive resource provisioning in the cloud." Future Generation Computer Systems 28.1 (2012): 155- 162 Sách, tạp chí
Tiêu đề: Empirical prediction models for adaptive resource provisioning in the cloud
Tác giả: Islam, Sadeka, et al. "Empirical prediction models for adaptive resource provisioning in the cloud." Future Generation Computer Systems 28.1
Năm: 2012
[5] Huang, Jinhui, Chunlin Li, and Jie Yu. "Resource prediction based on double exponential smoothing in cloud computing." Consumer Electronics, Communications and Networks (CECNet), 2012 2nd International Conference on.IEEE, 2012 Sách, tạp chí
Tiêu đề: Resource prediction based on double exponential smoothing in cloud computing
[6] Vazquez, Carlos, Ram Krishnan, and Eugene John. "Time series forecasting of cloud data center workloads for dynamic resource provisioning." Journal of Wireless Mobile Networks, Ubiquitous Computing, and Dependable Applications (JoWUA) 6.3 (2015): 87-110 Sách, tạp chí
Tiêu đề: Time series forecasting of cloud data center workloads for dynamic resource provisioning
Tác giả: Vazquez, Carlos, Ram Krishnan, and Eugene John. "Time series forecasting of cloud data center workloads for dynamic resource provisioning." Journal of Wireless Mobile Networks, Ubiquitous Computing, and Dependable Applications (JoWUA) 6.3
Năm: 2015
[7] Roy, Nilabja, Abhishek Dubey, and Aniruddha Gokhale. "Efficient autoscaling in the cloud using predictive models for workload forecasting."Cloud Computing (CLOUD), 2011 IEEE International Conference on. IEEE, 2011 Sách, tạp chí
Tiêu đề: Efficient autoscaling in the cloud using predictive models for workload forecasting
[8] Hornik, Kurt, Maxwell Stinchcombe, and Halbert White. "Multilayer feedforward networks are universal approximators." Neural networks 2.5 (1989):359-366 Sách, tạp chí
Tiêu đề: Multilayer feedforward networks are universal approximators
Tác giả: Hornik, Kurt, Maxwell Stinchcombe, and Halbert White. "Multilayer feedforward networks are universal approximators." Neural networks 2.5
Năm: 1989
[9] Venkatesan, D., K. Kannan, and R. Saravanan. "A genetic algorithm-based artificial neural network model for the optimization of machining processes."Neural Computing and Applications 18.2 (2009): 135-140 Sách, tạp chí
Tiêu đề: A genetic algorithm-based artificial neural network model for the optimization of machining processes
Tác giả: Venkatesan, D., K. Kannan, and R. Saravanan. "A genetic algorithm-based artificial neural network model for the optimization of machining processes."Neural Computing and Applications 18.2
Năm: 2009
[10] Ding, Shifei, Chunyang Su, and Junzhao Yu. "An optimizing BP neural network algorithm based on genetic algorithm." Artificial Intelligence Review36.2 (2011): 153-162 Sách, tạp chí
Tiêu đề: An optimizing BP neural network algorithm based on genetic algorithm
Tác giả: Ding, Shifei, Chunyang Su, and Junzhao Yu. "An optimizing BP neural network algorithm based on genetic algorithm." Artificial Intelligence Review36.2
Năm: 2011
[11] Fu, Zemin, et al. "Using genetic algorithm-back propagation neural network prediction and finite-element model simulation to optimize the process of multiple- step incremental air-bending forming of sheet metal." Materials & design 31.1 (2010): 267-277 Sách, tạp chí
Tiêu đề: Using genetic algorithm-back propagation neural network prediction and finite-element model simulation to optimize the process of multiple-step incremental air-bending forming of sheet metal
Tác giả: Fu, Zemin, et al. "Using genetic algorithm-back propagation neural network prediction and finite-element model simulation to optimize the process of multiple- step incremental air-bending forming of sheet metal." Materials & design 31.1
Năm: 2010
[12] Huang, Yuansheng, Yufang Lin, and Zilong Qiu. "Freight prediction model based on GABP neural network." Computational Intelligence and Design, 2008.ISCID'08. International Symposium on. Vol. 1. IEEE, 2008 Sách, tạp chí
Tiêu đề: Freight prediction model based on GABP neural network
[13] Ali-Eldin, Ahmed, et al. "Workload classification for efficient auto-scaling of cloud resources." Department of Computer Science, Umea University, Umea, Sweden, Tech. Rep (2013) Sách, tạp chí
Tiêu đề: Workload classification for efficient auto-scaling of cloud resources
[14] [2002-53.pdf] Berberidis, Christos, et al. "Multiple and partial periodicity mining in time series databases." ECAI. Vol. 2. 2002 Sách, tạp chí
Tiêu đề: Multiple and partial periodicity mining in time series databases
[15] Vlachos, Michail, S. Yu Philip, and Vittorio Castelli. "On Periodicity Detection and Structural Periodic Similarity." SDM. Vol. 5. 2005 Sách, tạp chí
Tiêu đề: On Periodicity Detection and Structural Periodic Similarity
[16] Zhang, Guoqiang, B. Eddy Patuwo, and Michael Y. Hu. "Forecasting with artificial neural networks:: The state of the art." International journal of forecasting 14.1 (1998): 35-62 Sách, tạp chí
Tiêu đề: Forecasting with artificial neural networks:: The state of the art
Tác giả: Zhang, Guoqiang, B. Eddy Patuwo, and Michael Y. Hu. "Forecasting with artificial neural networks:: The state of the art." International journal of forecasting 14.1
Năm: 1998
[17] Montana, David J., and Lawrence Davis. "Training Feedforward Neural Networks Using Genetic Algorithms." IJCAI. Vol. 89. 1989 Sách, tạp chí
Tiêu đề: Training Feedforward Neural Networks Using Genetic Algorithms
[19] Faraway, Julian, and Chris Chatfield. "Time series forecasting with neural networks: a comparative study using the airline data." Applied statistics(1998):231-250 Sách, tạp chí
Tiêu đề: Time series forecasting with neural networks: a comparative study using the airline data
Tác giả: Faraway, Julian, and Chris Chatfield. "Time series forecasting with neural networks: a comparative study using the airline data." Applied statistics
Năm: 1998
[20] Kihoro, J. M., R. O. Otieno, and C. Wafula. "Seasonal time series forecasting: A comparative study of ARIMA and ANN models." AJST 5.2 (2004) Sách, tạp chí
Tiêu đề: Seasonal time series forecasting: A comparative study of ARIMA and ANN models
[21] Armstrong, J. Scott, and Fred Collopy. "Error measures for generalizing about forecasting methods: Empirical comparisons." International journal of forecasting 8.1 (1992): 69-80 Sách, tạp chí
Tiêu đề: Error measures for generalizing about forecasting methods: Empirical comparisons
Tác giả: Armstrong, J. Scott, and Fred Collopy. "Error measures for generalizing about forecasting methods: Empirical comparisons." International journal of forecasting 8.1
Năm: 1992

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w