1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu cơ sở dữ liệu trong bộ nhớ giải quyết bài toán đa giao dịch

78 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN VĂN TÙNG NGHIÊN CỨU CƠ SỞ DỮ LIỆU TRONG BỘ NHỚ GIẢI QUYẾT BÀI TOÁN ĐA GIAO DỊCH LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH Thái Ngun - 2012 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN VĂN TÙNG NGHIÊN CỨU CƠ SỞ DỮ LIỆU TRONG BỘ NHỚ GIẢI QUYẾT BÀI TOÁN ĐA GIAO DỊCH Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH NGƢỜI HƢỚNG DẪN KHOA HỌC TS Hoàng Đỗ Thanh Tùng Thái Nguyên - 2012 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan luận văn “Nghiên cứu Cơ sở liệu nhớ giải toán đa giao dịch” cơng trình nghiên cứu riêng tơi Luận văn tơi tự tìm hiểu, thử nghiệm thu thập từ nhiều nguồn dƣới hƣớng dẫn bảo cặn kẽ thầy giáo TS Hoàng Đỗ Thanh Tùng Các số liệu luận văn trung thực với thử nghiệm Luận văn chƣa đƣợc công bố trƣớc Học viên Nguyễn Văn Tùng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn i MỤC LỤC MỤC LỤC i LỜI CẢM ƠN iii BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT iv DANH MỤC CÁC HÌNH VẼ v MỞ ĐẦU .1 Chƣơng GIẢI PHÁP THỜI GIAN THỰC CHO GIAO DỊCH CƠ SỞ DỮ LIỆU 1.1 Xu hƣớng giao dịch sở liệu thời gian thực 1.2 Khái quát giao dịch sở liệu .4 1.2.1 Khái niệm 1.2.2 Trạng thái giao dịch 1.3 Bài toán đa giao dịch ứng dụng trực tuyến 1.4 Giải pháp sử dụng sở liệu nhớ .8 1.5 Lợi sử dụng sở liệu nhớ 12 1.6 Kết luận chƣơng 14 Chƣơng CƠ SỞ DỮ LIỆU TRONG BỘ NHỚ .15 2.1 Kiến trúc hệ thống sở liệu nhớ 15 2.1.1 Lợi đánh địa trực tiếp thƣờng trú nhớ 15 2.1.2 Các vấn đề với đánh địa trực tiếp .16 2.1.3 Tổ chức liệu thƣờng trú nhớ 17 2.2 Các cấu trúc mục 25 2.2.1 Các cấu trúc mục có .25 2.2.2 T Tree 29 2.3 Xử lý truy vấn 36 2.4 Khôi phục .37 2.5 Kiểm soát đồng thời .41 2.5.1 Cấu trúc khóa 42 2.5.2 Các khóa quan hệ 44 2.5.3 Các khóa ghi 44 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ii 2.5.4 Các khóa vị từ 45 2.5.5 Các khóa thành phần mục 46 2.6 Kết luận chƣơng 46 Chƣơng THỬ NGHIỆM VÀ ĐÁNH GIÁ 48 3.1 Cơ sở liệu nhớ Oracle TimesTen 48 3.1.1 So sánh TimesTen CSDL thông thƣờng .48 3.1.2 Kiến trúc TimesTen 50 3.1.3 Ứng dụng kết nối đến Data Store 52 3.1.4 Data Availability Integrity 53 3.2 Thử nghiệm đánh giá 60 3.2.1 Môi trƣờng thử nghiệm 60 3.2.2 Thử nghiệm 62 3.2.3 Đánh giá 65 3.3 Kết luận chƣơng 66 KẾT LUẬN VÀ HƢỚNG NGHIÊN CỨU 67 TÀI LIỆU THAM KHẢO 68 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iii LỜI CẢM ƠN Lời đầu tiên, xin chân thành cảm ơn Ban giám hiệu thầy cô giáo Trƣờng Đại học Công nghệ thông tin Truyền thông - Đại học Thái Nguyên, Viện Công nghệ thông tin - Viện Khoa học Cơng nghệ Việt Nam hỗ trợ, hƣớng dẫn giảng ý nghĩa, quan trọng suốt q trình tơi đƣợc đào tạo Trƣờng Tơi xin bày tỏ lịng biết ơn sâu sắc đến thầy giáo TS Hoàng Đỗ Thanh Tùng tận tình hƣớng dẫn định hƣớng tơi nghiên cứu, đƣa bảo cặn kẽ trình thực luận văn Lời cảm ơn chân thành xin đƣợc gửi tới Lãnh đạo đồng nghiệp trƣờng Trung cấp nghề Công nghiệp tàu thủy Phà Rừng tạo điều kiện thuận lợi, hỗ trợ giải công việc để tơi theo học chƣơng trình Đồng cảm ơn bạn bè lớp Cao học CK09C thảo luận, cung cấp cho tài liệu, tƣ liệu qúy giá để xây dựng nội dung luận văn học tập Tôi xin cảm ơn giúp đỡ, động viên, chia sẻ gia đình, bạn bè dành cho tơi q trình học tập nghiên cứu Học viên Nguyễn Văn Tùng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn iv BẢNG DANH MỤC CÁC CHỮ VIẾT TẮT Thuật ngữ ACID Chi tiết Ý nghĩa Atomicity, Consistency, Tính nguyên tử, tính qn, Isolation, Durability tính lập, tính bền CSDL Cơ sở liệu DBMS Database Management System Hệ quản trị sở liệu IMDB In-Memory Database Cơ sở liệu nhớ MMDB Main Memory Database Cơ sở liệu nhớ Relational Database RDBMS Management System Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Hệ quản trị sở liệu quan hệ http://www.lrc-tnu.edu.vn v DANH MỤC CÁC HÌNH VẼ TT Tên hình Trang Hình 1.1 Hội họp tƣơng lai Hình 1.2 Hệ thống thi trực tuyến Hình 1.3 Các bƣớc thực giao dịch chuyển khoản từ tài khoản A sang tài khoản B Hình 1.4 Trạng thái giao dịch Hình 2.1 Cấu trúc phân đoạn 18 Hình 2.2 Cấu trúc phân vùng quan hệ 19 Hình 2.3 Quan hệ Thiết kế mục 21 Hình 2.4 Ví dụ liên kết 23 Hình 2.5 Các mục đƣợc cấu trúc 26 10 Hình 2.6 Hằm băm dựa mục 28 11 Hình 2.7 T Tree 30 12 Hình 2.8 Giá trị giới hạn Nút A 31 13 Hình 2.9 Các phép tái cân T Tree 35 14 Hình 2.10 Các phép tái cân T Tree đặc biệt 36 15 Hình 2.11 Cấu trúc khối kiểm sốt khóa quan hệ 43 16 Hình 2.12 Cấu trúc khối kiểm sốt khóa giao dịch 44 17 Hình 3.1: So sánh công cụ disk-based RDBMS TimesTen 49 18 Hình 3.2 Các thành phần TimesTen 50 19 Hình 3.3 TimesTen Data Store 51 20 Hình 3.4 TimesTen Data Manager 51 21 Hình 3.5 TimesTen ODBC JDBC APIs 52 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn vi TT Tên hình Trang 22 Hình 3.6 Two-tiered logging 53 23 Hình 3.7 Các hoạt động Checkpoint 55 24 Hình 3.8 Khơi phục liệu từ log checkpoint files 56 25 Hình 3.9 Master Subscriber Data Store 56 26 Hình 3.10 Master Subscriber Replication Agents 57 27 Hình 3.11 Ví dụ cấu hình replication 58 28 Hình 3.12 Replication Hot standby load balancing 59 29 Hình 3.13 Active standby pair 59 30 Hình 3.14 Insert liệu vào TimesTen 63 31 32 Hình 3.15 Insert liệu vào MS SQL Server 2008 ổ cứng SSD Hình 3.16 Insert liệu vào MS SQL Server 2008 ổ cứng HDD 63 64 33 Hình 3.17 Dữ liệu TimesTen 64 34 Hình 3.18 Dữ liệu MS SQL Server 2008 65 35 Hình 3.19 Biểu đồ so sánh thời gian insert triệu ghi 66 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU Ngày nay, xu cơng nghệ thơng tin tồn cầu nhƣ phát triển mạng internet, giới đƣợc kết nối khơng khoảng cách Nhƣ tất yếu, phủ doanh nghiệp cần có hệ thống, ứng dụng Cơ sở liệu (CSDL) trực tuyến (online) phục vụ tức thời (real time) đáp ứng hàng triệu ngƣời dùng cuối khắp nơi Để đáp ứng xu này, điện toán đám mây (cloud computing) mơ hình cơng nghệ thơng tin hứa hẹn Khác với mơ hình tính tốn lƣới (Grid computing) yêu cầu thực thi đƣợc phép “đợi lúc CPU rảnh” Mơ hình tính tốn Clouds hoàn toàn khác, nhiều ngƣời dùng đƣợc sử dụng tài nguyên để giao dịch đồng thời đảm bảo chất lƣợng dịch vụ tức thời nhƣng lại phải thứ tự Hay nói cách khác, bắt buộc hệ thống phải xử lý đáp ứng thời gian thực cho hàng triệu giao dịch Vì vậy, vấn đề nỗi lo lắng cho hệ thống trực tuyến phát triển nhanh chóng, mà giải pháp xử lý song song khơng cịn nhiều tác dụng Ví dụ nhƣ giao dịch ngân hàng trực tuyến, giao dịch chứng khoán, mua hàng trực tuyến, kiểm sốt phƣơng tiện giao thơng… Vì vậy, với hệ thống phải xử lý đa giao dịch với số lƣợng vô lớn mà đảm bảo thời gian thực có xu hƣớng cải tiến kỹ thuật cho CSDL xử lý song song, thay đổi kiến trúc CSDL, thay đổi chế hoạt động, sử dụng nhớ (in-Memory) Trong luận văn tập trung nghiên cứu, tìm hiểu CSDL nhớ nhằm giải tốn cho hệ thống có số lƣợng giao dịch lớn đáp ứng truy vấn thời gian thực Thử nghiệm với hệ thống Oracle TimesTen để đƣa đánh giá CSDL nhớ Luận văn đƣợc chia làm chƣơng: Chƣơng 1: Giải pháp thời gian thực cho giao dịch sở liệu Chƣơng 2: Cơ sở liệu nhớ Chƣơng 3: Thử nghiệm đánh giá Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 55 TimesTen trì hai checkpoint files cho Data Store, có tên DataStoreName.ds0 DataStoreName.ds1 Khi mà Data Store đƣợc checkpoint vào ổ đĩa, TimesTen ghi đè lên checkpoint file cũ Chỉ có liệu đƣợc thay đổi kể từ checkpoint gần đƣợc ghi lại Hoạt động checkpoint quét Data Store tìm khác biệt, sau cập nhật thông tin thay đổi loại bỏ thứ không cần thiết (đã tồn rồi) Hình 3.7: Các hoạt động Checkpoint Data Store thể bị lỗi hệ thống đổ vỡ hay tiến trình sử dụng gặp cố, kết nối bị ngắt Khi ứng dụng kết nối lại đến Data Store bị lỗi, Subdaemon cấp phát memory segment cho Data Store khơi phục lại từ checkpoint log file Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 56 Hình 3.8 Khôi phụ c liệ u từ log checkpoint files 3.1.4.3 Replication Là tiến trình chép liệu Data Store, để tạo liệu có tính sẵn sàng cao nhằm nhiệm vụ giảm thiểu tối đa việc ảnh hƣởng đến hiệu suất nhiều ứng dụng sử dụng Ngồi cịn có vai trị phục hồi Data Store thất bại, Replication hữu ích cho việc phân phối để ngƣời dùng tải nhiều Data Store với hiệu suất tối đa dễ bảo trì Replication configurations TimesTen Replication chép cập nhật từ Master Data Store đến Subscriber Data Store Hình 3.9 Master Subscriber Data Store Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 57 Để đạt đƣợc hiệu cao chi phí thấp, TimesTen sử dụng Transaction Log Buffer Nhƣ hình 3.9, Replication Master Subscriber Data Store đƣợc điều khiển Replication Agent, giao tiếp thông qua TCP/IP socket Replication Agent Master (Master Agent) Data Store đọc ghi từ Transaction Log chuyển tiếp thay đổi đƣợc phát đến Replication Agent Subscriber (Subscriber Agent) Data Store Subscriber Agent thực cập nhật lại Data Store Nếu Subscriber Agent không hoạt động thay đổi đƣợc chuyển tiếp từ Master, Master giữ thay đổi nhật ký đến thực thay đổi đƣợc cho Subscriber Hình 3.10 Master and Subscriber Replication Agents Điểm tập trung TimesTen Replication tạo cho liệu khả sẵn sàng cao Để đạt đƣợc mục tiêu Replication cung cấp nhiều cách khác việc cấu hình, để đƣa đƣợc cân tốt hiệu tính sẵn sàng Replication đƣợc cấu hình thơng qua câu lệnh SQL Thơng thƣờng, Replication đƣợc cấu hình đơn hƣớng (Unidirectional hay one way) từ Master đến hay nhiều Subscribers, hai hƣớng (bidirectional hay two way) hai hay nhiều Data Store Master Subscriber Nhiều ta cấu hình đa hƣớng (N-way) cập nhật nơi (update anywhere) Replication Số hóa Trung tâm Học liệu – Đại học Thái Ngun http://www.lrc-tnu.edu.vn 58 Hình 3.11 Ví dụ cấu hình replication Hot standby: phƣơng pháp lƣu dự phịng, có hệ thống repication chạy đồng thời với hệ thống Hình 3.11, thể làm cách replication cấu hình để cung cấp hot standby cho việc lƣu Data Store cân tải (load-balanced) cách đồng Trong chế độ cấu hình hot standby, Master Data Store đơn lẻ đƣợc chép đến Subscriber Data Store với chế dự phịng thích hợp xây dựng bên thân ứng dụng Với cấu hình cân tải, khối lƣợng cơng việc (workload) đƣợc phân chia master subscriber Có kiểu bản:  Split workload: Mỗi Data Store lƣu trữ phần Data Store khác  Distributed workload: Nơi ngƣời dùng truy cập trở thành nguồn liệu Các nguồn ngang hàng nhau, không phân biệt Master Subscriber Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 59 Hình 3.12 Replication Hot standby load balancing Kích hoạt chế độ Active standby pair Trong chế độ standby pair, Data Store đƣợc định nghĩa nhƣ Master Một Active Master Data Store, lại Standby Master Data Store Trong đó, Active Master Data Store cập nhật trực tiếp đƣợc, Standby Master Data Store khơng Standby Master Data Store nhận đƣợc thay đổi từ Active Master Data Store truyền thay đổi đến 62 Subscriber Data Store (chỉ đƣợc đọc) Nếu Active Master Data Store lỗi, đƣợc khôi phục từ Standby Master Data Store, hoạt động tạm thời chuyển giao cho Standby Master Data Store Tƣơng tự, Standby Master Data Store bị lỗi Hình 3.13 Active standby pair Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 60 Replication thiếu đồng dịch vụ “return” TimesTen Replication mặc định chế thiếu đồng bộ, nghĩa ứng dụng thay đổi Master Data Store tiếp tục làm việc mà khơng chờ thay đổi đƣợc Subscriber nhận đƣợc Giữa Master Subscriber Data Store có chế nội để xác nhận cập nhật thành cơng, nhƣng lại vơ hình với ứng dụng Kiểu làm việc giúp hệ thống có đƣợc hiệu suất tối đa, nhƣng ứng dụng lại bị tách rời hồn tồn tiến trình tự chép (replication) Subscriber TimesTen cung cấp dịch vụ “return” để cung cấp thêm thông tin cho ƣng dụng cần mức độ tin tƣởng cao liệu đƣợc nhân quán Master and Subscriber Data Store 3.2 Thử nghiệm đánh giá 3.2.1 Mơi trƣờng thử nghiệm Chƣơng trình thử nghiệm đƣợc chạy máy tính phịng Nghiên cứu hệ thống quản lý - Viện Công nghệ thông tin - Viện Khoa học Cơng nghệ Việt Nam Cấu hình máy chủ nhƣ sau: CPU: Core I7 3.07 GHz RAM: 18GB OS: Server 2003 SP2 (32 Bit) HDD, SSD Server thử nghiệm đƣợc cài đặt JDK-6U29-i586, hai hệ quản trị CSDL để so sánh Oracle TimesTen (32 Bit) Microsoft SQL Server 2008 Chƣơng trình thử nghiệm cài đặt ngôn ngữ C++ (Visual Studio 2010) Trong phần thử nghiệm này, đối tƣợng liệu tập trung nghiên cứu đối tƣợng chuyển động liên tục nhƣ phƣơng tiện giao thông CSDL nhắm tới áp dụng cho ứng dụng LBS (location based service) nhƣ toán kiểm soát phƣơng tiện giao thông Ở ta thiết kế chƣơng trình tạo liệu với đối tƣợng phân bố không gian hai chiều theo phạm vi [0, 10000] trục Sau đối tƣợng đƣợc gán VBR, đó: Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 61 - Trên chiều, vận tốc thay đổi kích thƣớc khơng (đối tƣợng khơng thay đổi kích thƣớc khơng gian chuyển động) - Giá trị vận tốc khoảng [-50, 50] - Vận tốc thay đổi tối đa lần cập nhật File liệu đƣợc tạo CSDL chứa ghi đối tƣợng Trong file liệu đối tƣợng đƣợc tạo cách ngẫu nhiên mốc thời gian t0 (bao gồm mục đối tƣợng, mbr, vận tốc, thời điểm đối tƣợng) Sau mốc thời gian t1, t2, t3,… số ngẫu nhiên đối tƣợng đƣợc tạo với vận tốc thay đổi Các ghi đƣợc mơ tả với kiểu cấu trúc C++ Oid mục cho đối tƣợng, mbr (minimum bounding rectangle) mảng với phần tử mô tả vị trí kích cỡ đối tƣợng, vbr (velocity bounding rectangle) một mảng với phần tử mô tả mô tả cạnh mbr ref giá trị cho thời gian mà đối tƣợng đƣợc chèn hay đƣợc cập nhật struct MovingObject { int Oid; //Chỉ mục đối tƣợng, xác định đối tƣợng float mbr[4]; //Vị trí kích thƣớc đối tƣợng float vbr[4]; //Véc tơ chuyển động đối tƣợng theo hƣớng float ref; //Thời gian tham chiếu đối tƣợng đƣợc thêm cập nhật }; Bảng 3.1 mơ tả ví dụ đối tƣợng chuyển động thời điểm Cột mục đối tƣợng, bốn cột tƣơng ứng với trục X Y (vị trí kích thƣớc đối tƣợng), cột tƣơng ứng với tốc độ đối tƣợng cột cuối thời điểm tƣơng ứng với bảng Table1(COLUMN1, COLUMN2, COLUMN3, COLUMN4, COLUMN5, COLUMN6, COLUMN7, COLUMN8, COLUMN9, COLUMN10) đƣợc tạo để thử nghiệm TimesTen SQL Server 2008 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 62 Bảng 3.1 Dữ liệu số đối tƣợng chuyển động thời điểm Oid X1 X2 Y1 Y2 Vx1 Vx2 Vy1 Vy2 time 2108.2 2108.3 8522.5 8522.5 -21.5 -21.5 -13.9 -13.9 2806.7 2806.7 5814.8 5814.8 -49.8 -49.8 6.8 6.8 9968.1 9968.1 1870.4 1870.4 34.7 34.7 41.5 41.5 910.5 7318.2 7318.2 -3.0 -3.0 -39.8 -39.8 4271.0 4271.0 4824.4 4824.4 44.9 44.9 -26.4 -26.4 910.5 3.2.2 Thử nghiệm Việc thử nghiệm so sánh thời gian để hoàn thành insert triệu ghi vào hai CSDL liệu Timesten MS SQL Server 2008 Các chƣơng trình thử nghiệm đƣợc chạy môi trƣờng Việc sinh liệu đƣợc mô tả phần 3.2.1 Chạy chƣơng trình sinh liệu ngẫu nhiên cho insert vào CSDL Timesten MS SQL Server 2008 Đối với MS SQL Server 2008 thử nghiệm insert liệu ổ HDD ổ SSD ổ SSD có tốc độ truy xuất nhanh nhiều so với ổ HDD Việc Insert liệu vào CSDL đƣợc thực Tại mốc 100 nghìn ghi đƣợc insert lấy thời gian hồn thành Việc so sánh tốc độ hai hệ quản trị đƣợc so sánh thời gian hoàn thành việc insert mốc ghi Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 63 Kết thử nghiệm: Hình 3.14 Insert liệu vào TimesTen Hình 3.15 Insert liệu vào MS SQL Server 2008 ổ cứng SSD Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 64 Hình 3.16 Insert liệu vào MS SQL Server 2008 ổ cứng HDD Hình 3.17 Dữ liệu TimesTen Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 65 Hình 3.18 Dữ liệu MS SQL Server 2008 3.2.3 Đánh giá Việc thực insert liệu vào TimesTen nhanh gấp nhiều lần so với MS SQL Server 2008 Nhìn vào biểu đồ so sánh thời gian cho thấy (Hình 3.19), việc insert liệu MS SQL Server 2008 ổ HDD hay ổ SSD chậm nhiều so với TimesTen Ổ SSD sử dụng cơng nghệ sử dụng chíp nhớ gần nhƣ RAM nên tốc độ truy xuất nhanh nhiều so với đĩa từ ổ HDD thơng thƣờng Nhìn vào kết thử nghiệm, TimesTen mốc 50 nghìn ghi đầu đƣợc insert 37 giây cần 37 giây cho 50 nghìn ghi Để hoàn tất insert triệu ghi cần 12 phút 23 giây Trong đó, MS SQL Server 2008 cần phút 51 giây cho 50 nghìn ghi đầu, cần phút 54 giây cho 50 nghìn ghi tiếp theo, cần 35 phút 25 giây cho triệu ghi đƣợc insert ổ cứng SSD cần phút 55 giây cho 50 nghìn ghi đầu, cần phút 36 giây cho 50 nghìn ghi tiếp theo, cần 83 phút cho triệu ghi đƣợc insert ổ cứng HDD Nhƣ với 50 nghìn ghi đƣợc insert TimesTen thời gian hồn thành gần nhƣ thời gian thực, cịn MS SQL Server 2008 thời gian tính theo phút nên chậm nhiều so với TimesTen Vì hệ thống cần số lƣợng giao dịch lớn sử dụng CSDL nhớ phƣơng án tối ƣu Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 66 90 80 70 TimesTen 60 SQL SSD SQL HDD 50 40 30 20 10 trăm trăm trăm trăm trăm trăm trăm trăm trăm Triệu nghìn nghìn nghìn nghìn nghìn nghìn nghìn nghìn nghìn Hình 3.19 Biểu đồ so sánh thời gian insert triệu ghi 3.3 Kết luận chƣơng Trong chƣơng giới thiệu hệ quản trị CSDL nhớ Oracle TimesTen Việc thử nghiệm đƣợc tiến hành máy tính phịng Nghiên cứu hệ thống quản lý - Viện Công nghệ thông tin - Viện Khoa học Công nghệ Việt Nam Việc thử nghiệm thực giao dịch đơn giản insert liệu vào CSDL Kết thử nghiệm phần cho thấy tốc độ CSDL nhớ so với hệ CSDL thông thƣờng Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 67 KẾT LUẬN VÀ HƢỚNG NGHIÊN CỨU CSDL nhớ lĩnh vực khó Tại Việt Nam việc áp dụng công nghệ chƣa nhiều, việc tìm hiểu, phát triển ứng dụng điều cần thiết Đặc biệt bối cảnh điện toán đám mây đời, ứng dụng có sẵn đâu cho ngƣời dùng cuối Yêu cầu ngƣời dùng thời gian đáp ứng giao dịch phải nhanh, thời gian thực Để giải vấn đề giải pháp CSDL nhớ tối ƣu Luận văn trình bày đƣợc hệ thống phải xử lý lƣợng giao dịch lớn mà thời gian đáp ứng đòi hỏi nhanh, thời gian thực; đƣa đƣợc giải pháp sử dụng CSDL nhớ; đƣa đƣợc ƣu nhƣợc điểm CSDL nhớ lợi sử dụng Trọng tâm luận văn tìm hiểu kiến trúc, cấu trúc mục, xử lý truy vấn, khôi phục kiểm soát đồng thời IMDB; cấu trúc điển hình gắn với IMDB T Tree Phần thử nghiệm so sánh thời gian để hoàn thành insert triệu ghi vào hai CSDL liệu TimesTen MS SQL Server 2008 Các chƣơng trình thử nghiệm đƣợc chạy môi trƣờng Kết đạt đƣợc cho thấy, với việc sử dụng CSDL TimesTen việc insert 50 nghìn ghi có thời gian hồn thành thời gian thực (chỉ tính giây) Việc insert TimesTen nhanh gấp nhiều lần so với MS SQL Server 2008 (trên ổ SSD ổ HDD) Việc thử nghiệm thực giao dịch đơn giản insert liệu vào CSDL Để hoàn thiện đƣợc đề tài, hƣớng nghiên cứu tiếp tƣơng lai tập trung vào: - Nghiên cứu Indexing - Nghiên cứu chế xử lý truy vấn IMDB - Nghiên cứu Recovery IMDB Đây vấn đề quan trọng IMDB khả khơi phục liệu trƣờng hợp hệ thống gặp cố Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 68 TÀI LIỆU THAM KHẢO Tiếng Việt Khánh Hà (2012), Giải pháp Công nghệ nhớ trong, xuất nhanh, http://www.sbv.gov.vn, ngày 05/8/2012 Mai Phƣơng (2011), IMDS cho địi hỏi truy http://www.pcworld.com.vn , ngày 13/2/2012 Hồng Xa (4.2009), “Các loại trình ứng dụng Cơ sở liệu”, Tạp chí CNTT & TT, Kỳ 2, tr 16 - 17 Tiếng Anh A.Ammann, M.Harahan and R.Krishnamurthy (February 1985), Design of a Memory Resident DBMS, Proc IEEE COMPCON, San Francisco A C Ammann, M B Hanrahan, R.Krishnamurthy ( 1985) , Design of a memory resident DBMS, in Proc IEEE COMPCOM Conj Aho, J Hopcroft and J D Ullman (1974), The Design and Analysis of Computer Algorithm, Addison-Wesley Pulishing Company B R Badrinath and K Ramamritham (March 1992.), “Semantics-Based Concurrency Control: Beyond Commutativity”, ACM Transactions on Database Systems, 17(1) C.J Date (1985), An Introduction to Database Systems, Addision-Wesley D.Comer (June 1979), The Ubiquitous B Tree, Computing Surveys 11,2 D J De Witt, R Katz, F Olken, L Shapiro, M Stonebraker and D Wood (June 1984), Implemententation Techniques for Main Memory Database Systems, Proc ACM SIGMOD Conf, 1-8 10 D Knut (1973), The Art of Computer Programming, Addisong-Wesley, Reading, Mass 11 IBM (1979), IMS Version Release 1.5 Fast Path Feature Description and Design Guide, IBM World Trade System Centers (G320-5775) 12 IBM (1984), Guide to IMS/VS V1 R3 Data Entry Database (DEDB) Facitlity, IBM International Systems Centers (GG24-1633-0) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 69 13 K Salem and H Garcia-Molina (1986), Crash Recovery Mechanisms for Main Storage Database System, Princeton Univ Comp Sci Dept Tech Rep CS-TR-034086 14 M Eich (March 1986) , MMDB Recovery, Southern Methodist Univ Dept of Computer Sciences TR# 86-CSE-11 15 Oracle (2006), Oracle TimesTen In-Memory Database Acrchitectura Overview Release 6.0 16 Plattner H - Alexander Zeier (2011), In-Memory Data Management An Inflection Point for Enterprise Applications, Springer 17 R Hagmann (1986), A Crash Recovery Scheme fot a Memory Resident Database System, IEEE Transactions on Computers 18 R Fagin, J Nievergelt, N Pippenger and H.R Strong (1979), Extendible Hashing: A fast access method for dynamic files, ACM Trans on Database System 4,3, 315-344 19 Tobin Jon Lehman (1986), Main Memory Database – Overview 20 W.Litwin (October 1980), Linear Hashing: A New Tool For File and Table Addressing, Proc 6th Conf Very Large Data Base, Montreal, Canada Website: 21 http://no-disk.com Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ... TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN VĂN TÙNG NGHIÊN CỨU CƠ SỞ DỮ LIỆU TRONG BỘ NHỚ GIẢI QUYẾT BÀI TOÁN ĐA GIAO DỊCH Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC... hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan luận văn ? ?Nghiên cứu Cơ sở liệu nhớ giải toán đa giao dịch? ?? cơng trình nghiên cứu riêng tơi Luận... MỞ ĐẦU .1 Chƣơng GIẢI PHÁP THỜI GIAN THỰC CHO GIAO DỊCH CƠ SỞ DỮ LIỆU 1.1 Xu hƣớng giao dịch sở liệu thời gian thực 1.2 Khái quát giao dịch sở liệu .4 1.2.1 Khái niệm

Ngày đăng: 26/03/2021, 07:07

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN