Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
329,56 KB
Nội dung
1
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Phạm Đình Luật
VẤN ĐỀCẤPPHÁTVÀCẬPNHẬTCÁCMẢNH
TRONG HỆPHÂNTÁN
Chuyên ngành: Truyền dữ liệu và Mạng máy tính
Mã số: 60.48.15
Người hướng dẫn khoa học: PGS. TS Lê Huy Thập
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2012
2
LỜI MỞ ĐẦU
Ngày nay, công nghệ thông tin (CNTT) đã trở
thành một nhân tố không thể thiếu trong mọi lĩnh vực của
đời sống xã hội. Sự bùng nổ nhu cầu xây dựng cáchệ
thống thông tin, mà trước hết là cáchệ thống thông tin
quản lý đã thu hút sự quan tâm của nhiều nhà khoa học.
Các hệ thống cơ sở dữ liệu (CSDL) đã lần lượt xuất hiện.
Thập niên 60, xuất hiện Mô hình dữ liệu mạng (Network
Data Model) và Mô hình dữ liệu phân cấp. Mô hình dữ
liệu quan hệ (Relation Data Model) được E.Codd đề xuất
năm 1970 đánh dấu mốc phát triển quan trọng về cơ sở lý
thuyết của cáchệ thống CSDL. Thập niên 80, là thập niên
của cáchệ thống CSDL hướng đối tượng cùng với sự phát
triển rực rỡ của các bộ vi xử lý đáp ứng được yêu cầu tốc
độ tính toán ngày càng cao. Những máy tính này có khả
năng thực hiện tới hàng tỷ phép tính trong một giây đó là
nhờ công nghệ tích hợp và chế tạo bộ vi xử lý. Song về
mặt vật lý mà nói, chúng ta không thể tích hợp mãi các vi
mạch vào một con chip trên cùng một diện tích được mà
chỉ đến một lúc nào đó khả năng tích hợp không còn nữa,
3
chính vì vậy các nhà sản xuất đã sản xuất ra những con
chip đa xử lý. Vì vậy một chiến lược được đặt ra theo
hướng thứ hai là chia bài toán ra thành những công việc
nhỏ để có thể chạy song song trên một hay nhiều bộ xử lý.
Nghĩa là tăng tốc độ tính toán bằng cách sử dụng đồng
thời nhiều máy tính để bộ xử lý tính toán song song nhằm
nâng cao hiệu năng tính toán, tiết kiệm thời gian, giảm chi
phí, giải quyết được cácvấnđề lớn hơn, phức tạp hơn và
tăng khả năng xử lý đồng thời cao hơn.
Lĩnh vực CNTT ở Việt nam tuy còn non trẻ nhưng nó
phát triển nhanh chóng và góp phần không nhỏ trong công
cuộc xây dựng, phát triển đất nước. Nhiệm vụ của những
cán bộ làm công tác trong lĩnh vực CNTT là phải đi trước,
đón đầu những tiến bộ của khoa học kỹ thuật và xu hướng
phát triển của thời đại nhất là trong lĩnh vực CNTT. Chính
vì vậy, tôi đã lựa chọn đề tài:
“Cấp phátvàcậpnhậtcácmảnhtronghệ thống phân
tán” để nghiên cứu thực hiện.
4
CHƯƠNG I. HỆ ĐA XỬ LÝ
1.1 Tổng quan hệ đa xử lý
1.1.1 Sơ đồ cấu trúc tổng quát của vi xử lý
Tùy thuộc vào các thế hệ khác nhau, các bộ vi xử
lý có thể có cấu trúc bên trong khác đi nhưng vẫn có một
số nguyên tắc hoạt động cơ bản nhất.
Vi xử lý là một mạch số có thể thực hiện nhiều
chức năng số khác nhau. Nó sẽ thực hiện một bài toán,
một công việc khi được cung cấp một chương trình. Một
chương trình là một chuỗi các tín hiệu nhị phân nối tiếp
nhau, mỗi chuỗi nhị phân sẽ yêu cầu (cho phép) một chức
năng của vi xử lý hoạt động. Quá trình làm việc của vi xử
lý bao gồm hai chu kỳ chính lặp lại một cách liên tục đó
là:
- Chu kỳ lấy các mã lệnh.
- Chu kỳ thực hiện các chức năng mà lệnh yêu cầu.
Tương ứng với hai chu kỳ trên có thể chia vi xử lý ra hai
phần chính: Đơn vị thực hiện lệnh EU (Execution Unit),
và đơn vị giao tiếp BUS (Bus Interface).
1.1.2 Đa xử lý CMP (Chip multi processor)
SIMD (Single Instrucstion stream, Multiple Data
stream - Đơn chỉ thị đa dữ liệu)
5
Các máy tính loại SIMD gồm các bộ xử lý giống
nhau, các bộ vi xử lý này cùng thực hiện một lệnh giống
nhau để xử lý nhiều dòng dữ liệu khác nhau. Mỗi bộ xử lý
có bộ nhớ dữ liệu riêng, nhưng chỉ có chung một bộ nhớ
lệnh và một bộ xử lý điều khiển, bộ nhớ này đọc và thi
hành các lệnh. Tính song song trongcác máy SIMD là
tính song song của các dữ liệu.
MIMD (Multiple Instruction Stream, Multiple
Data Stream)
Một hệ thống MIMD là một hệ thống nhiều bộ xử
lý và nhiều bộ nhớ, trong đó mỗi bộ xử lý có một đơn vị
xử lý riêng và thực hiện chương trình riêng. Các máy
MIMD xử lý phântán thông qua một số các bộ xử lý độc
lập, chia sẻ tài nguyên chứa tronghệ thống bộ nhớ chính,
mỗi bộ xử lý thực hiện độc lập, đồng thời và thực hiện các
chương trình riêng. Cáchệ thống MIMD thực hiện các
phép toán theo dạng song song không đồng bộ, các nút
hoạt động hợp tác chặt chẽ nhưng thực hiện độc lập. Ví dụ
trong hệ thống phục vụ đặt chỗ máy bay, việc đặt chỗ xảy
ra thường xuyên, liên tục và đồng thời, mỗi cuộc đặt chỗ
cần một chương trình để thực hiện, các chương trình này
6
không bắt đầu song song từng lệnh một, do đó chúng ta có
nhiều dòng chảy lệnh và nhiều dòng chảy dữ liệu.
1.2 Ứng dụng đa xử lý dữ liệu
Database server: Database server là dịch vụ kết nối
trực tiếp đến máy chủ chứa cơ sở dữ liệu. Server là một
máy chủ mà trên đó có cài đặt phần HQTCSDL như: SQL
Server, MySQL, Oracle… dịch vụ Database server hoàn
toàn đạt hiệu quả nếu hệ thống được thiết kê có bộ nhớ
được chia sẻ kiểu kiến trúc MIMD UMA.
Web server: Web server là dịch vụ mà một máy
tính (máy chủ) trên đó cài đặt phần mềm phục vụ Web hay
còn gọi là Web Server. Dịch vụ Web Server sử dụng hệ
thống bộ nhớ không chia sẻ MIMD NUMA.
Multimedia: Là kỹ thuật tích hợp trên một nền
thống nhấtcác dạng dữ liệu khác nhau với sự hỗ trợ của
máy tính.
CAD/CAM:
CAD là cácphần mềm thiết kế vàcácphần mềm vẽ
có sự trợ giúp của máy tính.
CAM là một hoạt động cụ thể trong công nghệ chế
tạo cơ khí. Kết quả của CAM là cụ thể, đó là chi tiết cơ
khí.
7
1.3 Tổng quan về quản trị cơ sở dữ liệu phântán
1.3.1 Khái niệm cơ sở dữ liệu phântán
Hệ CSDL phântán - DDBS System (DDBS): Là
một tập hợp dữ liệu có liên đới logic và được phân bố trên
các nút của một mạng máy tính.
Hệ quản trị CSDL phântán (DDBMS) là một hệ
thống phần mềm cho phép quản lý các DDBS và làm cho
việc phântán trở nên vô hình đối với người sử dụng.
Những gì có thể phân tán? đó là phântán thiết bị
xử lý, phântán chức năng, phântán dữ liệu, vàphântán
quyền điều khiển.
Tại sao phải thực hiện phân tán? việc xử lý phân
tán nhằm thích ứng tốt hơn với việc phân bố ngày càng
rộng rãi của các công ty, tổ chức; ứng dụng được sự phát
triển của công nghệ máy tính hiện tại bao gồm: phần cứng,
phần mềm)
1.3.2 Các đặc điểm chính của hệ cơ sở dữ liệu phân
tán
1.3.2.1 Chia sẻ tài nguyên
1.3.2.2 Tính mở
8
Là dễ ràng mở rộng nâng cấpphần cứng vàcác
thiết bị phần mềm với điều kiện là các thành phần này
phải theo một tiêu chuẩn chung.
1.3.2.3 Khả năng song song
+ Nhiều người sử dụng đồng thời ra các lệnh hay các
tương tác với các chương trình ứng dụng.
+ Nhiều tiến trình server chạy đồng thời, mỗi tiến trình
đáp ứng yêu cầu từ các tiến trình Client khác.
1.3.2.4 Khả năng mở rộng
Khả năng mở rộng được đặc trưng bởi tính không
thay đổi phần mềm hệ thống vàphần mềm ứng dụng khi
hệ thống được mở rộng.
1.3.2.5 Khả năng thứ lỗi
+ Dùng khả năng thay thế để đảm bảo sự hoạt động liên
tục và hiệu quả.
+ Dùng các chương trình hồi phục khi gặp sự cố.
1.3.2.6 Tính trong suốt
Được hiểu như là sự che khuất đi các thành phần
riêng biệt của hệ đối với người sử dụng và những người
lập trình ứng dụng: +Tính trong suốt về vị trí;+ Tính trong
suốt trong việc sử dụng;+ Tính trong suốt của việc phân
chia;+ Tính trong suốt trong sự trùng lặp.
9
1.3.2.7 Đảm bảo tính tin cậy vànhất quán
Sự bí mật của dữ liệu phải được bảo vệ, các chức
năng khôi phục hư hỏng phải được đảm bảo, ngoài ra yêu
cầu nhất quán của dữ liệu cũng rất quan trọngtrong thể
hiện (Khi các thuộc tính dữ liệu là khác nhau thì các thao
tác phải nhất quán).
1.3.3 Mục đích của việc sử dụng dữ liệu phântán
- Đáp ứng nhu cầu nhanh nhất, hiệu quả nhấttrong
việc cậpnhậtvà chia sẻ thông tin, cũng như các yêu cầu
làm việc trong môi trường mạng Internet, tintranet phát
triển rực rỡ như hiện tại, rất phù hợp cho các Công ty và
các Tập đoàn mở rộng vàphát triển trong xu thế toàn cầu
hóa và hội nhập hóa.
- Độ tin cậy và khả năng sử dụng nâng cao
- Khả năng phục hồi nhanh chóng
1.3.4 Kiến trúc cơ bản của hệphântán
1.3.5 Các yếu tố phức tạp của hệ quản trị cơ sở dữ
liệu phântán
Có ba yếu tố phức tạp chính như sau:
+ Dữ liệu có thể được nhân bản.
+ Khi có sự cố làm gián đoạn, hư hỏng thì hệ thống
phải đảm bảo rằng các tác dụng đó sẽ có ở trên dữ liệu và
10
tại (những) vị trí bị mất liên lạc sau khi hệ thống đã khôi
phục lại hoạt động.
+ Đồng bộ hoá các giao dịch trên nhiều vị trí sẽ khó
khăn hơn so với hệ thống tập trung.
1.3.6 Cácvấnđề cần giải quyết khi xây dựng hệ cơ sở dữ
liệu phântán
+ Xử lý vấn tin phân tán;+ Quản lý thư mục phân
tán;+ Điều khiển đồng thời phân tán;+ Quản lý khóa gài
phân tán;+ Độ khả tín của hệ quản trị cơ sở dữ liệu phân
tán;+ Hỗ trợ điều hành;+ Cơ sở dữ liệu đa chủng loại
1.4 Kết luận
Do sự phát triển mạnh mẽ của cáchệ đa xử lý ngày
càng nhanh, đòi hỏi người lập trình cũng có những hướng
phát triển phần mềm một cách phù hợp đáp ứng việc tính
toán giải quyết công việc nhanh, nâng cao được hiệu năng
xử lý của cáchệ đa xử lý, tiết kiệm thời gian công sức,
giảm nhiều chi phí, giải quyết được cácvấnđề lớn hơn,
phức tạp hơn và tăng khả năng xử lý đồng thời cao hơn…
Đòi hỏi phải xây dựng được các cơ sở dữ liệu trong
đó có cơ sở dữ liệu phântán đáp ứng được việc hội nhập
kinh tế toàn cầu, đáp ứng được việc phát triển mở rộng
của các tổ chức kinh tế toàn cầu khi có cácvăn phòng, chi
[...]... THỬ NGHIỆM 3.1 Bài toán cấp phát vàvấnđề cập nhật dữ liệu 3.1.1 Cập nhậtcác quan hệ trung gian 3.1.2 Cập nhậtcác mảnh Tác nhân chính ảnh hưởng đến hiệu qủa hoạt động của một chiến lược thực hiện là kích thước cácmảnh được tạo ra Khi cấpphátcácmảnh đến các vị trí khác, kích thước các quan hệ trung gian vàmảnh phải được tính toán Vì 22 cácmảnh thường xuyên được cậpnhật nên chúng ta luôn luôn... lưu tại các Workstation 2.1.3 Thiết kế cơ sở dữ liệu phântán Thiết kế một hệ thống máy tính phântán cần phải chọn những vị trí đặt dữ liệu và chương trình trên một mạng máy tính, rất có thể phải kể luôn cả việc thiết kế hệ 13 thống mạng Đối với DDBMS, việc phântáncác ứng dụng đòi hỏi hai vấn đề: - Phântánhệ quản trị CSDL vàphântáncác chương trình ứng dụng chạy trên hệ quản trị đó - Phântán dữ... định rất quan trọng, có ảnh hưởng tới hiệu năng vấn tin Mức độ phânmảnh có thể là thái cực không phânmảnh thành từng bộ phận (trường hợp phânmảnh ngang) hoặc thành từng thuộc tính ( trường hợp phânmảnh dọc) 2.2.4 Phương pháp phânmảnh cơ sở dữ liệu phântán 2.2.4.1 Phânmảnh ngang vàphânmảnh ngang dẫn xuất a) Phânmảnh ngang nguyên thủy b) Phânmảnh dọc 2.3 Bài toán qui hoạch toán học 2.3.1 Bài... hợp mãi các vi mạch vào một con chíp trên cùng một diện tích được, chính vì vậy các nhà sản xuất đã cho ra đời các chíp đa xử lý Đểtận dụng ưu điểm đó các nhà lập trình sẽ hướng chia các bài toán lớn thành các bài toán nhỏ hơn, đơn giản đi để có thể chạy song song trên một hay nhiều bộ vi xử 25 lý Việc cấpphátvà cập nhậtcác mảnh tronghệ thống phân tán, chia sẻ dữ liệu và thu thập dữ liệu trong môi... tâm hoàn thiện vấnđề bảo mật và toàn vẹn dữ liệu khi phânmảnhvàcậpnhật cơ sở dữ liệu Đểđề tài đi vào thực tế cần phải nghiên cứu kỹ hơn trong việc quản lý kho số di động như: cấpphát giải số mới, thu hồi các số do khách hàng bỏ (không tiếp tục sử dụng), các đoạn giải số mà khách hàng chưa sử dụng đểcậpnhật vào kho số, giúp cho việc quản lý tài nguyên kho số online được tốt hơn trong mạng vinaphone... tâm của chương là việc phânmảnhvà tái cấu trúc cơ sở dữ liệu đồng thời kiểm tra tính đúng đắn của cơ sở dữ liệu Việc cậpnhậtvàcấp phát các mảnh thu được một lời giải tối ưu không hẳn đã là một phương pháp tối ưu trong tính toán Các nghiên cứu chỉ được ra rằng việc đặt vấnđề đơn giản hóa để thiết kế CSDL phântán là không thích hợp vì vậy các nhà nghiên cứu chỉ tìm được ra các giải thuật heuristic... LIỆU PHÂNTÁN 2.1 CSDL phântánvàHệ quản trị cơ sở dữ liệu phântán 2.1.1 Hệ quản trị cở sở dữ liệu Hệ quản trị cơ sở dữ liệu bao gồm một tập cácphần mềm (chương trình) sau: + Các chương trình quản lý dữ liệu phântán + Chứa các chương trình để quản trị việc truyền thông dữ liệu + Các chương trình để quản trị cơ sở dữ liệu địa phương + Các chương trình quản trị từ điển dữ liệu 12 2.1.2 Kiến trúc hệ. .. nhiều vấnđề truy nhập và có thể làm lãng phí nhiều không gian lưu trữ Cuối cùng, việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như một đơn vị, sẽ cho phép thực hiện nhiều lần giao dịch đồng thời và cho phép thực hiện song song một câu vấn tin bằng cách chia nó thành một tập các câu vấn con hoạt tác trên cácmảnh Vì thế ́ việc phânmảnh sẽ làm tăng mức độ hoạt động đồng thời và như... thông tin và biết thông tin một cách đầy đủ Có hai chiến lược chính được xác định trong việc thiết kế các CSDL phântán là tiếp cận từ trên xuống (topdown approach) và tiếp cận từ dưới lên (bottom-up approach) 14 a) Quán trình tiếp cận từ trên xuống b) Quá trình thiết kế từ dưới lên c) Các xu hướng hiện đại của hệ cơ sở dữ liệu phântán 2.2 Cách phânmảnhvà tái cấu trúc cơ sở dữ liệu phântánĐể thuận... Manager 40 Bảng 2.2d: Quan hệ ASG 2.2.1 Tại sao cần phải phânmảnh Trước tiên, khi tạo khung nhìn của các ứng dụng thường chỉ là tập con của mối quan hệ, đơn vị truy xuất không phải là toàn bộ quan hệ Vì vậy đưa tập con của quan hệ ra khung nhìn là tốt nhất cho lên phânmảnhcác quan hệvàphântán đến nơi sử dụng khung nhìn sẽ là điều thích hợp nhất 17 Thứ hai là nếu các ứng dụng có các khung nhìn được . NGHỆ BƯU CHÍNH VIỄN THÔNG
Phạm Đình Luật
VẤN ĐỀ CẤP PHÁT VÀ CẬP NHẬT CÁC MẢNH
TRONG HỆ PHÂN TÁN
Chuyên ngành: Truyền dữ liệu và. thuật và xu hướng
phát triển của thời đại nhất là trong lĩnh vực CNTT. Chính
vì vậy, tôi đã lựa chọn đề tài:
Cấp phát và cập nhật các mảnh trong hệ thống