HOÀN THIỆN kỹ THUẬT đảm bảo gắn bó dữ LIỆU TRÊN các WEBSITE KHI cập NHẬT CSDL BẰNG NGÔN NGỮ ASP TRÊN MẠNG INTERNET (1)

23 388 0
HOÀN THIỆN kỹ THUẬT đảm bảo gắn bó dữ LIỆU TRÊN các WEBSITE KHI cập NHẬT CSDL BẰNG NGÔN NGỮ ASP TRÊN MẠNG INTERNET (1)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG ------ TIỂU LUẬN Môn: HỆ PHÂN TÁN Đề tài: HOÀN THIỆN KỸ THUẬT ĐẢM BẢO GẮN DỮ LIỆU TRONG CÁC WEBSITE KHI CẬP NHẬT CƠ SỞ DỮ LIỆU BẰNG NGÔN NGỮ ASP TRÊN MẠNG INTERNET GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Lớp: Cao học KHMT K24 Khóa: 2011-2013 ĐÀ NẴNG, 04/2012 LỜI NÓI ĐẦU ------ Hiện nay các hệ thống thông tin trên mạng rất phổ biến như các website mua bán máy tính, đăng thi và thi qua mạng, các website thương mại điện tử, . đang phát triển rất mạnh mẽ và ngày càng chuyên nghiệp hơn. Cùng với đó là một xu hướng kỹ thuật mới được hình thành đó là xu hướng phân tán các thành phần tạo nên hệ tin học theo hướng tiếp cận nơi sử dụng và sản xuất thông tin trên cơ sở mạng máy tính nhằm khai thác có hiệu quả toàn hệ, nhất là vấn đề việc khai thác và sử dụng các tài nguyên một cách có hiệu quả nhất. Đó cũng chính là nội dung của học phần Hệ phân tán mà tôi đã được học, trong phạm vi báo cáo này sẽ trình bày về vấn đề đảm bảo gắn dữ liệu cho các website khi cập nhật dữ liệu bằng ngôn ngữ ASP. Trong thời gian làm bài tiểu luận này, tôi đã nhận được rất nhiều sự hỗ trợ của các quý thầy và các bạn học cùng lớp, đặc biệt xin gửi lời cảm ơn chân thành nhất đến thầy Lê Văn Sơn đã giúp đỡ tôi hoàn thiện bài tiểu luận này. Trân trọng cảm ơn ! Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 1 CHƯƠNG I CÁC KHÁI NIỆM VỀ HỆ TIN HỌC PHÂN TÁN I.1 Định nghĩa hệ tin học phân tán Hệ tin học phân tán là hệ thống xử lý thông tin bao gồm nhiều bộ xử lý hoặc các bộ xử lý nằm ở xa ở các vị trí khác nhau và được liên kết với nhau thông qua phương tiện viễn thông dưới sự điều khiển thống nhất của hệ điều hành. Hệ phân tán là một tập hợp bao gồm các bộ xử lý hoặc bộ vi xử lý với bộ nhớ và đồng hồ độc lập. Điều này đồng nghĩa với việc các bộ xử lý không sử dụng chung bộ nhớ và đồng hồ. Trong hệ tin học phân tán, các tính toán có thể được tính trên nhiều bộ xử lý hay trên vi xử lý của hệ thống đa bộ xử lý. Như vậy hệ thống hệ tin học phân tán đòi hỏi hệ thống của mình phải trang bị bộ nhớ cục bộ. Các bộ xử lý trao đổi thông tin qua các hệ thống đường truyền khác nhau như là cáp chuyên dụng, bus trao đổi, đường điện thoại, cáp quang, . . . Khác với hệ thống máy đơn, mạng máy tính là tập hợp các thiết bị đầu cuối được kết nối với nhau thông qua hệ thống đường truyền. Các thiết bị đầu cuối của máy tính rất đa dạng, bao gồm tập hợp các máy tính, các thiết bị chuyên dụng, các thiết bị truyền tin, các thiết bị tiếp nhận và hiển thị thông tin. Hệ thống mạng máy tính được điều khiển bằng hệ điều hành mạng. Hệ thống tin học này có thể là hệ tập trung hoặc hệ phân tán. Căn cứ vào các thành phần của hệ tin học, ta nhận thấy hệ tin học có thể bao gồm bốn thực thể sau: GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Các hệ thống phần mềm Hệ thống dữ liệu Tập hợp phần cứng Hệ thống truyền thông Hình 1 Các thực thể của hệ tin học phân tán Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 2 Trong hệ tin học phân tán, cấu hình phần cứng của mạng có thể bao gồm các bộ xử lý có cấu tạo hoàn toàn khác nhau về khả năng, tốc độ và được thiết kế cho các chức năng khác nhau. Chúng có thể là các bộ xử lý, các trạm làm làm việc, các máy tính tập trung và các máy tính điện tử vạn năng lớn. Chúng được gọi bằng các tên khác nhau như trạm, node . . . căn cứ vào ngữ cảnh mà ở đó nó được nêu ra. Ngoài hệ thống phần cứng, phần mềm, dữ liệu thì hệ phân tán còn có hệ thống truyền thông được mô tả như ở trên. Song điều cơ bản để phân biệt hệ tin học phân tán với mạng máy tính là và hệ điều hành mạng chính là nguyên tắc xây dựng hệ. I.2 Ưu điểm và hạn chế của hệ thống phân tán I.2.1 Ưu điểm  Chia sẻ tài nguyên: Chia sẻ tài nguyên trong hệ thống phân tán cung cấp một cơ chế để chia sẻ tập tin ở vị trí xa, xử lý thông tin trong một cơ sở dữ liệu phân tán, in ấn tại một vị trí xa, sử dụng những thiết bị ở xa để thực hiện các thao tác…  Tăng tốc độ tính toán: Hệ thống phân tán cho phép phân chia việc tính toán trên nhiều vị trí khác nhau để tính toán song song.  An toàn: Nếu một vị trí trong hệ thống phân tán bị hỏng, các vị trí khác vẫn tiếp tục làm việc mà không ảnh hưởng đến toàn bộ hệ thống.  Thông tin liên lạc với nhau: Có nhiều lúc, chương trình cần chuyển đổi dữ liệu từ vị trí này sang vị trí khác. Khi các vị trí được nối kết với nhau trong một hệ thống mạng, việc trao đổi dữ liệu diễn ra rất dễ dàng. I.2.2 Hạn chế  Giá phát triển phần mềm cao: Do các khó khăn khi cài đặt một hệ thống phân tán, giá thành sẽ tăng lên.  Dễ mắc lỗi hơn: Vì các trạm trong hệ phân tán làm việc song song, khó có thể đảm bảo thuật toán được thực hiện đúng trên tất cả các trạm. Do vậy mà số lỗi sẽ tăng lên. GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 3  Khối lượng các xử lý tăng: Hệ thống phân tán cần truyền nhiều thông báo, nhiều tính toán phụ. Do vậy khối lượng xử lý tăng lên so với hệ thống tập trung. I.3 Nguyên tắc xây dựng hệ phân tán  Chia sẻ tài nguyên: Thực tế phát triển mạng máy tính đặt ra một vấn đề lớn là cần phải dùng chung tài nguyên. Một tiến trình trên một trạm nào đó có thể cung cấp tài nguyên dùng chung ở một trạm khác.  Liên lạc: Khi các hệ thống đã được mắc nối với nhau, các thực thể trong hệ có thể trao đổi thông tin với nhau.  Tin cậy: Một trạm trong hệ bị sự cố không làm cho toàn hệ ảnh hưởng, mà ngược lại, công việc đó được phân cho các trạm khác đảm nhận. Ngoài ra, trạm bị sự cố có thể tự động phục hồi lại trạng thái ban đầu trước khi có sự cố hay trạng thái ban đầu của nó.  Tăng tốc: Đây là khái niệm mới về phân tán tải. Một tính toán lớn nào đó, nếu chỉ sử dụng một trạm thì thời gian cho kết quả lâu. Tính toán này được chia nhỏ và thực hiện song song trên các trạm. Điều này cũng cần thiết đối với các trạm quá tải. I.4 Điều kiện của hệ phân tán Để đảm bảo hoạt động thì các hệ thống kết nối với nhau phải thỏa mãn hai điều kiện cơ bản sau đây :  Bất kỳ một hệ thống thành phần nào (hệ cục bộ) đều có thể liên lạc thông suốt với các hệ thống thành phần khác.  Mỗi một hệ thống cục bộ được đặc trưng bằng một tên duy nhất và tên này có thể được nhận biết bởi các hệ thống viễn thông. GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 4 CHƯƠNG II SỰ GẮN THÔNG TIN TRONG CƠ SỞ DỮ LIỆU II.1 Các điều kiện giả định và thực tế Ta có một tập hợp các thông tin nào đó có thể được truy cập bởi một tập các tiến trình. Số lượng các thông tin có thể truy cập được và các tiến trình có nhu cầu thông tin là con số cố định. Hệ này phát triển rời rạc theo thời gian giữa các điểm quan sát, ta có thể nhận biết được trạng thái thực của chúng, có nghĩa là các đối tượng và các ngữ cảnh thực hiện tiến trình, hệ kiểu như vậy hoạt động với độ ổn định cao. Các điều kiện giả định này so với thực tế có các điểm khác biệt cơ bản như sau: STT So sánh 1 Các đối tượng và các tiến trình có thể được tạo lập và hủy bỏ có tính chất động trong suốt quá trình tồn tại của hệ 2 Các đối tượng và các tiến trình có thể được phân tán trên các trạm khác nhau, liên hệ với nhau qua hệ thống viễn thông. Do vậy, ta không thể xác định trạng thái thời điểm của hệ vì lý do độ trễ đường truyền giữa các trạm và tính không tương thích giữa các điểm quan sát trong trạm đó. 3 Hệ thống viễn thông và các tiến trình là các đối tượng có thể xảy ra các sự cố về kỹ thuật. II.2 Tác động và giao dịch Các đối tượng khác nhau của hệ không phải là các đối tượng độc lập với nhau, chúng quan hệ với nhau bởi tập các quan hệ gọi là các ràng buộc toàn vẹn. Các ràng buộc này thể hiện sâu sắc các đặc tính riêng biệt của hệ. Trạng thái của hệ thỏa mãn một tập các ràng buộc toàn vẹn gọi là trạng thái gắn bó. GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 5 Các nhà thiết kế và vận hành hệ mong muốn rằng việc thực hiện các tiến trình phải duy trì cho được hệ trong trạng thái gắn bó. Để chính xác hóa đặc tính này, cần phải lưu ý là trạng thái của hệ chỉ được xác định ở mức quan sát cho trước. Ta quan tâm đến hai mức quan sát sau: STT Mức Giải thích 1 Người sử dụng Tiến trình là một dãy thực hiện các giao dịch. Giao dịch đó là chương trình duy nhất được thực hiện từ một trạng thái gắn dẫn hệ đến một trạng thái gắn khác. 2 Hệ thống Mỗi giao dịch được cấu tạo từ một dãy các tác động được thể hiện như sau: Nếu hai tác động A và B thuộc hai giao dịch khác nhau được thực hiện bởi hai tiến trình thì hiệu ứng tổng quát của chúng sẽ là hiệu ứng của dãy (A,B) hoặc là (B,A). Nếu một tập hợp các giao dịch M được thực hiện bởi các tiến trình độc lập và được thực hiện một cách tuần tự, điều này có nghĩa là các giao dịch này thực hiện xong thì giao dịch khác mới thực hiện và tuân thủ theo một trật tự nào đó. Sự gắn của hệ được bảo toàn. Ở mức hệ thống ta có thể nói rằng tác động là phần tử nhỏ nhất của hệ thống mà ta không thể chia cắt được nữa. Nhưng vì lý do hiệu quả nên các giao dịch được xử lý song song nên việc gắn dữ liệu không còn được đảm bảo. Một yếu tố quan trọng khác là trong quá trình thực hiện các giao dịch không được thực hiện một cách ngắt quãng mà phải liên tục cho đến khi giao dịch kết thúc nhằm đảm báo tính gắn dữ liệu. II.3 Tác động của sự cố đối với việc gắn dữ liệu Phương pháp đảm bảo gắn dữ liệu một cách khả thi trong điều kiện có sự cố cho các hệ thống thông tin, bản chất của vấn đề gắn dữ liệu cũng như nguyên nhân dẫn đến GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 6 sự cố làm cho dữ liệu không còn gắn được chỉ ra và nhóm ghép trong quá trình phân tích và thiết kế hệ thống. Một cơ sở dữ liệu được xem là gắn nếu nó thỏa mãn các ràng buộc về toàn vẹn ngữ nghĩa. Để đảm bảo tính gắn dữ liệu nhiều cơ chế cũng như kiểm soát tính toàn vẹn về mặt ngữ nghĩa được sử dụng. Việc kiểm soát tính toàn vẹn ngữ nghĩa tốt sẽ đảm bảo được tính gắn dữ liệu của hệ thống thông tin. Hiện nay, người ta đang áp dụng hai phương pháp chủ yếu sau:  Loại bỏ các chương trình/ thủ tục cập nhật có thể dẫn đến trạng thái không gắn dữ liệu trong các cơ sở dữ liệu.  Triệu gọi các chương trình/thủ tục đặc biệt đã được cài đặt sẵn trên hệ thống nhằm khôi phục trạng thái ban đầu trước khi cập nhật. Để có thể khôi phục lại dữ liệu và trạng thái gắn thông tin của toàn hệ thống khi có sự cố xảy ra, một trong những vấn đề hàng đầu là xác định được loại, bản chất và vị trí diễn ra sự cố mà tự đó nhận biết một cách tự động và chuyển đến phương án giải quyết nào cho phù hợp. Tổng quan, sự cố có thể chia làm hai loại chính là sự cố xảy ra do các trạm trên hệ phân tán và sự cố do hệ thống viễn thông gây ra. Để tiện lập trình giải pháp, người ta cụ thể hóa thành bốn mức và các nguyên nhân thể hiện trong bảng sau: STT Loại sự cố Nguyên nhân 1 Sự cố giao dịch Do một lỗi nào đó trong bản thân giao dịch gây nên. 2 Sự cố vị trí Do một lỗi phát sinh trong quá trình vận hành hệ thống. Lỗi này có thể xuất phát từ các thiết bị phần cứng. Khi bị sự cố hệ thống lập tức ngừng hoạt động. Hệ thống chương trình, đặc biệt là các chương trình điều khiển GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 7 cũng có thể sinh ra lỗi. Đó là các lỗi do thuật toán hoặc do viết lệnh sai, do lưu trữ chương trình hay do virus. Các lỗi này thường là ở các chường trình và ở cơ sở dữ liệu. 3 Sự cố phương tiện Do sự cố của các thiết bị lưu trữ thứ cấp dùng để lưu cơ sở dữ liệu. Khi có sự cố này thì một phần hoặc tất cả cơ sở dữ liệu trên thiết bị đó được xem như bị hủy hoại hoặc không thể truy cập một cách bình thường được. 4 Sự cố đường truyền Do lỗi trong các thông điệp, các thông điệp vô trật tự, thông điệp bị thất lạc hoặc không phân phối thông điệp và các sự cố khác liên quan đến đường truyền. Bảng 1: Các loại sự cố và nguyên nhân gây nên sự cố Phương pháp tổng quan cho việc khắc phục bốn loại sự cố trên được trình bày trong bảng sau: STT Loại sự cố Cách khắc phục 1 Sự cố giao dịch Hủy bỏ giao dịch, sau đó đặt lại cơ sở dữ liệu về trạng thái của nó trước khi khởi động giao dịch này. 2 Sự cố vị trí Thiết kế nghi thức ủy thác nguyên tử không bị phong tỏa. 3 Sự cố phương tiện Được xem như những vấn đề cục bộ của một vị trí, vì vậy không xem xét trong trường hợp các hệ thống phân tán. 4 Sự cố đường truyền Sử dụng bộ đếm thời gian và cơ chế quá hạn và theo dõi xem đã qua bao lâu kể từ khi vị trí gởi không nhận được thông điệp trả lời của vị trí đến. GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh Gắn dữ liệu trong các website khi cập nhật bằng ASP Trang 8 II.4 Xử lý các sự cố Ta giả sử rằng các bộ xử lý và bộ nhớ tạo nên các trạm là nguyên nhân chính của sự cố ngắt quãng quá trình thực hiện các tiến trình. Các hệ thống viễn thông cũng có thể là nơi diễn ra các sự cố làm mất hẳn hoặc chồng chéo các thông điệp. Ta xét sự gắn thông tin không chỉ trong các điều kiện thuận lợi như đã nêu trước đây mà còn tính đến các yếu tố mới và cũng xét đến các công cụ cho phép đảm bảo cho sự gắn này. Nếu một tiến trình nào đó bị sự cố trong khi thực hiện giao dịch thì trạng thái của hệ xuất phát từ việc thực hiện từng phần đó chắc chắn sẽ không còn đảm bảo sự gắn bó. Một cơ chế cho phép duy trì sự gắn trong môi trường phân tán có sự cố phải được thực hiện như sau: STT Công việc phải thực hiện 1 Một giao dịch bắt buộc phải thực hiện một cách trọn vẹn. 2 Nếu có sự cố xảy ra thì bắt buộc giao dịch phải quay về điểm xuất phát. Muốn thực hiện những điều vừa nêu trong bảng trên, người ta đòi hỏi phải có các đặc tính toàn vẹn như sau: STT Đặc tính 1 Nếu một tiến trình bị sự cố trước khi kết thúc một giao dịch T nhưng lại sau các thay đổi cần thiết của T thì hệ là gắn bó. 2 Nếu một tiến trình bị sự cố trước khi kết thúc một giao dịch T nhưng lại trước các thay đổi cần thiết của T thì hệ là gắn bó. GVHD: PGS.TS. Lê Văn Sơn Thực hiện: Đặng Quý Linh

Ngày đăng: 30/12/2013, 16:13

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan