Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
372,97 KB
Nội dung
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN
THÔNG
BÙI VĂN CÔNG
SÁNH LƯỢCĐỒCHOKHÁMPHÁDỊCHVỤ
WEB
Chuyên Ngành: KHOA HỌC MÁY TÍNH
MÃ SỐ:
60.48.01
TÓM TẮT LUẬN VĂN THẠC
SĨ
Hà Nội - 2012
Luận văn được hoàn thành
tại
:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH
VIỄN
THÔNG
Người hướng dẫn khoa học: PGS.TS TRẦN ĐÌNH QUẾ
Phản biện 1: …………………………………………………….
Phản biện 2: …………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện
Công nghệ
Bưu
chính Viễn
thông
Vào lúc: giờ ngày tháng năm
Có thể tìm hiểu luận văn
tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn
thông
1
MỞ ĐẦU
Dịch vụWeb là các thành phần ứng dụng sử dụng các giao thức mở như
HyperText Transfer Protocol (HTTP), Extensible Markup Language (XML) và
Simple Object Access Protocol (SOAP) [2]. Chúng được thiết kế để hỗ trợ khả
năng tương tác giữa các máy tính với nhau trong mạng. Cho đến nay, nhiều
công ty cung cấp dịchvụWeb tới các khách hàng. Ví dụ như dịchvụweb APIs
của Google cho phép các nhà phát triển phần mềm truy vấn trực tiếp hàng tỉ
trang web từ các chương trình máy tính cá nhân của họ. Nhà phát triển có thể sử
dụng ngôn ngữ lập trình mà họ ưa thích ví dụ như Java, Perl, Visual Studio.Net
để phát triển các ứng dụng truy cập tới các dịchvụweb của Google.
Số lượng các dịchvụWeb đang tăng trưởng với một tốc độ bùng nổ, điều
này đặt ra những thách thức lớn về độ chính xác, tính hiệu quả và tự động truy
xuất dịchvụcho người dùng. Khámphádịchvụ là quá trình đánh giá một truy
vấn cho một dịchvụ và trả về một tập hợp các dịchvụ tương thích. Mục đích
của khámphádịchvụ là để tìm dịchvụWeb thích hợp với một tập hợp các yêu
cầu của người dùng.
Luận văn tập trung vào kỹ thuật sánhlược đồ, nghiên cứu kỹ thuật sánh
lược đồchokhámphádịchvụ web, tập trung vào vấn đề mô hình hóa các thao
tác sánhdịchvụWeb bằng lượcđồ cây và các vấn đề liên quan. Qua đó áp
dụng kỹ thuật đã nghiên cứu, tiến hành cài đặt, thử nghiệm để đưa ra đánh giá,
so sánh từ các kết quả đạt được.
Ngoài phần mở đầu, phần kết luận và các phụ lục, nội dung luận văn
được trình bày trong ba chương.
Chương 1: Dịchvụweb và khámphádịchvụ web. Phần này trình
bày về lý do sự ra đời của dịchvụ web; một số khái niệm trong dịchvụ
web; kiến trúc; cách biểu diễn dịchvụ web; các giai đoạn trong vòng đời
của dịchvụ web.
2
Chương 2: Kỹ thuật sánhlượcđồchokhámphádịchvụ web.
Chương này tập trung nghiên cứu kỹ thuật sánhlượcđồchokhámphá
dịch vụ web; tập trung vào vấn đề mô hình hóa các thao tác sánhdịchvụ
web bằng lượcđồ cây và các vấn đề liên quan; các tiêu chí để phân loại
kỹ thuật khámphádịchvụ web; một số thuật toán khám phá.
Chương 3: Thực nghiệm và kết quả. Chương này sẽ mô tả chi tiết về
các công cụ, dữ liệu, phương pháp, kỹ thuật lựa chọn thực nghiệm và toàn
bộ quá trình tiến hành thực nghiệm. Kết quả thực nghiệm sẽ được phân
tích, so sánh và đánh giá.
3
CHƯƠNG 1: DỊCHVỤWEB VÀ KHÁMPHÁDỊCHVỤWEB
1.1 Dịchvụweb
Một kiến trúc của dịchvụWeb gồm có 3 chuẩn chính: SOAP (Simple
Object Access Protocol), WSDL (Web Service Description Language) và
UDDI (Universal Description, Discovery, and Integration). Giao tác UDDI sử
dụng SOAP để nói chuyện với UDDI server, sau đó các ứng dụng SOAP yêu
cầu một dịchvụ Web. Các thông điệp SOAP được gửi đi chính xác bởi HTTP
và TCP/IP.
1.1.1 Các thành phần của dịchvụ web: XML, WSDL, UDDI, SOAP
1.1.1.1 Thành phần XML (eXtensible Markup Language)
Là một chuẩn mở do W3C đưa ra cho cách thức mô tả dữ liệu, nó được sử
dụng để định nghĩa các thành phần dữ liệu trên trang web và cho những tài liệu
B2B. Về hình thức, XML hoàn toàn có cấu trúc thẻ giống như ngôn ngữ HTML
nhưng HTML định nghĩa thành phần được hiển thị như thế nào thì XML lại
định nghĩa những thành phần đó chứa cái gì. Với XML, các thẻ có thể được lập
trình viên tự tạo ra trên mỗi trang web và được chọn là định dạng thông điệp
chuẩn bởi tính phổ biến và hiệu quả mã nguồn mở.
Mỗi tài liệu XML bao gồm một prolog, một số các phần tử (element) và một
epilog (tùy chọn).
Prolog bao gồm một khai báo XML và các tham chiếu đến các tài liệu
bên ngoài.
Các phần tử XML có thể có một số thuộc tính giống như HTML. Các
thuộc tính cung cấp thêm thông tin về một phần tử, thông tin này không phải là
một phần dữ liệu. Một thuộc tính là một cặp tên – giá trị bên trong thẻ mở của
phần tử:
4
1.1.1.2 Thành phần WSDL (Web Service Description Language)
WSDL định nghĩa cách mô tả dịchvụWeb theo cú pháp tổng quát của
XML, bao gồm các thông tin:
+ Tên dịchvụ
+ Giao thức và kiểu mã hóa sẽ được sử dụng khi gọi các hàm của dịchvụ
Web
+ Loại thông tin: thao tác, tham số, những kiểu dữ liệu (có thể là giao
diện của dịchvụWeb cộng với tên cho giao diện này).
1.1.1.3 Thành phần UDDI (Universal Description, Discovery, and Integration)
Cấu trúc UDDI :
Trang trắng - White pages: chứa thông tin liên hệ và các định dạng chính
yếu của dịchvụ Web, chẳng hạn tên giao dịch, địa chỉ, thông tin nhận dạng…
Những thông tin này cho phép các đối tượng khác xác định được dịch vụ.
Trang vàng - Yellow pages: chứa thông tin mô tả dịchvụWeb theo những
loại khác nhau. Những thông tin này cho phép các đối tượng thấy được dịchvụ
Web theo từng loại với nó.
Trang xanh - Green pages: chứa thông tin kỹ thuật mô tả các hành vi và
các chức năng của dịchvụ Web.
Loại dịchvụ - tModel: chứa các thông tin về loại dịchvụ được sử dụng.
1.1.1.4 Thành phần SOAP (Simple Object Access Protocol)
Cấu trúc một thông điệp theo dạng SOAP
Thông điệp theo định dạng SOAP là một văn bản XML bình thường bao
gồm các phần tử sau:
Phần tử gốc - envelop: phần tử bao trùm nội dung thông điệp, khai báo
văn bản XML như là một thông điệp SOAP.
Phần tử đầu trang – header: chứa các thông tin tiêu đề cho trang, phần tử
này không bắt buộc khai báo trong văn bản. Header còn có thể mang những dữ
5
liệu chứng thực, những chứ ký số, thông tin mã hóa hay cài đặt cho các giao
dịch khác.
Phần tử khai báo nội dung chính trong thông điệp – body: chứa các thông
tin yêu cầu và thông tin được phản hồi.
Phần tử đưa ra các thông tin về lỗi – fault: cung cấp thông tin lỗi xảy ra
trong qúa trình xử lý thông điệp.
1.2 Khámphádịchvụweb
Để có thể thành công với dịchvụWeb cần phải quan tâm đến khá nhiều
vấn đề, bao gồm việc triển khai, giám sát và tích hợp hệ thống.
Giám sát (monitoring)
Xác định đường đi dữ liệu (Data routing)
Triển khai (Deployment)
Quản lý (Management)
Cấu hình và quản lý phiên bản (Configuration and version management)
Bảo mật (Security)
Các phương pháp khámphádịchvụweb
Việc tìm kiếm các thao tác dịchvụweb tương tự là kết nối lỏng lẻo được
liên quan tới ba vấn đề sánh khác: sánh tài liệu văn bản, sánhlược đồ, sánh các
thành phần phần mềm.
Sánh tài liệu văn bản: Việc sánh và phân loại các tài liệu là một vấn đề
lớn trong việc trích rút thông tin.
Sánh lược đồ: Cơ sở dữ liệu chung được xem xét đối với vấn đề tự động
hóa của việc sánh các lượcđồ [17].
Sánh các thành phần phần mềm: Việc sánh các thành phần phần mềm
được xem như là việc quan trọng đối với việc tái sử dụng phần mềm [9].
1.3 Kết luận chương
Dịch vụWeb hiện tại đang được tích hợp với nhiều hệ thống ứng dụng
trong tất cả các lĩnh vực bởi khả năng phát triển và giảm độ phức tạp của hệ
6
thống, đặc biệt là đối với các dịchvụ B2B. Với dịchvụ Web, các doanh nghiệp,
khách hàng và cả đối tác kinh doanh có thể dễ dàng hoạt động và gắn kết với
nhau. Việc xây dựng một dịchvụWeb cần phải quan tâm đến nhiều yếu tố:
kiến trúc, chức năng và các tiến trình nghiệp vụ của hệ thống, ngôn ngữ sử
dụng… Do đó, với một dịchvụ Web, việc giao tiếp và truyền nhận dữ liệu trở
nên dễ dàng và hiệu quả hơn, đồng thời đem lại chi phí thấp hơn và tăng cường
những khả năng giao tiếp thời gian thực, kết nối với mọi người trên khắp thế
giới. Bản chất của nền tảng công nghệ này là kiến trúc hướng dịchvụ và sự
phát triển của dịchvụWeb có tương lai rất khả quan.
7
CHƯƠNG 2: KỸ THUẬT SÁNHLƯỢCĐỒCHOKHÁMPHÁDỊCHVỤ
WEB
2.1 Khảo sát đặc trưng của các dịchvụweb
Có 4 giai đoạn chính để xây dựng một dịchvụWeb là xây dựng, triển
khai, tiến hành và quản lý.
Giai đoạn xây dựng: bao gồm phát triển và chạy thử ứng dụng dịchvụ
Web, xây dựng các chức năng và định nghĩa dịch vụ.
Giai đoạn triển khai: công bố định nghĩa dịch vụ, xây dựng WSDL và
triển khai mã thực thi của dịchvụ Web.
Giai đoạn tiến hành: tìm kiếm và gọi thực thi dịchvụWeb bởi những
người dùng muốn sử dụng dịch vụ.
Quản lý: quản lý và quản trị dịch vụ, duy trì sự ổn định của dịch vụ, cập
nhật thông tin mới, sửa lỗi khi nó xảy ra.
Qui trình xây dựng một dịchvụWeb bao gồm các bước sau:
a. Định nghĩa và xây dựng các chức năng, các dịchvụ mà dịchvụ sẽ cung
cấp (sử dụng ngôn ngữ Java chẳng hạn).
b. Tạo WSDL chodịchvụ
c. Xây dựng SOAP server
d. Đăng ký WSDL với UDDI registry để cho phép các client có thể tìm
thấy và truy xuất.
e. Client nhận file WSDL và từ đó xây dựng SOAP client để có thể kết
nối với SOAP server
f. Xây dựng ứng dụng phía client (như sử dụng Java) và sau đó gọi thực
hiện dịchvụ thông qua việc kết nối tới SOAP server.
Lựa chọn một ngôn ngữ, xây dựng các tiến trình nghiệp vụ, bắt đầu tạo
nên một dịchvụWeb và cung cấp dịchvụ trên Internet.
8
2.2 Kỹ thuật sánhlượcđồ
Các phương thức sánhlượcđồ đã được đề xuất ở [20]. Phương thức đầu
tiên là sự nỗ lực để xác định sự tương tự ngữ nghĩa giữa các yếu tố của hai lược
đồ. Bởi vậy công việc khảo sát cần bắt đầu với các kỹ thuật tương tự ngữ nghĩa
mà nó đã được sử dụng để sánh giữa hai lược đồ.
2.2.1 Định nghĩa kỹ thuật sánhlượcđồ
Kỹ thuật sánhlượcđồ có thể được hình thức hóa như sau: “Cho hai lược
đồ, S
1
và S
2
, tìm kiếm các thành phần tốt nhất giữa lượcđồ S
1
và lượcđồ S
2
.
Việc khámphá tất cả các thông tin sẵn có trong các lược đồ, các nguồn thể
hiện dữ liệu và các nguồn từ vựng”.
2.2.2 Biểu đồ truyền thống
Sánh lượcđồ truyền thống được xây dựng dựa trên ý tưởng mà có hai
lược đồ cần phải sánh với nhau. Khi số lượng lớn hơn 2 thì việc sánh được thực
hiện trong mỗi cặp với nhau. Vấn đề chính trong sánhlượcđồ truyền thống cho
phép độ tương tự tương ứng giữa các thành phần trong hai lượcđồ input
Định nghĩa 1: Một ánh xạ là một tập của các ánh xạ thành phần, mỗi
trong số chúng chỉ định các thành phần cụ thể của bất kỳ lượcđồ input tương
ứng. Công thức xây dựng như sau: cho hai lượcđồ S
1
và S
2
một ánh xạ được
viết như sau
1 2
, , ,
T k
M M M M
, trong đó M
i
đại diện cho một ánh xạ như một
biến nhị phân. Ví dụ:
1 2
i i
G G
, sao cho
1
1
i
G S
,
2
2
i
G S
và
1
j
i
G
.
2.2.3 Biểu đồ Holistic
Việc sánhlượcđồ là việc khámphá ngữ nghĩa tương ứng giữa các thuộc
tính trong các lượcđồ khác nhau dựa trên nền tảng của việc tìm kiếm và trao
đổi dữ liệu thông qua các nguồn thông tin.
Cách tiếp cận Holistic tạo ra một lượcđồ trong thực tế. Việc xây dựng
này dựa trên “nội dung ngang hàng với nhau” giữa các lược đồ. Dựa trên nội
dung thông tin, việc sánh Holistic sẽ có nhiều lợi ích chẳng hạn như độ chính
[...]... dịchvụ web; một số khái niệm trong dịchvụ web; kiến trúc; cách biểu diễn dịchvụ web, tìm hiểu sâu cách miêu tả dịchvụweb dựa trên các thành phần như WSDL, UDDI, SOAP; các giai đoạn trong vòng đời của dịchvụ web: miêu tả dịch vụ, quảng cáo dịch vụ, lựa chọn dịch vụ, hợp dịch vụ, thực thi dịch vụ, đặc biệt thấy được tầm quan trọng của việc khámphádịchvụ Kỹ thuật sánhlượcđồchokhámphá dịch. .. dịchvụ web: Trình bày kỹ thuật sánhlược đồ: như biểu đồ truyền thống, biểu đồ Holistic, kiến trúc hệ thống sánh, đồng thời nghiên cứu kỹ thuật sánhlượcđồchokhámphádịchvụweb thông qua mô hình hóa các thao tác sánhdịchvụWeb bằng lượcđồ cây, hiệu chỉnh khoảng cách cây, mô hình chi phí cholượcđồ cây, chuyển đổi lượcđồ cây XML Đồng thời xác định tương tự giữa các thao tác dịchvụweb ... các giải thuật sánh sau: o Giải thuật sánh với trọng số lớn nhất o Giải thuật sánh với trọng số cực đại có thứ tự o Giải thuật sánhlượcđồ tổng thể 2.3 Kỹ thuật sánh lược đồ cho khámphádịchvụweb 2.3.1 Giới thiệu về tìm kiếm dịchvụweb Việc tìm kiếm các thao tác dịchvụweb tương tự là kết nối lỏng lẻo được liên quan tới ba vấn đề sánh sau: sánh tài liệu văn bản, sánh lược đồ, sánh các thành phần... web, chưa có demo cụ thể cho thấy kết quả Hướng phát triển: Nghiên cứu các kỹ thuật khác chokhámphádịchvụweb và so sánh đánh giá 24 Xây dựng demo hoàn chỉnh để thấy được kết quả của việc sử dụng kỹ thuật sánh lược đồ cho khámphádịchvụweb đồng thời so sánh với các kỹ thuật sánh khác Nghiên cứu quan hệ giữa quá trình khámphá và lựa chọn dịchvụ ... tiếp cận khámphádịchvụweb dựa trên lược đồ phù hợp và kết hợp sánh dựa trên lược đồ và dựa trên mức đối với khámphádịchvụweb Qua đó đưa ra đánh giá, so sánh các kết quả đạt được trên hai cách tiếp cận trên thông qua các mô hình của chúng Hạn chế: Luận văn mới chỉ dừng ở việc nghiên cứu và đánh giá giữa các cách tiếp cận khác nhau trong việc khámphádịchvụ web, chưa có demo cụ thể cho thấy... bảo toàn Định nghĩa 1: Hệ thống sánhlượcđồ S2 là một ánh xạ - tiền xử lý nhằm nâng cao hiệu năng cho hệ thống S1 nếu với mọi vấn đề sánhlượcđồ P, Cả S1 và S2 tạo ra các tập ánh xạ lượcđồ A1=A2 Định nghĩa 2: Hệ thống sánhlượcđồ S2 là một ánh xạ - bảo toàn nhằm nâng cao cho hiệu năng cho hệ thống S1 nếu với mọi vấn đề sánhlượcđồ P, và cho với mọi ánh xạ lượcđồ T A1 A2 cùng các giá trị... vấn đề tìm kiếm: Cấu trúc của các dịchvụ Web: Đối với mỗi dịchvụweb có một file WSDL được liên kết để mô tả chức năng và giao diện của nó Một dịchvụweb được công bố bởi việc đăng ký file WSDL của nó và một mô tả trong UDDI 2.3.3 Giải thuật phân cụm các thao tác dịchvụWeb Kỹ thuật sánhlượcđồ được phân cụm - Một kỹ thuật nhằm nâng cao hiệu năng cho việc sánhlượcđồ bằng cách sử dụng giải thuật... cả hai đều là phương pháp thống kê mà lợi ích thu được từ các quan sát với cách tiếp cận Holistic việc sánhlượcđồ đại diện cho hai phương pháp 2.2.4 Kiến trúc hệ thống sánhDo việc phổ biến rộng rãi của việc sánhlượcđồ đưa đến sự hình dung giải pháp chung, phù hợp đối với các ngôn ngữ lượcđồ khác nhau và các miền ứng dụng chẳng hạn như một giải pháp có tiềm năng cao được phát triển, dođó việc... thành phần phần mềm o Sánh tài liệu văn bản: việc sánh và phân loại các tài liệu là một vấn đề lớn trong việc trích rút thông tin 10 o Sánhlược đồ: Là cơ sở dữ liệu chung được xem xét đối với vấn đề tự động hóa của việc sánh các lượcđồ [12,13], thông qua đó nó xác định ngữ nghĩa của các lượcđồ và đề xuất các thao tác sánh dựa trên chúng o Sánh các thành phần phần mềm: việc sánh các thành phần phần... áp dụng cho các node liên kết Sau quá trình kết hợp, mỗi node liên kết được thay thế bởi tất cả các node tùy chọn của nó, ví dụ được thay thế bởi tất cả node con của nó - delete (xóa): luật này được áp dụng cho các node đa dạng 2.3.2.5 Xác định tính tương tự giữa các thao tác dịchvụweb Việc xác định tính tương tự giữa các thao tác dịchvụWeb thực chất là việc mô tả cấu trúc của các dịchvụWeb thông . nghiên cứu kỹ thuật sánh
lược đồ cho khám phá dịch vụ web, tập trung vào vấn đề mô hình hóa các thao
tác sánh dịch vụ Web bằng lược đồ cây và các vấn đề. nghiên cứu kỹ thuật sánh lược đồ cho khám phá
dịch vụ web; tập trung vào vấn đề mô hình hóa các thao tác sánh dịch vụ
web bằng lược đồ cây và các vấn đề