MỤC LỤC
Ví dụ, đặt Web server trên một máy chủ chạy hệ điều hành Linux trong khi người dùng sử dụng máy tính chạy hệ điều hành Windows, ứng dụng vẫn có thể chạy và xử lý bình thường mà không cần thêm yêu cầu đặc biệt để tương thích giữa hai hệ điều hành.Các ứng dụng có tích hợp dịch vụ Web đã không còn là xa lạ, đặc biệt trong điều kiện thương mại điện tử đang bùng nổ và phát triển không ngừng cùng với sự lớn mạnh của Internet. Bất kì một lĩnh vực nào trong cuộc sống cũng có thể tích hợp với dịch vụ Web, đây là cách thức kinh doanh và làm việc có hiệu quả bởi thời đại ngày nay là thời đại của truyền thông và trao đổi thông tin qua mạng. Sử dụng các giao thức và chuẩn mở , giao thức và định dạng dữ liệu dựa trên văn bản (text), giúp các lập trình viên dễ dàng hiểu được.
Thúc đẩy đầu tư các hệ thống phần mềm đã tồn tại bằng cách cho phép các tiến trình/chức năng nghiệp vụ (hàm) đóng gói trong giao diện dịch vụ Web. Thúc đẩy hệ thống tích hợp, giảm sự phức tạp của hệ thống, hạ giá thành hoạt động, phát triển hệ thống nhanh và tương tác hiệu quả với hệ thống của các doanh nghiệp khác. Những thiệt hại lớn sẽ xảy ra vào khoảng thời gian chết của Dịch vụ Web, giao diện không thay đổi, có thể lỗi nếu một máy khách không được nâng cấp, thiếu các giao thức cho việc vận hành.
Là một chuẩn mở do W3C đưa ra cho cách thức mô tả dữ liệu, nó được sử dụng để định nghĩa các thành phần dữ liệu trên trang web và cho những tài liệu B2B. Về hình thức, XML hoàn toàn có cấu trúc thẻ giống như ngôn ngữ HTML nhưng HTML định nghĩa thành phần được hiển thị như thế nào thì XML lại định nghĩa những thành phần đó chứa cái gì. Với XML, các thẻ có thể được lập trình viên tự tạo ra trên mỗi trang web và được chọn là định dạng thông điệp chuẩn bởi tính phổ biến và hiệu quả mã nguồn mở.
XML là công cụ chính để giải quyết vấn đề này và là kiến trúc nền tảng cho việc xây dựng một dịch vụ Web, tất cả dữ liệu sẽ được chuyển sang định dạng thẻ XML. Khi đó, các thông tin mã hóa sẽ hoàn toàn phù hợp với các thông tin theo chuẩn của SOAP hoặc XML- RPC và có thể tương tác với nhau trong một thể thống nhất. XML là ngôn ngữ xây dựng cấu trúc tài liệu văn bản, dựa theo chuẩn SGML (Standard Generalized Markup Language: siêu ngôn ngữ có khả năng sinh ngôn ngữ khác).
Từ những ngày đầu của Internet,người ta đã quan tâm đến tính an toàn trong trao đổi thông tin.Mặc dù,không có sự an toàn tuyệt đối,nhưng những phát triển trong lĩnh vực này thì rất nhanh và mang lại nhiều thành quả vì đây là vấn đề cấp bách của nhiều doanh nghiệp.Không có một mức an toàn thích hợp,sự khai thác thương mại của internet thì không hoàn toàn an toàn.Do đó những giải thuật để kiểm chứng,sự mã hóa khóa thông tin và chữ ký số hóa có thể là những giải pháp cung cấp một mức đủ an toàn. HTTP(HyperText Transfer Protocol): là giao thức thường được sử dụng nhất cho việc trao đổi thông tin trên internet,tuy nhiên lại là một giao thức không an toàn,bởi vì tất cả thông tin được gởi dưới dạng văn bảng trong mạng ngang hàng không an toàn.HTTP thuộc về nhóm của những phương thức như SMTP,telnet và FTP được thiết kế trong giai đoạn đầu của internet mà vẫn đề an toàn chưa được quan tâm nhiều.Một phát triển của HTTP là HTTPS(HTTP+SSL(Secure Socket Layer)) ,nó là một chuẩn an toàn cho HTTP,khí bạn truyền dữ liệu từ client đến server (chẳng hạn user+password) dữ liệu được mã hóa trước khi truyền,hacker có bắt được cũng khó có thể biết được password của bạn là gì. SOAP/HTTP dựa trên cơ chế truyền thông điệp bằng cách sử dụng giao thức HTTPS.Không giống sự an toàn mức thông điệp,HTTPS cung cấp sự an toàn với toàn bộ gói dữ liệu HTTP.Mặc dù HTTPS không bao phủ tất cả các khía cạnh trong chuẩn an toàn chung,nhưng nó cung cấp một mức bảo vệ đầy đủ với định danh và.
Những thông điệp bị thay đổi hoặc mất mát(SOAP message susceptible to. modification-no integrity): Trong quá trình chuyển thông tin từ người rút tiền đến trung tâm dữ liệu,nó có thể bị chặn.Và những thông tin này có thể bị thay đổi,ví dụ như số tài khoản là 123 thì bị thay đổi là 456.Vấn đề này dẫn đến sự thiếu toàn vẹn. Trước khi có ws-security sự an toàn chuyển kênh thông điệp rất thường sử dụng.Sự an toàn kênh chuyển thông điệp ở chổ là nó mã hóa toàn bộ thong điệp,dẫn đến sử dụng CPU cao hơn.Tuy nhiên,với ws-security nó cung cấp những giải pháp tối ưu hóa những thao tác an toàn,mà yêu cầu ít thời gian sử dụng CPU hơn. Ws-Security là một chuẩn an toàn bao trùm cho SOAP và cả những phần mở rộng của SOAP,nó được dung khi muốn xây dựng một web service toàn vẹn và tin cậy.Nó được thiết kế mang tính mở nhằm có thể hướng tới những mô hình an toàn khác bao gồm SSL.WS Security cung cấp nhiều hổ trợ cho nhiều cơ chế an toàn khác nhau,nhiều khuôn dạng chữ ký,và nhiều công nghệ mã hóa.Nó đảm bảo cho tính an toàn,sự toàn vẹn thông điệp và tính tin cậy của thong điệp.Mặc dù vậy những cơ chế này cũng chưa đảm bảo tất cả các khía cạnh của một giải pháp an toàn đầy đủ trong vô vàn rất nhiều yêu cầu đòi hỏi an toàn khác nhau của web services.Do đó,ws security chỉ là một lớp trong nhiều lớp của một giải pháp an toàn web service.
Tính toàn vẹn an toàn được đưa vào ứng dụng để đảm bảo rằng không ai có thể sửa đổi thông điệp trong khi nó đang được chuyển.Thực chất tính toàn vẹn là nó tạo ra một chữ ký số hóa XML dựa vào nội dung của thông điệp.Nếu dữ liệu thong điệp bị thay đổi bất hợp pháp,nó sẽ không còn thích hợp với chữ ký số hóa XML.Một chữ ký được tạo ra dựa vào một khóa mà người gởi thong điệp tạo ra.Do đó người nhận chỉ nhận thong điệp khi chữ ký sử dụng và nộp dung phù hợp.Còn nếu không phù hợp thì một thông báo lỗi sẽ gởi về người gởi. Chỉ rỏ thành phần của thông điệp mà phải có xác nhận hay một dấu hiệu chứng thực nào đú,phần trong thụng điệp cú chữ ký là phần thõn.Chỉ rừ một khúa trờn hệ thống tập tin mà sẽ ký lên thông điệp.Chỉ những client đã được cấp quyền mới có quyền sở hữu khúa này.Chỉ rừ những giải thuật sẽ được sử dụng bởi khúa để ký lên thông điệp.Nếu một client chờ đợi một sự phản hồi từ server với thông tin yêu.
WS-SecureConversation Describes: cho phép quản lý và xác nhận thông điệp trao đổi giữa các phần,bao gồm sự trao đổi ngữ cảnh an toàn .thiết lập dẫn xuất ra những session. WS-Authentication Describes: cho phép quản lý những dữ liệu cần chứng thực và chính sách chứng thực. WS-Policy Describes:Cho phép quản lý những rang buộc của những chính sách an toàn ở các điểm trung gian và đầu cuối.
WS-Trust Describes:khung cho phép những web service an toàn trao đổi,tương tác với nhau. Định nghĩa và xây dựng các chức năng, các dịch vụ mà dịch vụ sẽ cung cấp (sử dụng ngôn ngữ Java chẳng hạn). Xây dựng ứng dụng phía client (chẳng hạn sử dụng Java) và sau đó gọi thực hiện dịch vụ thông qua việc kết nối tới SOAP server.Lựa chọn một ngôn ngữ, xây dựng các tiến trình nghiệp vụ và chúng ta bắt đầu tạo nên một dịch vụ Web như ý muốn.
Giả sử rằng sử dụng thuộc tính A để phân hoạch tập hợp S thành những tập hợp {S1, S2,. Như vậy, độ lợi thông tin của thuộc tính tuổi là lớn nhất, ta chọn thuộc tính này để phân lớp dữ liệu. (v: số giá trị cùa thuộc tính A) là công thức tính thông tin để phân nhánh trên cây quyết định.
Đây là công thức tính độ đo Gain Ratio cho thuộc tính A trên cơ sở dữ liệu D, sau đó ta chọn thuộc tính nào có độ đo Gain Ratio lớn nhất để phân lớp theo thuộc tính đó. Độ đo Gain Ratio của thuộc tính Age có giá trị lớn nhất nên ta chọn thuộc tính này để phân lớp dữ liệu.