(LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

77 6 0
(LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHÙNG VĂN VIỆT NGHIÊN CỨU LUẬT KẾT HỢP VÀ THỬ NGHIỆM KHAI PHÁ CƠ SỞ DỮ LIỆU HỢP ĐỒNG GIAO NHẬN VẬN TẢI TẠI CÔNG TY STC VIỆT NAM NHẰM PHÁT HIỆN RA XU HƢỚNG VỀ CÁC ĐIỀU KHOẢN GIAO NHẬN VẬN TẢI LỰA CHỌN TRONG CÁC HỢP ĐỒNG VẬN TẢI HÀNG HÓA LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội - 2012 TIEU LUAN MOI download : skknchat@gmail.com ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ PHÙNG VĂN VIỆT NGHIÊN CỨU LUẬT KẾT HỢP VÀ THỬ NGHIỆM KHAI PHÁ CƠ SỞ DỮ LIỆU HỢP ĐỒNG GIAO NHẬN VẬN TẢI TẠI CÔNG TY STC VIỆT NAM NHẰM PHÁT HIỆN RA XU HƢỚNG VỀ CÁC ĐIỀU KHOẢN GIAO NHẬN VẬN TẢI LỰA CHỌN TRONG CÁC HỢP ĐỒNG VẬN TẢI HÀNG HĨA Ngành: Cơng nghệ Thơng tin Chuyên ngành: Hệ thống Thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: TS PHÙNG VĂN ỔN Hà Nội - 2012 TIEU LUAN MOI download : skknchat@gmail.com LỜI CAM ĐOAN Tôi cam đoan rằng, luận văn thạc sĩ Hệ thống Thông tin “Nghiên cứu luật kết hợp thử nghiệm khai phá Cơ sở liệu Hợp đông giao nhận vận tải Công ty STC Việt Nam nhằm phát xu hướng điều khoản giao nhận vận tải lựa chọn hợp đồng vận tải hàng hóa” cơng trình nghiên cứu riêng Những số liệu kết nghiên cứu luận văn trung thực không trùng lặp với đề tài khác Hà nội, ngày 05 tháng 05 năm 2012 Phùng Văn Việt TIEU LUAN MOI download : skknchat@gmail.com LỜI CẢM ƠN Tác giả xin chân thành cảm ơn thầy giáo, cô giáo khoa Công nghệ thông tin - Đại học Công nghệ, Đại học Quốc gia Hà nội, tận tâm giảng dạy kiến thức hai năm học qua với cố gắng thân Đặc biệt xin bày tỏ biết ơn sâu sắc đến thầy giáo Tiến sĩ Phùng Văn Ổn, người tận tình hướng dẫn, động viên tơi thực luận văn Tác giả xin chân thành cảm ơn Ban lãnh đạo Công ty STC Việt nam, bạn đồng nghiệp, bạn lớp cao học K15HTTT tạo điều kiện, giúp đỡ suốt thời gian qua Rất mong nhận góp ý tất thầy cô, bạn bè, đồng nghiệp để luận văn phát triển hồn thiện Hà Nội, tháng 05 năm 2012 NGƢỜI THỰC HIỆN Phùng Văn Việt MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT MỞ ĐẦU CHƢƠNG 1: NGHIÊN CỨU MỘT SỐ VẤN ĐỀ VỀ LUẬT KẾT HỢP Lý thuyết luật kết hợp 1.1 Luật kết hợp 1.2 Một số tính chất luật kết hợp 1.3 Phân loại luật kết hợp 1.4 Đặc tả toán khai phá liệu 11 Các đặc trưng luật kết hợp 12 2.1 Khơng gian tìm kiếm luật 12 2.2 Độ hỗ trợ luật 14 Một số giải thuật khai phá tập phổ biến 15 3.1 Giải thuật BFS 15 TIEU LUAN MOI download : skknchat@gmail.com 3.1.1 Mô giải thuật Apriori 17 3.1.2 Một số biến thể Apriori 22 3.1.3 Cải tiến thuật toán Apriori 23 3.2 Giải thuật DFS 27 3.3 Giải thuật DHP 28 3.4 Giải thuật PHP 30 Phát sinh luật từ tập phổ biến 33 4.1 Cải tiến 34 4.2 Cải tiến 1.a 35 4.3 Một số kỹ thuật khác việc tối ưu hóa chi phí tính độ Confident 36 Đánh giá, nhận xét 36 CHƢƠNG 2: HỆ THỐNG GIAO NHẬN VẬN TẢI VÀ TẬP ĐOÀN STC 37 Tổng quan dịch vụ giao nhận vận tải 37 Các phương thức vận tải hàng hóa 40 Các rủi ro giao nhận vận tải 41 3.1 Khái niệm 41 3.2 Phân loại 42 3.2.1 Theo nguồn gốc 42 3.2.2 Theo điều kiện bảo hiểm 43 3.2.2.1 Nhóm rủi ro hàng hóa 43 3.2.2.2 Nhóm rủi ro đặc biệt 44 3.2.2.3 Nhóm rủi ro loại trừ 45 Các điều khoản giao nhận vận tải(Incoterm) 46 4.1 EXW 47 4.2 FCA 47 4.3 FAS 48 4.4 FOB 48 4.5 CFR 48 4.6 CIF 49 4.7 CPT 49 4.8 CIP 49 4.9 DAT 49 TIEU LUAN MOI download : skknchat@gmail.com 4.10 DAP 50 4.11 DDP 50 Thực trạng sử dụng Incoterm, ví dụ tranh chấp 51 Tập đoàn STC công ty STC Việt Nam 54 CHƢƠNG 3: ỨNG DỤNG, THỬ NGHIỆM KHAI PHÁ DỮ LIỆU TÍCH HỢP HỆ THỐNG CƠ SỞ DỮ LIỆU HỢP ĐỒNG GIAO NHẬN VẬN TẢI 55 Bài toán 55 1.1 Phát biểu toán 55 1.2 Đặc tả liệu 56 1.3 Minh họa chương trình 64 1.4 Phân tích, đánh giá 64 Hướng phát triển 65 KẾT LUẬN 66 PHỤ LỤC 67 TÀI LIỆU THAM KHẢO 72 TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Từ viết tắt Ck Conf Tiếng Anh Ck confidence Tiếng Việt Tập K – itemset ứng cử Độ tin cậy CSDL DW Database Data Warehouse Cơ sở liệu Kho liệu Item Itemset K- itemset item itemset K- itemset Khoản mục Tập khoản mục Tập gồm K mục KDD Knowledge Discovery and Data Mining Kỹ thuật phát tri thức khai phá liệu Lk Lk Tập K - itemset phổ biến Minconf Minimum Confidence Độ tin cậy tối thiểu Minsup OLAP Minimum Support Độ hỗ trợ tối thiểu Phân tích trực tuyến MOLAP ROLAP pre(k, s) Record Supp Multidimensional OLAP Relational OLAP pre(k, s) record suppport Phân tích đa chiều trực tuyến Phân tích quan hệ trực tuyến Tiếp đầu dãy có độ dài k s Bản ghi Độ hỗ trợ TID SQL SQO DBSCAN Transaction Indentification Structured Query Language Sematics Query Optimization Định danh giao tác Ngôn ngữ truy vấn có cấu trúc On Line Analytical Processing TC ADO Density Based Spatial Thuật toán phân lớp dựa vào vị trí Clustering of Application địa phương with Noise DENsity Based CLUstEring Thuật tốn phân lớp (tổng qt) Tính chất Activate X Data Object DFS BFS DHP Depth First Search Breadth First Search Direct Hashing and Pruning Tìm kiếm theo độ sâu Tìm kiếm theo bề rộng Bảng băm trực tiếp cắt tỉa PHP I/O Perfect Hashing and Pruning Input/Output Bảng băm lý tưởng cắt tỉa Vào/ra DENCLUE TIEU LUAN MOI download : skknchat@gmail.com MỞ ĐẦU Trong năm gần đây, việc nắm bắt thông tin coi sở hoạt động sản xuất, kinh doanh Cá nhân tổ chức thu thập hiểu thông tin, hành động dựa thông tin kết xuất từ thơng tin có đạt thành cơng hoạt động Chính lý đó, việc tạo thông tin, tổ chức lưu trữ khai thác ngày trở nên quan trọng gia tăng không ngừng Sự tăng trưởng vượt bậc sở liệu (CSDL) sống như: thương mại, quản lý khoa học làm nảy sinh thúc đẩy phát triển kỹ thuật thu thập, lưu trữ, phân tích khai phá liệu… khơng phép tốn đơn giản thơng thường như: phép đếm, thống kê… mà đòi hỏi cách xử lý thơng minh hơn, hiệu Từ nhà quản lý có thơng tin có ích để tác động lại trình sản xuất, kinh doanh mình… tri thức Các kỹ thuật cho phép ta khai thác tri thức hữu dụng từ CSDL (lớn) gọi kỹ thuật khai phá liệu (DM – Data Mining) Khai phá luật kết hợp nội dung quan trọng khai phá liệu Luận văn tìm hiểu luật kết hợp ứng dụng số thuật toán khai phá luật kết hợp CSDL lớn từ áp dụng kỹ thuật khai phá liệu vào hệ thống sở liệu hàng hóa vận chuyển cơng ty STC Việt Nam nhằm phát xu hướng điều khoản giao nhận vận tải(Incoterm) lựa chọn theo khu vực, quốc gia TIEU LUAN MOI download : skknchat@gmail.com CHƢƠNG 1: NGHIÊN CỨU MỘT SỐ VẤN ĐỀ VỀ LUẬT KẾT HỢP Việc dự đốn thơng tin có giá trị cao dựa số lượng liệu lớn nghiệp vụ ngày trở lên quan trọng nhiều tổ chức, doanh nghiệp Chẳng hạn, vấn đề nhà quản lí kinh doanh cần biết kiểu mẫu hành vi mua hàng khách hàng, xu hướng kinh doanh, vv… Những thơng tin học từ liệu có sẵn Một vấn đề khó khăn việc khai phá liệu CSDL có số vơ lớn liệu cần xử lý Các tổ chức doanh nghiệp quy mô vừa có từ hàng trăm Megabyte đến vài Gigabyte liệu thu thập Các ứng dụng khai phá liệu thường thực phân tích liệu phức tạp, nhiều thời gian toàn CSDL Vì vậy, tìm thuật tốn nhanh hiệu để xử lý khối lượng liệu lớn thách thức lớn Chương trình bày sở lý thuyết luật luật kết hợp, khai phá liệu dựa vào luật kết hợp, đồng thời trình bày số thuật toán liên quan đến luật kết hợp Lý thuyết luật kết hợp Từ giới thiệu từ năm 1993, toán khai thác luật kết hợp nhận nhiều quan tâm nhiều nhà khoa học Ngày việc khai thác luật phương pháp khai thác mẫu phổ biến việc khám phá tri thức khai thác liệu (KDD: Knowledge Discovery and Data Mining) Một cách ngắn gọn, luật kết hợp biểu thức có dạng: X  Y , X Y tập trường gọi item Ý nghĩa luật kết hợp dễ nhận thấy: Cho trước sở liệu có D tập giao tác - giao tác T D tập item - X  Y diễn đạt ý nghĩa giao tác T có chứa X chắn T có chứa Y Độ tin cậy luật (rule confidence) hiểu xác suất điều khoản p(Y  T | X  T) Ý tưởng việc khai thác luật kết hợp có nguồn gốc từ việc phân tích liệu mua hàng khách nhận “Một khách hàng mua mặt hàng x1 x2 mua mặt hàng y với xác suất c%” Ứng dụng trực tiếp luật tốn kinh doanh với tính dễ hiểu vốn có chúng – người chuyên gia khai thác liệu – làm cho luật kết hợp trở thành một phương pháp khai thác phổ biến Hơn nữa, luật kết hợp không bị giới hạn phân tích phụ thuộc lẫn phạm vi ứng dụng bán lẻ mà chúng cịn áp dụng thành cơng nhiều toán kinh doanh TIEU LUAN MOI download : skknchat@gmail.com Việc phát luật kết hợp mục (item) liệu “giỏ” toán đặc trưng khai phá liệu Dữ liệu giỏ liệu bao gồm mục mua khách hàng với thông tin ngày mua hàng, số lượng, giá cả, … Luật kết hợp tập mục mà thường mua với tập mục khác Hiện nay, có nhiều thuật tốn dùng cho việc phát luật kết hợp Tuy nhiên, vấn đề nảy sinh số lần quét (duyệt) CSDL nhiều ảnh hưởng lớn đến hiệu tính khả thi thuật tốn CSDL lớn Đối với CSDL lưu đĩa, phép duyệt CSDL gây số lần đọc đĩa lớn Chẳng hạn CSDL kích thước 1GB địi hỏi khoảng 125000 lần đọc khối cho lần duyệt (với kích thước khối 8KB) Nếu thuật tốn có 10 lần duyệt gây 1250000 lần đọc khối Giả thiết thời gian đọc trung bình 12ms trang, thời gian cần thiết để thực thao tác I/O là1250000*12ms hay sấp sỉ tiếng đồng hồ !!! Trong phần này, xem xét số định nghĩa, tính chất có liên quan đến luật luật kết hợp Đồng thời tìm hiểu ý nghĩa luật kết hợp 1.1 Luật kết hợp a) Ý nghĩa luật kết hợp: Luật kết hợp lĩnh vực quan trọng khai thác liệu Luật kết hợp giúp tìm mối liên hệ mục liệu (items) sở liệu Trong ngành giao nhận vận tải ngày xuất nhiều Công ty tham gia mua bán, giao nhận vận tải điểm cung cấp hàng hóa khác với chủng loại hàng ưu thích khác nhau, áp dụng điều khoản giao nhận hàng hóa khác theo khu vực vùng miền áp dụng cho có lợi cho người tham gia vận chuyển hàng hóa để tránh độ rủi ro định, đem lại lợi nhuận kinh tế tối đa với hình thức vận tải áp dụng theo đặc trưng địa lý vùng miền kinh tế thị trường mở cửa Do đó, tìm mối liên hệ việc tìm khách hàng tham gia trình giao nhận phù hợp với loại mặt hàng đặc thù mặt hàng theo đơn hàng Hay ngành viễn thông, loại dịch vụ cung cấp cho khách hàng ngày nhiều, tìm mối liên kết việc sử dụng loại dịch vụ để phục vụ cho việc quảng cáo, tiếp thị Ví dụ để tìm hiểu thói quen sử dụng dịch vụ viễn thông khách hàng, người ta thường đặt câu hỏi “Những dịch vụ khách hàng thường hay sử dụng lúc với đăng ký sử dụng trung tâm chăm sóc khách hàng ?” Các kết nhận dùng cho việc tiếp thị dịch vụ liệt kê dịch vụ khách hàng hay sử dụng lúc nằm gần nhau, khuyến dịch vụ kèm theo… 10 TIEU LUAN MOI download : skknchat@gmail.com Ví dụ: Với bảng số liệu điều khoản giao nhận vận tải áp dụng trình giao nhận năm 2010 ta phân chia sau: Thuộc tính Tổng số lượng hợp đồng gia tăng thuộc tính có nhiều giá trị, nên ta phân chia thành miền, khoảng giá trị từ 25, từ 26 50, >=51, Khí đó, tập liệu có thuộc tính (Tổng gia tăng 25, Tổng gia tăng 26 50, …) tương ứng với thuộc tính Tổng gia tăng Các thuộc tính khác phân chia tương tự khoảng giá trị khác tùy vào số lượng thuộc tính khoảng giá trị người phân chia qui định Như vậy, với cách ánh xạ trên, từ CSDL gốc ban đầu, ta có CSDL dạng boolean sau đây: Số lượng toàn hợp đồng STT Quốc gia Tổng số Gia Gia Gia Gia tăng(0 25) tăng(26 50) tăng(51 75) tăng(75 ) The Netherlands 156 0 Belgium 150 0 France 145 0 Germany 15 0 U.S.A 60 0 South Africa 90 0 Brazil 211 0 China 171 0 Australia 202 0 … Bảng 4: Dữ liệu chuyển đổi từ dạng số sang dạng Boolean Việc ánh xạ xảy vấn đề sau: “minsup”: Nếu số lượng khoảng cho thuộc tính số lượng (hoặc số giá trị riêng cho thuộc tính phân loại) lớn support cho khoảng nhỏ Do đó, việc chia thuộc tính q nhiều khoảng làm cho luật chứa khơng đạt support tối thiểu “minconf”: Một số thơng tin bị việc chia khoảng Một số luật có minconf item chúng có giá trị đơn khoảng nhỏ, TIEU LUAN MOI download : skknchat@gmail.com thơng tin bị Sự mát thơng tin tăng kích thước khoảng chia lớn Như vậy, kích thước khoảng lớn (số khoảng nhỏ) có nguy số luật khơng có confidence tối thiểu, cịn kích thước khoảng nhỏ (số khoảng lớn) số luật lại có nguy khơng có support tối thiểu Để giải hai vấn đề trên, người ta ý đến tất vùng liên tục thuộc tính số lượng khoảng phân đoạn Vấn đề “minsup”sẽ khắc phục cách liên hợp khoảng gần kề giá trị gần kề Vấn đề “minconf” khắc phục cách tăng số lượng khoảng mà không ảnh hưởng đến vấn đề “minsup” Người ta thực phương pháp đơn giản để thực việc chuyển thuộc tính số lượng phân loại dạng với Với thuộc tính phân loại, giá trị ánh xạ vào tập số ngun liên tiếp Với thuộc tính số lượng khơng cần khoảng chia (tức có giá trị) giá trị ánh xạ vào tập số nguyên liên thứ tự giá trị Cịn thuộc tính số lượng phân khoảng, khoảng ánh xạ vào tập số nguyên liên tiếp, thứ tự khoảng bảo tồn Các ánh xạ làm cho ghi CSDL trở thành tập cặp (Attribute, Value) Bài toán khai phá luật kết hợp lúc thực qua bước sau: Xác định số lượng phần chia cho thuộc tính số lượng Với thuộc tính phân loại, ánh xạ thuộc tính vào tập số ngun liên tiếp Với thuộc tính số lượng khơng cần phân khoảng, ánh xạ giá trị chúng vào tập số nguyên liên thứ tự giá trị thuộc tính Với thuộc tính số lượng phân khoảng, ánh xạ khoảng chia vào tập số nguyên liên tiếp bảo tồn thứ tự khoảng Bằng cách này, thuật toán xem giá trị vùng giá trị thuộc tính định lượng Tìm support cho giá trị thuộc tính phân loại lẫn thuộc tính số lượng, tìm tất itemset mà support lớn support tối thiểu Sử dụng tập tìm để sinh luật kết hợp Xác định luật đáng quan tâm kết xuất chúng Như vậy, xét CSDL thực tế gia tăng các thông số hợp đồng mua bán vận chuyển hàng hóa điều khoản áp dụng theo vùng miền địa lý, ta thực phân chia thuộc tính bảng thành khoảng ký hiệu sau: 64 TIEU LUAN MOI download : skknchat@gmail.com Số lượng hợp đồng: Cột số Tổng số: Kí hiệu: Cột Kí hiệu: [0, 100] A Gia tăng: [101, 200] B C [0, 25] a [201, …] [26, 50] b [51, …] c FAS: Cột Tổng số: Kí hiệu: Cột [0,15] [16, 30] D Gia tăng: E [31, ] F [0, 3] [4, 7] [8, .] d e f Tổng số: [0,2 0] [21, 40] [41, ] G H I Kí hiệu FOB: Cột Kí hiệu: Cột Kí hiệu: Gia tăng: [0, 10] [11, 20] g h [21, ] i CFR: Cột Kí hiệu: Tổng số: [0,10] J Cột 10 Gia tăng: Kí hiệu: [11,20] K [21, ] L [0, 2] [3, 5] j [6, ] k l CIF: Cột 11 Tổng số: [0,30] Kí hiệu: M Cột 12 Gia tăng: Kí hiệu: [31,60] N [0, 10] [61, ] O [11, 20] m n [21, ] o Các điều khoản áp dụng khác: Cột 13 Kí hiệu: Cột 14 Kí hiệu: Tổng số: [0,10] [11, 20] P Q Gia tăng: [0, 5] p [21, ] R [6, 10] q [11, ] r 65 TIEU LUAN MOI download : skknchat@gmail.com Từ việc phân tích trên, ta có sơ đồ quan hệ để lưu trữ liệu tốn sau: Hình 7: Sơ đồ quan hệ sử dụng chương trình 66 TIEU LUAN MOI download : skknchat@gmail.com Chương trình chạy phần liệu Công ty STC Viêt nam Kết nhận (kết tùy thuộc vào minsupp minconf, kết nhận với minsupp =0.4, minconf =0.8 ): Tập phổ biến Supp CFR_Giatang[0 2] 0.6668 CFR_Giatang[6 ] 0.5556 Tongsohopdong_Giatang[26 50] 0.5556 FAS_Giatang[0 3] 0.5556 CIF_Giatang[0 10] 0.5556 Dieukhoankhac_Giatang[0 10] 0.5556 Tongsohopdong_Tongso[101 200] 0.4444 FAS_Tongso[31 ] 0.4444 CFR_Tongso[1 30] 0.4444 FOB_Giatang[0 10] 0.4444 CFR_Giatang[0 2] and Tongsohopdong_Giatang[26 50] 0.4444 CFR_Giatang[0 2] and FAS_Giatang[0 3] 0.4444 CFR_Giatang[0 2] and CIF_Giatang[0 10] 0.4444 CFR_Giatang[0 2] and Dieukhoankhac_Giatang[0 10] 0.4444 CFR_Giatang[0 2] and Tongsohopdong_Tongso[101 200] 0.4444 CFR_Giatang[0 2] and CFR_Tongso[0 10] 0.4444 CFR_Giatang[6 ] and Tongsohopdong_Giatang[26 50] 0.4444 Tongsohopdong_Giatang[26 50] and Tongsohopdong_Tongso[101 200] 0.4444 FAS_Giatang[0 3] and CFR_Tongso[0 10] 0.4444 CIF_Giatang[0 10] and CIF_Tongso[0 30] 0.4444 CFR_Giatang[0 2] and Tongsohopdong_Giatang[26 50] and Tongsohopdong_Tongso[101 200] 0.4444 67 TIEU LUAN MOI download : skknchat@gmail.com Luật kết hợp Supp Conf Tongsohopdong_Tongso[101 200] -> CFR_Giatang[0 2] 0.4444 CFR_Tongso[0 10] -> CFR_Giatang[0 2] 0.4444 Tongsohopdong_Tongso[101 200] -> Tongsohopdong_Giatang[26 50] 0.4444 CFR_Tongso[0 10]->FAS_Giatang[0 3] 0.4444 CIF_Tongso[0 30]->CIF_Giatang[0 10] 0.4444 CIF_Tongso[0 30] and Tongsohopdong_Giatang[26 50]-> Tongsohopdong_Tongso[101 200] 0.4444 0.4444 Tongsohopdong_Tongso[101 200] and Tongsohopdong_Giatang[26 50] -> CFR_Giatang[0 2] 0.4444 Tongsohopdong_Giatang[26 50]->CFR_Giatang[0 2] 0.4444 0.8 FAS_Giatang[0 3]->CFR_Giatang[0 2] 0.4444 0.8 CIF_Giatang[0 10]->CFR_Giatang[0 2] 0.4444 0.8 Dieukhoankhac_Giatang[0 10]->CFR_Giatang[0 2] 0.4444 0.8 CFR_Giatang[6…]->Tongsohopdong_Giatang[26 50] 0.4444 0.8 Tongsohopdong_Giatang[26 50]->CFR_Giatang[6…] 0.4444 0.8 Tongsohopdong_Giatang[26 50]->Tongsohopdong_Soluong[101 200] 0.4444 0.8 FAS_Giatang[0 3]->CFR_Tongso[0 10] 0.4444 0.8 CIF_Giatang[0 10]->CIF_Tongso[0 30] 0.4444 0.8 Tongsohopdong_Tongso[101 200] -> CFR_Giatang[0 2] and Tongsohopdong_Giatang[26 50] Dựa vào bảng kết ta nhận thấy rằng: - Nhìn chung hầu hết quốc gia số lượng hợp đồng ký đồng năm khoảng từ 100 đến 200 hợp đồng số lượng gia tăng so với năm trước - - không nhiều khoảng từ 25 đến 50 hợp đồng Điều khoản áp dụng giao nhận vận CFR gia tăng không đáng kể hầu hết quốc gia chủ yếu quốc gia mạnh hàng hải kinh doanh dịch vụ giao nhận vận tải Các quốc gia có xu hương sử dụng điều khoản CIF nhiều số lượng hợp đồng sử dụng CIF khơng q nhiều lại tăng đáng kể so với năm 68 TIEU LUAN MOI download : skknchat@gmail.com trước cụ thể tổng số hợp đồng sử dụng điều khoản CIF 30 hợp đồng mức tăng so với năm trước khoảng gần 30% số hợp đồng - Một số quốc gia có xu hướng sử dụng điều khoản CIF việc ký kết hợp đồng tăng lên Brazil, Belgium, Nam phi 1.3 Minh họa chƣơng trình Hình 8: Giao diện chương trình- Q trình tạo luật kết hợp theo thuật tốn Apriori Chương trình tác giả phát triển dựa ngơn ngữ lập trình VB.Net sử dụng hệ quản trị sở liệu SQL Server Có thể chạy hầu hết cấu hình máy tính khơng q thấp dịng CPU từ Pentum III trở lên 1.4 Phân tích, đánh giá Chương trình thực tìm tập phổ biến luật kết hợp thơng qua hai thuật tốn Apriori Apriori_Tid Ta có số nhận xét sau: Để xác định độ Support tập ứng viên, thuật tốn Apriori ln ln phải qt lại tồn giao tác CSDL Do tiêu tốn nhiều thời gian số k-items tăng (số lần xét duyệt giao tác tăng) Trong trình xét duyệt khởi tạo thuật tốn Apriori_Tid, kích thước C‟k lớn hầu hết tương đương với kích thước CSDL gốc Do đó, thời gian tiêu tốn với thuật tốn Apriori, ngồi thuật tốn Apriori-Tid cịn phải gánh chịu thêm chi phí phát sinh C‟k vượt nhớ mà phải sử dụng kèm nhớ ngồi Điều đáng quan tâm thuật tốn CSDL D không dùng để đếm support với giai đoạn k>1 mà tập C‟k Số lượng điểm vào C‟k có 69 TIEU LUAN MOI download : skknchat@gmail.com thể nhỏ số giao dịch CSDL D, đặc biệt k lớn Đây ưu điểm thuật toán Apriori_Tid Nếu khối lượng ghi sở liệu lớn thời gian xử lý việc thống kê điều khoản áp dụng vào hợp đồng giao nhận vận tải theo quốc gia lớn Tuy nhiện, số lượng quốc gia có hợp đồng giao nhận vận tải với Cơng ty STC Việt Nam khơng nhiều thời gian xử lý để tìm xu hướng áp dụng Incoterm không nhiều Hƣớng phát triển Tiếp tục hồn thiện mở rộng chương trình luận văn để áp dụng vào thực tế cách triệt để Chương trình thực theo bước trình khai phá liệu như: 1-chọn lọc liệu (chọn lọc, trích rút liệu cần thiết từ CSDL), 2-làm liệu (chống trùng lặp giới hạn vùng giá trị), 3-làm giàu liệu, 4-khai thác tri thức từ liệu (tìm tác vụ phát luật kết hợp, trình chiếu báo cáo), 5-chọn liệu có ích áp dụng vào hoạt động thực tế Cho đến hầu hết thuật toán xác định tập phổ biến xây dựng dựa thừa nhận độ hỗ trợ cực tiểu (minsup) thống nhất, tức tập mục chấp nhận có độ hỗ trợ lớn độ hỗ trợ tối thiểu Điều không thực tế có nhiều ngoại lệ khác chấp nhận thường có độ hỗ trợ thấp nhiều so với khuynh hướng chung (các tiêu chí phân loại, ưu tiên khác nhau) Mặt khác, xem xét thuộc tính số lượng rời rạc hố phân khoảng thuờng tạo số khoảng lớn Vì vậy, hướng nghiên cứu phát luật kết hợp với độ hỗ trợ không giống luật kết hợp mờ (điều nhiều người quan tâm) Số lượng lần duyệt sở liệu nhiều, thời gian xử lý lớn Do vậy, cần cải tiến sử dụng thuật toán CHARM để tìm tập phổ biến đóng vận dụng “Luật kết hợp thiết yếu nhất” để sinh luật từ tập phổ biến đóng độ hỗ trợ, độ tin cậy cho trước Nghiên cứu sâu thuật toán khai phá liệu, áp dụng để khai phá hệ sở liệu giao nhận vận tải cách triệt để xác giúp ích cơng ty dịch vụ giao nhận vận tải khai thác đưa điều khoản áp dụng hiệu việc ký kết hợp đồng tránh thiệt hại rủi ro cách tốt đem nguồn lợi kinh tế cho công ty 70 TIEU LUAN MOI download : skknchat@gmail.com KẾT LUẬN Luận văn đề cập đến nội dung kho liệu ứng dụng lưu trữ khai phá tri thức kho liệu nhằm hỗ trợ định Về mặt lý thuyết, khai phá tri thức bao gồm bước: Hình thành, xác định định nghĩa tốn; thu thập tiền xử lý liệu; khai phá liệu, rút tri thức; sử dụng tri thức phát Phương pháp khai phá liệu là: phân lớp, hồi quy, định, suy diễn, quy nạp, K- láng giềng gần, … phương pháp áp dụng liệu thơng thường tập mờ Về thuật tốn khai phá tri thức, luận văn trình bày số thuật toán minh hoạ số thuật toán kinh điển phát tập báo phổ biến khai phá luật kết hợp, như: Apriori, AprioriTid, phân hoạch, … Về mặt cài đặt thử nghiệm, luận văn giới thiệu kỹ thuật khai phá liệu theo thuật toán Apriori, Apriori_Tid áp dụng vào toán phát xu hướng điều khoản vận tải Incoterm lựa chọn theo khu vực, quốc gia Trong trình thực luận văn, cố gắng tập trung tìm hiểu tham khảo tài liệu liên quan Tuy nhiên, với thời gian trình độ có hạn nên khơng tránh khỏi hạn chế thiếu sót Tơi mong nhận xét góp ý thầy cô giáo bạn bè, đồng nghiệp người quan tâm để hoàn thiện kết nghiên cứu 71 TIEU LUAN MOI download : skknchat@gmail.com PHỤ LỤC Các mẫu văn hợp đồng mua bán giao nhận vận tải : CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc ========================== HỢP ĐỒNG GIAO NHẬN VẬN CHUYỂN HÀNG HOÁ (Số : … DV/ Hanel) - Căn Luật dân luật thương mại nước cơng hịa xã hội chủ nghĩa Việt Nam có hiệu lực thi hành từ ngày 01 tháng 01 năm 2006 - Căn pháp lệnh hợp đồng kinh tế - Căn nhu cầu khả bên Hôm nay, ngày……tháng…… năm 2010 công ty cổ phần Hanel Mirolin, chúng tơi gồm có: I Cơng ty cổ phần Hanel Mirolin Địa : Số 551 , Nguyễn Văn Cừ, Long Biên, Hà Nội Mã số thuế Số Tài Khoản Chương Dương : 010 176 0550 : 0021 0010 54979 , Ngân hàng Ngoại thương Việt nam, chi nhánh Điện thoại : 04- 3783 3165 Đại diện Ông : Phạm Quang Anh - Fax: 04- 3783 3157 - Chức vụ : Giám đốc ( Sau gọi tắt bên A ) II- Công ty TNHH vận tải DV-TM Đức Việt Địa Mã số thuế : 87 Lam Sơn, Phường 2, Quận Tân Bình, TP HCM : 0304420551 Số tài khoản : (VND) 007 100 001 775 (USD) 007 137 009 827 , Ngân hàng Ngoại thương Việt nam, chi nhánh Hồ Chí Minh Điện thoại : 08 - 3848 7275 Fax: 08 – 3848 7276 Chi nhánh Hà Nội : 406, CT3 Vimeco Tower, Trung Hòa, Cầu Giáy, Hà nội Điện thoại : 04- 2225 0325 - Đại diện Ơng : Ngơ Kiêm Hiếu – Chức vụ: Giám đốc Fax: 04- 2225 0326 72 TIEU LUAN MOI download : skknchat@gmail.com ( Sau gọi tắt bên B ) Đã thoả thuận ký kết hợp đồng uỷ thác giao nhận vận tải với điều khoản điều khoản sau: ĐIỀU I - VẬN CHUYỂN : Bên A đồng ý để bên B vận chuyển hàng hố nhập với chi tiết sau : Tên Hàng : Sen vòi phụ kiện bồn tắm Số lượng trọng lượng : cont 20’DC Địa điểm gửi hàng : Cảng Pusan, Hàn Quốc Địa điểm trả hàng : Cảng Hải Phòng , Việt nam Điều khoản giao hàng Tổng giá cước cho công : FOB Pusan : USD 520 Bằng chữ : Năm trăm hai mươi đô la Mỹ (Giá trên: bao gồm cước vận tải quốc tế chi phí điện giải phóng hàng hãng tàu chưa bao gồm phí THC , khách hàng trực tiếp toán với hãng tàu) ĐIỀU II - THANH TỐN: Thời hạn hình thức tốn : Bên A tốn tồn cước vận chuyển phí dịch vụ cho bên B hình thức chuyển khoản ngân hàng bên B giao chứng từ nhận hàng Đồng tiền toán : Bên A toán cho bên B đồng đô la Mỹ , trường hợp tốn VNĐ tỉ giá quy đổi sở tỉ giá đô la Mỹ bán Ngân hàng ngoại thương Việt nam thời điểm phát hành hoá đơn ĐIỀU III - TRÁCH NHIỆM CỦA MỖI BÊN : Trách nhiệm bên A : a) Bên A phải chịu trách nhiệm tính hợp pháp hàng hố vận chuyển, b) Bên A phải thông báo trước cho bên B kế hoạch nhập để bên B thu xếp vấn đề đặt chỗ, đảm bảo tiến độ vận chuyển c) Bên A phải toán cước vận chuyển chi phí dịch vụ cho bên B theo cam kết điều II Trách nhiệm bên B : a) Thường xuyên cung cấp đầy đủ xác lịch tàu cho bên A b) Đảm bảo lịch tàu ngày c) Thông báo kịp thời cho người nhận bên A hàng tới cảng đến 73 TIEU LUAN MOI download : skknchat@gmail.com ĐIỀU IV - ĐIỀU KHOẢN CUỐI CÙNG: Hai bên cam kết thực nghiêm chỉnh điều khoản nêu hợp đồng Trong q trình thực có điều vướng mắc hai bên gặp thương lượng giải tinh thần đảm bảo lợi ích chung Nếu tranh chấp phát sinh không giải thương lượng hồ giải đưa Toà Kinh tế thành phố Hà Nội để giải Hợp đồng gồm 03 trang, làm thành hai có nội dung giá trị pháp lý , bên giữ ĐẠI DIỆN BÊN A ĐẠI DIỆN BÊN B 74 TIEU LUAN MOI download : skknchat@gmail.com 75 TIEU LUAN MOI download : skknchat@gmail.com PURCHASE ORDER P.O.No: 01-10/ Asi- Rainbow To: Guangzhou Rainbow Electronics Co., Ltd Address: Floor 5, No.1112, Guangzhou Main Road Guangzhou, P.R CHINA Please confirm with your Order Acknowledgment within three (3) days upon receipt of copy of this purchase order Tel:+86 - 20 - 87631360 Fax:+86 - 20 - 87749579 Attn: Ms Fangyun Lei Please refer to all future correspondences: PO.No 01-10/ASI/ RAINBOW : 8th July, 2010 : Nguyen Thi Chinh Phuong; Tel: (844) 62691886 Ext 18; PO date Responsible Fax: (844) 62691925 Term of payment Term of delivery : by T/T : FOB Guangzhou, Incoterms 2000 Please delivery to : Advanced Systems for Delivery time: upon order acknowledgment Industry Co Ltd (Asi) # 313, F4 Building, Yenhoa Urban Zone, Yenhoa Ward, Cau Giay District, Hanoi, Vietnam Please submit the English original documents & invoice to : Nguyen Thi Chinh Phuong 76 TIEU LUAN MOI download : skknchat@gmail.com TÀI LIỆU THAM KHẢO Tiếng Việt [1] Một số vấn đề chọn lọc công nghệ thông tin - Thái Nguyên, 29 – 31 tháng năm 2003, Nhà xuất Khoa học Kỹ thuật, 2005 [2] Nguyễn Cơng Cường, Nguyễn Dỗn Phước, Hệ mờ, mạng nơron ứng dụng - NXB Khoa học Kỹ thuật, 2001 [3] Hoàng Kiếm - Đỗ Phúc, Giáo trình khai phá liệu - Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh, 2005 [4] Nguyễn Lương Thục, Một số phương pháp khai phá luật kết hợp cài đặt thử nghiệm - Luận văn thạc sỹ ngành CNTT, Khoa Tin học, Đại học Sư phạm Huế, 2002 [5] Incorterm 2000, Incoterm 2010 Tiếng Anh [6] John Wiley & Sons (2003) - Data Mining-Concepts Models Methods And Algorithms, Copyright © 2003 The Institute of Electrical and Electronics Engineers, Inc [7] Bao Ho Tu (1998), Introduction to Knowledge Discovery and Data mining, Institute of Information Technology National Center for Natural Science and Technology [8] Jean – Marc Adamo, Data Mining for Association Rules and Sequential Patterns, Sequential and Parallel Algorithms, 2001Springer – Verlag New York, Inc [9] Mohammet J Zaki and Chin Jui Hasiao CHAM - An efficient Algorithm for Close Itemset Mining 77 TIEU LUAN MOI download : skknchat@gmail.com ... HỌC CÔNG NGHỆ PHÙNG VĂN VIỆT NGHIÊN CỨU LUẬT KẾT HỢP VÀ THỬ NGHIỆM KHAI PHÁ CƠ SỞ DỮ LIỆU HỢP ĐỒNG GIAO NHẬN VẬN TẢI TẠI CÔNG TY STC VIỆT NAM NHẰM PHÁT HIỆN RA XU HƢỚNG VỀ CÁC ĐIỀU KHOẢN GIAO NHẬN... đông giao nhận vận tải Công ty STC Việt Nam nhằm phát xu hướng điều khoản giao nhận vận tải lựa chọn hợp đồng vận tải hàng hóa” cơng trình nghiên cứu riêng Những số liệu kết nghiên cứu luận văn. .. Incoterm, ví dụ tranh chấp 51 Tập đồn STC cơng ty STC Việt Nam 54 CHƢƠNG 3: ỨNG DỤNG, THỬ NGHIỆM KHAI PHÁ DỮ LIỆU TÍCH HỢP HỆ THỐNG CƠ SỞ DỮ LIỆU HỢP ĐỒNG GIAO NHẬN VẬN TẢI 55 Bài toán

Ngày đăng: 27/06/2022, 09:15

Hình ảnh liên quan

DHP Direct Hashing and Pruning Bảng băm trực tiếp và sự cắt tỉa PHP Perfect Hashing and Pruning  Bảng băm lý tưởng và sự cắt tỉa  I/O Input/Output Vào/ra  - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

irect.

Hashing and Pruning Bảng băm trực tiếp và sự cắt tỉa PHP Perfect Hashing and Pruning Bảng băm lý tưởng và sự cắt tỉa I/O Input/Output Vào/ra Xem tại trang 7 của tài liệu.
Bảng 1: Ví dụ về một cơ sở dữ liệu dạng giao dịch D - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Bảng 1.

Ví dụ về một cơ sở dữ liệu dạng giao dịch D Xem tại trang 11 của tài liệu.
Ví dụ: Với cơ sở dữ liệu D cho ở bảng 1, và giá trị ngưỡng minsupp =50% sẽ liệt kê tất cả các tập phổ biến (frequent-itemset) như sau :  - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

d.

ụ: Với cơ sở dữ liệu D cho ở bảng 1, và giá trị ngưỡng minsupp =50% sẽ liệt kê tất cả các tập phổ biến (frequent-itemset) như sau : Xem tại trang 12 của tài liệu.
Các tập phổ biến nằm trong phần trên của hình trong khi những tập không phổ biến lại nằm trong phần dưới - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

c.

tập phổ biến nằm trong phần trên của hình trong khi những tập không phổ biến lại nằm trong phần dưới Xem tại trang 18 của tài liệu.
Hình 2: Cây cho tậ pI ={1,2,3,4} - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 2.

Cây cho tậ pI ={1,2,3,4} Xem tại trang 19 của tài liệu.
Các giải thuật mà ta xem xét trong bài này được hệ thống hóa như hình vẽ 8. Các giải thuật được phân loại dựa vào việc:  - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

c.

giải thuật mà ta xem xét trong bài này được hệ thống hóa như hình vẽ 8. Các giải thuật được phân loại dựa vào việc: Xem tại trang 20 của tài liệu.
Hình 4. Ví dụ thuật toán Apriori - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 4..

Ví dụ thuật toán Apriori Xem tại trang 26 của tài liệu.
4.1. Cải tiến 1- Giảm số lƣợng các luật đƣợc phát sinh & cần phải kiểm tra - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

4.1..

Cải tiến 1- Giảm số lƣợng các luật đƣợc phát sinh & cần phải kiểm tra Xem tại trang 39 của tài liệu.
Hình 5: Mô tả cải tiến 1 - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 5.

Mô tả cải tiến 1 Xem tại trang 39 của tài liệu.
Hình 6: Mô hình các phương thức vận tải - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 6.

Mô hình các phương thức vận tải Xem tại trang 45 của tài liệu.
Bảng 3: Cơ sở dữ liệu về điều khoản giao nhận vận tải được áp dụng trong quá trình giao nhận vận tải trong năm 2010 - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Bảng 3.

Cơ sở dữ liệu về điều khoản giao nhận vận tải được áp dụng trong quá trình giao nhận vận tải trong năm 2010 Xem tại trang 62 của tài liệu.
Bảng 4: Dữ liệu chuyển đổi từ dạng số sang dạng Boolean - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Bảng 4.

Dữ liệu chuyển đổi từ dạng số sang dạng Boolean Xem tại trang 63 của tài liệu.
Hình 7: Sơ đồ quan hệ sử dụng trong chương trình - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 7.

Sơ đồ quan hệ sử dụng trong chương trình Xem tại trang 66 của tài liệu.
Dựa vào bảng kết quả trên ta nhận thấy rằng: - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

a.

vào bảng kết quả trên ta nhận thấy rằng: Xem tại trang 68 của tài liệu.
Hình 8: Giao diện chính chương trình- Quá trình tạo luật kết hợp theo thuật toán Apriori  - (LUẬN văn THẠC sĩ) nghiên cứu luật kết hợp và thử nghiệm khai phá cơ sở dữ liệu hợp đồng giao nhận vận tải tại công ty STC việt nam nhằm phát hiện ra xu hướng về các điều khoản giao nhận vận tải lựa chọn

Hình 8.

Giao diện chính chương trình- Quá trình tạo luật kết hợp theo thuật toán Apriori Xem tại trang 69 của tài liệu.

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan