67
độ Replication, tự động đồng bộ theo một chiều từ db của các tỉnh lên cơ sở dữ liệu nghành
- Dabase indexer: sử dụng Lucene 3.4.0. Đây là db chuyên dùng để đánh chỉ mục, có thể chịu đựng hàng tỉ record
Hình 3.14: Indexer database proccess
- Kí số: Do số lƣợng hóa đơn vô cùng lớn, kí điện tử là một thuật toán rất tốn tài nguyên, các server không đủ tài nguyên để sử dụng nên phải dùng máy kí số chuyên dụng
- Services cho cơ quan thuế: sử dụng chuẩn giao thức SOAP, có xác thực tocken key khi kết nối
- Ngôn ngữ lập trình: Microsoft MVC 5, Entity framework 6.0, có cơ chế cache các query.
- Hệ thống báo cáo: Sử dụng rdlc report
3.5.2.So sánh hiệu năng và phân tích kết quả đầu ra
a. Hiệu năng tìm kiếm bản ghi được đánh chỉ mục primary cluster (khóa chính)
Số bản ghi Số lần test DB tập trung DB phân tán
100 1000 0.02s 0.3s
1000 1000 0.06s 0.4s
100.000 1000 1s 0.4s
1000.000 1000 1.2s 0.7s
10.000.000 500 3s 0.8s
Bảng 3.5: Hiệu năng tìm kiếm bản ghi đƣợc đánh chỉ mục primary cluster (khóa chính)
68
b. Tốc độ xuất báo báo thống kê theo khách hàng sử dụng điện
Số bản ghi Số lần test DB tập trung DB phân tán
100 1000 0.02s 0.3s
1000 1000 0.06s 0.4s
100.000 1000 1s 0.4s
1000.000 1000 1.2s 0.7s
10.000.000 500 3s 0.8s
Bảng 3.6: Tốc độ xuất báo cáo
c. Phân tích kết quả đầu ra
Qua việc đánh giá hiệu năng chúng ta thấy rõ ràng với số lƣợng ít dữ liệu, db tập trung tỏ ra tốc độ hơn. Nhƣng khi dữ liệu tăng nhanh, DB tập trụng có thời gian chạy một query lũy tiến rất nhanh, nhƣng DB phân tán vẫn duy trì thời gian ở mức ổn định. Lý do khi ít số bản ghi, DB phân tán lại chạy chậm hơn vì mỗi query, hệ thống phải thực hiện truy lục 2 lần, một lần vào DB indexer, lần 2 mới vào db chứa dữ liệu. Trên thực tế, hệ thống quản lý hóa đơn có số lƣợng bản ghi rất lớn, vì vậy việc áp dụng DB phân tán trong ứng dụng này là tuyệt đối cần thiết
Hình 3.15: Biểu đồ so sánh hiệu năng Màu xanh: Có sử dụng phân tán
Màu đỏ: DB tập trung 1-100 records 2-1000 records 3-100.000 records 0.04 0.09 1 1.8 4 0 1 2 3 4 5 1 2 3 4 5
69
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 1.Kết luận
Triển khai một hệ thống cơ sở dữ liệu phân tán là một lĩnh phức tạp, cần phải hiểu biết về kiến trúc hệ thống và kiến thực sâu rộng về Database. Với mỗi đặc thù hệ thống và yêu cầu nghiệp vụ khác nhau sẽ có những cách thiết kế cụ thể khác nhau trên một nguyên tắc về cơ sở dữ liệu phân tán nói chung, không thể áp dụng kiến trúc hệ thống này vào đặc thù hệ thống khác đƣợc.
Luận văn này đã đƣa ra các nguyên tắc thiết kế một hệ thống phân tán, các kĩ thuật xử lý để áp dụng đối với từng loại bài toán khác nhau. Trọng tâm của luận văn chính là mô hình phân tán dữ liệu đối với một bài toán quản lý hóa đơn điện tử ngành điện. Mô hình thiết kế đó đảm bảo bám sát vào yêu cầu nghiệp vụ của việc xử lý các hóa đơn, các dịch vụ công mà ngành điện cần cung cấp cho xã hội cũng nhƣ có thể đƣa ra các báo cáo thống kê một cách hiệu quả, nhanh chóng.
Phần cuối của luận văn đã so sánh và phân tích đƣợc ƣu nhƣợc điểm khi triển khai một cơ sở dữ liệu tập trung hay phân tán. Từ kết luận đó, có thể có thông tin bổ ích khi quyết định xây dựng một hệ thống thực tế theo mô hình phân tán hay tập trung.
2.Hƣớng phát triển
Ngày nay, khi mà nhu cầu đơn giản hóa trong việc quản lý hóa đơn ngày càng tăng. Hóa đơn điện tử đã thể hiện đƣợc điểm mạnh và tính tiện dụng cũng nhƣ tiết kiệm và dễ dàng quản lý. Không chỉ với ngành điện, hệ thống còn có thể áp dụng đối với cách ngành nghề khác.
Việc ban hành hành lang pháp lý về chữ kí điện tử đang tạo đà phát triển mạnh mẽ của hóa đơn điện tử. Trong tƣơng lai, cần mở rộng hệ thống hơn nữa, xây dựng thêm các chức năng và các dịch vụ công để giải quyết triệt để bài toán hóa đơn phức tạp và khó quản lý của một nền kinh tế.
70
TÀI LIỆU THAM KHẢO * Tiếng Việt
[1] Lê Huy Thập, Cơ sở lý thuyết song song, NXB THÔNG TIN VÀ TRUYỀN THÔNG, 8-2010.
[2] Đoàn Văn Ban, Nguyễn Mậu Hân, Xử lý song song và phân tán, NXB Khoa học và Kỹ thuật, 2006.
[3] Đỗ Xuân Lôi, Cấu trúc dữ liệu và giải thuật, NXB Khoa học và Kỹ thuật, 1996.
[4] Lê Huy Thập, Bài giảng CSDL phân tán, tại ĐH Sƣ Phạm Hà Nội 2 và Học Viện CN Bƣu Chính Viễn Thông.
[5]Đỗ Xuân Lôi, Cấu trúc dữ liệu và giải thuật, NXB Khoa học và Kỹ thuật, 1996
* Tiếng Anh
[6] Robert Sedgewick, Cẩm nang thuật toán Vol.1 and vol.2. NXB Khoa học và Kỹ thuật, 2001.
[7] M.Tamer Ozsu, Patrick Valduriez, Nguyên lý các hệ cơ dữ liệu phân tá, Trần Đức Quang biên dịch, NXB Thống kê, 1999.
[8] Seyed H. Roo, “Parallel processing and Parallel Algorithms, Theory and Coputation”, Springer 1999.