Mó húa dữ liệu Cỏc cụng cụ để phõn tớch, thiết kế hệ thống thụng tin quản lý

Một phần của tài liệu Ứng dụng tin học trong công tác quản lý nhân sự tại Tổng công ty xăng dầu Việt Nam và các công ty thành viên (Trang 43 - 50)

quản lý

Mó hoỏ dữ liệu

Khỏi niệm mó hoỏ dữ liệu

Mó hoỏ là cỏch thức để thực hiện việc phõn loại, xếp lớp cỏc đối tượng cần quản lý, được sử dụng trong bất kỳ một hệ thống thụng tin nào, đặc biệt là cỏc hệ thống thụng tin quản lý.

Những lợi ớch của mó hoỏ dữ liệu

Nhận diện khụng nhầm lẫn cỏc đối tượng: Chẳng hạn trong tập tin về hàng hoỏ, nếu mỗi mặt hàng được nhận diện chỉ bởi cỏi tờn thỡ sẽ cú khả năng nhầm lẫn khi cú nhiều hàng hoỏ trựng tờn hoặc cú nhiều tờn hay viết khụng chớnh xỏc tờn hàng. Do đú cần phải gỏn cho mỗi hàng hoỏ một thuộc tớnh định danh, cũn gọi là mệnh danh mang tinh duy nhất.

Mụ tả nhanh chúng cỏc đối tượng: Chẳng hạn một tờn cụng ty rất dài, khú nhớ và khú viết vỡ vậy sẽ làm chậm việc nhập mỗi khi làm việc với cụng ty đú. Nếu được nhập vào qua một số ký hiệu ngắn gọn, rồi truy tỡm trong bảng mó hoỏ để lấy ra tờn đầy đủ của cụng ty thỡ sẽ nhanh và chớnh xỏc hơn.

Nhận diện nhúm đối tượng nhanh hơn: Chẳng hạn trong một tập hợp tờn khỏch hàng ta muốn làm việc với những khỏch hàng thuộc cỏc tỉnh, thành phố khỏc nhau. Nếu trong mó hoỏ cú bao hàm những ký hiệu thể hiện khớa cạnh phõn nhúm trước như vậy thỡ làm việc với chỳng sẽ rất dễ dàng và nhanh chúng.

5 phương phỏp mó hoỏ cơ bản

+

Phương phỏp mó hoỏ phõn cấp : Đõy là nguyờn tắc tạo một bộ mó rất

đơn giản. Người ta phõn cấp đối tượng từ trờn xuống và mó số được xõy dựng từ

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức

trỏi qua phải cỏc chữ số được kộo dài về phớa bờn phải để thể hiện chi tiết sự phõn cấp sõu hơn.

Vớ dụ: Hệ thống tài khoản kế toỏn Việt Nam là một bộ mó 3 cấp. Hai chữ số đầu cho tài khoản, hai chữ số tiếp theo cho tiểu khoản và hai chữ số cuối cho tiết khoản.

+

Phương phỏp mó liờn tiếp : Được tạo ra bởi một quy tắc tạo dóy nhất

định, thường là dựng tuần tự cỏc chữ số để gỏn mó cho đối tượng. Ưu điểm: Phự hợp cho xử lý tự động.

Nhược điểm: Vỡ gỏn tuần tự nờn khụng thể chốn thờm mó vào giữa hai mó cũ, khụng gợi nhớ.

+ Phương phỏp mó tổng hợp: Khi kết hợp việc mó hoỏ phõn cấp với mó

hoỏ liờn tiếp thỡ ta được phương phỏp mó hoỏ tổng hợp. +

Phương phỏp mó hoỏ theo xeri : Phương phỏp này chớnh là sử dụng một

tập hợp theo dóy gọi là xeri. Xeri được coi như một giấy phộp theo mó quy định. +

Phương phỏp mó hoỏ gợi nhớ : Phương phỏp này căn cứ vào đặc tớnh của

đối tượng để xõy dựng mó. Chẳng hạn dựng việc viết tắt cỏc chữ cỏi đầu làm mó như mó tiền tệ quốc tế: VND, USD...

Ưu điểm: Gợi nhớ cao, cú thể nới rộng dễ dàng.

Nhược điểm: Ít thuận lợi cho tổng hợp và phõn tớch, dài hơn mó phõn cấp và dễ bị trựng lặp.

+ Phương phỏp mó hoỏ ghộp nối: Phương phỏp này chia mó ra thành nhiều

trường, mỗi trường tương ứng với một đặc tớnh, những liờn hệ cú thể cú giữa những tập hợp con khỏc nhau với đối tượng được gỏn mó.

Ưu điểm: Nhận diện khụng nhầm lẫn; cú khả năng phõn tớch cao; cú nhiều khả năng kiểm tra thuộc tớnh.

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức (adsbygoogle = window.adsbygoogle || []).push({});

Nhược điểm: Khỏ cồng kềnh vỡ phải cần nhiều ký tự, phải chọn những đặc tớnh ổn định nếu khụng bộ mó mất ý nghĩa.

Yờu cầu đối với bộ mó :

• Bảo đảm tỷ lệ kộn chọn và tỷ lệ sõu sắc bằng 1: Chất lượng của một bộ mó được đo lường bằng hai con số tỷ lệ sau:

Số lượng đối tượng thoả món được lọc ra Tỷ lệ kộn chọn = ---

Tổng số đối tượng được lọc ra Số lượng đối tượng thoả món lọc ra

Tỷ lệ sõu sắc = --- Tổng số đối tượng thoả món cú trong tập tin

• Cú tớnh uyển chuyển và lõu bền: Một bộ mó phải tiờn lượng được khả năng thay đổi của đối tượng quản lý để cú thể thớch ứng với những thay đổi đú. Một bộ mó được xem là cú tớnh chất này khi nú cho phộp nới rộng và bổ sung mó mới.

• Tiện lợi khi sử dụng:

Bộ mó càng ngắn gọn càng tốt. Điều đú giỳp tiết kiệm bộ nhớ, tiết kiệm thời gian nhập liệu và giảm sai lầm khi sử dụng. Kiểm tra dễ dàng hoặc bằng thủ cụng hoặc tự động là yờu cầu cần lưu ý.

Khai thỏc dễ dàng cho những xử lý về sau là khớa cạnh cần xem xột khi xõy dựng bộ mó. Bộ mó dóy ký tự xử lý dễ dàng hơn cho cỏc yờu cầu phõn

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức

nhúm, tổng hợp hơn là bộ mó số. Tuy nhiờn mó số ngắn gọn hơn, nhập nhanh hơn.

Giải mó dễ dàng tức là bộ mó phải xõy dựng sao cho cú thể diễn dịch dễ và rừ ràng.

Cỏch thức tiến hành mó hoỏ : gồm 4 bước sau • Xỏc định tập hợp cỏc đối tượng cần mó hoỏ • Xỏc định cỏc xử lý cần thực hiện

• Lựa chọn giải phỏp mó hoỏ

+ Xỏc định trật tựu đăng cấp cỏc tiờu chuẩn lựa chọn. + Kiểm tra lại những bộ mó hiện hành

+ Kiểm tra độ ổn định của cỏc thuộc tỡnh + Kiểm tra khả năng thay đổi của đối tượng.

• Triển khai mó hoỏ..: Gồm cỏc cụng việc như: lập kế hoạch, xỏc định đội ngũ và cỏc quy tắc, quy chế xõy dựng bộ mó, thụng tin đầy đủ về bộ mó cho cỏc đối tượng sử dụng và loại bỏ cỏc bộ mó lỗi thời.

Mó hoỏ là cụng việc rất quan trọng của việc xõy dựng hệ thống thụng tin. Chỳng bắt đầu ngay cả khi người thiết kế hệ thống thụng tin chưa ý thức rừ ràng về việc sử dụng chỳng. Mó hoỏ và sử dụng mó xảy ra trong suốt quỏ trỡnh phõn tớch, thiết kế, cài đặt và khai thỏc hệ thống thụng tin.

Cỏc cụng cụ mụ hỡnh hoỏ hệ thống thụng tin

Sơ đồ luồng thụng tin IFD (Information Flow Diagram)

Sơ đồ luồng thụng tin IFD là cụng cụ để mụ tả hệ thống thụng tin theo cỏch thức động, tức là mụ tả sự di chuyển của dữ liệu, việc xử lý, lưu trữ trong thế giới vật lý bằng cỏc sơ đồ.

Cỏc ký phỏp của sơ đồ luồng thụng tin (trang sau):

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức

+ Xử lý:

Thủ cụng Giao tỏc người - mỏy Tin học hoỏ hoàn toàn

+Kho dữ liệu:

Thủ cụng Tin học hoỏ

+Dũng thụng tin:

Lưu ý: (adsbygoogle = window.adsbygoogle || []).push({});

+ Dũng thụng tin vào ra với kho dữ liệu khụng cần phải cú mũi tờn chỉ hướng.

+ Cú thể dựng thờm một số ký tự khỏc như màn hỡnh, đĩa từ. • Sơ đồ luồng dữ liệu DFD (Data Flow Diagram)

Sử dụng sơ đồ luồng dữ liệu để mụ tả hệ thống thụng tin như sơ đồ luồng thụng tin nhưng trờn gúc độ trừu tượng. Trờn sơ đồ chỉ bao gồm cỏc luồng dữ liệu, cỏc xử lý, cỏc lưu trữ dữ liệu, nguồn và đớch nhưng khụng hề quan tõm tới

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức

Tài li ệu

nơi, thời điểm và đối tượng chịu trỏch nhiệm xử lý. Sơ đồ luồng thụng tin chỉ mụ tả đơn thuần hệ thống thụng tin làm gỡ và để làm gỡ.

Ký phỏp dựng cho sơ đồ DFD

Sơ đồ luồng dữ liệu DFD sử dụng bốn ký phỏp cơ bản: thực thể, tiến trỡnh, kho dữ liệu và dũng dữ liệu.

+ Nguồn hoặc đớch: Biểu thị nguồn xuất phỏt và đớch đến của thụng tin.

+ Dũng dữ liệu: là dũng chuyển rời thụng tin vào hoặc ra khỏi tiến trỡnh xử lý, hay kho dữ liện. Mỗi dũng dữ liệu phải cú 1 tờn xỏc đinh trừ dũng giữa xử lý và kho dữ liệu.

Tờn dũng dữ liệu

+ Tiến trỡnh xử lý: là khõu biến đổi thụng tin, từ thụng tin đầu vào nú biến đổi, tổ chức, xử lý, xắp xếp hoặc bổ sung tạo ra thụng tin mới, thụng tin đầu ra lưu vào kho dữ liệu hoặc chuyển đến tiến trỡnh tiếp theo để xử lý.

+ Kho dữ liệu: dựng để thể hiện cỏc thụng tin cần lưu trữ dưới dạng vật lý. Cỏc kho dữ liệu này cú thể là cỏc tập tài liệu, cỏc cặp hồ sơ hoặc cỏc tệp thụng tin trờn đĩa.

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức

Tờn người/bộ phận nhận tin Tờn tiến trỡnh xử lý Tờn dữ liệu

Cỏc mức của DFD

Sơ đồ ngữ cảnh (Context Diagram) thể hiện rất khỏi quỏt nội dung chớnh của hệ thống thụng tin. Sơ đồ này khụng đi vào chi tiết mà nú mụ tả sao cho chỉ cần một lần là nhận ra nội dung chớnh của hệ thống. Với sơ đồ ngữ cảnh, để dễ nhỡn hơn, cú thể bỏ qua cỏc kho dữ liệu, bỏ qua cỏc xử lý cập nhật

Phõn ró sơ đồ ngữ cảnh: Sơ đồ ngữ cảnh là sơ đồ tổng quan của hệ thống thụng tin, để mụ tả hệ thống chi tiết hơn người ta dựng kỹ thuật phõn ró

(Explosion) sơ đồ. Bắt đầu từ sơ đồ ngữ cảnh ta phõn ró ra thành sơ đồ mức 0,

tiếp đú là mức 1…tuỳ theo mức độ chi tiết do yờu cầu đũi hỏi.

Một số quy ước và quy tắc liờn quan tới DFD

+ Mỗi luồng dữ liệu phải cú một tờn trừ luồng giữa xử lý và kho dữ liệu.

+ Dữ liệu chứa trờn 2 vật mang khỏc nhau nhưng luụn luụn đi cựng nhau thỡ cú thể tạo ra chỉ một luồng duy nhất.

+ Xử lý luụn phải được đỏnh mó số.

+ Vẽ lại cỏc kho dữ liệu để cỏc luồng dữ liệu khụng cắt nhau. + Tờn cho xử lý phải là một động từ.

+ Xử lý buộc phải thực hiện một biến đổi dữ liệu. Luồng vào phải khỏc với luồng ra từ một xử lý.

Đối với việc phõn ró DFD

+ Cố gắng chỉ để tối đa 7 xử lý trờn một trang DFD.

Lớp Tin Học Kinh Tế 45B SVTH: Nguyễn Tiến Đức (adsbygoogle = window.adsbygoogle || []).push({});

+ Thụng thường một xử lý mà logic của nú được trỡnh bày bằng ngụn ngữ cú cấu trỳc chỉ chiếm một trang giấy thỡ khụng phõn ró tiếp.

+ Tất cả cỏc xử lý trờn một DFD phải thuộc cựng một mức phõn ró. + Luồng vào của một DFD mức cao phải là luồng vào của một DFD con mức thấp nào đú. Luồng ra tới đớch của một DFD con phải là luồng ra tới đớch của một DFD mức lớn hơn nào đú.

+ Xử lý khụng phõn ró tiếp thờm thỡ được gọi là xử lý nguyờn thuỷ. Mỗi xử lý nguyờn thuỷ phải cú một phớch xử lý logic trong từ điển hệ thống.

Sơ đồ lưồng thụng tin và sơ dồ luồng dữ liệu là hai cụng cụ thường dựng nhất để phõn tớch và thiết kế hệ thống thụng tin. Chỳng thể hiện hai mức mụ hỡnh và hai gúc nhỡn động và tĩnh về hệ thống.

Một phần của tài liệu Ứng dụng tin học trong công tác quản lý nhân sự tại Tổng công ty xăng dầu Việt Nam và các công ty thành viên (Trang 43 - 50)