3.2.1 Mô tả phần cứng
Việc phát sóng các chương trình phát thanh (hệ Âm nhạc – Tin tức - Giải trí VOV3) trên máy tính tại Đài Tiếng nói Việt nam đã được triển khai vào năm 1996. Điều này có nghĩa là một mạng máy tính dành cho công tác sản xuất và phát sóng các chương trình đã được hình thành. Tuy mới ở dạng một mạng ngang hàng gồm hai máy tính luân phiên sản xuất và phát sóng chương trình, nhưng hệ thống này cũng bao gồm cả hệ cơ sở dữ liệu và một ổ cứng lưu trữ các file âm thanh phục vụ cho công tác truyền âm.
Năm 1997, một hệ thống mạng máy tính phục vụ công tác phát thanh bao gồm một số máy trạm và máy chủđược đưa vào hoạt động để thay thế cho hệ thống cũ không còn đáp ứng được nhu cầu phát thanh ngày càng tăng. Hệ thống này bao gồm một hệ cơ sở dữ liệu tập trung cùng với ổ cứng lưu trữ âm thanh nằm trên máy chủ chính là tiền đề cho việc phát triển mạng máy tính phát thanh sau này.
Cùng với sự phát triển của công nghệ thông tin, hệ thống phát thanh trên máy tính, hay còn gọi là mạng máy tính phát thanh của Đài tiếng nói Việt nam ngày càng lớn mạnh. Đến năm 2003, một hệ thống mạng máy tính phát thanh gồm 75 trạm làm việc âm thanh và 120 trạm văn bản với khả năng lưu trữ hàng ngàn giờ âm thanh cùng với hàng vạn trang văn bản đã được triển khai tại toà nhà Biên tập 41-43. Năm 2005, một hệ thống mạng phát thanh khác dành cho hệ phát thanh đối ngoại của Đài cũng được triển khai. Có thể nói đây là hai hệ thống mạng máy tính phát thanh tương đối lớn.
Các máy chủ trong hệ thống mạng đối nội bao gồm hai máy chủ HP- LXr8000, hai máy chủ HP LH4 . Hai máy chủ Netserver LXr8000 tạo thành một cặp cluster dùng cho hệ cơ sở dữ liệu chính của hệ phần mềm phát thanh. Hai máy chủ LH4 tạo thành một cặp Cluster thứ hai dùng để lưu trữ nguồn âm
Hệ thống máy chủ và các trạm làm việc được kết nối với nhau thông qua mạng xương sống gồm hai corebuilder 3500 và các cặp switch 3COM 3300.
Hệ cơ sở dữ liệu chính Db1 và Db2 được sử dụng Raid 1 để bảo vệ dữ liệu, khiến cho hệ thống lưu trữ có tính dự phòng vì thế tính an toàn của giữ liệu được gia tăng. Raid 1(ghi dữ liệu song song lên một hoặc nhiều ổ cứng cùng một thời điểm) được cấu hình để đảm bảo khả năng an toàn của dữ liệu khi có một ổ đĩa bị hỏng. Raid 1 cũng làm nâng cao hiệu quả của việc đọc dữ liệu từổ cứng.
Các File server được sử dụng Raid 5. Raid 5, hay còn được gọi là một dẫy các bít chẵn lẻ được quay vòng (Rotating Parity Array), nhằm tránh hiện tượng dữ liệu bị tăng quá nhiều tại ổ ghi chẵn lẻ có thể dẫn đến thắt cổ chai, giảm hiệu năng hoạt động của hệ thống, nguyên nhân gây ra bởi vì chỉ có duy nhất một ổ đĩa dành cho parity của phương pháp RAID 3 và 4. Bit thông tin chẵn lẻ trong RAID 5 được sắp xếp đều ở tất cả các ổđĩa trong dẫy.
Đối với hệ thống cơ sở dữ liệu dành cho hệ phát thanh đối ngoại, hệ thống phần cứng bao gồm hệ thống mạng và hệ thống máy chủ lưu trữ dữ liệu.
Hình 3.2 : Cấu trúc phần cứng hệ phát thanh đối ngoại
Các máy chủ trong hệ thống phát thanh đối ngoại bao gồm hai máy ML530, hai máy DL 360 .Hai máy chủ ML530 tạo thành một cặp dùng cho hệ cơ sở dữ liệu MS SQL chính của hệ phần mềm phát thanh đối ngoại.
Hệ cơ sở dữ liệu sybase chính Db1 và Db2 được sử dụng Raid 1 để bảo vệ dữ liệu, khiến cho hệ thống lưu trữ có tính dự phòng vì thế tính an toàn của giữ liệu
được gia tăng.Các File server được sử dụng Raid 5. Trên mỗi máy chủ Database có cài DBShare. Dịch vụ này được thiết kếđể tập trung hóa và đảm bảo chắc chắn tất cả truy cập đến database bởi ứng dụng Netia. DBShare tập trung tất cả mọi truy nhập. Nó là nền tảng của mối liên hệ giữa chương trình ứng dụng và cơ sở dữ liệu. DBShare cải thiện tình trạng kết nối mở bằng cách tựđộng tắt những máy rảnh rỗi để lưu lượng máy chủđược giải phóng.
3.2.2 Mô tả Cơ sở dữ liệu
Hai phần mềm phát thanh hiện đang được sử dụng đều là hai phần mềm chuyên nghiệp. Cả hai phần mềm đều là những phần mềm đóng nên việc nghiên cứu các tính năng, cách khai thác sao cho có hiệu quả là một vấn đề hết sức phức tạp đặc biệt là phần cơ sở dữ liệu. Khó khăn lớn nhất cho công tác nghiên cứu đó là tài liệu về cơ sở dữ liệu của hai phần mềm này là rất ít và hầu như là không có. Để có thể nắm bắt được cấu trúc các bảng trong CSDL, hầu hết phải dựa trên cách thức khai thác phần mềm rồi sau đó mới lần ngược ra được cấu trúc dữ liệu và mối quan hệ giữa các bảng với nhau. Chính vì vậy việc xây dựng một hệ cơ sở dữ liệu phục vụ cho truyền thanh là rất cần thiết với những trường, những bảng phù hợp với nhu cầu của người dùng.
- Cơ sở dữ liệu phần mềm phát thanh đối nội (DALET)
Phần mềm này được xây dựng trên mô hình Client/Server, sử dụng hệ quản trị cơ sở dữ liệu cơ sở dữ liệu Sybase Adaptive Server version 11.9.2. Cũng như các phần mềm sử dụng cơ sở dữ liệu khác, phần mềm này cũng có các giao diện thể hiện dữ liệu. Có nhiều giao diện người dùng trong phần mềm nhưng hai giao diện thể hiện dữ liệu rõ nét nhất là BaseBrowser và LogEdit. Căn cứ vào hai giao diện này, chúng ta có thể tìm ra được cấu trúc dữ liệu và mối quan hệ giữa dữ liệu với giao diện thể hiện.
Thể hiện dữ liệu trên cửa sổ BaseBrowser
Hình 3.3 : Giao diện cửa sổ BaseBrowser
Giao diện cửa sổ BaseBrowser thể hiện thông tin của một Title, nó cho biết title nằm ở thư mục nào ( Class), thời lượng, ngày được tạo ra, lần sửa cuối cùng, tên file vật lý và đường dẫn của một file…Các thông tin này của Title không nằm trên một bảng CSDL mà nằm ở nhiều bảng khác nhau và được liên kết với nhau bằng một hoặc nhiều trường chỉ số (Index).
- Cơ sở dữ liệu phát thanh đối ngoại (NETIA)
So với cơ sở dữ liệu của hệ phát thanh đối nội thì số lượng các bảng trong cơ sở dữ liệu này ít hơn nhiều, nhưng số trường trong mỗi bảng lại khá lớn ví dụ như bảng T_RUN có 43 trường, bảng T_ITEM có tới 107 trường. Đây cũng chính là một trong những khó khăn nhưng đồng thời cũng là một thuận lợi cho việc tìm hiểu cấu trúc dữ liệu của hệ phần mềm. Ngoài ra cũng có thể xem CSDL này là CSDL động vì số lượng bảng còn phụ thuộc vào một số nhu cầu của người sử dụng. Với phần mềm dành cho hệ phát thanh đối ngoại, việc thể hiện dữ liệu không thông qua cấu trúc hình cây mà thông qua việc tạo các “thẻ” (TAB), chính vì vậy, khi mỗi thẻ được tạo ra trên giao diện (Browser) thì trong CSDL sẽ xuất hiện thêm một bảng.
Giao diện được dùng để thể hiện dữ liệu trong phần mềm Netia được gọi là Browser.
Giao diện này được thiết kế để đáp ứng nhu cầu tìm kiếm nhanh các nguồn tin có trong cơ sở dữ liệu. Browser gồm nhiều chức năng tìm kiếm theo các tiêu chuẩn khác nhau như tìm kiếm theo kiểu file, tìm kiếm theo trạng thái nguồn tin, tìm kiếm theo trường, tìm kiếm theo thứ tự. Browser cho phép người sử dụng truy cập trực tiếp tới bất kỳ file nào được lưu trong cơ sở dữ liệu. Các file âm thanh được phân loại theo từng thẻ trong Browser: Tab All, News, Music, Feeds, Jingle, Commercial, Text, Cartstack. Phụ thuộc vào từng thẻ mà các nút chức năng cũng như các trường tìm kiếm được hiển thị khác nhau
3.3 Thiết kế Cơ sở dữ liệu truyền thanh
3.3.1 Phân tích yêu cầu bài toán
Bước đầu tiên trong việc xây dựng một cơ sở dữ liệu là quyết định xem nhu cầu của cơ sở dữ liệu thông qua việc phân tích nhu cầu của người sử dụng.
Công việc xây dựng một CSDL luôn hướng tời vấn đề cung cấp dịch vụ tối ưu cho khách hàng. Đối với hệ CSDL xây dựng phát thanh, đối tượng hướng tới chính là các biên tập viên, phóng viên. Sau khi ngân hàng dữ liệu đã đáp ứng được nhu cầu khai thác sử dụng của nội bộ nhân viên trong toàn thể cơ quan thì có khả năng hướng tới quá trình thương mại hóa các nguồn âm. Vì vậy, một hệ thống lưu trữ âm thanh trực tuyến là một tiềm năng rất lớn trên thị trường. Chính vì lẽ đó, mà về mặt kỹ thuật đòi hỏi một CSDL lớn , linh hoạt và có khả năng chia sẻ.
Việc đầu tiên là tìm hiểu nhu cầu của người sử dụng, hiểu cặn kẽ những nhu cầu khác nhau của người dùng. Để có thể xây dựng một CSDL thực sự thiết thực gắn với người dùng thì vấn đề đầu tiên là phải hiểu được quy trình làm việc cũng như đối tượng mà CSDL hướng tới. Cấu trúc vật lý có ảnh hưởng lớn đến cấu trúc chung của toàn CSDL.
Một số bước tiến hành quá trình phân tích nhu cầu người dùng:
- Phân tích CSDL hiện tại, tìm hiểu ưu nhược điểm của CSDL hiện tại. Tìm kiếm các trường khóa quan trọng cho cơ sở dữ liệu: những trường nào thường xuyên được sử dụng, những trường nào hiếm khi sử dụng và những trường nào hầu như không sử dụng. Ta có thể thấy rằng những thông tin ko bao giờ sử dụng có thể loại trừ khỏi CSDL mới hoặc giả thiết có những thông tin thực sự cần thiết phải thêm vào.
- Nói chuyện với từng người ở trong các nhóm khác nhau để tìm hiểu nhu cầu đối với việc lưu trữ dữ liệu.
- Có các bản copy của các form và báo cáo hiện tại – những bản thông tin dùng để lưu trữ thông tin của các nguồn âm. Những bản báo cáo này sẽ giúp trong việc điền các trường và các bảng trong CSDL.
- Đảm bảo việc phân tích dữ liệu một cách chính xác, những vấn đề liên quan, từ ai, tại sao nó quan trọng và bất cứ thông tin nào mà có thể liên quan.
Đối với CSDL phát thanh thì mục đích lớn nhất đó là lưu trữ các nguồn âm một cách tường minh nhất, phục vụ cho quá trình khai thác và sản xuất chương trình một cách hiệu quả và thiết thực.
- Nghiên cứu nhu cầu của từng nhóm người khác nhau. Ví dụ đối với hệ phát thanh VOV3 chương trình sản xuất chủ yếu là về ca nhạc, thông tin giải trí thì cần có nơi chứa các nguồn âm về âm nhạc với các thể loại khác nhau, đáp ứng được nhu cầu sản xuất.
- Nghiên cứu các form lưu giữ thông tin về nguồn âm hiện tại
PHIẾU THU THANH CHƯƠNG TRÌNH
Tên bài………..……… Tên Album/CD:……… Thời lượng:……….giờ……….phút………giây……… Thể loại nhạc:……… Chi tiết loại nhạc:………. Làn điệu:……… Tác giả lời……… Phối khí……… Diễn xuất……… Dàn nhạc……… Chỉ huy……….………..………..………..………..………… Biên tập:……… Người thu:……… Nơi thu:……… Stereo:………..Mono………
Các thông tin ở phiếu thu này cho ta biết chính xác những thông tin về nguồn âm. Phiếu thu này cho ta biết những thông tin hữu ích phục vụ cho việc thiết kế các bảng trong CSDL đồng thời ta cũng nhận thấy có nhiều thông tin không cần thiết và có thể loại bỏ, trách rườm rà trong quá trình thiết kế.
3.3.2 Lựa chọn hệ quản trị CSDL.
Microsoft SQL Server 2000 là một hệ quản trị cơ sở dữ liệu quan hệ (Relational database management system – RDBMS), nó cung cấp các dịch vụ quản lý và lưu trữ dữ liệu cho các tổ chức thương mại lớn, cùng với việc truy xuất dữ liệu hỗ trợđối với các tổ chức nhỏ hơn và các người dùng riêng biệt. SQL Server 2000 chấp nhận thực thi các yêu cầu của khách hàng. Các lệnh của người dùng được gửi như là các lệnh truy vấn giao tác (Transact-SQL). T-SQL là một ngôn ngữ dùng bởi SQL Server 2000 để truy vấn một cơ sở dữ liệu hoặc hiệu chỉnh nội dung của nó. Các câu lệnh T-SQL dùng để hiệu chỉnh hoặc truy xuất dữ liệu có thể chia thành 3 nhóm khác nhau:
- Ngôn ngữđịnh nghĩa dữ liệu (Data Definition Language – DDL)được dung để định nghĩa các đối tượng của cơ sở dữ liệu như các kiểu dữ liệu, bảng và các truy vấn.
- Ngôn ngữ thao tác dữ liệu (Data Manipulation Language – DML)
được dùng để chọn, chèn, cập nhật và xóa dữ liệu trong các đối tượng của CSDL.
- Ngôn ngữ điều khiển dữ liệu (Data Control Language – DCL) được dùng để chọn, chèn, cập nhật và xóa dữ liệu trong các đối tượng của CSDL.
Cơ sở dữ liệu của SQL Server 2000
Một CSDL của SQL Server là tập hợp các bảng (Table) dùng để chứa các dữ liệu và những đối tượng khác, chẳng hạn Views, indexes, store producres, và triggers…Chúng được ấn định để hỗ trợ các hoạt động được thực hiện với dữ liệu. Dữ liệu được chứa trong một CSDL thường liên quan đến một chủđề hay tiến trình
đặc biệt. SQL Server có thể hỗ trợ nhiều CSDL. Mỗi một CSDL có thể liên quan hay không liên quan đến các CSDL khác.
Khi tạo một CSDL, ta phải xây dựng cấu trúc lưu trữ dữ liệu. Cấu trúc này bao gồm ít nhất một tập tin dữ liệu (data file) và một tập tin vết giao tác(transaction log file). Cách dữ liệu được lưu trữ trong CSDL của SQL Server:
Hình 3.6: Các tập tin CSDL SQL Server
Một CSDL được lưu chứa trong các tập tin vật lý trên đĩa cứng, một CSDL trải dài trên ít nhất là hai tập tin. Một vài tập tin dữ liệu (data file) và một tập tin vết (transaction log file). Những tập tin này được chỉđịnh khi CSDL được tao hay hiệu chỉnh. SQL Server 2000 cho phép ba loại tập tin CSDL:
- Primary data files: Một CSDL có một primary data file dùng để ghi nhận lại tất cả những tập tin khác trong CSDL và lưu trữ dữ liệu. Theo ngầm định, tên của primary data file có đuôi mở rộng là .MDF.
- Secondary data files: một CSDL có thể không có hoặc có nhiều secondary data files, dùng để lưu các đối tượng của CSDL. Theo ngầm định, tên của secondary data file có phần mở rộng là . NDF.
- Log files: Một CSDL có ít nhất một log file dùng chứa những thông tin cần thiết cho việc phục hồi tất cả những giao tác (transaction) trong CSDL. Theo ngầm định, log file có phần mở rộng là .LDF
3.3.3 Thiết kế mô hình ER cho CSDL
Hệ thống lưu trữ dữ liệu là hệ thống tương tác giữa hai bên, bên khối sản xuất và khối biên tập. Khối sản xuất tạo ra nguồn âm, lưu trữ vào các form với tiêu chuẩn nhất định. Khối biên tập, tìm kiếm khai thác nguồn âm đã được sản xuất nhằm phục vụ cho chương trình.
Cơ sở dữ liệu truyền thanh [TRUYENTHANH] cần lưu giữ thông tin về người sử dụng [NGUOIDUNG], các thư mục chứa nguồn âm [THUMUC] và các nguồn âm [NGUONAM] trong hệ thống. Sau khi tập hợp được tất cả các yêu cầu của hệ thống, ta tiến hành mô tả lại bằng mô hình ER.
Các quy tắc nghiệp vụ của hệ thống CSDL thiết kế:
a. Cơ sở dữ liệu [TRUYENTHANH] có nhiều thư mục [THUMUC]. Mỗi thư mục có tên (tenthumuc), mã số (mathumuc) duy nhất. Mỗi thư mục được truy cập bởi một hoặc một số người dùng [NGUOIDUNG] xác định. Mỗi [THUMUC] có ngày được tạo ra (ngaytaothumuc).
b. Mỗi thư mục đều chứa một số nguồn âm [NGUONAM]. Mỗi một nguồn âm có tên nguồn âm (tennguonam), mã nguồn âm (manguonam) duy nhất, thời lượng (thoiluong), ngày khởi tạo ( ngaykhoitao), tác giả( tacgia), tên album/CD (album).
c. Với mỗi người dùng [NGUOIDUNG], chúng ta lại lưu lại những thông tin sau: tên đăng nhập (tennguoidung), mã sốđăng nhập (madangnhap), mật khẩu đăng nhập (matkhau), thuộc nhóm người sử dụng nào (nhom).
d. Mỗi nhóm người dùng có thể truy cập vào nhiều thư mục.