Giới thiệu cơ sở dữ liệu

Một phần của tài liệu Chuẩn hóa và xác định mối quan hệ giữa các cụm từ, tìm và lấy thông tin liên quan đến cụm từ (Trang 35)

Mục này chúng ta đi vào trình bày thiết kế, tổ chức cơ sở dữ liệu để thực hiện lưu trữ thông tin và phục vụ kết xuất ra báo cáo.

a. Bảng ChuDe

Do quá trình thăm dò và tổng hợp không phải chỉ dành cho một mà là nhiều chủ đề, vì thế chúng ta cần thiết kế một bảng để lưu nội dung của các chủ đề. Bảng chủ đề được đặt tên là ChuDe và có cấu trúc như sau:

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

MaChuDe Varchar 10 Khoá chính

ChuDe Nvarchar 100 Chủ đề cần nghiên cứu và tổng hợp

Bảng 7.Cấu trúc bảng ChuDe

Dữ liệu (minh họa) của bảng ChuDe:

MaChuDe ChuDe

TCCK Thị trường chứng khoán CNTT Công nghệ thông tin

DBTT Dự báo thời tiết

ATGT An toàn giao thông

BĐ Bóng đá

GiaVang Giá vàng

BDS Thị trường bất động sản

TTV Thị trường vàng

TTNT Thị trường ngoại tệ GiaXangDau Giá xăng dầu

Bảng 8.Dữ liệu minh họa bảng ChuDe b. Bảng CumTu

Bảng cụm từ chứa các “cụm từ” được dùng để tìm các địa chỉ đoạn văn hay bài viết có chứa cụm từ liên quan đến chủ đề. Các “cụm từ” được người sử dụng đưa vào bảng cụm từ sau đó dùng phương pháp thống kê để tìm lớp “mode”. Bảng này bao gồm các trường lưu các dữ liệu cho mục đích tổng hợp văn bản và cung cấp tiêu đề của khối văn bản cần tổng hợp. Bảng cụm từ được đặt tên là CumTu và có cấu trúc như sau:

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

MaCumTu varchar 10 Khoá chính

CumTu Nvarchar 4000 Cụm từ cần dùng để thu lượm thông tin

Bảng 9.Cấu trúc bảng CumTu Dữ liệu (minh họa) của bảng CumTu:

MaCumTu CumTu

000001 Bóng đá Anh

000002 Mã chứng khoán tăng mạnh

000003 Thị trường bất động sản đóng băng 000004 Báo cáo doanh thu của các NHTMCP 000005 Ảnh hưởng cơn bão số 9 (adsbygoogle = window.adsbygoogle || []).push({});

000006 Vụ lúa bội thu

000007 Giá vàng tăng trở lại

000008 Vàng tăng

000009 Giá gạo xuất khẩu 000010 Xăng tăng giá 000011 Cà phê xuất khẩu

000012 Thị trường chứng khoán tăng mạnh cuối tuần 000013 Thị trường chứng khoán giảm mạnh cuối tuần

…. ...

Bảng 10.Dữ liệu minh họa bảng CumTu c. Bảng TimKiem

Bảng tìm kiếm được dùng để tạo ra các chủ đề, ứng với các chủ đề là các cụm từ tương ứng (thuộc lớp mode) tìm thông tin cho chủ đề này. Tần suất xuất hiện của các cụm từ càng lớn thì thông tin thu được càng phong phú và đa dạng. Bảng tìm kiếm được đặt tên là TimKiem có cấu trúc như sau:

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

MaCumTu varchar 10 Khoá chính

MaChuDe varchar 10

Bảng 11.Cấu trúc bảng TimKiem Dữ liệu (minh họa) của bảng TimKiem:

ThiTruong 000002 Chứng khoán ThiTruong 000008 Giá vàng tăng vọt ThiTruong 000007 Giá vàng tăng trở lại

GiaVang 000008 Vàng tăng

GiaVang 000007 Giá vàng tăng trở lại

... ...

Bảng 12.Dữ liệu minh họa bảng TimKiem

d. Bảng TongHop

Bảng tổng hợp được dùng để lưu giữ các văn bản có chứa cụm từ thuộc chủ đề. Cấu trúc của bảng phụ thuộc vào yêu cầu tổng hợp của người sử dụng. Bảng tổng hợp được đặt tên là TongHop và có cấu trúc như sau:

STT

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

1 ID int 10 Khóa chính

2 MaChuDe varchar 10 Khóa ngoại

3 DC_Website Nvarchar 4000 Địa chỉ Website 4 DC_KetNoi Nvarchar 4000 Địa chỉ đã kết nối

5 NgayTruyCap DateTime Ngày truy cập vào Website và E-Mail

6 TieuDeBaiViet Nvarchar 100 Tiêu đề bài viết có cụm từ 7 NoiDungTK Nvăn bản Nội dung tìm kiếm được (adsbygoogle = window.adsbygoogle || []).push({});

8 NgayPhatHanh Varchar 50 Ngày đưa bản tin có chứa cụm từ

9 TacGia Nvarchar 100 Tên tác giả của đoạn VB có cụm từ

Bảng 13.Cấu trúc bảng TongHop

Các trường từ trường số 7 trở đi được gọi là trường diễn giải, chúng được sử dụng để làm rõ thêm cho nội dung tìm kiếm. Tên, số lượng, kiểu, độ rộng của các trường là tuỳ ý, phụ thuộc vào yêu cầu tổng hợp của người sử dụng.

e. Bảng NguoiDung

Bảng người dùng được thiết kế để lưu trữ thông tin người dùng trong hệ thống. Bảng người dùng đặt tên là NguoiDung và có cấu trúc như sau:

STT

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

1 MaNguoiDung varchar 10 Khóa chính

2 TenDangNhap Nvarchar 50 Tên sử dụng đăng nhập vào hệ thống

3 TenDayDu Nvarchar 50 Họ tên người dùng 4 MatKhau Varchar 200 Mật khẩu đăng nhập

5 MoTa Nvarchar 100 Thông tin mô tả

6 TuNgay DateTime Ngày bắt đầu có hiệu lực

7 DenNgay DateTime Ngày hết hiệu lực

8 ThoiGianBatDau DateTime Thời gian bắt đầu tham gia hệ thống

9 TrangThai Bit Đã được kích hoạt hay chưa

10 NgayTao DateTim Ngày tạo người dùng

11 Email Varchar 100 Địa chỉ email

12 DienThoai Varchar 15 Điện thoại

Bảng 14.Cấu trúc bảng NguoiDung f. Bảng ThamSo

Bảng tham số được dùng để lưu giữ các tham số của hệ thống dùng cho việc cấu hình hệ thống. Bảng tham số được đặt tên là ThamSo và có cấu trúc như sau:

STT

Tên trường Kiểu dữ liệu

Độ rộng

Ghi chú

1 MaThamSo varchar 10 Khóa chính

2 TenThamSo Nvarchar 100 Tên tham số 3 GiaTriThamSo Nvarchar 200 Giá trị tham số

4 GhiChu Nvarchar 100 Chú thích thêm về tham số (adsbygoogle = window.adsbygoogle || []).push({});

Bảng 15. Cấu trúc bảng ThamSo

Tạo cấu trúc các bảng sử dụng Hệ quản trị Cơ sở dữ liệu SQL 2005 như sau: Create Table <Tên bảng>(<Danh sách trường, kiểu, độ rộng>)

Câu lệnh tạo bảng ChuDe:

CREATE TABLE [dbo].[dttChuDe](

[ID] [int] IDENTITY(1,1) NOT NULL, [MaChuDe] [nvarchar](50) NOT NULL,

[TenChuDe] [nvarchar](100) NOT NULL,

CONSTRAINT [PK_dttChuDe] PRIMARY KEY CLUSTERED (

[ID] ASC

)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY]

Câu lệnh tạo bảng CumTu:

CREATE TABLE [dbo].[dttCumTu](

[ID] [int] IDENTITY(1,1) NOT NULL, [MaCumTu] [nvarchar](50) NULL, [TenCumTu] [nvarchar](4000) NULL,

CONSTRAINT [PK_dttCumTu] PRIMARY KEY CLUSTERED (

[ID] ASC

)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY]

Câu lệnh tạo bảng TimKiem:

CREATE TABLE [dbo].[dttTimKiem]( [MaChuDe] [int] NOT NULL, [MaCumTu] [int] NOT NULL,

CONSTRAINT [PK_dttTimKiem] PRIMARY KEY CLUSTERED (

[MaChuDe] ASC, [MaCumTu] ASC

)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY]

Câu lệnh tạo bảng TongHop:

CREATE TABLE [dbo].[dttTongHop]( [ID] [int] NOT NULL,

[IDChuDe] [int] NULL,

[MaChuDe] [nvarchar](50) NULL, [DC_Website] [nvarchar](4000) NULL, [DC_KetNoi] [nvarchar](4000) NULL, [NgayTruyCap] [datetime] NULL,

[TieuDeBaiViet] [nvarchar](100) NULL, [NoiDungTK] [ntext] NULL,

[TacGia] [nvarchar](100) NULL,

CONSTRAINT [PK_dttTongHop] PRIMARY KEY CLUSTERED (

[ID] ASC

)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]

Câu lệnh tạo bảng NguoiDung: (adsbygoogle = window.adsbygoogle || []).push({});

CREATE TABLE [dbo].[dttNguoiDung](

[ID] [numeric](18, 0) IDENTITY(1,1) NOT NULL, [TenDangNhap] [nvarchar](50) NULL,

[TenDayDu] [nvarchar](50) NULL, [MatKhau] [varchar](200) NULL, [MoTa] [nvarchar](100) NULL, [TuNgay] [datetime] NULL, [DenNgay] [datetime] NULL,

[ThoiGianBatDau] [datetime] NULL,

[TrangThai] [bit] NULL CONSTRAINT [DF_dttNguoiDung_TrangThai] DEFAULT ((1)),

[NgayTao] [datetime] NULL, [Email] [varchar](100) NULL, [DienThoai] [varchar](50) NULL,

[IsSuperAdm] [bit] NULL CONSTRAINT [DF_dttNguoiDung_IsSuperAdm] DEFAULT ((0)),

CONSTRAINT [PK_dttNguoiDung] PRIMARY KEY CLUSTERED (

[ID] ASC

)WITH (IGNORE_DUP_KEY = OFF) ON [PRIMARY] ) ON [PRIMARY]

Câu lệnh tạo bảng ThamSo:

CREATE TABLE [dbo].[dttThamSo](

[ID] [numeric](18, 0) IDENTITY(1,1) NOT NULL, [TenThamSo] [nvarchar](100) NOT NULL,

[GiaTriThamSo] [nvarchar](200) NOT NULL, [GhiChu] [nvarchar](100) NULL,

CONSTRAINT [PK_dttThamSo] PRIMARY KEY CLUSTERED (

[ID] ASC

) ON [PRIMARY]

Một phần của tài liệu Chuẩn hóa và xác định mối quan hệ giữa các cụm từ, tìm và lấy thông tin liên quan đến cụm từ (Trang 35)