BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGÔ VĂN KHOA NGHIÊN CỨU KỸ THUẬT PHÂN TÍCH VÀ TRÍCH RÚT THUỘC TÍNH TÀILIỆUPHỤCVỤ CHO CÁC BÀI TOÁN TÌM KIẾM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 Công trình được hoàn thành tạiĐẠI HỌC ĐÀ NẴNG Ngƣời hƣớng dẫn khoa học: TS. HUỲNH CÔNG PHÁP Phản biện 1: PGS.TS. VÕ TRUNG HÙNG Phản biện 2: PGS.TS. TRƢƠNG CÔNG TUẤN Luận văn được bảo vệ trước Hộiđồng chấm Luận văn tốt nghiệp thạc sĩ Kỹ thuật họp tạiĐại học Đà Nẵng vào ngày 18 tháng 5 năm 2013. Có thể tìm hiểu luận văn tại: - Trung tâm Thôngtin - Học liệu, Đại Học Đà Nẵng 1 MỞ ĐẦU 1. Lý do chọn đề tài Trên môi trường Internet ngày nay, số lượng thôngtin từ các Web Site là vô cùng lớn và vẫn đang còn gia tăng nhanh chóng theo từng ngày. Với hiện trạng đó, tìm kiếm thôngtin là một nhu cầu không thể thiếu cho những người sử dụng Internet. Ngày nay, loại thôngtin mà người sử dụng muốn tìm kiếm cũng đã trở nên phong phú, nó không còn đơn thuần là tìm kiếm nội dung văn bản trên một trang Web trên Internet, thay vào đó còn nhiều loại khác như: hình ảnh, tập tin âm thanh, tập tin video, tàiliệu dưới dạng những tập tin được soạn thảo bằng các trình soạn thảo … Tuy nhiên, hiện nay các máy tìm kiếm là công cụ tìm kiếm hỗ trợ rất tốt cho người sử dụng để truy vấn thông tin. Với các máy tìm kiếm khá phổ biến hiện nay như Google, Yahoo, thì khi nhận một truy vấn từ người dùng, các máy tìm kiếm này thường trả về một danh sách lớn các kết quả tìm kiếm. Các kết quả tìm kiếm này thường không chính xác, các kết quả tìm kiếm thường theo danh sách các từ khóa mà người dùng truy vấn. Thêm vào đó, đối với các truy vấn “nhập nhằng”, có nhiều chủ đề liên quan thì người dùng rất khó khăn và tốn nhiều thời gian xem xét các tiêu đề và đoạn tóm lược của tàiliệu để tìm ra kết quả mong muốn. Ví dụ, người truy vấn muốn tìm địa danh Đà Nẵng nhưng kết quả trả về các bài viết có chứa từ khóa Đà Nẵng như FPT Đà Nẵng hay báo Đà Nẵng điện tử, du lịch Đà Nẵng, khách sạn Đà Nẵng… Nguyên nhân cho ra kết quả như trên là do tệp chỉ mục danh sách các từ được xây dựng với mỗi từ gắn vào một từ khóa mà thôi. Từ 2 hiện trạng đó để nâng cao tính chính xác cho kết quả tìm kiếm, chúng tôi đề xuất xây dựng tệp chỉ mục ngữ nghĩa tốt hơn, mỗi từ khóa gắn với một từ và cócác thuộc tính mô tả từ đó, để phụcvụ tốt cho bài toán kiếm. Do đó chúng tôi quyết định chọn đề tài “Nghiên cứu kỹ thuật phân tích và trích rút thuộc tính tàiliệuphụcvụ cho các bài toán tìm kiếm”. Trong luận văn này, chúng tôi mong muốn sử dụng các kĩ thuật đã được nghiên cứu, sử dụng kĩ thuật phân tích và trích rút thuộc tính tàiliệu cùng với một số phương pháp xử lý ngôn ngữ tự nhiên để xây dựng tệp chỉ mục ngữ nghĩa để áp dụng vào máy tìm kiếm, tìm ra tập tất cả đối tượng thỏa mãn yêu cầu do người dùng đặt ra. 2. Mục tiêu và nhiệm vụ - Tìm hiểu các kỹ thuật phân tích và trích rút thuộc tính của tài liệu. - Xây dựng lại tệp chỉ mục ngữ nghĩa phụcvụ tốt CƠNG TY CỔ PHẦN THIẾT KẾ CƠNG NGHIỆP HĨA CHẤT CHEMICAL INDUSTRY ENGINEERING JOINT STOCK COMPANY THÔNGTIN CỦA CỔĐÔNG Họ tên: Ngày tháng năm sinh: CMND/Hộ chiếu số: Ngày cấp………………… Nơi cấp: Hộ thường trú (Ghi theo sổ hộ CMND): Chỗ (Ghi chi tiết số nhà, đường phố, thơn,…nơi cổđơng nhận tàiliệu Công ty gửi) Điện thoại liên hệ (gồm số di động điện thoại bàn có): Fax (nếu có): Email: …….Ngày… tháng……năm 2014CỔĐÔNG Ghi chú: Để đảm bảo quyền lợi cổ đông, đề nghị Quý cổđông điền đẩy đủ thôngtin theo mẫu gửi Thư ký Công ty (ông Nguyễn Văn Quý, điện thoại cố định: 04.3845.5777, máy lẻ 206, điện thoại di động: 0936.888.680, email: quyvan.nguyen@ceco.com.vn) 21A Cát Linh, Đống Đa, Hà Nội, VN - Tel: +84438455777- Fax: +84438232325 - Website: www.ceco.com.vn http://NgocHung.name.vn
PHẦN SỐ HỌC
Bài 1: TÍNH CHIA HẾT TRÊN TẬP HỢP SỐ NGUYÊN.
SỐ NGUYÊN TỐ.
A. Nhắc lại và bổ sung các kiến thức cần thiết:
I. Tính chia hết:
1. Định lí về phép chia: Với mọi số nguyên a,b (b ≠ 0), bao giờ cũng có một cặp số
nguyên q, r sao cho : a = bq + r với 0 ≤ r < b .
a gọi là số bị chia , b là số chia, q là thương và r là số dư.
Trong trường hợp b > 0 và r ≠ 0 có thể viết: a = bq + r = b(q +1)+ r - b.
Ví dụ: Mọi số nguyên a đều có dạng:
a = 2q ± 1 (xét phép chia cho b = 2)
a = 3q ; 3q ± 1 (xét phép chia cho b = 3)
a = 4q ; 4q ± 1 ; 4q ± 2 (xét phép chia cho b = 4).
a = 5q; 5q ± 1; 5q ± 2 (xét phép chia cho b = 5)
......................
2. Tính chia hết: Nếu a chia b mà số dư r = 0, ta nói :
a chia hết cho b hay a là bội của b (kí hiệu a b)
b chia hết a hay b là ước của a (kí hiệu b\ a)
Vậy: a b (b\ a) khi và chỉ khi có số nguyên q sao cho a = bq.
3. Các tính chất:
1) Nếu a b thì ± a ± b (b ≠ 0)
2) a a; 0 a với mọi a ≠ 0
3) a ± 1 với mọi a
4) Nếu a m thì an m (m ≠ 0, n nguyên dương).
5) Nếu a b và b a thì |a| = |b|
6) Nếu a b và b c (b,c ≠ 0) thì a c.
7) Nếu a c và b c(c ≠ 0) thì (a ± b) c. Điều ngược lại không đúng.
8) Nếu a m hoặc b m thì ab m(m ≠ 0). Điều ngược lại không đúng.
9) Nếu a p và a q, (p, q)= 1 thì a pq
10) Nếu a = mn; b = pq và m p n q thì a b
11) Nếu ab m và (b,m) = 1 thì a m
12) Nếu a ± b m và a m thì b m
II. Số nguyên tố:
1.Định nghĩa: Số nguyên tố là số tự nhiên lớn hơn 1, chỉ có hai ước là 1 và chính nó.
Hợp số là số tự nhiên lơn hơn 1 có nhiều hơn hai ước.
Số 1 và số 0 không phải là số nguyên tố cũng không phải là hợp số.
2. Định lí cơ bản của số học: Mọi số tự nhiên lớn hơn 1 đều phân tích được ra thừa số
nguyên tố một cách duy nhất(không kể thứ tự các thừa số).
Số nguyên tố được coi như là tích chỉ gồm một thừa số là chính nó.
Có vô số số nguyên tố (không có số nguyên tố lớn nhất).
Số hoàn chỉnh: là số bằng tổng các ước của nó không kể bản thân nó.
Ví dụ: 6 , 28, ... , 2n-1(2n - 1)
III. Một số phương pháp thôngthường để giải bài toán về chia hết:
1
http://NgocHung.name.vn
Cách 1: Để chứng minh A(n) chia hết cho k, có thể xét mọi trường hợp số dư khi
chia n cho k.
Ví dụ 1: Chứng minh rằng:
a) Tích của hai số nguyên liên tiếp chia hết cho 2.
b) Tích của ba số nguyên liên tiếp chia hết cho 3.
Giải : a) Viết tích của hai số nguyên liên tiếp dưới dạng A(n) = n(n + 1).
Có hai trường hợp xảy ra :
* n 2 => n(n + 1) 2
* n không chia hết cho 2 (n lẻ) => (n + 1) 2 => n(n +1) 2
b) Chứng minh tương tự a.
Cách 2: Để chứng minh A(n) chia hết cho k, có thể phân tích k ra thừa số: k = pq .
+ Nếu (p, q) = 1, ta chứng minh A(n) p và A(n) q.
+ Nếu (p, q) ≠ 1, ta phân tích A(n) = B(n) .C(n) rồi chứng minh:
B(n) p và C(n) q .
Ví dụ 2: a) Chứng minh: A(n) = n(n +1)(n + 2) 6.
b) Chứng minh: tích của hai số chẵn liên tiếp chia hết cho 8.
Giải : a) Ta có 6 = 2.3; (2,3) = 1 . Theo chứng minh trên đã có A(n) chia hết cho 2 và 3.
Do đó A(n) chia hết cho 6.
b) Ta viết A(n) = 2n(2n + 2) = 2n. 2(n +1) = 4n(n + 1).
8 = 4 . 2.
Vì 4 4 và n(n +1) 2 nên A(n) 8
Ví dụ 3 : Chứng minh rằng n5 - n chia hết cho 10, với mọi số nguyên dương n.
(Trích đề thi HSG lớp 9 cấp tỉnh năm học 2005 - 2006)
Giải : A(n) = n5 - n = n(n4 - 1) = n(n2 - 1)(n2 + 1) = n(n - 1)(n + 1)(n2 +1) 2
n = 5k + 1 => (n - 1) 5
n = 5k + 4 => (n + 1) 5.
n = 5k + 2 => n2 + 1 = (5k + 2)2 + 1 = (25k2 + 20k + 4 + 1) 5
n = 5k + 3 => n2 + 1 = (5k + 3)2 + 1 = (25k2 + 30k + 9 + 1) 5
Vậy : A(n) chia hết cho 2 và 5 nên phải chia hết cho 10.
Cách 3: Để chứng minh A(n) chia hết cho k , có thể biến đổi A(n) thành tổng(hiệu)
của nhiều hạng tử , trong đó mỗi hạng tử đều chia hết cho k . ( Đã học trong tính
chất chia hết của một tổng ở lớp 6)
(Liên hệ: A(n) không chia hết cho k ...)
Ví dụ 4: Chứng minh n3 - 13n (n > 1) chia hết cho 6. (Trích đề thi HSG cấp II toàn
quốc năm 1970).
Giải : n3 - 13n = n3 - n - 12n = n(n2 - 1) - 12n = (n - 1)n(n + 1) - 12n
(n - 1)n(n + 1) là tích của 3 số tự nhiên 1 CLC: Nghị quyết Đạihộicổđôngthườngniên 2009 Công ty CP Cát Lợi (mã CK: CLC) công bố Nghị quyết Đạihộicổđôngthườngniênnăm 2009 họp ngày 08/04/2009 với các nội dung sau: Điều 1. Thông qua Báo cáo Tài chính đã được kiểm toán năm 2008 với các chỉ tiêu đạt được như sau: • Tổng doanh thu: 929.221.227.565 đồng Bao gồm: - Doanh thu bán hàng và cung cấp dịch vụ: 923.690.086.295 đồng - Doanh thu hoạt độngtài chính: 4.447.118.616 đồng. - Thu nhập khác: 1.084.022.654 đồng. • Lợi nhuận sau thuế: 49.139.690.772 đồng. Điều 2. Thông qua Kế họach họat động sản xuất kinh doanh năm 2009 với một số chỉ tiêu tài chính như sau: • Tổng doanh thu: 925.000.000.000 đồng. • Lợi nhuận trước thuế: 50.000.000.000 đồng. • Nộp ngân sách: 80.000.000.000 đồng. Đây là kế hoạch SXKD do Công ty xây dựng trình HĐQT trước Đại hội. Đạihộiđồngcổđông thố ng nhất giao cho Ban Giám đốc lãnh đạo điều hành hoạt động SXKD của Công ty hoàn thành các chỉ tiêu kế hoạch đã được Đạihộiđồngcổđôngthông qua. Điều 3. Thông qua Báo cáo của Hộiđồng Quản trị đánh giá về thực trạng công tác quản lý kinh doanh của Công ty năm 2008. Điều 4. Thông qua Báo cáo hàng năm của Ban Kiểm soát Công ty đánh giá quản lý Công ty của HĐQT và Ban Giám đốc năm 2008. Điều 5. Thông qua kế hoạch phân phối lợ i nhuận 2008: Trích lập các quỹ, tiền cổ tức 2008: • Lợi nhuận sau thuế năm 2008: 49.139.690.772 đồng. • Trích các quỹ công ty năm 2008: 13.291.515.886 đồng. Gồm: - Quỹ dự phòng tài chính (10% LNST): 4.914.000.000 đồng. - Quỹ dự trữ bổ sung vốn điều lệ (5% LNST): 2.457.000.000 đồng. - Quỹ đầu tư và phát triển (số thuế TNDN được giảm): 3.213.515.886 đồng. - Quỹ khen thưởngphúc lợi (5% LNST): 2.457.000.000 đồ ng. - Quỹ thưởng Ban quản lý điều hành: 250.000.000 đồng. • Cổ tức bằng tiền 2008 (25% VĐL): 32.759.575.000 đồng - Cổ tức đã tạm ứng đợt 1-2008 (20% VĐL) 26.207.660.000 đồng. - Cổ tức bổ sung năm 2008 (5% VĐL) 6.551.915.000 đồng. 2 • Lợi nhuận sau thuế năm 2008 còn lại: 3.088.599.886 đồng. • Lợi nhuận sau thuế chưa phân phối năm 2007 767.437.144 đồng. • Thuế thu nhập phải nộp bổ sung 2005,2006,2007 1.668.362.017 đồng. • Lợi nhuận còn để lại chưa phân phối: 2.187.675.013 đồng. Điều 6. Thông qua chi phí thù lao, hội họp của Hộiđồng quản trị, ban kiểm soát năm 2008 là 204.444.772 đồng. Điều 7. Thông qua mức thù lao cho thành viên Hộ i đồng Quản trị và thành viên Ban kiểm soát năm 2009: • Đối với thành viên HĐQT không trực tiếp làm việc tại Công ty: 4.000.000 đồng/thành viên /tháng. • Đối với thành viên Ban Kiểm soát không trực tiếp làm việc tại Công ty : 3.000.000 đồng/thành viên /tháng. • Đối với thành viên HĐQT, ban kiểm soát là các cán bộ quản lý trong Công ty kiêm nhiệm được hưởng phụ cấp tiền lương theo quy định của nhà nước. Điều 8. Thông qua việc lựa chọn đơn vị kiểm toán nă m 2009: Đồng ý chọn Công ty TNHH DV tư vấn TCKT và kiểm toán phía Nam (AASCS) để kiểm toán báo cáo tài chính năm 2009 cho Công ty Cổ Phần Cát Lợi. Điều 9. Thông qua việc chấp thuận cho Công ty ký kết hợp đồng bán hàng có giá trị lớn hơn hoặc bằng 50% tổng giá trị tài sản của công ty: Chấp thuận cho Công ty được được ký kết Hợp đồng giao dịch bán hàng và cung cấp sản phẩm cho Tổ chức Đạihộiđồngcổđông nhằm thu hút Nhà đầu tư Trong bài viết này, chúng tôi muốn trình bày một số ghi nhận từ góc độ quản trị công ty qua quan sát Đạihộiđồngcổđông (ĐHĐCĐ) của một công ty cổ phần (sau đây gọi là Công ty X) nhằm rút ra những kinh nghiệm cho các doanh nghiệp trong tổ chức ĐHĐCĐ và xây dựng hệ thống quản trị công ty tốt với mục đích trước hết là nhằm thu hút nhà đầu tư. Theo Quyết định 12/2007/QĐ-BTC ngày 13/3/2007 về việc ban hành Quy chế quản trị công ty áp dụng cho các công ty niêm yết trên Sở Giao dịch Chứng khoán/ Trung tâm Giao dịch Chứng khoán, “quản trị công ty” là hệ thốngcác quy tắc để đảm bảo cho công ty được định hướng điều hành và được kiểm soát một cách có hiệu quả vì quyền lợi của cổđông và những người liên quan đến công ty. Các nguyên tắc quản trị công ty bao gồm: Đảm bảo một cơ cấu quản trị hiệu quả; Đảm bảo quyền lợi của cổ đông; Đối xử công bằng giữa cáccổ đông; Đảm bảo vai trò của những người có quyền lợi liên quan đến công ty; Minh bạch trong hoạt động của công ty; Hộiđồng quản trị (HĐQT) và Ban kiểm soát (BKS) lãnh đạo và kiểm soát công ty có hiệu quả. Việc đảm bảo các nguyên tắc kể trên thông qua ĐHĐCĐ cũng chính là tiêu chí để đánh giá ban đầu về hệ thống quản trị công ty. 1. Đảm bảo một cơ cấu quản trị hiệu quả Cơ cấu quản trị công ty hay cơ cấu tổ chức quản lý công ty theo quy định tại Điều 95 Luật doanh nghiệp và Điều lệ công ty gồm có ĐHĐCĐ, HĐQT, Tổng giám đốc (“GĐ) và BKS. ĐHĐCĐ gồm tất cả cáccổđôngcó quyền biểu quyết, là cơ quan quyết định cao nhất của công ty cổ phần. Tuy nhiên, nếu trong Công ty cổđông lớn nắm giữ hơn 75% phần góp vốn trong vốn điều lệ, có toàn quyền quyết định những vấn đề quan trọng về định hướng phát triển, sửa đổi bổ sung Điều lệ (như ở Công ty X.) dường như tổ chức ĐHĐCĐ chỉ là hình thức, mang tính chất thôngtin nhiều hơn. Công ty X. đã chuẩn bị ĐHĐCĐ một cách chu đáo với mục đích rõ ràng để thu hút Nhà đầu tư. Trong bối cảnh suy thoái, vai trò của Nhà đầu tư trở nên quan trọng hơn bao giờ hết. Thông qua ĐHĐCĐ, Nhà đầu tư có thể đánh giá Công ty có một cơ chế quản trị hiệu quả như thế nào. 2. Đảm bảo quyền lợi của cổđông và đối xử công bằng giữa cáccổđông Ở ĐHĐCĐ của Công ty X. chỉ có một số cổđôngđại diện tham dự, hiện tượng này chưa hẳn đã là tốt. Theo Khoản 11 Điều 4, Luật Doanh nghiệp 2005, cổđông là người sở hữu ít nhất một cổ phần đã phát hành của công ty cổ phần. Một trong những quyền gắn liền và mang lại lợi ích cho quyền kinh tế của cổđông là quyền quyết định . Quyết định ở đây chính là quyền quyết định các vấn đề của công ty như phương hướng hoạt động kinh doanh, các chính sách phát triển công ty và các vấn đề chủ chốt của công ty như thành viên HĐQT, BKS, phân chia lợi nhuận… Bản thân mỗi cổđông không thể thực hiện quyền quyết định vấn đề công ty một cách trực tiếp vì mỗi người có một ý chí khác nhau. Chính vì vậy họ cần thống nhất với nhau để đi đến một quyết định chung thông qua việc tham gia ĐHĐCĐ. Hình thức để cổđông thể hiện ý chí của mình là tham gia quyết định các vấn đề của công ty ở ĐHĐCĐ bằng cách biểu quyết. Bản thân mỗi cổđông không thể độc lập đưa ra quyết định nhưng họ có thể tham gia vào việc quyết định, xem xét, thảo C6NG TY C6 PH,\N XAY DUNG YA DAU TU 492 Dia chi: s6 198- Truong Chjnh - Tha* phd Vinh - NghCAn - 3854370 Fax 0383854494 Dienftoai:038.3853804 Email:c92@c92.com.vn Website:www.c92,com.vn Tp lrinh,nsdyJ3 ttuing 04 ndm2015 S6://J /TI-IIDQT TOTRINH DAIHOI DONCC6 DONCTHUONCNTIiN\AM 2OI5 vlv: ni6uquylt ttdng quamqts6v5nedthuQcthim quyAnD4i