Quan điểm mới nhất hiện nay cho rằng từ điển là một bản miêu tả đầy đủ về kho từ ngữ được các thành viên trong cộng đồng ngôn ngữ sử dụng, và xuất phát điểm của công việc miêu tả đó chín
Trang 1TRƯỜNG ĐẠI HỌC TÂY BẮC
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN
XÂY DỰNG PHẦN MỀM TỪ ĐIỂN VIỆT - LÀO CHUYÊN
NGÀNH CÔNG NGHỆ THÔNG TIN
Thuộc nhóm ngành khoa học: Công nghệ thông tin
SƠN LA, 5/2017
Trang 2TRƯỜNG ĐẠI HỌC TÂY BẮC
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN
XÂY DỰNG PHẦN MỀM TỪ ĐIỂN VIỆT - LÀO CHUYÊN
NGÀNH CÔNG NGHỆ THÔNG TIN
Thuộc nhoám ngành khoa học: Công nghệ thông tin
Sinh viên thực hiện: Trịnh Minh Quý Nam, Dân tộc: Kinh
Đỗ Hồng Nhung Nữ, Dân tộc: Kinh Năn Thị Đa Sẻng Súc Nữ, Dân tộc: Lào Hông Sả Khon Sí Mương May Nữ, Dân tộc: Lào Thắt Sạ Ni Con Đa La Chăn Nữ, Dân Tộc: Lào
SƠN LA, 5/2017
Trang 31
LỜI CẢM ƠN
Sau một thời gian học tập, nghiên cứu và triển khai đề tài: “Xây dựng phần mền từ điển Việt – Lào chuyên ngành Công nghệ thông tin”, đến nay chúng tôi đã hoàn thành đề tài nghiên cứu của mình
Chúng tôi xin bày tỏ tấm lòng biết ơn sâu sắc nhất tới thầy giáo - thạc sỹ Nguyễn Văn Tú đã trực tiếp hướng dẫn chúng tôi trong suốt quá trình chúng tôi thực hiện đề tài nghiên cứu khoa học này
Đồng thời chúng tôi cũng chân thành cảm ơn tới lãnh đạo Nhà trường, Ban chủ nhiệm Khoa cùng các thầy cô giáo đã giúp đỡ, tạo điều kiện để chúng tôi có cơ hội nghiên cứu, học tập và hoàn thành đề tài nghiên cứu này
Do hạn chế về trình độ chuyên môn và thời gian thực hiện nên đề tài không tránh khỏi những thiếu sót, rất mong nhận được sự góp ý của thầy cô để chúng tôi có thể hoàn thành tốt nhất đề tài nghiên cứu này
Chúng tôi xin chân thành cảm ơn!
Sơn la, tháng 5 năm 2017
Sinh viên
Trịnh Minh Quý
Đỗ Hồng Nhung Năn Thị Đa Sẻng Súc Hông Sả Khon Sí Mương May Thắt Sạ Ni Con Đa La Chăn
Trang 42
Trang 53
MỤC LỤC
LỜI CẢM ƠN 1
PHẦN MỞ ĐẦU 7
1.Lý do chọn đề tài 7
2.Mục đích nghiên cứu 7
3.Phương pháp nghiên cứu 8
3.1 Phương pháp phân tích và tổng hợp lý thuyết 8
3.2 Phương pháp phân loại và hệ thống hoá lý thuyết 9
3.3 Phương pháp thu thập thông tin 9
4.Ý nghĩa của chương trình 10
CHƯƠNG I: TỔNG QUAN VỀ TỪ ĐIỂN 11
1 Phân biệt từ điển nói chung (từ điển thông thường, từ điển phổ quát) và từ điển thuật ngữ 11
1.1 Khái niệm từ điển và từ điển thuật ngữ 11
1.1.1 Khái niệm từ điển 11
1.1.2 Khái niệm từ điển thuật ngữ 12
1.2 Sự giống nhau giữa từ điển thông thường và từ điển thuật ngữ 14
1.3 Một số đặc tính tiêu biểu của từ điển 14
1.4 Thể loại từ điển bách khoa toàn thư 16
1.5 Trật tự sắp xếp từ vựng trong từ điển tiếng Việt 16
CHƯƠNG II: CÁC PHƯƠNG PHÁP XÂY DỰNG TỪ ĐIỂN 19
2.1 Công cụ hỗ trợ 19
2.1.1 Ngôn ngữ lập trình Java 19
2.1.2 Một số đặc điểm nổi bật của Java 20
2.2 NetBean IDE và JDK 25
2.3 Thiết kế cơ sở dữ liệu cho từ điển 33
2.3.1 Kiểu dữ liệu theo chuẩn DICT 35
2.3.2 Kiểu dữ liệu sử dụng trong đề tài 36
Trang 64
CHƯƠNG III: PHẦN MỀM TỪ ĐIỂN VIỆT - LÀO CHUYÊN NGÀNH
CÔNG NGHỆ THÔNG TIN 39
3.1 Các chức năng chính của ứng dụng 39
3.2 Kết quả của việc tạo dữ liệu 39
3.3 Thiết kế các module 39
3.4 Thiết kế giao diện người dùng 41
3.4.1 Giao diện của ứng dụng 44
3.4.2 Chức năng tìm từ: nhập từ, dịch từ 45
3.4.3 Dịch từ Lào – Việt, Việt – Lào 45
3.4.4 Danh sách từ, nghĩa của từ 46
3.5 Xử lý sự kiện 47
3.5.1 Khai báo các biến 47
3.5.2 Tạo danh sách các từ 47
3.5.3 Đọc từ 48
3.5.4 Dịch từ 48
3.5.5 Hình ảnh 50
3.5.6 Phím phát hành 50
3.5.7 Dịch từ Việt – Lào 51
3.5.8 Dịch từ Lào – Việt 52
3.6 Cài đặt và sử dụng chương trình 53
3.6.1 Cài đặt 53
3.6.2 Khởi động chương trình 53
3.7 Đánh giá 54
KẾT LUẬN VÀ KIẾN NGHỊ 55
1 Kết luận 55
2.Kiến nghị 55
TÀI LIỆU THAM KHẢO 56
Trang 75
DANH MỤC HÌNH ẢNH
Hình 1: Màn hình chính của NetBeans IDE 29
Hình 2: Giao diện 1 29
Hình 3: Giao diện 2 30
Hình 4: Giao diện 3 31
Hình 5: Giao diện 4 32
Hình 6: Một đoạn dữ liệu trong từ điển stardict theo chuẩn DICT 36
Hình 7: Định dạng tập tin index được sử dụng trong đề tài 37
Hình 8: Một đoạn dữ liệu được sử dụng trong đề tài 38
Hình 9: Các lớp trong chương trình từ điển 40
Hình 10: Giao diện của ứng dụng 44
Hình 11: Chức năng nhập từ và dịch từ 45
Hình 12: Dịch từ Lào – Việt, Việt – Lào 45
Hình 13: Danh sách từ, nghĩa của từ (âm thanh, hình ảnh) 46
Hình 14: Click vào thư mục có đuôi jar 53
Hình 15: Giao diện khi khởi động 54
Trang 86
DANH MỤC BẢNG
Bảng 1: Định dạng tập tin index trong kiểu dữ liệu theo chuẩn DICT 35Bảng 2: Định dạng tập tin dữ liệu trong kiểu dữ liệu theo chuẩn DICT 35Bảng 3: Định dạng tập tin dữ liệu được sử dụng trong đề tài 37Bảng 4: Tương tác giữa các module 40
DANH SÁCH THUẬT NGỮ VIẾT TẮT
Tên viết tắt Ý nghĩa
CNTT Công nghệ thông tin
SDK Software Development Kit
IDE Integrated Development Environment
NCKH Nghiên cứu khoa học
JDK Java SE Development Kit
CPU Central Processing Unit
OOP Object Oriented Programming
PHP Hypertext Preprocessor
Trang 9và học
Hiện nay chưa có phần mềm hay công cụ nào hỗ trợ dịch từ ngữ chuyên ngành Công nghệ thông tin từ tiếng Lào sang tiếng Việt và từ tiếng Việt sang tiếng Lào
Các bạn du học sinh Lào khi học tiếng Việt trên lớp chỉ ở mức độ là giao tiếp chứ chưa thực sự chuyên sâu vào chuyên ngành Gây khó khăn trong việc tham khảo tài liệu, nghe giảng
Phần mềm từ điển Việt – Lào chuyên ngành Công nghệ thông tin giúp các lưu học sinh Lào nhanh chóng nắm bắt ý nghĩa của các từ chuyên ngành, thuận tiện hơn trong việc trao đổi về kiến thức giữa sinh viên Lào và sinh viên Việt Nam, chủ động trong việc tìm hiểu thêm và hiểu sâu hơn về bài học, nâng cao hiệu quả học tập, giúp người học hiểu bài nhanh hơn nhờ những thuật ngữ chuyên ngành có trong từ điển
2 Mục đích nghiên cứu
Đối với việc học chuyên ngành CNTT tại trường Đại Học Tây Bắc của những bạn du học sinh Lào, thì một công cụ hỗ trợ không thể thiếu trong quá trình học đó là từ điển Có từ điển thì việc học, đọc giáo trình sẽ trở nên dễ dàng hơn rất nhiều Việc lựa chọn từ điển quan trọng giống như chúng ta chọn tài liệu học phù hợp với trình độ của bạn Lựa chọn từ điển phù hợp giúp cho người sử dụng phục vụ tốt nhất cho mục đích sử dụng và hoàn cảnh sử dụng Có rất nhiều
từ điển khác nhau, có thể là từ điển Anh - Anh, Anh - Việt, hay Việt – Anh… nhưng lời khuyên là nên sử dụng từ điển dành riêng cho từng nội dung Với sinh viên học chuyên ngành CNTT việc sử dụng các cuốn từ điển quá lớn và mang tính hàn lâm là không thật sự cần thiết Vì vậy, mặc dù đã có quá nhiều những
Trang 108
phần mềm từ điển online và offline, nhưng chúng tôi vẫn quyết định cùng cùng xây dựng bộ từ điển và danh mục tra cứu đa mục đích Với tên gọi là: “ Từ điển Việt – Lào chuyên ngành Công nghệ thông tin” Dành cho học sinh, sinh viên
và giáo viên đã và đang học tập, giảng dạy chuyên ngành CNTT
3 Phương pháp nghiên cứu
3.1 Phương pháp phân tích và tổng hợp lý thuyết
Nghiên cứu lý thuyết thường bắt đầu từ phân tích các tài liệu để tìm ra cấu trúc, các xu hướng phát triển của lý thuyết Từ phân tích lý thuyết, lại cần tổng hợp chúng lại để xây dựng thành một hệ thống khái niệm, phạm trù tiến tới tạo thành lý thuyết khoa học mới
Phương pháp phân tích lý thuyết:
Là phương pháp phân tích lý thuyết thành những mặt, những bộ phận, những mối quan hệ theo lịch sử thời gian để nhận thức, phát hiện và khai thác các khía cạnh khác nhau của lý thuyết từ đó chọn lọc những thông tin cần thiết phục vụ cho đề tài nghiên cứu
Phân tích lý thuyết bao gồm những nội dung sau:
+ Phân tích nguồn tài liệu (tạp chí và báo cáo khoa học, tác phẩm khoa học, tài liệu lưu trữ thông tin đại chúng) Mỗi nguồn có giá trị riêng biệt
+ Phân tích tác giả (tác giả trong hay ngoài ngành, tác giả trong cuộc hay ngoài cuộc, tác giả trong nước hay ngoài nước, tác giả đương thời hay quá cố) Mỗi tác giả có một cái nhìn riêng biệt trước đối tượng
+ Phân tích nội dung (theo cấu trúc logic của nội dung)
Phương pháp tổng hợp lý thuyết:
Là phương pháp liên quan kết những mặt, những bộ phận, những mối quan hệ thông tin từ các lý thuyết đã thu thập được thành một chỉnh thể để tạo
ra một hệ thống lý thuyết mới đầy đủ và sâu sắc về chủ đề nghiên cứu
Tổng hợp lý thuyết bao gồm những nội dung sau:
+ Bổ sung tài liệu, sau khi phân tích phát hiện thiếu hoặc sai lệch
+ Lựa chọn tài liệu chỉ chọn những thứ cần, đủ để xây dựng luận cứ + Sắp xếp tài liệu theo lịch đại (theo tiến trình xuất hiện sự kiện để nhận dạng động thái); sắp xếp tài liệu theo quan hệ nhân – quả để nhận dạng tương tác
+ Làm tái hiện quy luật Đây là bước quan trọng nhất trong nghiên cứu tài liệu, chính là mục đích của tiếp cận lịch sử
Trang 119
+ Giải thích quy luật Công việc này đòi hỏi phải sử dụng các thao tác logic để đưa ra những phán đoán về bản chất các quy luật của sự vật hoặc hiện tượng
Phân tích và tổng hợp là hai phương pháp có quan hệ mật thiết với nhau tạo thành sự thống nhất không thể tách rời: phân tích được tiến hành theo phương hướng tổng hợp, còn tổng hợp được thực hiện dựa trên kết quả của phân tích Trong nghiên cứu lý thuyết, người nghiên cứu vừa phải phân tích tài liệu, vừa phải tổng hợp tài liệu
3.2 Phương pháp phân loại và hệ thống hoá lý thuyết
Phương pháp phân loại lý thuyết:
Là phương pháp sắp xếp các tài liệu khoa học thành hệ thống logic chặt chẽ theo từng mặt, từng đơn vị kiến thức, từng vấn đề khoa học có cùng dấu hiệu bản chất, có cùng hướng phát triển để dễ nhận biết, dễ sử dụng theo mục đích nghiên cứu, giúp phát hiện các quy luật phát triển của đối tượng, sự phát triển của kiến thức khoa học để từ đó dự đoán được các xu hướng phát triển mới của khoa học và thực tiễn
Phương pháp hệ thống hóa lý thuyết:
Là phương pháp sắp xếp những thông tin đa dạng thu thập được từ các nguồn, các tài liệu khác nhau thành một hệ thống với một kết cấu chặt chẽ (theo quan điểm hệ thống – cấu trúc của việc xây dựng một mô hình lý thuyết trong nghiên cứu khoa học) để từ đó mà xây dựng một lý thuyết mới hoàn chỉnh giúp hiểu biết đối tượng được đầy đủ và sâu sắc hơn
Phân loại và hệ thống hóa là hai phương pháp đi liền với nhau Trong phân loại đã có yếu tố hệ thống hóa Hệ thống hóa phải dựa trên cơ sở phân loại và hệ thống hóa làm cho phân loại được hợp lý và chính xác hơn
3.3 Phương pháp thu thập thông tin
Thu thập thông tin là hoạt động có tính mục đích Quá trình thu thập thông tin phải giải đáp cụ thể các câu hỏi: Thông tin này thu thập để làm gì, phục vụ cho công việc gì, liên quan đến những khía cạnh nào của vấn đề?
Thu thập thông tin có tính đa dạng về phương pháp, cách thức Tùy theo yêu cầu về thông tin, nguồn lực mà có thể áp dụng các phương pháp, cách thức thu thập thông tin cho phù hợp;
Thu thập thông tin có thể tìm kiếm từ các nguồn, kênh thông tin khác nhau Mỗi kênh thông tin có những ưu điểm và nhược điểm riêng, phù hợp với mỗi loại thông tin cần thu thập Việc lựa chọn nguồn thông tin thích hợp bảo đảm hiệu quả quá trình thu thập thông tin và chất lượng của thông tin;
Trang 12của tổ chức
4 Ý nghĩa của chương trình
Từ điển dường như là một phần không thể tách rời của học sinh, sinh viên
và giáo viên đã và đang học tập, giảng dạy chuyên ngành CNTT khi học ngoại ngữ trong xu thế toàn cầu hóa hiện nay Trong thời đại công nghệ số đang ngày càng len lỏi vào mọi ngóc ngách cuộc sống thì từ điển số là một sự thay thế tuyệt vời cho từ điển giấy truyền thống
Từ điển giúp tiết kiệm chi phí đầu tư khoảng 200.000đ/học sinh (nếu học sinh mua các loại từ điển để tra cứu, học tập); giúp học sinh, giáo viên và phụ huynh tiện tra cứu, giảm thời gian tra cứu so với các từ điển truyền thống, giúp người tra cứu dễ nhớ, dễ thuộc, góp phần nâng cao chất lượng học tập Từ đó, nâng cao khả năng tư duy, giao tiếp, dùng từ diễn đạt cho học sinh, giúp học sinh có vốn từ phong phú, kỹ năng sống tốt hơn Đây cũng là nguồn tư liệu cho giáo viên trong giảng dạy, bồi dưỡng nghiệp vụ, nâng cao chất lượng dạy học
Ngoài phần Mở đầu và phần Kết luận, kết cấu của đề tài bao gồm các chương sau:
Chương I Tổng quan về từ điển
Chương II Các phương pháp xây dựng từ điển
Chương II Phần mềm từ điển Việt – Lào chuyên ngành CNTT
Kết luận và kiến nghị
Trang 1311
CHƯƠNG I: TỔNG QUAN VỀ TỪ ĐIỂN
1 Phân biệt từ điển nói chung (từ điển thông thường, từ điển phổ quát) và
từ điển thuật ngữ
1.1 Khái niệm từ điển và từ điển thuật ngữ
1.1.1 Khái niệm từ điển
Từ điển là danh sách các từ, ngữ được sắp xếp thành các từ vị chuẩn (lemma) Một từ điển thông thường cung cấp các giải nghĩa các từ ngữ đó hoặc các từ ngữ tương đương trong một hay nhiều thứ tiếng khác Ngoài ra còn
có thể có thêm thông tin về cách phát âm, các chú ý ngữ pháp, các dạng biến thể của từ, lịch sử hay từ nguyên, cách sử dụng hay các câu ví dụ, trích dẫn
Đối với các ngôn ngữ sử dụng ký tự Latin thì các từ có thể được sắp xếp theo thứ tự chữ cái Đối với các ngôn ngữ tại Đông Á chịu ảnh hưởng của chữ Hán, sử dụng ký tự là đơn vị ngôn ngữ có nghĩa thì phân biệt từ điển và tự điển (tự = chữ, từ điển rộng hơn tự điển và bao hàm tự điển) Thông thường từ điển được trình bày dưới dạng sách, ngày nay từ điển còn được số hóa và cung cấp dưới dạng phần mềm máy tính hay truy cập trực tuyến trên web, trên trình nhắn tin nhanh, hay có trong các thiết bị số cá nhân như PDA, điện thoại
Từ điển là nơi giải thích thông tin về ngôn ngữ của con người một cách
dễ hiểu và khách quan nhất Từ điển có nhiệm vụ, nhất là từ điển bách khoa toàn thư, giúp người xem hiểu và vận dụng (sử dụng) chính xác một từ, ngữ, thuật ngữ, thành ngữ, khái niệm, phạm trù hay một vấn đề cụ thể trong đời sống xã hội con người Từ nhiệm vụ này, từ điển đã được hình thành dưới nhiều dạng thức tồn tại khác nhau, góp phần giải quyết (hay đáp ứng) một hoặc nhiều nhu cầu khác nhau trong đời sống xã hội loài người Đến nay, đã có các dạng thức từ điển như: từ điển bách khoa toàn thư, từ điển luật học, từ điển triết học, từ điển thành ngữ, từ điển song ngữ, từ điển thần học, từ điển tiếng lóng, từ điển ngôn ngữ phụ nữ
Theo quan điểm truyền thống, từ điển thường được xem là những bản ghi chép đáng tin cậy về những quy tắc mà những người nói cùng một ngôn ngữ nên tuân theo khi sử dụng ngôn ngữ đó Qua các thông tin trong từ điển, người
ta biết cách dùng ngôn ngữ một cách chuẩn tắc Hiện nay, các nhà làm từ điển
có quan điểm rộng hơn về khái niệm từ điển Chẳng hạn, L Zgusta (1984) cho rằng, từ điển là bản kiểm kê từ vựng của một ngôn ngữ cụ thể, và là công cụ giao tiếp trong một ngôn ngữ cụ thể hay trong các ngôn ngữ khác nhau Còn theo Keating (1988), từ điển là một hệ thống được tạo dựng nhằm lưu giữ các từ
Trang 1412
của một ngôn ngữ cũng như những lí giải về ý nghĩa của các từ này và cách thức sử dụng chúng Quan điểm mới nhất hiện nay cho rằng từ điển là một bản miêu tả đầy đủ về kho từ ngữ được các thành viên trong cộng đồng ngôn ngữ sử dụng, và xuất phát điểm của công việc miêu tả đó chính là những “chứng cứ” từ ngữ sống động và đa diện mà các thành viên của cộng đồng ngôn ngữ sử dụng khi họ giao tiếp với nhau
Từ điển tập hợp và sắp xếp các từ ngữ trong kho từ vựng của ngôn ngữ theo một khuôn mẫu có tính hệ thống (ví dụ theo trật tự bảng chữ cái) Biên soạn từ điển là quá trình ghi chép, xử lí và biên soạn thông tin ngôn ngữ theo một khuôn mẫu từ điển cụ thể Kết quả của quá trình biên soạn thường là một danh sách các từ, các trích dẫn, từ điển và ngân hàng dữ liệu điện tử Thông tin trong từ điển bao gồm: chính tả, phát âm, định nghĩa giải thích (ngữ nghĩa), sự phân chia âm tiết, từ chuyển dịch tương đương, các hình thức phái sinh của từ
và các kết hợp từ, các lớp ngữ pháp, cách dùng (cú pháp) của từ, tra cứu ngang tới các mục từ khác, tranh minh hoạ, từ nguyên, nguồn tham khảo, v.v
Từ điển nói chung bao quát toàn bộ các khía cạnh của một ngôn ngữ nguồn cho trước, như các từ phổ dụng, các từ khả kết, các biến thể phương ngữ, các từ cổ, từ nguyên, các từ thuộc phong cách văn học hoặc khoa học kĩ thuật, tiếng lóng, từ thông tục, các từ theo giới, từ kiêng kị, v.v Theo Cluver (1989), đặc điểm cơ bản của từ điển phổ quát là kiểu từ điển này định hướng theo từ chứ không theo chủ đề
1.1.2 Khái niệm từ điển thuật ngữ
Thuật ngữ là những từ ngữ biểu thị khái niệm khoa học công nghệ, chủ yếu để dùng trong các văn bản khoa học công nghệ
Đặc điểm của thuật ngữ:
Đặc điểm thứ nhất: khác với từ ngữ phổ thông, mỗi thuật ngữ thuộc một lĩnh vực khoa học công nghệ chỉ biểu thị một khái niệm và ngược lại mỗi khái niệm trong lĩnh vực đó chỉ được biểu hiện bằng một thuật ngữ
Đặc điểm thứ hai: khác với từ ngữ phổ thông, thuật ngữ không có tính biểu cảm
Sử dụng thuật ngữ:
Muốn thống nhất việc dùng thuật ngữ và hiểu cho chính xác thì phải có định nghĩa hoặc giải thích thuật ngữ trong lĩnh vực khoa học công nghệ tương ứng và có lưu ý đến văn cảnh sử dụng thích hợp
Trang 1513
Trong văn bản bên ngoài lĩnh vực, nếu việc dùng một thuật ngữ có thể gây nhập nhằng (vì có nghĩa khác ở lĩnh vực khác) thì phải chú thích, ít nhất cũng cần lưu ý bằng cách in nghiêng hoặc đặt vào ngoặc kép
Thuật ngữ không được biểu hiện những sắc thái xúc cảm gây mâu thuẫn về giới tính, sắc tộc, tôn giáo, chính trị, giai cấp, địa vị, tuổi tác
Khác với từ ngữ văn chương, việc công nhận thuật ngữ cần có cơ quan có thẩm quyền phê duyệt và ban hành
Từ điển thuật ngữ là một tập hợp các thuật ngữ thuộc vào một lĩnh vực chủ đề cụ thể, tức là kiểu từ điển này hướng tới các nguồn từ vựng chuyên ngành chứ không phải toàn bộ từ vựng của một ngôn ngữ như từ điển phổ quát
Hệ thống khái niệm đằng sau các thuật ngữ thuộc vào một lĩnh vực chủ đề, các khái niệm này liên hệ với nhau theo kiểu tôn ti hoặc liên hợp chặt chẽ, do đó không thể xử lí chúng như những từ ngữ thông thường trong kho từ vựng chung của ngôn ngữ Sager (1990) đã chỉ ra, từ điển thuật ngữ là một bản ghi chép các
hệ thống biểu tượng và kí hiệu ngôn ngữ được con người áp dụng trong giao tiếp thuộc các khu vực tri thức và hoạt động có tính chuyên môn hoá Thông qua bản ghi chép này, các thuật ngữ được miêu tả, xử lí và trình bày một cách nhất quán theo hệ thống của mỗi chuyên ngành
Tiêu chí chọn thuật ngữ
Mỗi thuật ngữ cần đạt được một số tiêu chí dưới đây và đó cũng là những tiêu chí cho phép đánh giá lựa chọn trong trường hợp có nhiều ứng viên cho một khái niệm
Phù hợp với nhiều cấu trúc cú pháp,
Khó thay đổi theo thời gian
Tính phổ biến:
Được đại đa số dùng quen (dù không chính xác)
Trang 1614
Lưu ý:
Phổ biến không đồng nhất với đại chúng,
Không phải ai cũng biết một ngoại ngữ
Không phải nhà khoa học nào cũng biết nhiều ngoại ngữ
1.2 Sự giống nhau giữa từ điển thông thường và từ điển thuật ngữ
Nhìn chung, giữa ngôn ngữ thông thường và ngôn ngữ chuyên ngành không có sự khác biệt lớn, chủ yếu là sự tiệm tiến các ngữ vực, trong quá trình
đó các từ thông thường dần dần biến đổi thành các thuật ngữ, và ý nghĩa của từ
do đó cũng dần dần có tính chuyên môn hơn Việc biên soạn từ điển thông thường và từ điển thuật ngữ đều theo các nguyên tắc cơ bản giống nhau Về loại hình sản phẩm, cả hai kiểu biên soạn đều cho ra những sản phẩm có loại hình giống nhau như từ điển đơn ngữ, từ điển song ngữ và từ điển đa ngữ Về cấu trúc của từ điển, cả hai kiểu từ điển đều tương tự nhau về cấu trúc vĩ mô (chẳng hạn cách sắp xếp truyền thống theo trật tự bảng chữ cái), cấu trúc vi mô (với sự hiện diện của các lớp thông tin được phân cấp) và cấu trúc ngang (hệ thống tra
cứu ngang – mediostructure) Về ý nghĩa của các mục từ trong từ điển thông
thường và từ điển thuật ngữ, nhìn chung, các khái niệm của từ hay thuật ngữ đều được xác định bởi các phương pháp tương tự nhau, do đó, theo Cluver (1992), quy trình miêu tả và trình bày khái niệm/ý nghĩa của các từ trong từ điển thông thường và trong từ điển thuật ngữ diễn ra theo một thang độ tiệm tiến, trải dài từ các ý nghĩa phụ thuộc ngữ cảnh của từ (trong từ điển thông thường) đến các ý nghĩa không phụ thuộc ngữ cảnh của từ (trong từ điển thuật ngữ) Tác giả
này cho rằng, thay cho việc phân chia ngôn ngữ thành các ngữ vực (register)
riêng biệt, các nhà từ điển học có thể trình bày một thang độ tiệm tiến của ngôn ngữ trong từ điển: từ các ngữ vực không chính thống (như từ lóng hay từ thông tục) đến các ngữ vực có tính chính thống cao (các thuật ngữ khoa học - công nghệ), và ở giữa hai cực đó là những vùng giao thoa (vùng mờ) Những vùng giao thoa này hàm chỉ các thang độ chuẩn hoá khác nhau, chẳng hạn có một số ngữ vực trong thuật ngữ rất khó chuẩn hoá, vì có sự giao thoa giữa thuật ngữ và ngôn ngữ toàn dân, hay trường hợp các nghĩa tình thái của từ rất khó điều chỉnh
để đưa vào từ điển thông thường
1.3 Một số đặc tính tiêu biểu của từ điển
Tính chuẩn mực:
Từ điển là nơi cung cấp thông tin hoặc giải thích một sự vật hay hiện tượng một cách ngắn gọn và chính xác nhất Trừ phương pháp định nghĩa theo lối hàn lâm, bác học (phương pháp này sử dụng phổ biến trong từ điển triết học hay những từ điển chuyên ngành khác), phương pháp kiến giải của hầu hết từ điển là luôn dùng những ngôn từ đơn giản và phổ biến nhất trong xã hội Thông
Trang 1715
tin trong từ điển luôn được kiểm chứng và thừa nhận rộng rãi trong cộng đồng
xã hội
Tính tương đối:
Từ điển chứa đựng những thông tin đã có, đã được kiểm chứng - do đó,
nó luôn bị thay đổi hoặc bổ sung theo thời gian, cùng với sự thăng trầm của sự vật hoặc hiện tượng mà nó đã đề cập Từ điển luôn đi sau những thay đổi hoặc tiến bộ của xã hội loài người
Hiện nay đã có rất nhiều loại từ điển khác nhau Chúng gần như hoàn toàn độc lập với nhau Nhưng, như Ladislav Zgusta đã nhận xét ngay ở lời mở đầu công trình về từ điển học của mình (1971), một trong những đặc điểm lạ lùng nhất của từ điển học là các nhà từ điển rất ít trao đổi kinh nghiệm với nhau
Sự phân lập này có thể dẫn đến hiện tượng mâu thuẫn về nội dung của cùng một vấn đề trong các từ điển khác nhau Như vậy, tính tương đối của tự điển có thể phát sinh khi xem xét về cùng một vấn đề ở hai từ điển khác nhau
Từ điển mang đậm phong cách của nhóm tác giả biên soạn ra nó Tính tương đối của từ điển còn có nguyên nhân từ sự khác biệt của mỗi nền văn hóa - văn minh, ngôn ngữ, dân tộc, quốc gia trên thế giới Mỗi thành tố trên có thể lý giải về cùng một hiện tượng xã hội theo nhiều quan điểm, tư tưởng hay chính kiến khác nhau Do đó, có thể cùng một khái niệm, nhưng tùy theo mỗi nền văn hóa khác nhau, có thể có cách sử dụng (vận dụng) khác nhau
Như vậy, tính tương đối của từ điển có thể xuất phát từ sự chậm trễ khi cập nhật, sự phân lập của các nhà từ điển học hoặc sự khác biệt của các nền văn hóa trên Trái Đất
Tính đa dạng:
Thông tin trong từ điển ghi nhận tất cả sự nhìn nhận, đánh giá, sử dụng hay vận dụng một khái niệm (phạm trù) theo nhiều hướng khác nhau Sự đa dạng này có nguồn gốc từ sự khác biệt giữa các nền văn hóa, văn minh và tiến
bộ của các cộng đồng, dân tộc hoặc các quốc gia trên thế giới
Tính trung lập:
Tính đa dạng của từ điển bắt buộc nó phải thể hiện quan điểm trung lập trong tất cả các vấn đề mà nó đã đề cập Bản thân sự đa dạng luôn hàm chứa nhiều mâu thuẫn hay đối lập nhau Do đó, tính trung lập của từ điển còn nhằm tránh các xung đột có thể xảy ra giữa các nền văn hóa, văn minh trên Trái Đất[cần dẫn nguồn] Trừ từ điển của các nước có mô hình một đảng chính trị lãnh đạo, hầu hết các từ điển khác đều tôn trọng nguyên tắc trung lập này[cần dẫn nguồn]
Trang 1816
Tính lịch sử:
Trong từ điển luôn chứa đựng đầy đủ sự hình thành và phát triển của một khái niệm hay phạm trù mà nó lưu giữ Ở đó, người xem tiếp cận được cả cách sử dụng (vận dụng) từ ngữ từ lúc sơ khai cho đến hiện tại
1.4 Thể loại từ điển bách khoa toàn thư
Hiện nay, từ điển bách khoa toàn thư có vô số bài viết về nhiều lĩnh vực khác nhau trong đời sống xã hội loài người Tuy nhiên, đại thể có thể phân thành hai nhóm lớn như sau:
Nhóm cung cấp kiến thức: Đó là những bài viết cung cấp kiến thức cho cộng đồng về những vật, nhân vật, sự kiện lịch sử, địa danh cụ thể hay một
tổ chức kinh tế, chính trị có thực trong xã hội Nhóm bài viết này luôn bám sát thực tế, chuẩn mực và có thể kiểm chứng được Ví dụ như: từ điển, cầu, Tháp Eiffel, Sự kiện 30/4/1975, Huế, Nguyễn Đình Chiểu, Google là gì? Wikipedia là gì? Đảng cộng sản là gì? Chiến tranh Việt Nam Nhóm bài viết này có phổ biến trong từ điển bách khoa hay từ điển bách khoa toàn thư
Nhóm giải thích từ, ngữ: Đây là hướng đi đầu tiên và phổ biến nhất của
từ điển Theo nhóm này, khi tiếp cận từ điển nói chung, độc giả có thể hiểu và vận dụng chính xác một từ, chữ, khái niệm, thuật ngữ hay thành ngữ đã có trong
xã hội Nhóm bài viết này có trong mọi loại từ điển khác nhau
Ngoài ra, trong nhóm làm nhiệm vụ giải thích này, còn có nhiều bài viết nhằm giải thích các hiện tượng xảy ra trong cơ thể con người, gia đình, trong tự nhiên hay trong đời sống kinh tế, chính trị, xã hội loài người Ví dụ như: Sức ỳ trong tư duy là gì? Lạm phát là gì? Thủy triều là gì? Cách mạng là gì? Nhóm bài viết này có phổ biến trong từ điển bách khoa toàn thư
1.5 Trật tự sắp xếp từ vựng trong từ điển tiếng Việt
Các mục từ (đơn vị từ vựng) được xếp theo thứ tự các chữ cái:
a ă â b c d đ e ê g h i k l m n o ô ơ p q r s t u ư v x y
Thứ tự các dấu giọng của nguyên âm đơn: không dấu, huyền, hỏi, ngã, sắc, nặng Trật tự trên có thể được liệt kê như sau:
a à ả ã á ạ ă ằ ẳ ẵ ắ ặ â ầ ẩ ẫ ấ ậ (ai, ài, ải )
e è ẻ ẽ é ẹ ê ề ể ễ ế ệ (eo, èo, ẻo )
i ì ỉ ĩ í ị (iêu, iều, iểu )
o ò ỏ õ ó ọ ô ồ ổ ỗ ố ộ ơ ờ ở ỡ ớ ợ (ôi, ồi, ổi )
u ù ủ ũ ú ụ ư ừ ử ữ ứ ự (ui, ùi, ủi )
Trang 1917
y ỳ ỷ ỹ ý ỵ
Quy luật ưu tiên trước - sau:
Ưu tiên ngắn - dài:
Từng khối chữ (tổ hợp các con chữ) được sắp xếp trước - sau theo thứ tự sau: đơn tiết xếp trước đa tiết (tính từ trái sang phải) Các khối chữ viết thường xếp trước khối chữ viết hoa
Theo đó, dạng ưu tiên này được thể hiện như sau: khối chữ nào có
ít con chữ hơn (thường là âm tiết) được xếp trước khối chữ (có phần trùng với khối chữ có ít con chữ) có nhiều chữ hơn Ví dụ: a xếp trước A; "ta" xếp trước
"tay"
Ưu tiên chữ trước - dấu sau:
Đối với từ đơn tiết, được ưu tiên sắp xếp theo thứ tự chữ cái khác nhau đầu tiên, bất kể nó mang dấu gì Ví dụ: "tà" xếp trước "tay"; "tai" xếp trước "tay" trong mọi trường hợp (vì i xếp trước y)
Đối với từ đa tiết, căn cứ vào thứ tự của từng âm tiết từ trái sang phải để sắp xếp, sau mới căn cứ vào thanh điệu Ví dụ: "ba ba" xếp trước "ba gác"; "ba ba" xếp trước "bà cô" (vì "ba" xếp trước "bà")
Đối với những hình thức ghi cách phát âm phổ biến của mục từ vay mượn tiếng nước ngoài kiểu như ba-ga, a-xít , thì dấu gạch ngang xem như khoảng trắng và xếp bình thường như một từ đa tiết Ví dụ: "a tòng" xếp trước "a-xít"
Khi phiên âm các đơn vị từ vựng nước ngoài, về nguyên tắc, dấu gạch ngang (-) được quy ước như là khoảng trắng, nhưng theo luận lý thì nó vẫn phải xếp sau đơn vị từ vựng có cùng khối chữ nhưng cách nhau bằng khoảng trắng thực sự Ví dụ: "a lô" xếp trước "a-lô"
Ưu tiên ký hiệu & số:
Các ký hiệu (symbol) và ký số (number) thì xếp trước ký tự (character) Ví dụ:!, #, $, %, &, @ , 0, 1, 2, 3, 9 luôn luôn đứng trước a, b, c; B1 xếp trước B2 và ba, v.v
Tóm lại, thứ tự sắp xếp ưu tiên là: khối chữ (nghĩa trọn vẹn của khối chữ) xếp trước, sau đến các ký hiệu nằm ngoài khối chữ (trước và sau khối chữ), tiếp đến nội bộ khối chữ (các dấu gạch ngang, dấu phẩy, dấu ba chấm )
Trang 2018
Trang 2119
CHƯƠNG II: CÁC PHƯƠNG PHÁP XÂY DỰNG TỪ ĐIỂN
2.1 Công cụ hỗ trợ
2.1.1 Ngôn ngữ lập trình Java
Java (đọc như "Gia-va") là một ngôn ngữ lập trình hướng đối tượng (OOP)
và dựa trên các lớp (class) Khác với phần lớn ngôn ngữ lập trình thông thường, thay vì biên dịch mã nguồn thành mã máy hoặc thông dịch mã nguồn khi chạy, Java được thiết kế để biên dịch mã nguồn thành bytecode, bytecode sau đó sẽ được môi trường thực thi (runtime environment) chạy
Trước đây, Java chạy chậm hơn những ngôn ngữ dịch thẳng ra mã máy như C và C++, nhưng sau này nhờ công nghệ "biên dịch tại chỗ" - Just in time compilation, khoảng cách này đã được thu hẹp, và trong một số trường hợp đặc biệt Java có thể chạy nhanh hơn Java chạy nhanh hơn những ngôn ngữ thông dịch như Python, Perl, PHP gấp nhiều lần Java chạy tương đương so với C#, một ngôn ngữ khá tương đồng về mặt cú pháp và quá trình dịch/chạy
Cú pháp Java được vay mượn nhiều từ C & C++ nhưng có cú pháp hướng đối tượng đơn giản hơn và ít tính năng xử lý cấp thấp hơn Do đó việc viết một chương trình bằng Java dễ hơn, đơn giản hơn, đỡ tốn công sửa lỗi hơn
Trong Java, hiện tượng rò rỉ bộ nhớ hầu như không xảy ra do bộ nhớ được quản lý bởi Java Virtual Machine (JVM) bằng cách tự động "dọn dẹp rác" Người lập trình không phải quan tâm đến việc cấp phát và xóa bộ nhớ như C, C++ Tuy nhiên khi sở dụng những tài nguyên mạng, file IO, database (nằm ngoài kiểm soát của JVM) mà người lập trình không đóng (close) các streams thì rò rỉ dữ liệu vẫn có thể xảy ra
Java là một công nghệ xây dựng các ứng dụng phần mềm có vị trí rất lớn trong những năm cuối thế kỉ 20, đầu thế kỉ 21 Nó được coi là công nghệ mang tính cách mạng và khả thi nhất trong việc tạo ra các ứng dụng có khả năng chạy thống nhất trên nhiều nền tảng mà chỉ cần biên dịch một lần Lần đầu tiên xuất hiện vào năm 1992 như là một ngôn ngữ dùng trong nội bộ tập đoàn Sun Microsystems để xây dựng ứng dụng điều khiển các bộ xử lý bên trong máy điện thoại cầm tay, lò vi sóng, các thiết bị điện tử dân dụng khác Không chỉ là một ngôn ngữ, Java còn là một nền tảng phát triển và triển khai ứng dụng trong đó máy ảo Java, bộ thông dịch có vai trò trung tâm
Lịch sử:
Java được khởi đầu bởi James Gosling và bạn đồng nghiệp ở Sun Microsystems năm 1991 Ban đầu ngôn ngữ này được gọi là Oak (có nghĩa
Trang 2220
là cây sồi; do bên ngoài cơ quan của ông Gosling có trồng nhiều loại cây này),
họ dự định ngôn ngữ đó thay cho C++, nhưng các tính năng giống Objective C Không nên lẫn lộn Java với JavaScript, hai ngôn ngữ đó chỉ giống tên và loại cú pháp như C Công ty Sun Microsystems đang giữ bản quyền và phát triển Java thường xuyên Tháng 04/2011, công ty Sun Microsystems tiếp tục cho ra bản JDK 1.6.24
Java được tạo ra với tiêu chí "Viết (code) một lần, thực thi khắp nơi" ("Write Once, Run Anywhere" (WORA)) Chương trình phần mềm viết bằng Java có thể chạy trên mọi nền tảng (platform) khác nhau thông qua một môi trường thực thi với điều kiện có môi trường thực thi thích hợp hỗ trợ nền tảng
đó Môi trường thực thi của Sun Microsystems hiện hỗ trợ Sun Solaris, Linux, Mac OS, FreeBSD & Windows Ngoài ra, một số công ty, tổ chức cũng như cá nhân khác cũng phát triển môi trường thực thi Java cho những
hệ điều hành khác như BEA, IBM, HP Trong đó đáng nói đến nhất là IBM Java Platform hỗ trợ Windows, Linux, AIX & z/OS
Những chi tiết về ngôn ngữ, máy ảo và API của Java được giữ bởi Cộng đồng Java (do Sun quản lý) Java được tạo ra vào năm 1991 do một số kỹ sư
ở Sun, bao gồm ông James Gosling, một phần của Dự án Xanh (Green Project) Java được phát hành vào năm 1994, rồi nó trở nên nổi tiếng khi Netscape tuyên
bố tại hội thảo SunWorld năm 1995 là trình duyệt Navigator của họ sẽ hỗ trợ Java Về sau Java được hỗ trợ trên hầu hết các trình duyệt như Internet Explorer (Microsoft), Firefox (Mozilla), Safari (Apple)
Java được sử dụng chủ yếu trên môi trường NetBeans và Oracle Sau khi Oracle mua lại công ty Sun Microsystems năm 2009-2010, Oracle đã mô tả
họ là "người quản lý công nghệ Java với cam kết không ngừng để bồi dưỡng
một cộng đồng tham gia và minh bạch"
2.1.2 Một số đặc điểm nổi bật của Java.
Máy ảo Java (JVM - Java Virtual Machine):
Tất cả các chương trình muốn thực thi được thì phải được biên dịch ra mã máy Mã máy của từng kiến trúc CPU của mỗi máy tính là khác nhau (tập lệnh
mã máy của CPU Intel, CPU Solarix, CPU Macintosh … là khác nhau), vì vậy trước đây một chương trình sau khi được biên dịch xong chỉ có thể chạy được trên một kiến trúc CPU cụ thể nào đó Đối với CPU Intel chúng ta có thể chạy các hệ điều hành như Microsoft Windows, Unix, Linux, OS/2 …
Chương trình thực thi được trên Windows được biên dịch dưới dạng file có đuôi EXE còn trên Linux thì được biên dịch dưới dạng file có đuôi ELF, vì vậy
Trang 2321
trước đây một chương trình chạy được trên Windows muốn chạy được trên hệ điều hành khác như Linux chẳng hạn thì phải chỉnh sửa và biên dịch lại
Ngôn ngữ lập trình Java ra đời, nhờ vào máy ảo Java mà khó khăn nêu trên
đã được khắc phục Một chương trình viết bằng ngôn ngữ lập trình Java sẽ được biên dịch ra mã của máy ảo java (mã java bytecode) Sau đó máy ảo Java chịu trách nhiệm chuyển mã java bytecode thành mã máy tương ứng.Sun Microsystem chịu trách nhiệm phát triển các máy ảo Java chạy trên các hệ điều hành trên các kiến trúc CPU khác nhau
Thông dịch - Interpreter:
Java là một ngôn ngữ lập trình vừa biên dịch vừa thông dịch Chương trình nguồn viết bằng ngôn ngữ lập trình Java có đuôi *.java đầu tiên được biên dịch thành tập tin có đuôi *.class và sau đó sẽ được trình thông dịch thông dịch thành
mã máy
Trình thông dịch là một trình để thông dịch ngôn ngữ Trong thông dịch
mã nguồn của chương trình không được dịch trước thành ngôn ngữ máy, mà khi chạy chương trình mã nguồn mới được dịch và thực thi từng dòng lệnh 1 Tất cả các ngôn ngữ không biên dịch ra mã máy một lần duy nhất điều phải sử dụng trình thông dịch (PHP, WScripts, Perl, Linux Shell, Python ) Các ngôn ngữ theo trình thông dịch thường được gọi là script (kịch bản)
Như vậy chương trình viết bằng ngôn ngữ script phải có một trình thông dịch kèm theo khi chạy chương trình
Ưu điểm của trình thông dịch:
- Phát triển nhanh chóng
- Có thể chỉnh sửa mã nguồn bất kỳ khi này
- Mạnh xử lý cú pháp
- Uyển chuyển mềm dẻo
- Có thể chạy trên mọi nền tảng (flatform, hệ điều hành) nếu có trình thông dịch tương ứng, tại vì không phải là ngôn ngữ máy(chỉ là file văn bản) nên không bị phụ thuộc vào HĐH tiêu biểu là Perl, PHP, Python
Nhược điểm của trình thông dịch:
- Tại vì là ngôn ngữ thông dịch chạy line by line nên nên ngôn ngữ thông dịch không hỗ trợ đa luồn (multi thread), giao dịch (transaction)
- Cũng do chạy line by line nên tốc độ thực thi không nhanh bằng các chương trình viết bằng ngôn ngữ biên dịch (C, C++, VB ) đã chuyên trực tiếp
ra ngôn ngữ máy
Trình biên dịch – Compiler:
Trang 2422
Trình biên dịch sẽ dịch mã nguồn thành mã máy trên một HĐH xác định
và chỉ chạy trên hệ điều hành đó, do đó các chương trình được biên dịch sẽ phụ thuộc nhiều vào nền tảng và hệ điều hành
Ưu điểm trình biên dịch:
- Ràng buộc chặt chẽ về kiểu trong ngôn ngữ
- Hỗ trợ các tính năng đa tuyến, transtion
- Do đã biên dịch phụ thuộc vào hệ điều hành nên chương trình có thể tận dụng toàn bộ các tính năng đặc trưng của HĐH
Một chương trình viết bằng ngôn ngữ Java có thể chạy trên nhiều máy tính
có hệ điều hành khác nhau (Windows, Unix, Linux, …) miễn sao ở đó có cài đặt máy ảo java (Java Virtual Machine) Viết một lần chạy mọi nơi (write once run anywhere)
Một Platform là môi trường phần cứng hoặc phần mềm mà một hoặc nhiều chương trình chạy trong đó Có hai loại Platform, một loại dựa trên phần mềm (software-based) và một loại dựa trên phần cứng (hardware-based) Java cung cấp software-based platform Java Platform khác với nhiều nền tảng khác ở chỗ
nó chạy trên các nền tảng hardware-based khác nhau Nó có hai thành phần:
JRE (Java Runtime Environment)
API (Application Programming Interface)
Java code có thể chạy trên nhiều nền tảng như Windows, Linux, Sun Solaris, Mac/OS, … Java code được biên dịch bởi Trình biên dịch (Compiler)
và được chuyển đổi thành Bytecode Bytecode này là một code độc lập nền tảng bởi vì nó có thể chạy trên nhiều nền tảng khác nhau Đó là lý do vì sao java có khẩu hiệu “Viết một lần, Chạy khắp nơi (Write Once and Run Anywhere)”
Hướng đối tượng - OOP:
Hướng đối tượng trong Java tương tự như C++ nhưng Java là một ngôn ngữ lập trình hướng đối tượng hoàn toàn Tất cả mọi thứ đề cập đến trong Java đều liên quan đến các đối tượng được định nghĩa trước, thậm chí hàm chính của một chương trình viết bằng Java (đó là hàm main) cũng phải đặt bên trong một
Trang 25OOP cung cấp Data Hiding (ẩn dữ liệu) trong khi đó trong hướng thủ tục một dữ liệu toàn cục có thể được truy cập từ bất cứ đâu
OOP cung cấp cho bạn khả năng để mô phỏng các sự kiện trong thế giới thực một cách hiệu quả hơn Chúng ta có thể cung cấp giải pháp cho các vấn đề trong thế giới thực nếu chúng ta sử dụng Lập trình hướng đối tượng
Đa nhiệm - đa luồng (MultiTasking - Multithreading):
Java hỗ trợ lập trình đa nhiệm, đa luồng cho phép nhiều tiến trình, tiểu trình có thể chạy song song cùng một thời điểm và tương tác với nhau
Multitasking: Là khả năng chạy đồng thời một hoặc nhiều chương trình cùng một lúc trên một hệ điều hành Hệ điều hành quản lý việc này và sắp xếp lịch phù hợp cho các chương trình đó Ví dụ, trên hệ điều hành Windows chúng
ta có làm việc đồng thời với các chương trình khác nhau như: Microsoft Word, Google Chrome, …
Multithreading: Là khả năng thực hiện đồng thời nhiều phần khác nhau của một chương trình được gọi là thread Ví dụ trong Microsoft Excel chúng ta có thể làm việc đồng thời với các sheet khác nhau
Khả chuyển (portable):
Chương trình ứng dụng viết bằng ngôn ngữ Java chỉ cần chạy được trên máy ảo Java là có thể chạy được trên bất kỳ máy tính, hệ điều hành nào có máy
ảo Java “Viết một lần, chạy mọi nơi” (Write Once, Run Anywhere)
Hỗ trợ mạnh cho việc phát triển ứng dụng:
Công nghệ Java phát triển mạnh mẽ nhờ vào “đại gia Sun Microsystem”công ty đã phát minh ra ngôn ngữ Java ,cung cấp nhiều công cụ, thư viện lập trình phong phú hỗ trợ cho việc phát triển nhiều loại hình ứng dụng khác nhau,công nghệ Java được chia làm ba bộ phận cụ thể như sau:
+ J2SE (Java 2 Standard Edition): Gồm các đặc tả, công cụ, API của nhân Java giúp phát triển các ứng dụng trên desktop và định nghĩa các phần thuộc nhân của Java
+ J2EE (Java 2 Enterprise Edition) : Gồm các đặc tả, công cụ, API mở rộng J2SE để phát triển các ứng dụng qui mô xí nghiệp, chủ yếu để chạy trên
Trang 26bị điện tử cầm tay, robo và những ứng dụng điện tử khác
Chúng ta sẽ tìm hiểu sơ về thuật ngữ Java Development Kit (JDK - Bộ công cụ cho người phát triển ứng dụng bằng ngôn ngữ lập trình Java) là một tập hợp những công cụ phần mềm được phát triển bởi Sun Microsystems dành cho các nhà phát triển phần mềm, dùng để viết những applet Java hay những ứng dụng Java - bộ công cụ này được phát hành miễn phí gồm có trình biên dịch, trình thông dịch, trình giúp sửa lỗi debugger, trình chạy applet và tài liệu nghiên cứu
Kể từ khi ngôn ngữ Java ra đời, JDK là bộ phát triển phần mềm thông dụng nhất cho Java Ngày 17 tháng 11 năm 2006, hãng Sun tuyên bố JDK sẽ được phát hành dưới giấy phép GNU General Public License (GPL), JDK trở thành phần mềm tự do Việc này đã được thực hiện phần lớn ngày 8 tháng 5 năm 2007 và mã nguồn được đóng góp cho OpenJDK
Hiện tại bản JDK 6 U 18 được xem là phiên bản mới nhất với nhiều tính năng vượt trội hơn so với các phiên bản đầu tiên
Bảo mật:
Java bảo mật bởi vì:
Không có con trỏ tường minh
Chương trình chạy bên trong máy ảo
Classloader: Thêm sự bảo mật bằng việc phân chia package cho các class của hệ thống file trên local mà từ đó chúng được import với các file từ nguồn mạng
Bytecode Vertifier: Kiểm tra các đoạn code để tìm ra các phần code không hợp lệ mà có thể truy cập trái phép tới các đối tượng
Security Manager: Quyết định xem nguồn resource nào mà một lớp có thể truy cập chẳng hạn như đọc và ghi tới local disk
Những tính năng bảo mật này được cung cấp bởi Ngôn ngữ Java Ngoài
ra, một vài tính năng bảo mật khác được cung cấp thông qua nhà phát triển như SSL, JAAS, cryptography, …
Robust (Mạnh mẽ):
Trang 2725
Bạn có thể hiểu đơn giản Robust nghĩa là mạnh mẽ Java sử dụng trình quản lý bộ nhớ mạnh mẽ Đó là, Java sử dụng ít con trỏ hơn để tránh các vấn đề liên quan tới bảo mật Bên cạnh đó Java còn có Trình dọn rác tự động (Garbage Collection) Có xử lý ngoại lệ (Exception Handling) và cơ chế kiểm tra kiểu ngoại lệ xảy ra Đó là những điểm nổi bật khiếm cho Java mạnh mẽ!
Độc lập kiến trúc:
Một ứng dụng được biên dịch trên kiến trúc phần cứng này và ứng dụng đó chạy được trên tất cả các kiến trúc phần cứng khác vd: Một ứng dụng được biên dịch với vi xử lý 32bit và nó sẽ chạy tốt trên vi xử lý 64bit
Portable:
Java là ngôn ngữ lập trình có tính Portable bởi vì java có thể thực thi ứng dụng của nó trên tất cả các hệ điều hành và phần cứng khác nhau
Hiệu suất cao:
Hiệu suất Java nhanh hơn kể từ khi được thông dịch thành ByteCode, mã nguồn gốc thì chậm hơn so với một số ngôn ngữ biên dịch (ví dụ như C++)
2.2 NetBean IDE và JDK
2.2.1 NetBean IDE
Môi trường phát triển tích hợp (tiếng Anh: Integrated Development Environment; viết tắt: IDE) còn được gọi là "Môi trường thiết kế hợp nhất" (tiếng Anh: Integrated Design Environment) hay "Môi trường gỡ lỗi hợp nhất" (tiếng Anh: Integrated Debugging Environment) là một loại phần mềm máy tính có công dụng giúp đỡ các lập trình viên trong việc phát triển phần mềm NetBean IDE hỗ trợ nhiều hệ điều hành khác nhau như Windows, Mac, Linux, và Solaris NetBean bao gồm một IDE mã nguồn mở và một nền tảng ứng dụng cho phép nhà phát triển nhanh chóng tạo nên các ứng dụng dành cho web, doanh nghiệp, desktop và thiết bị di động bằng các ngôn ngữ lập trình Java, C/C++, JavaScript, Ruby, Groovy, và PHP
NetBeans IDE 6.5 Beta cung cấp nhiều tính năng mới như shortcut tìm kiếm trong toàn bộ IDE gọi là QuickSearch, giao diện thận thiện hơn với người dùng, và tính năng tự động biên dịch khi lưu (Compile on Save)
Ngoài việc hỗ trợ Java mọi phiên bản (Java SE, Java EE, Java ME), NetBean IDE còn là công cụ lý tưởng cho việc phát triển phần mềm bằng các ngôn ngữ PHP, C/C++, Groovy and Grails, Ruby and Rails, Ajax and JavaScript Phiên bản 6.5 còn tăng cường hỗ trợ cho web framework (Hibernate, Spring, JSF, JPA), trình ứng dụng máy chủ GlassFish và cơ sở dữ liệu
Trang 2826
Các môi trường phát triển hợp nhất thường bao gồm:
Một trình soạn thảo mã (source code editor): dùng để viết mã
Trình biên dịch (compiler) và/hoặc trình thông dịch (interpreter)
Công cụ xây dựng tự động: khi sử dụng sẽ biên dịch (hoặc thông dịch) mã nguồn, thực hiện liên kết (linking), và có thể chạy chương trình một cách tự động
Trình gỡ lỗi (debugger): hỗ trợ dò tìm lỗi
Ngoài ra, còn có thể bao gồm hệ thống quản lý phiên bản và các công cụ nhằm đơn giản hóa công việc xây dựng giao diện người dùng đồ họa (GUI)
Nhiều môi trường phát triển hợp nhất hiện đại còn tích hợp trình duyệt lớp (class browser), trình quản lý đối tượng (object inspector), lược đồ phân cấp lớp (class hierarchy diagram), để sử dụng trong việc phát triển phần mềm theo hướng đối tượng
Phân theo số lượng các ngôn ngữ được hỗ trợ, ta có thể chia các môi trường phát triển hợp nhất được sử dụng rộng rãi ngày nay thành hai loại:
Môi trường phát triển hợp nhất một ngôn ngữ: làm việc với một ngôn ngữ cụ thể, ví dụ: Microsoft Visual Basic 6.0 IDE
Môi trường phát triển hợp nhất nhiều ngôn ngữ: có thể làm việc với nhiều ngôn ngữ lập trình, ví dụ: Eclipse IDE, NetBeans, Microsoft Visual Studio
Lịch sử:
Khi các thế hệ máy tính đầu tiên ra đời, lập trình viên không có cách nào
để viết ra các chương trình trên các máy này Việc "viết chương trình" trong thời gian này gắn liền với việc phải thay đổi cấu trúc, linh kiện, của cả máy, hoặc đục lỗ lên những tấm thẻ để biểu thị cho những thông tin nào đó Ví dụ: để thay đổi mã lệnh cho máy tính đa chức năng đầu tiên là ENIAC (do hai kĩ sư người Mỹ J W Machily và J Presper Eckret chế tạo vào năm 1946), các nhà chế tạo phải thiết kế lại ENIAC
Sau đó, khi màn hình ra đời và việc phát triển có thể được thực hiện trên các thiết bị đầu cuối (terminal), các môi trường phát triển hợp nhất mới ra đời BASIC là ngôn ngữ đầu tiên có một môi trường phát triển hợp nhất cho riêng mình Tuy nhiên, môi trường này (một phần của Hệ thống chia sẻ thời gian Dartmouth) hoàn toàn dựa trên giao diện ký tự, và cũng không có nhiều
Trang 29Ngày nay, khái niệm "Môi trường phát triển hợp nhất" được phân biệt với khái niệm "công cụ soạn thảo văn bản" (như vi, emacs trên Linux) Khi nói đến
"môi trường phát triển hợp nhất", các lập trình viên thường nghĩ ngay đến chương trình mà với đó, hầu hết công việc của họ - như viết, chỉnh sửa mã, biên dịch, triển khai và gỡ lỗi - đều có thể được thực hiện
Những lập trình viên chuyên nghiệp thường sử dụng các môi trường phát triển hợp nhất để phát triển ứng dụng Họ tận dụng chúng để làm tăng tính hiệu quả và giảm thời gian thực hiện công việc của mình Ngoài ra, người mới học cũng có thể tận dụng những tiện ích của các môi trường phát triển hợp nhất để giảm bớt thời gian học của mình, vì những cấu hình, những dòng lệnh phức tạp (mà nếu không có môi trường phát triển hợp nhất phải thực hiện bằng tay) đều
đã được che giấu và tự động hóa, ta chỉ cần bấm nút là mọi việc có thể được thực hiện
Trong thời gian gần đây, người ta thấy nổi lên các môi trường phát triển hợp nhất nguồn mở (Open Source IDE), như NetBeans, Eclipse Các môi trường phát triển loại này ngày càng thông dụng, nhất là trong cộng đồng nguồn
mở
2.2.1 JDK
Bộ công cụ cho người phát triển ứng dụng bằng ngôn ngữ lập trình Java là một tập hợp những công cụ phần mềm được phát triển bởi Sun Microsystems dành cho các nhà phát triển phần mềm, dùng để viết những applet Java hay những ứng dụng Java - bộ công cụ này được phát hành miễn phí gồm
có trình biên dịch, trình thông dịch, trình giúp sửa lỗi (debugger, trình chạy applet và tài liệu nghiên cứu
Java Standard Edition( còn gọi là Java SE) : là công cụ và nền mà cung cấp
hỗ trợ để xây dựng các ứng dụng có các chức năng cao, tốc độ và đáng tin cậy