Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
277,5 KB
Nội dung
wWw.VipLam.Net Câu 1: Khái niệm và Các yếu tố cấu thành của Ngôn ngữ lập trình: Ngôn ngữ lập trình là một hệ thống được kí hiệu hóa để miểu tả những tính toán (qua máy tính) trong một dạng mà cả con người và máy tính đều có thể đọc và hiểu được. Ngôn ngữ lập trình = Kí hiệu + quy tắc kết hợp • Các yếu tố cấu thành của ngôn ngữ lập trình: o Cú pháp: Sự kết hợp của các kí hiệu ( Dạng của biểu thức, các phát triển, các đơn vị nhỏ của chương trình) o Ngữ nghĩa: Ý nghĩa cuả sự kết hợp. o Ngữ dụng: Mối quan hệ của cú pháp,ngữ nghĩa với thế giới bên ngoài Câu 2 : Phải có ngôn ngữ lập trình mà k dùng ngôn ngữ máy hay ngôn ngữ tự nhiên để lập trình vì : • Ngôn ngữ máy là ngôn ngữ trong đó các lệnh được viết bằng các số nhị phân (0 và 1). Nếu một chương trình được viết bằng ngôn ngữ máy thì chương trình đó sẽ rất dài. Các dòng số này không gợi nên ý nghĩa của lệnh. Người dùng muốn hiểu và sử dụng chương trình thì phải ghi nhớ một cách máy móc các dòng lệnh. • Ngôn ngữ tự nhiên là ngôn ngữ đa nghĩa, giàu cảm xúc biểu đạt, đóng về ngữ nghĩa. Nếu dùng ngôn ngữ tự nhiên để vết chương trình thì máy tính không thể xác định được khả năng biểu đạt của ngôn ngữ. Phải dùng ngôn ngữ lập trình để làm phương tiện giao tiếp giữa người và máy tính. Câu 3: Lịch sử phát triển của ngôn ngữ lập trình • Ngôn ngữ lập trình đầu tiên là ngôn ngữ máy tính (mã nhị phân). Ngôn ngữ máy phụ thuộc toàn bộ vào kiến trúc phần cứng và những quy ước khắt khe của nhà chế tạo → Không có tính khả chuyển • Từ những năm 1950 hợp ngữ assembly ra đời → là những ngôn ngữ bậc thấp. • Từ năm 1957 ngôn ngữ bậc cao đầu tiên ra đời. Đây là sản phẩm của IBM đưa ra. Đó là ngôn ngữ Fortran (Formula Translator). Là ngôn ngữ gần gũi với ngôn ngữ tự nhiên, với cách diễn đạt toán học (Điều kiện, vòng lặp). • Đầu những năm 1960 : COBOL : xử lý dữ liệu. Algol 60 : có cấu trúc điều khiển hiện đại Lisp : Ngôn ngữ lập trình hàm đầu tiên, ngôn ngữ xử lí danh sách • Giữa những năm 1960 : PL/1 : Kết hợp giữa ngôn ngữ tính toán số học và ngôn ngữ xử lí dữ liệu. Simula : Hướng đối tượng • Từ năm 1970 – 1990 : Các ngôn ngữ hướng đối tượng : C++ Lập trình Logic (1972) Lập trình hàm :ML.,miranda Ada • Từ năm 1990 đến nay: Hướng đối tượng + WWW: C#,java Ngôn ngữ kịch bản + Hướng đối tượng + WWW:PHP XML Ngôn ngữ kịch bản phía Client: Java Script Câu 4 : Các xu hướng phát triển & nghiên cứu chính of các ngôn ngữ lập trình trong giai đoạn hiện nay: • Moodul hóa, hướng đối tượng. wWw.VipLam.Net • Mã nguồn mở, framework. • Phát hiện lỗi tự động • Phát triển trình dịch biên. • Bảo mật • Lập trình cho di động • Web 2.0, điện toán cho đám mây • Lập trình trí tuệ nhân tạo Câu 5: Anh chị hãy cho biết tên của 3 ngôn ngữ lập trình được sử dụng phổ biến hiện nay trên thế giới, và theo anh chị thì vì sao nó lại được sử dụng phổ biến 1.Ngôn ngữ lập trình C# C# là một ngôn ngữ lập trình hướng đối tượng được phát triển bởi Microsoft, là phần khởi đầu cho kế hoạch .NET của họ. Tên của ngôn ngữ bao gồm ký tự thăng theo Microsoft nhưng theo ECMA là C#, chỉ bao gồm dấu số thường. Microsoft phát triển C# dựa trên C++ và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng giữa C++, Visual Basic, Delphi và Java. C# được thiết kế chủ yếu bởi Anders Hejlsberg kiến trúc sư phần mềm nổi tiếng với các sản phẩm Turbo Pascal, Delphi, J++, WFC. C#, theo một hướng nào đó, là ngôn ngữ lập trình phản ánh trực tiếp nhất đến .NET Framework mà tất cả các chương trình .NET chạy, và nó phụ thuộc mạnh mẽ vào Framework này. Mọi dữ liệu cơ sở đều là đối tượng, được cấp phát và hủy bỏ bởi trình dọn rác Garbage-Collector (GC), và nhiều kiểu trừu tượng khác chẳng hạn như class, delegate, interface, exception, v.v, phản ánh rõ ràng những đặc trưng của .NET runtime. 4. Ngôn ngữ lập trình Java Java (đọc như "Gia-va") là một ngôn ngữ lập trình dạng lập trình hướng đối tượng (OOP). Khác với phần lớn ngôn ngữ lập trình thông thường, thay vì biên dịch mã nguồn thành mã máy hoặc thông dịch mã nguồn khi chạy, Java được thiết kế để biên dịch mã nguồn thành bytecode, bytecode sau đó sẽ được môi trường thực thi (runtime environment) chạy. Bằng cách này, Java thường chạy nhanh hơn những ngôn ngữ lập trình thông dịch khác như Python, Perl, PHP, Cú pháp Java được vay mượn nhiều từ C & C++ nhưng có cú pháp hướng đối tượng đơn giản hơn và ít tính năng xử lý cấp thấp hơn. dự định ngôn ngữ Java thay cho C++, nhưng các tính năng giống Objective C. Không nên lẫn lộn Java với JavaScript, hai ngôn ngữ đó chỉ giống tên và loại cú pháp như C. Công ty Sun Microsystems đang giữ bản quyền và phát triển Java thường xuyên. 3. Ngôn ngữ lập trình PHP PHP (viết tắt hồi quy "PHP: Hypertext Preprocessor") là một ngôn ngữ lập trình kịch bản hay một loại mã lệnh chủ yếu được dùng để phát triển các ứng dụng viết cho máy chủ, mã nguồn mở, dùng cho mục đích tổng quát. Nó rất thích hợp với web và có thể dễ dàng nhúng vào trang HTML. Do được tối ưu hóa cho các ứng dụng web, tốc độ nhanh, nhỏ gọn, cú pháp giống C và Java, dễ học và thời gian xây dựng sản phẩm tương đối ngắn hơn so với các ngôn ngữ khác nên PHP đã nhanh chóng trở thành một ngôn ngữ lập trình web phổ biến nhất thế giới. Ngôn ngữ, các thư viện, tài liệu gốc của PHP được xây dựng bởi cộng đồng và có sự đóng góp rất lớn của Zend Inc., công ty do các nhà phát triển cốt lõi của PHP lập nên nhằm tạo ra một môi trường chuyên nghiệp để đưa PHP phát triển ở quy mô doanh nghiệp. wWw.VipLam.Net Câu 6: Phân biệt NNLT bậc thấp và NNLT bậc cao - Ngôn ngữ lập trình bậc thấp là một ngôn ngữ lập trình liên quan chặt chẽ đến phần cứng máy tính và không có tính khả chuyển. Từ "thấp" không có nghĩa là ngôn ngữ này kém hơn các ngôn ngữ lập trình bậc cao mà điều này nghĩa là các lệnh của nó rất gần ngôn ngữ máy. Phụ thuộc rất nhiều vào loại máy. Các ngôn ngữ lập trình bậc thấp thường được chia thành hai loại: thế hệ thứ nhất và thế hệ thứ hai. + Ngôn ngữ lập trình thế hệ thứ nhất, hay 1GL, là mã máy. Nó là ngôn ngữ duy nhất mà bộ vi xử lý có thể hiểu. Hiện nay các lập trình viên hầu như không bao giờ viết chương trình trực tiếp bằng ngôn ngữ máy vì nó không chỉ yêu cầu chú ý nhiều đến các chi tiết mà một ngôn ngữ bậc cao xử lý một cách tự động mà còn yêu cầu ghi nhớ và tìm những mã lệnh bằng số cho mỗi chỉ thị được sử dụng. + Ngôn ngữ lập trình thế hệ thứ hai, hay 2GL, là ngôn ngữ assembly. Nó được xem là ngôn ngữ thế hệ thứ hai vì mặc dù nó không phải là ngôn ngữ máy nhưng lập trình viên vẫn phải hiểu về kiến trúc của bộ vi xử lý (như các thanh ghi và các lệnh của bộ vi xử lý). Những câu lệnh đơn giản được dịch trực tiếp ra mã máy. - Ngôn ngữ lập trình bậc cao: Là ngôn ngữ gần với ngôn ngữ tự nhiên nhất. ít phụ thuộc vào loại máy, có tính độc lập cao và phải có chương trình dịch để dịch sang mã máy thì máy tính mới có thể thực hiện được. - Cho ví dụ: + Ngôn ngữ bậc thấp: Ngôn ngữ máy, Assembly, … + Ngôn ngữ lập trình bậc cao: fortran, pascal, C, Cobol…. Câu 7: Họ ngôn ngữ lập trình phổ biến là: - Ngôn ngữ máy và ngôn ngữ ASSEMBLY: Ngôn ngữ máy là đối tượng thi hành trực tiếp của vi xử lý. Hợp ngữ Assembly (1950s): chương trình viết bằng hợp ngữ ngắn hơn, chiếm ít bộ nhớ hơn và chạy nhanh hơn so với ngôn ngữ lập trình bậc cao. Ngôn ngữ Assembly thích hợp cho lập trinh các vi điều khiển (VD vi điều khiển trên ô tô) - Họ ngôn ngữ cổ điển (ngôn ngữ cấp cao loại ngôn ngữ thủ tục) gắn chặt với mô hình máy tính cổ điển Von Neumann: Kiến trúc Von Neumann có 2 đặc điểm đáng chú ý + Các lệnh được xử lý tuần tự theo thứ tự sắp xếp trong bộ nhớ + Chỉ cho phép đọc ghi mỗi lần 1 từ nhớ (Word Memory)\ VD: Fortran, Pascal, Basic, C, … - Họ ngôn ngữ hàm: Chương trình của ngôn ngữ hàm bao gồm các đối tượng dữ liệu, các hàm và các phép áp dụng hàm trên các đối tượng dữ liệu. Sử dụng định nghĩa hàm đệ qui. VD: Lisp, ML, Haskell,… - Họ ngôn ngữ hướng đối tượng: Chương trình của ngôn ngữ hướng đối tượng là một kịch bản hoạt động của các đối tượng trong chương trình. Các đối tượng gửi các thông điệp qua lại lẫn nhau. VD: Smalltalk, Eiffel, C+ +, Java,… - Họ ngôn ngữ lôgic: Chương trình viết trên ngôn ngữ lôgic là tập hợp các quy tắc và các sự kiện, được diễn đạt bằng các mệnh đề, liên quan đến vấn đề cần giải quyết. Người lập trình chỉ cần đặc tả lôgic của vấn đề, còn cơ chế giải quyết vấn đề theo đặc tả đó được cài sẵn trong chương trình dịch. VD: Prolog, VisiCalc,… Câu 8: Đặc trưng cơ bản của ngôn ngữ lập trình hướng đối tượng: - Là kĩ thuật lập trình hỗ trợ công nghệ đối tượng. OOP được xem là giúp tăng năng suất, đơn giản hóa độ phức tạp khi bảo trì cũng như mở rộng phần mềm bằng cách cho phép lập trình viên tập trung vào các đối tượng phần mềm ở bậc cao hơn. Ngoài ra, nhiều người còn cho rằng OOP dễ tiếp thu hơn cho những người mới học về lập trình hơn là các phương pháp trước đó. wWw.VipLam.Net - Chương trình của ngôn ngữ hướng đối tượng là một kịch bản hoạt động của các đối tượng trong chương trình. Các đối tượng gửi các thông điệp qua lại lẫn nhau - Đặc trưng cơ bản: - Tính trừu tượng: Đây là khả năng của chương trình bỏ qua hay không chú ý đến một số khía cạnh của thông tin mà nó đang trực tiếp làm việc lên, nghĩa là nó có khả năng tập trung vào những cốt lõi cần thiết. Mỗi đối tượng phục vụ như là một "động tử" có thể hoàn tất các công việc một cách nội bộ, báo cáo, thay đổi trạng thái của nó và liên lạc với các đối tượng khác mà không cần cho biết làm cách nào đối tượng tiến hành được các thao tác. Tính chất này thường được gọi là sự trừu tượng của dữ liệu. Tính trừu tượng còn thể hiện qua việc một đối tượng ban đầu có thể có một số đặc điểm chung cho nhiều đối tượng khác như là sự mở rộng của nó nhưng bản thân đối tượng ban đầu này có thể không có các biện pháp thi hành. Tính trừu tượng này thường được xác định trong khái niệm gọi là lớp trừu tượng hay lớp cơ sở trừu tượng + Đóng gói dữ liệu: dữ liệu luôn được tổ chức thành các thuộc tính của lớp đối tượng. Việc truy nhập đến dữ liệu phải thông qua các phương thức của đối tượng lớp. + Sử dụng lại mã nguồn: việc sử dụng lại mã nguồn được thể hiện thông qua cơ chế kế thừa. Cơ chế này cho phép các lớp đối tượng có thể kế thừa từ các lớp đối tượng khác. Khi đó, trong các lớp kế thừa, có thể sử dụng các phương thức (mã nguồn) của các lớp bị kế thừa, mà không cần phải định nghĩa lại. VD: Smalltalk, Eiffel, C++, Java,… Câu 9: Phân tích 3 yêu cầu của một ngôn ngữ lập trình: - Tính dễ viết + Ngôn ngữ lập trình phải có tính diễn đạt cao: Cung cấp cho người lập trình những công cụ để có thể nghĩ sao viết vậy (kỹ thuật đệ qui). + Ngôn ngữ phải đơn giản để dễ đọc, dễ nhớ và dễ nắm vững (không nên có quá nhiều khái niệm. VD ngôn ngữ C có quá nhiều toán tử, các toán tử gần giống nhau). + Ngôn ngữ phải linh hoạt. VD C linh hoạt hơn Pascal với phát biểu Break, Return - Tính dễ đọc + GOTO (Pascal) làm chương trình khó đọc + Dấu gạch dưới “_” trong danh hiệu làm chương trình dễ đọc hơn - Tính tin cậy (xác suất chạy đúng cao trong quá trình sử dụng) + Ngôn ngữ cần hạn chế sự xuất hiện của các lỗi không thể ngờ được. VD phát biểu trong FORTRAN SUM(I,J)= I + J; + Hiệu ứng lề (side effect) cũng là một nguồn gây lỗi + Ngôn ngữ cần kiểm tra chặt chẽ sự tương hợp kiểu của các biến trong biểu thức và phép gán, sự tương hợp của danh sách thông số của chương trình con ở nơi gọi và nơi định nghĩa. + Các bộ phận của chương trình cần có tính độc lập đối với nhau cao. + Tính tin cậy còn phụ thuộc vào chất lượng của chương trình dịch Câu 10: Tiêu chuẩn để đánh giá một ngôn ngữ lập trình tốt: - Tính rõ ràng (clarity), đơn giản (simplicity), nhất quán (unity) của các khái niệm - Tính rõ ràng của cú pháp chương trình (clarity of program syntax). Khả năng định nghĩa và sử đụng các cấu trúc hoặc các phép toán phức tạp cho phép bỏ qua các cho tiết. wWw.VipLam.Net - Tính tự nhiên đối với các ứng dụng (naturalness for the application) - Hỗ trợ tính trừu tượng hóa (support for abstraction) - Khả năng của ngôn ngữ lập trình hỗ trợ người lập trình tạo ra các chương trình đúng đắn. Phát hiện và sửa lỗi và thực hiện tiếp tục mà không cần dừng lại. - Dễ dàng kiểm tra chương trình - Môi trường lập trình đơn giản - Tính khả chuyển của chương trình - Chi phí sử dụng thấp: chi phí thực thi, dịch, viết, kiểm tra, sử dụng, bảo trì chương trình. Câu 11. Các thành tố cuả một ngôn ngữ lập trình hiện đại : -Các dạng câu lệnh: định nghĩa, khai báo, gán giá trị, kết hợp, điều kiện, vòng lặp, gọi (hàm, thủ tục, macro), các chỉ thị tiền xử lý (#ifndef MY_LIB #include "my_code.h“ #endif trong C/C++), chú giải • Chương trình con và macro (một khối lệnh được dùng lại nhiều lần) • Biến, hằng, tham số và đối số • Từ vựng qui ước: từ khóa, các tên chuẩn hay tên cho trước, các ký hiệu • Các luật cấm ngoại lệ: lỗi cú pháp, lỗi ý nghĩa • Ngoài ra còn 1 số thành tố khác như : - Giao diện đồ họa - Điều khiển theo sự kiện - Thời gian thực - Hỗ trợ hệ điều hành Câu 12: Trình bày khái niệm siêu ngôn ngữ (meta language), và cho biết vai trò của siêu ngôn ngữ trong quá trình thiết kế ngôn ngữ lập trình, lấy ví dụ một vài siêu ngôn ngữ. - Khái niệm: Ngôn ngữ dùng để xác định cú pháp (hoặc ngữ nghĩa) của một ngôn ngữ lập trình gọi là siêu ngôn ngữ (Meta language) 777 Khái niệm ngôn ngữ học của GS. Nguyễn Thiện Giáp (tr.377) - Vai trò: Nó có vai trò quan trọng trong quá trình thiết kế ngôn ngữ lập trình: Cú pháp quy định sự kết hợp giữa các kí hiệu trong bộ từ vựng. Ngữ nghĩa qui định ý nghĩa của mỗi sự kết hợp đó.Mà trong việc thiết kế ngôn ngữ, ngữ nghĩa hình thức cho phép các nhà thiết kế mô tả rõ ràng và chính xác ngữ nghĩa cũng như các đặc tả của ngôn ngữ. Cú pháp là thành phần quan trọng nhất trong một ngôn ngữ. Cú pháp được biểu diễn bởi một bộ luật cú pháp. Bộ luật này dùng để mô tả cấu trúc của chương trình, câu lệnh. Để lập trình, người lập trình phải nắm được bộ luật cú pháp của ngôn ngữ mà mình định xây dựng chương trình, để lập trình đúng. VD: Văn phạm phi ngữ cảnh, BNF,… Câu 13. Đặc tả từ vựng trong NNLT: - Ngôn ngữ là tập hợp chuỗi các ký tự từ alphabet (A…Z, a…z, $,@,0 9, +,_,*,/,=,…) - Token: Một token là một tập hợp các xâu kí tự có một nghĩa xác định. Ví dụ: Các từ khoá, định danh, toán tử, hằng, xâu kí tự, … - Pattern: Pattern của một token là các qui tắc kết hợp các kí tự để tạo nên token đó - Lexeme: Là một chuỗi các kí tự thoả mãn pattern của một token Câu 14. Biểu thức chính quy: - Để biểu diễn các token người ta dùng biểu thức chính quy. - Một biểu thức chính quy là một chuỗi miêu tả một bộ các chuỗi khác, theo những quy tắc cú pháp nhất định wWw.VipLam.Net - BTCQ có thể hiểu như là một ngôn ngữ nhỏ dùng cho mục đích: để tìm một chuỗi con trong biểu thức chuỗi lớn. Câu 15: Anh/chị hãy cho biết vì sao cần đặc tả cú pháp ngôn ngữ lập trình. Đầu vào và đầu ra của công việc đặc tả cú pháp là gì ? Phân tích cú pháp có mục đích duyệt chương trình nguồn để phát hiện và thông báo các lỗi không đúng với quy ước của ngôn ngữ. Các lỗi này làm cho nghĩa của chương trình không rõ và do đó không thể dịch đúng được. Ví dụ trong ngôn ngũ PASCAL ta viết dòng lệnh d := (a+ b)/e-f)+g. Khi đọc đến dấu ngoặc đóng thứ 2 sau f, ta sẽ không hiểu được nguời viết muốn tính gì và đương nhiên cũng không thể dịch được. Lý do làm cho dòng lệnh không rõ nghĩa ở đây là thiếu một dấu ngoặc "(" ở phía trước, có thể là trước chữ e, cũng có thể trước chữ a. Những lỗi sai với quy ước của ngôn ngữ gọi là lỗi cú pháp. Quá trình phân tích cú pháp cũng tạo ra các thông tin cần thiết về cấu trúc của chương trình và các đối tượng sẽ dùng trong công việc dịch được mô ta tiếp theo đây. Trong quá trình phân tích cú pháp, danh mục các đối tượng cũng được xây dựng để còn sinh mã chương trình trong giai đoạn tiếp theo. Công việc này gọi là phân tích từ vựng. - Đầu vào là chương trình nguồn - Đầu ra là + Những lỗi cú pháp cần sửa + Thông tin cần thiết về cấu trúc của chương trình Câu 16: Trình bày các đặc điểm của cú pháp cụ thể: Trả lời: * Cú pháp của ngôn ngữ được định nghĩa bởi bộ 4 (Văn phạm phi ngữ cảnh: Context – Free Grammar) - Ký hiệu bắt đầu S ∈ N(Start symbol) - Tập các ký hiệu không kết thúc N (Non-terminals) - Tập các ký hiệu kết thúc Σ (Terminals) - Tập các luật sinh P (Production) có dạng: A → a Với A ∈ N và a là chuỗi các ký hiệu kết thúc và không kết thúc Câu hợp lệ của ngôn ngữ là chuỗi kí hiệu kết thúc được dẫn ra từ kí hiệu khởi đầu S thông qua các luật sinh trong tập luật sinh P * BNF là một siêu ngôn ngữ phổ biến để xây dựng cú pháp cụ thể * Ví dụ: Cú pháp cụ thể dạng BNF cho biểu thức trong PASCAL - <expression>::= <term> | <expression> <addop> <term> - <term> ::= <factor> | <term> <multop><factor> - <factor> ::= <identifier> | <literal> | (<expression>) - <identifier> ::= a | b | c,….|z - <literal> ::= 0 | 1 | 2,…|9 - <addop> ::= +, -, or - <multop> :: * | / | div | mod | and Cú pháp cụ thể còn được gọi là cú pháp phi ngữ cảnh (context-free syntax), trong đó vế trái của mỗi luật sinh chỉ có duy nhất một ký hiệu không kết thúc. wWw.VipLam.Net Cú pháp phi ngữ cảnh biểu diễn được cú pháp của mọi ngôn ngữ lập trình cấp cao hiện nay. Câu 17: Anh/chị hãy phân tích vai trò của đặc tả ngữ nghĩa ngôn ngữ lập trình. Đầu vào, đầu ra của công việc đặc tả ngữ nghĩa là gì ? - Đặc tả ngữ nghĩa hình thức cho phép: + Chứng minh tính đúng đắn của chương trình + Kiểm tra tính đúng đắn của chương trình dịch - Cú pháp và ngữ nghĩa hình thức được dùng để hiện thực và thiết kê ngôn ngữ lập trình. + Cú pháp hình thức được sử dụng để tạo ra bộ phân tích cú pháp của ngôn ngữ + Ngữ nghĩa hình thức giúp cho quá trình sinh tự động các trình thông dịch và biên dịch của ngôn ngữ. + Trong việc thiết kế ngôn ngữ, ngữ nghĩa hình thức cho phép nhà thiết kế mô tả rõ ràng và chính xác ngữ nghĩa cũng như các đặc tính của ngôn ngữ. - Đặc tả ngữ nghĩa hình thức thông qua bộ phân tích ngữ nghĩa. - Bộ phân tích ngữ nghĩa (BPTNN) thực hiện + Kiểm tra lỗi ngữ nghĩa: kiểm tra kiểu; kiểm tra phạm vi của hằng, biến; kiểm tra việc sử dụng tên + Thu nhận thông tin thuộc tính cho các từ tố (token), ví dụ như thông tin về giá trị, thông tin về loại hằng, biến hay hàm cho tên. + BPTNN phân tích ý nghĩa của các cấu trúc cú pháp tạo nên chương trình nguồn. VD trong biểu thức gán c:=a+b*7, BPTNN xác định ý nghĩa của các tác vụ :=, +, *, kiểm tra xem các tác vụ có nhận các đối số thuộc các kiểu thích hợp hay không dựa vào bảng ký hiệu. Câu 18: Anh/chị hãy cho biết đặc điểm của quá trình biên dịch lấy VD về các ngôn ngữ biên dịch mà anh/chị biết Trả lời: * Đặc điểm của quá trình biên dịch: Chương trình nguồn được trình biên dịch chuyển sang chương trình đích, thường ở dạng mã máy (hoặc assembly), sau đó chương trình đích mới được thực thi. Trong hệ thống biên dịch dữ liệu và chương trình nguồn được xử lý ở hai thời điểm khác nhau. Trong đó: - Chương trình nguồn viết bằng ngôn ngữ nguồn - Chương trình đối tượng được thể hiện trên ngôn ngữ đối tượng - Thời gian chuyển đổi từ chương trình nguồn sang chương trình đối tượng goi là thời gian dịch (compile time) - Thời gian diễn ra sự thực thi chương trình đối tượng trên máy tính gọi là thời gian thực thi (execution time hoăc run time) wWw.VipLam.Net * Ví dụ về ngôn ngữ biên dịch: Ngôn ngữ biên dịch là ngôn ngữ mà chương trình dịch cho nó là chương trình biên dịch. Ví dụ như Fortran: , Pascal, C, C++… Câu 19: - Thay vì chuyển đổi toàn bộ chương trình nguồn như trình biên dịch, trình thông dịch chỉ chuyển đổi một mệnh đề của chương trình và thực hiện đoạn mã kết quả ngay, sau đó nó tiếp tục chuyển đổi mệnh đề thứ 2 rồi thi hành đoạn mã kết quả thứ 2 và cứ thế. - Khi sử dụng trình thông dịch, mỗi lần chạy chương trình là mỗi lần chương trình nguồn được thông dịch sang ngôn ngữ máy. Không có chương trình đối tượng nào được tạo ra. Ưu điểm: - có thể chạy một chương trình vẫn còn lỗi cú pháp. Chỉ đến lúc thông dịch đến câu lệnh có lỗi cú pháp, quá trình thi hành chương trình mới bị ngừng lại và trình thông dịch sẽ thông báo lỗi. - Do không có chường trình đối tượng nào được tao ra ==> tốn ít dung lượng đĩa - Có thể chạy trên mọi hệ điều hành Nhược điểm: - Trong thông dịch thì chương trình đích không được lưu lại nên mỗi lần thực hiện phải dịch lại từ đầu. (ngược lại với trình biên dịch) • Một số ngôn ngữ thông dịch: vbscript, javascript, shell script, sql script. Câu 20: Anh( chị) hãy liệt kê các giai đoạn của trình biên dịch, đầu vào đầu ra của các giai đoạn? Trả lời: Chương trình dịch chia làm 6 giai đoạn: - Phân tích từ vựng - Phân tích cúa pháp - Phân tích ngữ nghĩa - Sinh mã trung gian - Tối ưu mã - Sinh mã đích * Phân tích từ vựng: - Đầu vào: chương trình nguồn là 1 chuỗi các kí hiệu - Đầu ra: các kí hiệu trong chuỗi chương trình nguồn được gom lại thành các nhóm kí hiệu có ý nghĩa gọi là các token, như từ khóa, tên biến, hằng, kí hiệu tác vụ. * Phân tích cú pháp - Đầu vào: chuỗi các token do bộ phân tích từ vựng cung cấp Phân tích Tổng hợp wWw.VipLam.Net - Đầu ra: cấu trúc phức tạp hơn của chương trình nguồn như: biểu thức, phát biểu, chương trình con. Các cấu trúc được thể hiện dưới dạng cây cú pháp với nút lá là các token. * Phân tích ngữ nghĩa: - Đầu vào: Các cấu trúc cú pháp tạo nên chương trình nguồn - Đầu ra: phát hiện các lỗi ngữ nghĩa, thông tin thuộc tính cho các từ tố (token) cho ra chương trình nguồn đã sửa lỗi * Sinh mã trung gian - Đầu vào: Chương trình nguồn có ở bước trên - Đầu ra: dạng biểu diễn mã trung gian (mã bộ tứ, mã 3 địa chỉ) của chương trình nguồn * Tối ưu mã Đầu vào: Mã trung gian vừa được sinh ra ở bước trên - Đầu ra: chương trình đích tối ưu về tốc độ thực thi và bộ nhớ sử dụng * Sinh mã đích - Đầu vào: mã trung gian đã được tối ưu - Đầu ra: mã đích thông thường ở dạng mã máy hay mã Assembly Câu 21: Anh/chị hãy trình bày nội dung của quá trình phân tích từ vựng. 1. Source program: Chương trình nguồn đối với chương trình dịch chỉ là một chuỗi kí hiệu 2. Lexical analyzer: Bộ phân tích từ vựng dò các kí hiệu trong chuỗi kí hiệu chương trình nguồn, và gom chúng lại thành các nhóm kí hiệu có ý nghĩa gọi là các Token: như từ khóa, tên biến, hằng, kí hiệu tác vụ. 3. VD phân tích từ vựng phép gán: c:=a+b*7 thu được: c ident(định danh) b ident(định danh) := becomes(kí hiệu tác vụ gán) * times (kí hiệu tác vụ nhân) a ident(định danh) 7 number (số/hằng) + plus(kí hiệu tác vụ cộng) Chuỗi tokens thu được: id1:=id2+id3*7 (ident, c) becomes (ident, a) plus (ident, b) times (number, 7) Source program Lexical analyzer Get next token Token Parser Symbol table wWw.VipLam.Net 4. Parser: Bộ phân tích cú pháp nhận các kí hiệu có ý nghĩa gọi là các Token trong chuỗi kí hiệu từ bộ phân tích từ vựng, sau đó bộ phân tích từ vựng lấy token kế (Get next token) từ bộ phân tích cú pháp. 5. Bảng danh hiệu (symbol table) Câu 22: Anh chị hãy cho biết bảng danh hiệu (Symbol table) dùng để làm gì? Và vai trò của nó trong quá trình biên dịch chương trình? * Bảng danh hiệu (symbol table) là một cấu trúc dữ liệu dùng để lưu trữ tất cả định danh (bao gồm các trường lưu giữ ký hiệu và các thuộc tính của nó) là thông tin của chương trình Các thông tin này được tập hợp từ các giai đoạn phân tích của trình biên dịch và được sử dụng bởi giai đoạn tổng hợp để sinh mã đích * Vai trò của bảng danh hiệu (Symbol table) trong quá trình biên dịch chương trình là: - Là cơ sở dữ liệu cho toàn bộ hệ thống biên dịch - Trong quá trình chạy chương trình chỉ cần lấy lại thông tin từ bảng Symbol table mà không cần kiểm tra lại thông tin - Khi chạy chương trình lần thứ 2 mà dữ liệu nguồn không có gì thay đổi thì nó sẽ chạy trực tiếp trên file đích đã chứa sẵn bảng Symbol table1 lần biên dịch mà thực thi được nhiều lầnthời gian chạy chương trình nhanh Câu 23: Anh chị hãy trình bày nội dung của quá trình phân tích cú pháp - Bộ phân tích cú pháp phân tích chuỗi các token do bộ phân tích từ vựng cung cấp, để thu được các cấu trúc phức tạp hơn của chương trình nguồn như: biểu thức, phát biểu, chương trình con. Các cấu trúc được thể hiện dưới dạng cây cú pháp với nút lá là các token. c …. a …. b … Danh hiệu Thuộc tính [...]... biết các lỗi của chương trình được phát hiện như thế nào trong quá trình biên dịch chương trình */ Xử lý lỗi cú pháp Chương trình nguồn có thể chứa các lỗi ở nhiều mức độ khác nhau: - Lỗi từ vựng như danh biểu, từ khóa, toán tử viết không đúng - Lỗi cú pháp như ghi một biểu thức toán học với các dấu ngoặc đóng và mở không cân bằng - Lỗi ngữ nghĩa như một toán tử áp dụng vào một toán hạng không tương thích... phép toán thông tin về kiểu của mỗi một đối số sẽ được kiểm tra -Ưu điểm: mềm dẻo khi viết chương trình, không cần khai báo kiểu dữ liệu và kiểu của ĐTDL có thể thay đổi trong quá trình thực thi chương trình -Nhược điểm: có khả năng bỏ sót lỗi về kiểu; yêu cầu bộ nhớ lớn do phải lưu trữ thông tin kiểu dữ liệu trong quá trình thực hiện chương trình; làm chậm quá trình thực thi do vừa phải tính toán vừa... thông tin về kiểu không gắn với ĐTDL tại thời điểm thực thi chương trình nên tiết kiệm bộ nhớ và tăng tốc độ chạy chương trình - Nhược điểm: không mềm dẻo, cụ thể người lập trình phải cân nhắc và xác định kiểu cho ĐTDL một cách rõ ràng - Các ngôn ngữ kiểm tra kiểu tĩnh: Pascal, C, … Câu 28: Anh chị hãy cho biết đặc điểm của kiểm tra kiểu động, ưu và nhược điểm của kiểm tra kiểu động -Để kiểm tra kiểu... vào văn phạm của ngôn ngữ những luật sinh lỗi và sử dụng văn phạm này để xây dựng bộ phân tích cú pháp, chúng ta có thể sinh ra bộ đoán lỗi thích hợp để chỉ ra cấu trúc lỗi được nhận biết trong dòng nhập d Chiến lược hiệu chỉnh toàn cục (global correction): Một cách lý tưởng là trình biên dịch tạo ra một số thay đổi trong khi xử lý một lỗi Có những giải thuật để lựa chọn một số tối thi u các thay đổi... các đối số của phép toán số học ‘+’ có lẫn số thực và số nguyên thì số nguyên được chuyển đổi tự động sang kiểu số thực wWw.VipLam.Net Câu 30: Anh chị hãy phân biệt các loại phép gán khác nhau - Là tác vụ cơ bản để thay đổi giá trị của đối tượng dữ liệu - Đặc tả tác vụ gán := : type1 x type2 → void = : type1 x type2 → type3 Z := X + Y Z = X + (Y = W 2) A=B=C Ngôn ngữ Pascal Ngôn ngữ C - Các NNLT khác... toán quan hệ so sánh hai giá trị dữ liệu đối số và trả về kết quả là một đối tượng dữ liệu logic (đúng hoặc sai) - Gán trị: Cũng như phép gán tổng quát, phép gán của số nguyên có thể trả về hoặc không trả về một giá trị Sự cài đặt Kiểu dữ liệu nguyên hầu hết được cài đặt một cách trực tiếp bằng cách dùng sự biểu diễn bộ nhớ được xác định bởi phần cứng và tập hợp các phép tính số học, các phép toán... Phần lớn việc phát hiện và phục hồi lỗi trong một trình biện dịch tập trung vào giai đọan phân tích cú pháp Vì thế, bộ xử lý lỗi (error handler) trong quá trình phân tích cú pháp phải đạt mục đích sau: Ghi nhận và thông báo lỗi một cách rõ ràng và chính xác Phục hồi lỗi một cách nhanh chóng để có thể xác định các lỗi tiếp theo Không làm chậm tiến trình của một chương trình đúng */ Các chiến lược... giá trị “NULL” Tùy thuộc vào kiểu của biến mà giá trị NULL này sẽ có một giá trị cụ thể, ví dụ nếu là biến số thì NULL là 0, nếu là biến chuỗi kí tự thì NULL là chuỗi rỗng, nếu biến là logic thì NULL là FALSE - Khởi tạo biến ngay sau khi nó vừa được tạo ra là một cách lập trình tốt và trong một số ngôn ngữ mới đều cung cấp phương tiện để làm điều này một cách dễ dàng Trong ngôn ngữ Pascal một biến được... biết đặc điểm của kiểm tra kiểu tĩnh, ưu và nhược điểm của kiểm tra kiểu tĩnh - Thông tin về kiểu của các ĐTDL phải được cung cấp cho bộ dịch Bộ biên dịch tập hợp thông tin từ khai báo trong chương trình vào trong bảng danh biểu (symbol table) nơi chứa thông tin về kiểu của các biến và chương trình con - Ưu điểm: tất cả các nhánh chương trình, các phép toán đều được kiểm tra nên không bỏ sót các lỗi... chương trình con - Khi chương trình được thực thi, chương trình chính được thực hiện đầu tiên Trong thời gian thực thi, chương trình chính có thể gọi các CTC thực hiện Và mỗi CTC này, đến lượt nó, lại có thể gọi các chương trình con khác thực hiện - CTC không được đệ qui - Cần có các phát biểu gọi tường minh - CTC phải được hoàn thành ở mỗi lần gọi - Điều khiển được chuyển ngay tức thời ở điểm gọi - Trình . thay vì biên dịch mã ngu n thành mã máy hoặc thông dịch mã ngu n khi chạy, Java được thi t kế để biên dịch mã ngu n thành bytecode, bytecode sau đó sẽ được môi trường thực thi (runtime environment). trình gọi là siêu ngôn ngữ (Meta language) 777 Khái niệm ngôn ngữ học của GS. Nguyễn Thi n Giáp (tr.377) - Vai trò: Nó có vai trò quan trọng trong quá trình thi t kế ngôn ngữ lập trình: Cú pháp. Microsoft phát triển C# dựa trên C++ và Java. C# được miêu tả là ngôn ngữ có được sự cân bằng giữa C++, Visual Basic, Delphi và Java. C# được thi t kế chủ yếu bởi Anders Hejlsberg kiến trúc sư phần mềm