Một ngôn ngữ hình thức được định nghĩa như một tập các chuỗi kí tự, trong đó mỗi chuỗi kí tự là một chuỗi các biểu tượng được lấy ra từ một tập hữu hạn được gọi là biểu tượng terminal. Một trong những phiền toái khi làm việc với cả ngôn ngữ tự nhiên và ngôn ngữ hình thức là có quá nhiều sự khác biệt hình thức và kí hiệu cho việc viết ngữ pháp. Tuy nhiên, hầu hết chúng đều tương tự như cách mà chúng căn cứ vào ý tưởng của cấu trúc cụm từ - các chuỗi kí tự được soạn thảo của các chuỗi kí tự cơ sởđược gọi là cụm từ, dẫn đến các phạm trù khác nhau. Các phạm trù như cụm danh từ, cụm động từ, câu được gọi là biểu tượng nonterminal. Trong kí pháp BNF quy luật viết phù hợp của biểu tượng nonterminal đơn ở bên trái và liên kết của đầu cuối hoặc không
đầu cuối viết ở bên phải. Quy luật được viết như trong ví dụ sau: S → NP VP
Có nghĩa là chúng ta có thểđem bất kì cụm từ NP thêm vào sau bất kì cụm từ VP và kết quả là một cụm từ dạng câu.
Các bước thành phần của giao tiếp:
Một đoạn giao tiếp điển hình, trong đó người nói S muốn truyền đạt lời thông báo P đến người nghe H sử dụng từ W, được sắp xếp trong 7 tiến trình. Ba bước đối với người nói:
Mục đích : S muốn H tin P (trong đó S đặc biệt tin P)
Phát sinh : S chọn từ W (bởi vì chúng nhấn mạnh nghĩa của P) Tổng hợp : S phát âm từ W ( thường chuyển thẳng chúng đến H) Bốn bước đối với người nghe
Nhận thức : H nhận thức W’( W’=W, nhưng mất nhận thức là có thể)
Phân tích : H suy luận W’ có thể mang các nghĩa P1…,Pn (từ và cụm từ có thể có nhiều nghĩa)
Ý nghĩa hóa : H suy luận rằng S có ý định truyền đạt Pi (trong đó ý nghĩa Pi=P, nhưng sự mất giải thích là có thể)
Hợp nhất : H quyết định tin tưởng vào Pi, (hoặc loại bỏ nó nếu nó không được H chắc chắn tin tưởng)