Căn cứ vào đặc điểm hiện nay của các ngôn ngữ đã biết các nhà ngôn ngữ học phân các ngôn ngữ thành các loại hình sau (phân loại ngôn ngữ theo loại hình):
Ngôn ngữ hòa kết (flexional): loại hình này bao gồm các ngôn ngữ: Đức, Latin, Hy Lạp, Anh, Pháp, Nga, Arập.
Ngôn ngữ chắp dính (agglutinate): loại hình này có hiện tượng cứ nối tiếp thêm một các máy móc, cơ giới vào căn tố nào đó của một hay nhiều phụ tố; mà mỗi phụ tốđó lại chỉ luôn mang lại một ý nghĩa ngữ pháp nhất định. Ví dụ: Thổ Nhĩ Kỳ, Mông Cổ, Nhật Bản, Triều Tiên, …
Ngôn ngữ đơn lập (isolate): còn gọi là ngôn ngữ phi hình thái, không biến hình, đơn tiết, phân tiết, … Loại hình này bao gồm các ngôn ngữ: Việt, Hán, một số nước ở vùng Đông Nam Á, …
Ngôn ngữđa tổng hợp (polysynthetic): còn gọi là ngôn ngữ hỗn nhập hay lập khuôn. Đây là loại mang những đặc điểm của các lọai hình nói trên.
Để nghiên cứu từ vựng của ngôn ngữ người ta đưa ra một bộ môn gọi là từ vựng học (lexicology).
Các loại hình ngôn ngữ và các từ vựng của từng ngôn ngữ rất phức tạp. Do vậy việc nắm được các quy luật của từng bộ từ vựng của từng ngôn ngữ là đều hết sức khó khăn. Việc phân tích một cụm từ để phát âm thì càng phức tạp hơn, liên quan đến lĩnh vực ngôn ngữ học và khoa học máy tính.
Đối với các ngôn ngữ thuộc loại hình đơn lập như tiếng Việt, một số từ điển được xây dựng trên Desktop hiện nay đã giải quyết phần phát âm cho ngôn ngữ thuộc loại hình đơn lập bằng cách thu âm từng tiếng riêng lẻ tạo thành một thư viện âm thanh (tiếng Việt khoảng 10.000 tiếng). Khi đó để phát âm một cụm từ ta sẽ phân tích cụm từ này thành những “tiếng” riêng lẻ rồi dựa vào thư viện âm thanh mà phát âm. Trong ứng dụng của chúng em sẽ sử dụng đến kỹ thuật phát âm này cho tiếng Việt.
Đối với các ngôn ngữ thuộc loại hình hòa kết như tiếng Anh, ta không thể làm giống như cách đã làm đối với tiếng Việt được vì số lượng từ rất lớn (tiếng Anh có khoảng 400.000 tiếng), hơn nữa tùy theo cấu trúc ngữ pháp mà cùng một từ có thể phát âm khác nhau. Ta phải sử dụng cách khác đó là dựa vào các quy tắc có được khi nghiên cứu về tự vựng học. Đây rõ ràng là công việc kết hợp giữa ngôn ngữ học và khoa học máy tính. Để phát âm được tiếng Anh, các từ điển trên Desktop (sử dụng hệ điều hành Microsoft Windows) hiện nay sử dụng bộ SDK Text To Speech
của Microsoft. Với bộ SDK này công việc lập trình phát âm đã trở nên đơn giản hơn rất nhiều. Tuy nhiên đối hệ điều hành Symbian, hiện nay chưa có bộ thư viện nào hỗ trợ phát âm giống như vậy. Chúng em đề nghị một giải pháp là trên máy chỉ lưu âm thanh của những “tiếng” thông dụng (kỹ thuật này được chúng em gọi là Text To Speech Offline), khi chương tình không tìm thấy âm thanh trên máy thì sẽ kết truy cập đến chương trình trên sever (xây dựng với bộ SDK Text To Speech của Microsoft) yêu cầu lấy dữ liệu âm thanh về (kỹ thuật này được chúng em gọi là Text To Speech Online).