RTP là giao thức giao vận thời gian thực chạy trên UDP. RTP được sử dụng trong các ứng dụng truyền thông đa phương tiện thời gian thực để truyền dữ liệu đa phương tiện. Các đoạn audio/video được tạo bởi phía gửi của ứng dụng đa phương tiện, được phía gửi chèn header vào và được đóng gói trong gói tin RTP. Các trường quan trọng trong header như: Kiểu mã hóa, trường số thứ tự, trường nhãn thời gian và các trường khác. Mỗi gói RTP lại được đóng gói vào trong gói UDP và được truyền đi. RTP cung cấp dịch vụ cho các ứng dụng đa phương tiện, nó được xem như là lớp con của tầng giao vận [2].
Hình 2.6. RTP có thể được xem như là một thành phần của tầng giao vận Trên cách nhìn của người phát triển ứng dụng, RTP không phải là phần của tầng giao vận mà là của tầng ứng dụng, đó là vì người phát triển phải tích hợp RTP vào ứng dụng. Tại phía gửi của ứng dụng, nhà phát triển phải viết code để đóng gói tin RTP, rồi gửi nó tới giao diện socket UDP. Tương tự phía nhận, gói tin RTP khi qua giao diện socket UDP, người phát triển viết code để đọc các đoạn dữ liệu đa phương tiện từ gói tin RTP.
Hình 2.7. RTP cũng có thể được xem như là một phần của tầng ứng dụng Chúng ta cần lưu ý rằng, RTP không cung cấp các cơ chế đảm bảo phân phối gói tin đúng thời gian hay cơ chế đảm bảo chất lượng dịch vụ khác. Các dịch vụ mà RTP cung cấp là đóng gói gói tin RTP trong header của gói tin có các trường quan trọng như: Kiểu mã hóa, số thứ tự, nhãn thời gian để từ đó các ứng dụng bên trên có các cơ chế làm tăng chất lượng dịch vụ của ứng dụng. Việc đóng gói RTP được thực hiện ở các hệ thống cuối, không phải ở các router trung gian. Router không phân biệt được gói tin IP chứa gói RTP và gói tin IP không chứa gói RTP.
Trong một phiên Video Conference giữa 2 người, 4 luồng RTP được mở: 2 luồng cho truyền âm thanh (theo 2 hướng, mỗi hướng một luồng), 2 luồng truyền video (theo 2 hướng, mỗi hướng một luồng). Nếu kết hợp cả audio và video vào 1 luồng (như chuẩn MPEG1, MPEG2) thì chỉ cần 2 luồng RTP (mỗi hướng một luồng).
Gói tin RTP không chỉ được truyền unicast, nó có thể được gửi theo cơ chế multicast theo kiểu một-nhiều, nhiều-nhiều.