Phụ thuộc vào cấu hình, kích thước PU nội bộ trong HEVC có phạm vi từ 4x4 tới 64x64. Với mỗi kích thước, các hướng dự đoán có thể được chọn từ nhiều nhất 35 chế độ. Do số lượng lớn các chế độ, chi phí tìm kiếm sẽ cao. Để giảm chi phí, ta đề xuất thuật toán nội dự đoán nhanh, cái sẽ làm giảm 2/3 tổng các chế độ được ước lượng trên mỗi kích thước PU. Chỉ một số lượng giới hạn các chế độ được tìm kiếm với ngân sách thời gian và tài nguyên hạn chế.
Đầu tiên, ta giả sử quỹ tính toán là C. Ta sẽ tìm chế độ dự đoán tốt nhất trong quỹ tính toán của C chế độ. Nếu chi phí tìm kiếm chế độ đạt giới hạn, tìm kiếm sẽ dừng lại. Kết quả tốt nhất được lấy làm chế độ dự đoán. Để thực hiện tìm kiếm có hiệu quả, ta sử dụng một thuật toán tìm kiếm nhanh hai bước. Trong bước đầu tiên, ta thực hiện tìm kiếm thô. Ta tìm kiếm toàn bộ phạm vi các hướng nhưng với kích thước bước góc là /8. Ta nhận được chi phí cho mỗi chế độ. Trong bước thứ hai, tìm kiếm sàng lọc được thực hiện tại các chế độ lân cận góc chưa tìm mà ở quanh chế độ tốt nhất trong số các chế độ đã tìm ở bước thứ nhất. Chế độ tốt nhất được cập nhật sau mỗi lần tìm kiếm. Sau đó, tìm kiếm toàn diện được thực hiện cho các chế độ còn lại cho tới khi quỹ đạt giới hạn. Bằng cách sử
dụng thuật toán này, số lượng của các chế độ tìm kiếm được giảm xuống còn 1/3 của tìm kiếm đầy đủ với tốc độ BD tăng không đáng kể.
Các chế độ trong PU kích thước 64x64 bị bỏ qua trong nội dự đoán nhanh. Lợi ích chính từ kích thước PU lớn là cho chế độ liên đới. Khi kích thước khung tăng lớn hơn, khu vực trong cùng đối tượng hoặc với chuyển động đồng nhất có thể được dự đoán tốt và mã hóa một cách kinh tế với kích thước khối lớn. Tuy nhiên, PU kích thước lớn ít hữu dụng trong nội bộ. Thực tế, PU kích thước 64x64 hiếm khi được chọn (ít hơn 1%). Do đó, nội dự đoán kích thước 64x64 không quan trọng và có thể bị loại bỏ. Với sự loại bỏ nội dự đoán kích thước 64x64, tập hợp bổ sung của DCT và SRAM cho nội dự đoán kích thước 64x64 được tiết kiệm.