Phõn tớch xử lý SR

Một phần của tài liệu Mã turbo trong DSP ứng dụng trong WCDMA (Trang 73 - 88)

Cỏc chức năng xử lý tớn hiệu SR bao gồm:

-Mó húa và giải mó kờnh FEC: gồm bộ mó húa/giải mó CRC, xoắn và turbo. -Đan xen/giải đan xen: cú thể cú hai mức đan xen trước và sau khi ghộp

kờnh.

-Ghộp/giải ghộp tốc độ. -Ghộp kờnh/tỏch kờnh.

-MRC kờnh: đối với mục đớch của nghiờn cứu này thỡ chỳng được xem xột trong phõn tớch xử lý CR khi chỳng cú quan hệ khộp kớn.

Cỏc chức năng quan trọng nhất của DSP là hai loại giải mó kờnh: giải mó xoắn và giải mó turbo. Giải mó xoắn được sử dụng cho cỏc khung tốc độ số liệu thấp như là thoại, trong khi đú giải mó turbo được sử dụng cho cỏc khung tốc độ cao như video. Mặc dự việc giải mó kờnh cú vẻ rất phự hợp với việc thực hiện trờn một DSP mục đớch chung, nhưng nú thường được thực hiện trong cỏc ASIC ngoài để hiệu quả về mặt chi phớ và tổng trễ xử lý thấp hơn. Giải mó xoắn được bổ sung trong cỏc bộđồng xử lý do số lượng lớn cỏc kờnh tốc độ thấp cần được mó húa, trong khi đú giải mó turbo đũi hỏi quỏ nhiều phộp tớnh đối với cỏc DSP ngày nay. Phõn tớch sau sử dụng hai kịch bản chung để so sỏnh giải phỏp chỉ sử dụng phần mềm (DSP cho tất cả cỏc chức năng) với giải phỏp DSP+ FCP.

1. Hỗ trợ cho cỏc kờnh thoại 64 x 8 Kbps (81 bit, lớp A, cỏc khung AMR). 2. Hỗ trợ cho cỏc kờnh số liệu 4 x 384 Kbps.

Bảng 3.1 chỉ ra kết quả phõn tớch cho cỏc kịch bản này. Mỗi kịch bản cú thể hiểu rằng chỉ cho một xử lý SR cần hơn 1000MHz của một DSP 4MAC/chu kỳ

Đỗ Tun Anh 73 ĐTVT_2008-2010

giống như TMS3320C64xTM. Vỡ vậy, một giải phỏp được đề xuất là sẽ làm tăng cỏc tài nguyờn DSP với cỏc bộ đồng xử lý mềm dẻo. Giải phỏp sử dụng cỏc FCP này tạo ra tần số khoảng 118 MHz. Điều này làm giảm 10 lần tải xử lý. Cỏc FCP giải mó kờnh này cú thể được thực hiện bờn ngoài, cũn chi phớ, cụng suất và hiệu suất cú thể tối ưu hơn bằng việc tớch hợp cỏc bộđồng xử lý mềm dẻo trờn DSP và thiết kế chỳng để mang lại sự tiến bộ của kiến trỳc DSP.

Bảng 4.1: Cỏc phõn tớch tốc độ ký hiệu cho hai kịch bản để so sỏnh phương phỏp chỉ sử dụng DSP với phương phỏp DSP + FCP. 64 x 8 kbps 4 x 384 kbps C64x (MHz) C64x+FCPs (MHz) C64x (MHz) C64x+FCPs (MHz) Bộ nhớ Mó húa tốc độ ký hiệua 29 29 53 53 5 Mbits (số liệu) Giải mó tốc độ ký hiệu (ngoài cỏc bộ mó húa xoắn và Turbo) 17 17 16.5 16.5 20 kbytes (Pgm)

Bộ mó húa xoắn 211 ~2c N/A N/A 18 kbytes (số

liệu)

Bộ mó húa Turbo N/A N/A ~800+ ~5d 46 kbytes (số

liệu)

Chỉ DSP tổng ~257 ~870

DSP tổng + cỏc bộ

đồng xử lý ~48 ~75

aMó húa tốc độ ký hiệu bao gồm: Bộ mó húa CRC, bộ mó húa xoắn hoặc turbo, đan xen mức 1, ghộp tốc độ, đan xen mức 2, ghộp (cho thoại).

bGiải mó tốc độ ký hiệu bao gồm: Giải đan xen mức 2, tỏch (kờnh), giải ghộp tốc độ, giải đan xen mức 1, kiểm tra CRC. Cỏc yờu cầu bộ giải mó xoắn và turbo được chỉ riờng ra khi so sỏnh cỏc thực hiện phần cứng và phần mềm.

Đỗ Tun Anh 74 ĐTVT_2008-2010

cCho điều khiển trong DSP và 20% của một bộ đồng xử lý Viterbi chạy tại C64x CPU/4.

dCho điều khiển DSP và 10% của một bộđồng xử lý mềm dẻo chạy tại C64x CPU/2.

4.3.2 Phõn tớch xử lý CR

Xử lý CR bao gồm nhiều chức năng. Trờn đường lờn, bộ giải trải phổ RAKE, bộ tỡm kiếm truy nhập và lưu lượng, sự ước tớnh kờnh và MRC là chiếm nhiều thủ tục trong một giõy nhất. Cỏc chức năng khỏc (bắt, ấn định ngún, DLL) được xem xột như cỏc chức năng điều khiển và khụng yờu cầu nhiều cụng suất xử lý. Trong đường xuống, chức năng quan trọng nhất là bộ trải phổ. Bộ trải phổ cũng được thực hiện trong phần cứng. Như đó giải thớch trong phần 3.2, khối tớnh tớnh toỏn BTS được chi phối bởi bộ thu đường lờn, vỡ vậy bộ trải phổđường xuống khụng được đề cập trong phõn tớch này.

4.3.2.1 Phõn tớch bộ thu đường lờn

Bộ giải trải phổ RAKE và cỏc bộ tỡm kiếm truy nhập/lưu lượng sử dụng thao tỏc cơ bản giống nhau: giả tạp õm (PN) và giải trải phổ hàm Walsh. Thao tỏc này bao gồm việc tạo cỏc chuỗi Walsh và giả tạp õm được định thời hợp lý và thực hiện sự tương quan giữa cỏc chuỗi được tạo ra và cỏc chuỗi chip đến. Cỏc tương quan này được thực hiện tại CR. Bộ giải trải phổ RAKE và bộ tỡm kiếm truy nhập/lưu lượng cũng thực hiện ước tớnh năng lượng và tớch lũy khụng kết hợp, nhưng cỏc chức năng này yờu cầu cụng suất xử lý thấp hơn cỏc tương quan.

Thuật toỏn ước tớnh kờnh sẽ quyết định cỏc hệ số hiệu chỉnh pha cần dựng trong MRC. Thuật toỏn ước tớnh kờnh dựa trờn một bộ lọc trung bỡnh đa khe theo trọng số (WMSA) và tớnh phức tạp của bộ lọc này là tớnh phức tạp của một FIR hoạt động trờn một khe cơ sở (đang xem xột một hệ số hiệu chỉnh pha trờn mỗi khe). Sử dụng cỏc hệ số hiệu chỉnh pha được tớnh toỏn trước cho mỗi đường, MRC cú thể tỏi kết hợp tất cả cỏc đường với nhau để cung cấp cỏc ký hiệu tới phần xử lý SR. MRC thực hiện một phộp nhõn phức trờn mỗi đường (nhõn phức của tớn hiệu giải trải phổ

Đỗ Tun Anh 75 ĐTVT_2008-2010

với hệ số hiệu chỉnh pha) và sau đú cộng tất cả cỏc ký hiệu đó được hiệu chỉnh lại với nhau để cung cấp cỏc ký hiệu đó kết hợp cho cỏc chức năng xử lý SR cũn lại. Thụng thường MRC chạy tại SR; đú là một phộp nhõn phức được thực hiện tại SR. Khi đú tốc độ này cú thể cao hơn do việc thay đổi hoặc khụng biết cỏc hệ số trải phổ.

Nhưđó núi từ trước, tốc độ chip của tiờu chuẩn 3G là 3,6864 Mcps cho IS-2000 và 3,84 Mcps cho 3GPP. Rừ ràng, cỏc tốc độ chip cao này làm tăng số lượng cỏc thao tỏc trong một giõy cần thiết cho việc xử lý CR. Khi xem xột cỏc tốc độ chip này và số lượng người sử dụng yờu cầu được hỗ trợ (như được chỉ ra bởi cỏc nhà sản xuất trạm gốc) cụng suất xử lý cần cho bộ giải trải phổ RAKE và bộ tỡm kiếm truy nhập/lưu lượng nằm trong phạm vi của 10-30 GOPS cho 64 người sử dụng. Như đó núi trong phần trước, nú sẽ yờu cầu nhiều DSP hiệu suất cao để thực hiện cỏc chức năng bộ thu CR đường lờn đa kờnh của một hệ thống CDMA. Vỡ vậy, cú vẻ như một phương phỏp dựa vào phần mềm hoàn toàn để xử lý CR là khụng thể thực hiện mà vẫn hiệu quả về mặt chi phớ. (adsbygoogle = window.adsbygoogle || []).push({});

4.3.2.2 Sử dụng một bộđồng xử lý

Để hỗ trợ một số lượng lớn người sử dụng trờn mỗi DSP, một giải phỏp phần cứng là cần thiết cho xử lý CR để tối thiểu chi phớ. Giải phỏp này cú thể tạo ra một bộ đồng xử lý tương quan ASIC bờn ngoài cho DSP. Tuy nhiờn, nú phải cú tớnh mềm dẻo. Để cung cấp một mức mềm dẻo cao cho giải phỏp, cỏc chức năng thực hiện trờn bộ đồng xử lý phải nằm dưới sự điều khiển của DSP, phải cung cấp một mức cao về khả năng lập trỡnh và phải được tham số húa tốt.

Một CCP cú thể được bổ sung để hỗ trợ DSP trong cỏc chức năng CR cho giải trải phổ RAKE và tỡm kiếm truy nhập/lưu lượng. Tớnh mềm dẻo cú thểđược duy trỡ theo một cỏch hiệu quả về mặt chi phớ bằng việc thiết kế cẩn thận tớnh mềm dẻo nhờ một số phương phỏp khỏc nhau, tạo thành khối tương quan. DSP cú thể lập trỡnh CCP nhờ sử dụng một tập cỏc thao tỏc hoặc cỏc lệnh. CCP này được thảo luận trong phần sau.

Đỗ Tun Anh 76 ĐTVT_2008-2010

Tớnh mềm dẻo trong giải phỏp chung cú thể đạt được một phần bằng việc cho phộp sự ước tớnh kờnh và MRC được thực hiện trong phần mềm trờn DSP. Tương tự như vậy, DSP thực hiện tất cả cỏc nhiệm vụđiều khiển như ấn định ngún, khụi phục định thời và hiệu chỉnh dựa trờn cỏc kết quả được thực hiện từ CCP. Tớnh mềm dẻo này cho phộp cỏc nhà thiết kế hệ thống thực hiện cỏc thuật toỏn và phương phỏp riờng để tăng hiệu suất. Nú cũng cho phộp cỏc thay đổi và nõng cấp về sau. Sự ước tớnh kờnh chỉ là một vớ dụ của một chức năng, cú thểđược thực hiện bằng phương phỏp được cải tiến sẽ làm tăng hiệu suất.

Bảng 3.2 chỉ ra cỏc yờu cầu tớnh toỏn CR cơ bản, giả thiết 64 người sử dụng với 4 hướng cho mỗi người sử dụng. Hai trường hợp được đưa ra: chỉ sử dụng DSP TMS320C64xTM và sử dụng DSP kết hợp với CCP. CCP là một bộ phận của một lớp cỏc FCP được mụ tả trong phần sau.

Bảng 4.2: Phõn tớch CR so sỏnh phương phỏp chỉ DSP với phương phỏp DSP + CCP cho cỏc chức năng quan trọng C64x (BOPS hay MHz) C64x + CCP (MHz) Bộ nhớ Bộ giải trải phổ RAKE (CCP)a ~10 BOPS Khụng đỏng kể 3 Mbits Bộ tỡm kiếm truy nhập/lưu lượng (CCP)b ~20 BOPS Khụng đỏng kể 1 Mbits MRC 200 MHz 200 5 Mbits Ước tớnh kờnh dựa trờn WMSA 10 MHz 10 64 Kbits Cỏc chức năng điều khiển (bắt, ấn định ngún, dũ tỡm,…) 20 MHz 20 80 Kbits

aBộ giải trải phổ RAKE được ước tớnh để thực hiện 250 K cổng trong CCP tại tần số 80 MHz.

bBộ tỡm kiếm truy nhập/lưu lượng được ước tớnh để thực hiện 275 K cổng trong CCP tại tần số 80 MHz.

Đỗ Tun Anh 77 ĐTVT_2008-2010

Khỏi niệm FCP dưới đõy là để ghộp giữa ý tưởng của việc tăng tốc độ phần cứng với ý tưởng tớnh mềm dẻo đỏng kể của chức năng triển khai, cú lẽ là tới bỏn lập trỡnh. Điều này bao gồm chiến lược phỏt triển được nhận thức tốt và cỏc giao diện hiệu quả với DSP lừi, cả tại mức vật lý và cỏc mức hoạt động cao hơn. Đối với kiến trỳc trạm gốc 3G, một giải phỏp rất đắc lực và hiệu quả về chi phớ đó được đưa ra bằng việc thực hiện một DSP TMS320C64xTM với 3 FCP: Bộ giải mó Viterbi, bộ giải mó Turbo và CCP. Những thành phần này được mụ tả trong cỏc phần dưới đõy. Thờm vào đú, một bộ xử lý truyền thụng DSP mới của Texas Instruments là TMS320C6416TM, kết hợp bộ giải mó Viterbi và bộ giải mó Turbo theo một hỡnh thức ghộp chặt với chớnh DSP.

4.4.1 Bộđồng xử lý giải mó xoắn Viterbi

Một bộ giải mó Viterbi thường được sử dụng để giải mó cỏc mó xoắn sử dụng trong cỏc ứng dụng vụ tuyến. Thuật toỏn này bao gồm hai bước: 1- tớnh toỏn trạng thỏi hoặc cỏc ma trận hướng phỏt thụng qua biểu đồ lưới của mó; 2- sử dụng cỏc kết quả lưu trữ từ bước 1, thực hiện hướng ngược, nhờ số liệu này để xõy dựng từ mó giống nhất với từ mó được phỏt (được hiểu là dũ tỡm). Việc tớnh toỏn ma trận trạng thỏi đũi hỏi tớnh toỏn dũ tỡm sõu hơn và chủ yếu bao gồm cỏc toỏn tử cộng, so sỏnh và lựa chọn (ACS). Một thao tỏc ACS quyết định giỏ trị tiếp theo của mỗi ma trận trạng thỏi trong biểu đồ lưới và thực hiện thao tỏc này bằng việc lựa chọn kết quả lớn nhất của hai ma trận thớch hợp, một ma trận từ mỗi nhỏnh nhập vào trạng thỏi. Cỏc ma trận thớch hợp đến từ việc cộng ma trận nhỏnh tương ứng với ma trận trạng thỏi tương ứng trước đú. Cỏc ma trận nhỏnh nhận được từ số liệu thu được sẽ được giải mó. Thờm vào đú, thao tỏc ASIC lưu trữ nhỏnh được chọn để sử dụng trong quỏ trỡnh xử lý dũ tỡm.

Đỗ Tun Anh 78 ĐTVT_2008-2010

Hỡnh 4.2: Kiến trỳc mức cao bộđồng xử lý giải mó Viterbi

Kiến trỳc mức trờn của bộ đồng xử lý Viterbi mềm dẻo (VCP) được chỉ ra trong hỡnh 3.2 và bao gồm ba khối chớnh: khối ma trận trạng thỏi, khối dũ tỡm và khối giao diện DSP. Khi hoạt động tại tần số 80 MHz (160 MHz cho bộ nhớ của nú), khối ma trận trạng thỏi cú thể thực hiện 320x106 thao tỏc ACS trờn giõy, và VCP cú thể giải mó tại tốc độ 2,5Mbps. Điều này là tương đương với trờn 200 kờnh thoại cho cỏc hệ thống vụ tuyến 3G.

Để hoàn thành điều này trong khi giảm băng thụng bộ nhớ ma trận tới mức đủ hợp lý thỡ cấu trỳc xếp tầng trong hỡnh 3.3 được thực hiện. Thực tế, cấu trỳc này hoạt động trờn một cơ số 16 biểu đồ lưới con (16 trạng thỏi trờn 4 tầng) và vỡ vậy bỏ quả I/O bộ nhớ cho 3 trong 4 tầng biểu đồ lưới dẫn đến giảm 75% băng thụng. Đường số liệu này kết hợp một thanh ghi trao đổi duy nhất nhờ 4 bit đường biểu đồ lưới (được gọi là tiền dũ tỡm). Cỏc đoạn 4 bit sẽ khụng cần dũ tỡm nhiều, chỳng cú thể được sử dụng như cỏc phần trọn vẹn trong xử lý dũ tỡm. Điều này cho phộp dũ tỡm nhanh hơn. Cấu trỳc xếp tầng này cũng cú thể hoạt động tại cỏc chiều dài đó được giảm (giảm số lượng cỏc tầng); cụ thể là 3 tầng, 2 tầng, hoặc là 1 tầng. Tương tự như vậy trao đổi thanh ghi kết hợp tương ứng giống như trờn sẽ đem lại cỏc kết quả tiền dũ tỡm của cựng chiều dài bit.

Đỗ Tun Anh 79 ĐTVT_2008-2010

Hỡnh 4.3: Đường số liệu tầng cơ số 16 của tớnh toỏn ma trận trạng thỏi

Khối dũ tỡm hoạt động theo kiểu truyền thống để trở lại đường tắt. Điều này liờn quan đến chu kỳ lặp của việc đọc bộ nhớ dũ tỡm để thu được đoạn từ yờu cầu, phản ỏnh cỏc quyết định đường ưu tiờn, dịch cỏc đoạn từ này vào thanh ghi chỉ số trạng thỏi đểđịnh dạng chỉ số trạng thỏi tiếp theo cho dũ tỡm, và sử dụng số liệu này để định dạng địa chỉ bộ nhớ. Tuy nhiờn, thiết kế của chỳng ta cú thể di chuyển ngược lại 4 tầng tại một thời điểm nhờ tiền dũ tỡm đó đề cập ở trờn.

Tớnh mềm dẻo là một mục đớch quan trọng trong thiết kế của VCP. Nú cú thể hoạt động trờn thanh ghi dịch đơn cỏc mó xoắn với chiều dài K = 9, 8, 7, 6, 5; và cỏc tỷ lệ mó 1/2, 1/3, và 1/4. Cỏc đa thức xỏc định cho mó mong muốn được nhập vào. VCP cũng cho phộp chớch mẫu bất kỳ, cú cỏc phương phỏp tham số húa để nhõn chia cỏc khung cho dũ tỡm, vỡ vậy về cơ bản kớch thước khung khụng phải là vấn đề quan trọng. Và khoảng cỏc độ hội tụ cú thể được chỉ ra cho cỏc khung đó phõn chia. Do đú, thực hiện VCP hầu như cú thể giải mó được mó xoắn mong muốn bất kỳ tỡm thấy trong cỏc tiờu chuẩn vụ tuyến 2G, 2,5G và 3G.

Thao tỏc hiệu quả với một DSP cũng cú thể đạt được bởi bộ nhớ gắn với thiết bị, bằng việc cho phộp cỏc chuyển đổi số liệu khối tới đầu vào và/hoặc đầu ra đồng thời với việc giải mó, và bằng việc cung cấp nhiều đường tớn hiệu khỏc nhau cho sự đồng bộ DSP/DMA.

Bộ giải mó này rất nhỏ nhưng thụng lượng rất cao nờn nú hiệu quả về mặt chi phớ hơn một phương phỏp phần mềm. Điều này giải phúng DSP để xử lý nhiều kờnh hơn và/hoặc thực hiện cỏc thuật toỏn truyền thụng tiến bộ hơn.

Đỗ Tun Anh 80 ĐTVT_2008-2010

Cỏc bộ mó húa turbo được sử dụng trong cả hai tiờu chuẩn vụ tuyến 3GPP và IS-2000. Cỏc bộ mó húa turbo được biểu diễn trong hỡnh 3.4 cú thể nhận được hiệu suất BER=10-6 tại SNR=1,5dB. Bộ mó húa turbo bao gồm hai bộ mó húa xoắn hệ

Một phần của tài liệu Mã turbo trong DSP ứng dụng trong WCDMA (Trang 73 - 88)