AVS變長(cháng)解碼的DSP優(yōu)化 AVS變長(cháng)解碼的DSP優(yōu)化

AVS變長(cháng)解碼的DSP優(yōu)化

  • 期刊名字:計算機工程與應用
  • 文件大?。?25kb
  • 論文作者:于新濤,張宏波,馬磊
  • 作者單位:山東大學(xué),山大魯能信息科技有限公司
  • 更新時(shí)間:2020-09-30
  • 下載次數:次
論文簡(jiǎn)介

Computer Engineering and Applications計算機工程與應用2008 ,44(20) 93AVS變長(cháng)解碼的DSP優(yōu)化于新濤',張宏波1,馬磊1.2YU Xin- -tao',ZHANG Hong- -be' ,MA Leil21.山東大學(xué)信息科學(xué)與工程學(xué)院,濟南2501002.山大魯能信息科技有限公司,濟南2501001.School of Information Science and Engineering, Shandong University ,Ji' nan 250100, China2.Shanda Luneng Infomation Technology Co. ,Ldd,Ji' nan 250100,ChinaE-mail:yxt433@126.comYU Xin -tao,ZHANG Hong -bo,MA Lel.Optimization of AVS variable length decoding on DSP .Computer Engineeringand Applications ,2008,44(20):93-95.Abstract: The part of AVS variable length decoding is optimized based on DM642.The accessing method is changed accordingto the property of Exp-Golomb code.By altering the loop structure and assigning the registers appropriately ,the compiler canprocess an efctive software pipeline.The executive time is deduced by 30% afer optimization, which satisfies the requirements ofreal-time decoding of standard definition video sequences.Key words: Audio Video coding Standard(AVS);variable lengh decoding;Exp- Golomb;software pipeline摘要:在 DM642上對AVS變長(cháng)解碼部分進(jìn)行了優(yōu)化。針對指數哥倫布碼的特性調整了存儲器訪(fǎng)問(wèn)的方式,并通過(guò)對循環(huán)結構的調整及寄存器資源的合理分配使編譯器能夠進(jìn)行高效的軟件流水編排。經(jīng)過(guò)優(yōu)化后代碼執行時(shí)間降低了70%以上,達到了標清尺寸實(shí)時(shí)解碼要求。關(guān)鍵詞:AVS;變長(cháng)解碼;指數哥倫布碼;軟件流水DOI: 10778/jis.100 8331.2008.20.029文 章編號:1002- 8331(2008)20-0093-03文獻標識碼:A 圖分類(lèi) 號:TP301.61引言databits.其中k為階數。對于k階指數哥倫布碼,根據下式進(jìn)行AVS標準(Audio Video coding Standard)是我國制定的擁解析:有自主知識產(chǎn)權的音視頻編解碼標準,在IPTV、視頻監控等領(lǐng)CodeNum=2"* -2 +databits(1)域有著(zhù)廣泛的應用。AVS編碼效率是MPEG- 2的2~3倍,優(yōu)于在A(yíng)VS標準中規定了19個(gè)變長(cháng)碼表",不同的碼表決定國際上的MPEC-4 AVCH.264. 而且方案簡(jiǎn)沽,復雜度低于了ce(v )所用的指數哥倫布碼的階數。H.264,在高清部分處于領(lǐng)先地位。AVS 基本類(lèi)標準于2006年2.2變長(cháng)碼解碼2月正式成為中國國家標準".目前處于產(chǎn)業(yè)化階段,其中AVS由CodeNum做索引生成Level .Run的過(guò)程如圖1所示。標清/高清芯片的研發(fā)與實(shí)現是其中重要的工作。從碼流中讀取并解析CodeNum得到變換系數(rans_ coef-本文在TI公司的DM642平臺上對AVS解碼器中的變長(cháng)ficient)。 如果變換系數的值小于59,則以該系數為索引查表求解碼部分進(jìn)行了優(yōu)化,并且給出了Emulator. 上的仿真結果。得Level、Run的值并分別存入buf_ Jevel .buf run數組中。否則,需要解析下一個(gè)CodeNum,得到轉逸系數差值(es-2 AVS 變長(cháng)解碼的主要流程cape_ Jevel dif)。在A(yíng)VS變長(cháng)解碼中,采用了基于指數哥倫布的自適應變由變換系數確定Run的值:長(cháng)編碼技術(shù)。對于宏塊編碼數據,解碼器首先用0階.1階.2階n= trans. coff-59(2)或3階指數哥倫布碼進(jìn)行ce(v )解析.然后根據所得語(yǔ)法元素查表得到量化系數值( level)和游程( Run)。Lervel的模值由轉逸系數和RefAbsLevel確定,Level的符號由2.1指數哥倫布碼及 ce(v )語(yǔ)法元素解析變換系數的奇偶決定:指數哥倫布碼的比特串分為前綴和后綴兩部分。前綴由mlevel=中國煤化工”rons cof為奇數)(3)個(gè)“0"和1個(gè)分隔符"I"組成,后綴有mth個(gè)比特,記作二s_ cof為偶數)MYHCNMHG作者簡(jiǎn)介:于新濤( 1981-),男,碩上研究生,主要研究領(lǐng)域為視頻編解碼與DSP應用:張宏波(1984-),男,碩士研究生,主要研究領(lǐng)域為視頻編解碼;馬磊( 1960-).男.教授,研究生導師,主要研究領(lǐng)域為信號處理及嵌入式開(kāi)發(fā)。收稿日期:007-10-09修回 日期:208 -01-2194 2008 ,44(20)Computer Engineering and Applications計算機工程與應用初始3.2.2變長(cháng)解碼部分軟件流水的優(yōu)化軟件流水線(xiàn)技術(shù)用來(lái)對一個(gè)循環(huán)結構的指令進(jìn)行調度安。解析排,使之成為多重迭代循環(huán)并行執行。在編譯代碼時(shí),可以選擇CodeNum編譯器的-o2或o3選項,使編澤器將根據程序盡可能地安排traons. cofficient軟件流水線(xiàn)。' CodeNum(2)堿少冗余計算。對于幀內幀間或亮度塊的系數提取thile(trans coef?] =EOB)fran_ cof EOB其循環(huán)的公共操作如計算哥倫布階數等,放到循環(huán)外部執行。END一方面避免了重復的運算,另-方面減少了循環(huán)內部的代碼長(cháng)度,有利于軟件流水的編排。圍1宏塊系敷變長(cháng)碼解碼的流程圖(3)改變程序結構,拆分for循環(huán)。其中RefAbsLevel與式(2)中求得的Run有關(guān),當Run大于由于亮度系數的復朵性以及塊系數個(gè)數的不確定性,對變MaxRun時(shí),RefAbsLevel等于1;否則以Run為索引查表求得長(cháng)解碼流程中的循環(huán)往往難以進(jìn)行流水編排。 造成流水失敗的RefAbsLevelo原因有以下幾種:保存Level .Run之后,更新碼表的表號,繼續解析下一個(gè)圖I所示的變長(cháng)碼解碼的循環(huán)中,判斷變換系數是否小于塊系數,直到變換系數值等于EOB時(shí)跳出循環(huán)。59處出現了i-.se..分*支語(yǔ)句。由于每個(gè)跳轉指令有5個(gè)延遲間隙,使得程序執行時(shí)間延長(cháng);另外循環(huán)內跳轉也使軟件流3AVS變長(cháng)解碼的DSP實(shí)現與優(yōu)化水受到阻塞。3.1 DSP 實(shí)現平臺同時(shí),由于循環(huán)中的代碼過(guò)長(cháng),而且在碼表切換等處多次變長(cháng)解碼所采用的DSP平臺為T(mén)I公司的TMS320DM642/用到條件寄存器,使得循環(huán)體內寄存器不夠分配,?從而導致系C64x系列芯片,具有第二代高性能的超長(cháng)指令字結構Veloei-統編譯器無(wú)法實(shí)現循環(huán)的pipelineoTI.2,在8個(gè)功能單元里擴展了88條新的指令以增強其在視對于大部分的AVS編碼碼流,其宏塊殘差系數中變換系頻圖像應用中的性能,并提高了視頻處理的并行性。數小于59的比例占了90%以上,如表1所示。將AVS工作組提供的參考代碼m52j移植到DM642上,表1 不同碼流中亮度塊(幀內、幀間)系數<59的概率統計并通過(guò)以太網(wǎng)口傳送解碼輸出圖像。在優(yōu)化的過(guò)程中,主要是IntraInler發(fā)揮C64x芯片的并行性特點(diǎn)對數據進(jìn)行處理,并且通過(guò)對數測試序列<59≥59<59 ≥59據存儲結構以及程序架構的調整,使編譯器更好地進(jìn)行軟件流fobll 94.21% 5.79% 93.77% 6.239cctv. live 97.24% 2.76% 96.65% 3.35%水,以提高解碼的效率。mobile96.86% 3.14% 96.90% 3.10%3.2 DSP 優(yōu)化凹Morvie 1800k 98.52% 1.48% 97.57% 2.43%.2.1 指數哥倫布解碼的優(yōu)化對指數哥倫布解碼部分的優(yōu)化主要基于兩點(diǎn):( 1)存儲器當變換系數大于等于59時(shí),計算其對應的Level.Run以及更新碼表的操作都要比小于59時(shí)的情況復雜得多。根據這訪(fǎng)問(wèn)的優(yōu)化;(2 )使用內聯(lián)指令(intrinsic)。在A(yíng)VS工作組參考代碼中,指數哥倫布解碼部分的碼流-特點(diǎn),本文把 trans. coff<59 的情況單獨拆分出來(lái),即從復雜讀取是逐比特進(jìn)行的。而對C6000的存儲器進(jìn)行訪(fǎng)問(wèn)是很費循環(huán)中拆分出一個(gè)較小的簡(jiǎn)單循環(huán)。用偽代碼表示如下:時(shí)的,要提高數據處理效率,應使1條Load/Store指令能夠訪(fǎng)d問(wèn)多個(gè)數據。所以,在DSP程序中,對變長(cháng)解碼部分的碼流讀for( ;trans. coff<59 && != EOB;)取部分進(jìn)行了改進(jìn)。對于每個(gè)要解碼的系數,一次讀入32 bit到寄存器中進(jìn)行處理(itle Edian 模式下還要進(jìn)行4字節倒序中國煤化工的操作)。使用內聯(lián)指令. Jmbd(Ox1 ,buf[. _bits )來(lái)判斷前綴“0”YHCNMHG的個(gè)數,然后通過(guò)移位操作讀取dabits,按照公式(1 )進(jìn)行指Processing:escpe- Jevel. dif數哥倫布解析。使用內聯(lián)指令加以改編,可以大幅度減少循環(huán))while(rans_ coff!= EOB)體執行的指令周期數。(4)用邏輯判斷語(yǔ)句替代f-.語(yǔ)句,減少跳轉語(yǔ)句。把于新濤,張宏波,馬磊:AVS變長(cháng)解碼的 DSP優(yōu)化2008 ,44(20)95if結構用條件運算表達式進(jìn)行改寫(xiě),最后使循環(huán)可以pipeline。進(jìn)行03級別的優(yōu)化(STEP- -3)。此時(shí)觀(guān)察asm反饋信息,得知(5)減少中間變量。避免對存儲器的冗余存取,減少寄存器編譯器多次嘗試軟件流水均未成功。通過(guò)3.2.2中(3)(4)的方的使用數目,利于對循環(huán)做出更進(jìn)一一步的優(yōu)化。法調整循環(huán)結構,可以實(shí)現流水編排(STEP- 4)。(5)(6)進(jìn)步降(6)利用數據打包解包減少存取時(shí)間。Level Run分別保低了循環(huán)體內部的數據存取時(shí)間,使編譯器做出了更好的優(yōu)化。存在兩個(gè)數組中.增加了寄存器的存儲時(shí)間?,F將二者打包存變長(cháng)解碼的優(yōu)化為解碼器最終達到實(shí)時(shí)解碼奠定了基礎。放在一個(gè)int32型的數組中,在反]描反量化時(shí)再進(jìn)行解包。經(jīng)對于當前網(wǎng)絡(luò )帶寬條件下所能傳送的大部分碼流,變長(cháng)解碼占測試,存儲所用時(shí)間有所降低,而后續進(jìn)程中(反掃描部分)讀解碼理想總時(shí)間的比例都能夠控制在2%以下,達到了預期的取所耗費的時(shí)間基本不變。經(jīng)過(guò)上述調整,可以使編譯器對占變換系數絕大部分比例目標。同時(shí),對于更高碼率的碼流,仍需要進(jìn)-步地優(yōu)化,以適應未來(lái)IPTV技術(shù)的發(fā)展需求。的小于59循環(huán)內進(jìn)行軟件流水,提高了解碼效率。表3不同碼嗽測汰序列變 長(cháng)解碼所占比例4實(shí)驗結果及結論測試序列NSCC Ad Muvie CCTV Jive Foball幀數50本文在CCS2.21環(huán)境下對AVS變長(cháng)解碼部分的程序進(jìn)行尺寸720x576 720>x576 720x576 702x480優(yōu)化,并且在XDS510 Emulator. 上進(jìn)行了仿真,測試序列選用碼率/(Mb/s)1.471.761.3910.88了從I Mb/s到15 Mb/s的不同碼率的標清尺寸AVS碼流。解碼達實(shí)時(shí)(30 fs)所需總時(shí)間/ms26672933 2 867表2記錄了foball序列( 704x480,碼率10.88 Mb/s,50幀)變長(cháng)解碼時(shí)間/ms_79.5121.9 91.6198.9各優(yōu)化階段的變長(cháng)解碼函數占用時(shí)間。參考文獻: .表2各階段優(yōu)化后的變長(cháng)解碼部分喃數時(shí)間[1] AVS工作組CB1200090.2 -2006信息技術(shù)一先 進(jìn)音視頻編碼STEPCPU時(shí)鐘周期Clk函數時(shí)間/ms第2部分:視頻S].2006.1.使用-01 優(yōu)化406252.284677.1[2]陳光法.姚立敏,虞露.AVS熵解碼與DSP實(shí)現[小電視技術(shù),20042.指數哥倫布優(yōu)化300,578.6255009(10):43-46.3.使用-03編譯選項260,613.528434.44.使循環(huán)pipline196,977 ,493328.3(3]李方慧:TMS320C6000系列DSPs原理與應用[M].2版北京:電子工5.其他軟件流水優(yōu)化119.342.005業(yè)出版社2005.[4]楊陽(yáng).基于OMAP平臺的AVS解碼實(shí)現![小J電子設計應用,2006(4):通過(guò)3.2.1中的方法對哥倫布解碼部分的優(yōu)化(STEP-2),90-93.使得解碼器對變長(cháng)編碼數據的處理效率大為提高。再經(jīng)過(guò)3.2.[51]畢厚杰新-代視頻壓縮編碼標準- H.264/AVC[M.北京:人民郵電2中的(1)(2)處理,使循環(huán)滿(mǎn)足使用軟件流水的條件,對程序出版社,2005.(上接50頁(yè))i3 仿真結果達到最優(yōu)解未達到最優(yōu)解仿真最優(yōu)解送代次數用時(shí)/___達到最優(yōu)解次數_ 最差次優(yōu)解最好次優(yōu)解QEAQAIQEAHQAHQA IQEA HQAIQEA HQA7 0387.801.240.2320Car2 7166 94.53 9.95 17.75 0.35 173767226Car37312 114.00 23.93 20.20 0.83 2157491 7 3997328 7 366Can4800386.7219.8019.950.768008772090.2910.89 14.300.31197732Carf6 8505 65.23 8.79 8.22 0.22 131S570 8570 8570 857Car76590 15.165.951.500.1266458 36635.5511.424.060.29_2084248 424項指標上突出,就得在別的指標上付出代價(jià),相對而言,HQA參考文獻:性能最好,各項指標都比較穩定。[1]陸曉亮,胡蘇太量子計算機的發(fā)展現狀和趨勢J]高性能計算發(fā)展與應用, 2006(1):7-11.[2] Kuk -Hyun Han,Jong -Hwan Kim.Genetic quantum algorithm and5結束語(yǔ)its application to combinatorial optimization problem[CV/Proceed-采用具有并行性的量子比特的編碼方式,借鑒微粒群算法ngs of the 2000 IEEE Congress on Evolutionary Computation,的搜索特性,引進(jìn)經(jīng)典進(jìn)化計算的優(yōu)化理念,合成了一種新型00的自適應算法一混合 量子算法。從原理上說(shuō)明了該算法在尋[3]麥克中國煤化工北京:中國水利水電出優(yōu)方面的可用性,以及在組合優(yōu)化問(wèn)題中的實(shí)用性,并將其應YHCNMH G,4]云慶復進(jìn)化異次[]孔爾;舊五工業(yè)出版性, 2000: 148-151.用于置換flow shop 問(wèn)題,其測試結果表明該算法具有種群小、[5]楊溆嬡,劉芳,焦李成.量子進(jìn)化策略[小電子學(xué)報,2001 ,29(12):迭代次數少.用時(shí)少等優(yōu)點(diǎn),并且克服了QEA的不足之處,具1873-1877.有實(shí)用價(jià)值。6]曾建潮,介婧,崔志華,微粒群算法(M]北京:科學(xué)出版社2004:3- 4.

論文截圖
版權:如無(wú)特殊注明,文章轉載自網(wǎng)絡(luò ),侵權請聯(lián)系cnmhg168#163.com刪除!文件均為網(wǎng)友上傳,僅供研究和學(xué)習使用,務(wù)必24小時(shí)內刪除。
欧美AAAAAA级午夜福利_国产福利写真片视频在线_91香蕉国产观看免费人人_莉莉精品国产免费手机影院