波多在线播放_激情深爱五月_久久欧美精品_成人超碰_国产久_www.pixiv.moe

以文本方式查看主題

-  曙海教育集團論壇  (http://www.022-oo.cn/bbs/index.asp)
--  DSP6000系統開發  (http://www.022-oo.cn/bbs/list.asp?boardid=29)
----  TMS320C6000嵌入式系統優化編程的研究  (http://www.022-oo.cn/bbs/dispbbs.asp?boardid=29&id=1624)

--  作者:wangxinxin
--  發布時間:2010-11-22 14:08:03
--  TMS320C6000嵌入式系統優化編程的研究
使用匯編語言進行編程時特別需要注意的是C6000指令的延遲情況,有些指令并不是立刻就能得到結果。C6000指令集中有延遲的指令如表1所示。

表1 C6000的有延遲指令

圖片點擊可在新窗口打開查看

例1 32位歸一化函數morm_1()
short morm_1(long L_var1)
{short var_out;
if (L_var1= = 0L){
var_out = (short)0;
}
else {
if (L_var1= = (logn)0xffffffffL{
var_out = (short)31;
}
else {
if (L_var1< 0L) {
L_var1 = ~L_var1;
}
for(var_out=(short)0;L_var1<(long)0x40000000L;
var_out++){
L_var1 <<= 1L;
}}}
return(var_out);
}
使用匯編語言進行優化;
.global norm_1
_norm1:
B B3
CMPEQ 0,A4,B0
[!B0] NORM A4,A4
NOP 3
消耗時間(時鐘周期):C語言norm_1()為723;匯編語言為11。

2.2 使用線性匯編語言重寫整個函數

對于某些以循環體為主的函數可以使用線性匯編語言重寫整個函數。使用匯編優化器進行優化之后,效率是非常高的。

下面例子是算法中計算幀能量的函數,其中包含兩個單循環體。進行優化時,首先要確定循環的次數。對于循環次數是變量的情況,優化器不進行并行優化;其次盡量減少數據存取次數,例如以32位存取指令對16位數據進行存取,可以節省一增的存取周期。仔細觀察C代碼,會發現兩次循環次數相同。第二個循環要用到第一個循環的結果,因此可以將兩個循環合并在一起,這樣就避免了在第二個循環中再從存儲器中取結果,減少了一半的Load操作。

Long Comp_En(short *Dpnt)
{ int i;
long Rez;
short Temp[60];
for (i=0;i<60;i ++) Temp [i] = shr(Dpnt[i],(short) 2);
Rez=(long) 0;
for (i=0; i <60; i ++) Rez=L_mac(Rez,Temp[i],Temp[i]);
return Rez;
}
相應的線性匯編程序如下:
.global _Comp_En ;函數名定義,對c變量前加_
_Comp_En .cproc Dpnt;函數頭定義,Dpnt是參數
.reg Rez,Rez1,Rez2,1 ;寄存器定義,不必考慮實際的寄存器分配
.reg t1,t2,x1,c1,m1,m2
zero Rez
zero Rez1
zero Rez2
mv Dpnt,c1
mvk 30,i ;確定循環次數。因為用LDW代替LDH,循五環次數減少一半。
loop1 .trip 30
ldw *c1++,x1
sh1 x1,16,t1
shr t1,2,t1
shr x1,2,t2 ;將兩個循環合在一起,又減少了一半的從內存取數據的時間。
smpyh t1,t1,m1
smpyh t2,t2,m2
sadd Rez1,m1,Rez1
sadd Rez2,m2,Rez2
[i] sub i,1,i ;循環計數器從30遞減
[i] b loop1
sadd Rez1,Rez2,Rez
.return Rez
.endproc
消耗時間(時鐘周期):C語言為32971;線性匯編語言為93。

2.3 使用線性匯編改寫復雜函數中的循環體

當函數的邏輯關系復雜,判斷、跳轉、函數調用情況特別多時,上面方法的效果就會在打折扣。這時可以使用線性匯編將其中的循環部分改寫成一個函數,以優化后的函數調用代替環部分,而不是優化整個復雜函數。

高速數字信號處理器件的應用范圍越來越廣,特別是在移動通信領域中,軟件無線電、智能天線等新技術的實都需要強大的實時數字信號處理的支持。TMS320C6000系列DSP完全可以滿足此類要求。但目前對于并行DSP技術的軟硬件開發還處在摸索階段,如何充分利用高速DSP的資源,是這方面的研究重點。本文研究了最新推出的TMS320C6000的優化策略,從工程和系統的角度總結出一套既能滿足實時性又能保證開發時效性的實用的優化編程方法,以供分饗。

主站蜘蛛池模板: 先锋影音av最新资源 | avtom影院 首页亚洲 | 一级毛片私人影院老司机 | 成人黄性视频 | 尤物国产在线精品福利一区 | 国产在线第一区 | 99精品国产福利在线观看 | 日韩欧美中文字幕在线观看 | 亚洲国产aⅴ成人精品无吗 国内成人自拍视频 | 婷婷激情综合色五月久久竹菊影视 | 国产亚洲女人久久久久久 | 精品成人佐山爱一区二区 | 一区二区三区在线免费看 | 亚洲情综合五月天 | 天天色天天射天天操 | 二级黄绝大片中国免费视频 | 久久天堂色 | 亚洲精品一区二区三区婷婷月色 | 免费高清伧理片午夜伧理片 | 爱视频福利网 | 欧美成人综合在线 | 在线观看的av | 国产深夜福利视频在线 | 成年在线视频免费视频观看 | 精品视频一区二区观看 | 免费一区二区三区 | 日日日日干 | 久久久无码精品亚洲日韩按摩 | 国产成人自拍视频在线观看 | 天天操天天干天天操 | 精品欧美一区二区三区在线 | 国产精品国产三级国产aⅴ原创 | 久久免费看少妇高潮A片JA小说 | 天天做天天爱夜夜爽女人爽宅 | 亚洲国产精品无码AV久久久 | 69性影院在线观看国产精品87 | 久久xxx| 91色在线| 97天堂 | 国产精品资源在线观看网站 | 国产精品久久一区二区三区 |