今天，你被编译器耍了么？

5669

博文分类

闲谈 (66)

蜜语年月

一些页面

热评文章

情侣统计

日志总数： 66 篇
建站天数：5475 天
评论总数：530 爪
页面总数： 1 页
标签总数：0 个
博友人数： 41015 人

友情小窝

今天，你被编译器耍了么？

小明 2011-11-14 4,243 views

你以为你很会耍小聪明，你以为你的代码能优化性能，事实真的如此么？答：You’re Fucked!
请看如下HLSL代码：

for(int x=-1; x<=1; x+=2)

for(int y=-1; y<=1; y+=2)

for(int z=-1; z<=1; z+=2)

{

float3 vOffset = normalize(float3(x, y, z))*offsetScale;

}

看到这里，你有没有想过可能的优化呢，一个if语句2个GPU时钟，很多人都不挺地告诫你，慎用分支语句。于是，你写下了下面的代码：

#define NUM_OFFSET_VECTORS 27

const float3 OFFSET_VECTOR[NUM_OFFSET_VECTORS] = {

float3(-1,-1,-1),

float3(-1,-1,1),

float3(-1,-1,3),

float3(-1,1,-1),

float3(-1,1,1),

float3(-1,1,3),

float3(-1,3,-1),

float3(-1,3,1),

float3(-1,3,3),

float3(1,-1,-1),

float3(1,-1,1),

float3(1,-1,3),

float3(1,1,-1),

float3(1,1,1),

float3(1,1,3),

float3(1,3,-1),

float3(1,3,1),

float3(1,3,3),

float3(3,-1,-1),

float3(3,-1,1),

float3(3,-1,3),

float3(3,1,-1),

float3(3,1,1),

float3(3,1,3),

float3(3,3,-1),

float3(3,3,1),

float3(3,3,3)

};

for(int j=0; j<NUM_OFFSET_VECTORS; j++)

{

float3 vOffset = normalize(OFFSET_VECTOR[j])*offsetScale;

}

我只用了224个常量寄存器中的27个，就减少了2层分支，这下帧速应该上去了吧，为什么帧速反而下降了呢？
因为你丫被编译器骗了！

“优化”后的代码

“优化”前的代码
编译器把你“优化”后的代码直接展开了，就是它确实没有做条件分支，而是重复了27边相同的GPU指令！！！
“优化”前它帮你编译出95条指令，优化后它帮你编出了466条指令！！！
Compiler likes a box of chocolate, you never know what you will get!

http://blog.csdn.net/itlmy/article/details/6968881

本站遵循:署名-非商业性使用-相同方式共享
本文标题：今天，你被编译器耍了么？
订阅地址：小明家
转载请注明：http://xiaomingjia.com/?p=71