根据
this page,Microsoft的扩展属性__declspec(novtable)“阻止编译器生成代码以初始化类的构造函数和析构函数中的vfptr …使用这种形式的__declspec可以导致代码大小的显着减少.”
我用Visual Studio 2013 update 4,发布配置,x64编译了下面的代码,然后我获得了后面显示的汇编代码.
struct __declspec(novtable) textEmpty
{
virtual void fs() = 0;
};
struct textEmpty2
{
virtual void fs() = 0;
};
struct Y : textEmpty
{
void fs() override;
};
void Y::fs()
{
wcout << sizeof( * this ) << endl;
}
struct Y2 : textEmpty2
{
void fs() override;
};
void Y2::fs()
{
wcout << sizeof( * this ) << endl;
}
int main()
{
Y * d_ = new Y;
Y2 * d_2 = new Y2;
d_->fs();
d_2->fs();
return 0;
}
Y * d_ = new Y;
mov ecx,8
call operator new (07FF7AEED1090h)
test rax,rax
je main+26h (07FF7AEEA2A66h)
lea rdx,[Y::`vftable' (07FF7AEF189B0h)]
mov qword ptr [rax],rdx
Y2 * d_2 = new Y2;
mov ecx,8
call operator new (07FF7AEED1090h)
lea rcx,[Y2::`vftable' (07FF7AEF189C0h)]
test rax,rax
cmove rcx,qword ptr [rax]
mov qword ptr [rax],rcx
问题1.我在两个构造函数中计算相同数量的指令.鉴于微软关于减少代码大小的__declspec(novtable)的说法,我错过了什么?
问题2.在汇编代码中,Y2 * d_2 = new Y2;,第三行修改RCX,第五行也是如此. RCX未在第四行中使用.我缺少副作用吗?
更新编译标志位于下方,是,/ O2已设置.此外,我尝试禁用语言扩展并启用它.结果是一样的.
/GS /GL /W3 /Gy /Zc:wchar_t /Zi /Gm- /O2 /sdl /Fd”x64\Release\vc120.pdb” /fp:precise /D “WIN32” /D “NDEBUG” /D “_CONSOLE” /D “_LIB” /D “_UNICODE” /D “UNICODE” /errorReport:prompt /WX- /Zc:forScope /Gd /Oi /MT /Fa”x64\Release\” /EHsc /nologo /Za /Fo”x64\Release\”
最佳答案 好问题.我会试一试……
问题#1:
__declspec(novtable)确实减少了代码大小,但仅适用于具有该属性的类,如文档所指定:
In many cases, this removes the only references to the vtable that are
associated with the class and, thus, the linker will remove it. Using
this form of __declspec can result in a significant reduction in code
size.
这意味着您不会在子类中看到此效果.我已将您的代码修改为:
struct __declspec(novtable) textEmpty {
virtual void fs() {};
};
struct textEmpty2 {
virtual void fs() {};
};
struct Y : textEmpty {
void fs() override;
};
void Y::fs() {
wcout << sizeof(*this) << endl;
}
struct Y2 : textEmpty2 {
void fs() override;
};
void Y2::fs() {
wcout << sizeof(*this) << endl;
}
int main() {
textEmpty* e = new textEmpty;
textEmpty2* e2 = new textEmpty2;
Y * d_ = new Y;
Y2 * d_2 = new Y2;
d_->fs();
d_2->fs();
return 0;
}
汇编语言输出是:
textEmpty* e = new textEmpty;
000000013FFB12BA mov ecx,8
000000013FFB12BF call qword ptr [__imp_operator new (013FFB3178h)]
textEmpty2* e2 = new textEmpty2;
000000013FFB12C5 mov ecx,8
000000013FFB12CA call qword ptr [__imp_operator new (013FFB3178h)]
000000013FFB12D0 test rax,rax
000000013FFB12D3 je main+2Fh (013FFB12DFh)
000000013FFB12D5 lea rcx,[textEmpty2::`vftable' (013FFB3348h)]
000000013FFB12DC mov qword ptr [rax],rcx
Y * d_ = new Y;
000000013FFB12DF mov ecx,8
000000013FFB12E4 call qword ptr [__imp_operator new (013FFB3178h)]
000000013FFB12EA mov rdi,rax
000000013FFB12ED test rax,rax
000000013FFB12F0 je main+4Eh (013FFB12FEh)
000000013FFB12F2 lea rax,[Y::`vftable' (013FFB32F0h)]
000000013FFB12F9 mov qword ptr [rdi],rax
000000013FFB12FC jmp main+50h (013FFB1300h)
000000013FFB12FE xor edi,edi
Y2 * d_2 = new Y2;
000000013FFB1300 mov ecx,8
000000013FFB1305 call qword ptr [__imp_operator new (013FFB3178h)]
000000013FFB130B mov rbx,rax
000000013FFB130E test rax,rax
000000013FFB1311 je main+6Fh (013FFB131Fh)
000000013FFB1313 lea rax,[Y2::`vftable' (013FFB3300h)]
000000013FFB131A mov qword ptr [rbx],rax
000000013FFB131D jmp main+71h (013FFB1321h)
000000013FFB131F xor ebx,ebx
现在有意义吗?当在具有novtable的类(即textEmpty)上调用new时,编译器不会生成vftable指针初始化代码.另一方面,其他三个没有novtable属性的类的新语句会生成vftable指针初始化代码.
问题2:
出于某种原因,我的编译器会输出不同的东西这是我的旗帜:
/GS /GL /W3 /Gy /Zc:wchar_t /Zi /Gm- /O2 /Fd”x64\Release\vc120.pdb”
/fp:precise /D “WIN32” /D “NDEBUG” /D “_CONSOLE” /D “_LIB” /D
“_UNICODE” /D “UNICODE” /errorReport:prompt /WX- /Zc:forScope /Gd /Oi
/MD /Fa”x64\Release\” /EHsc /nologo /Fo”x64\Release\”
/Fp”x64\Release\sotestaaa.pch”
我的输出没有像输出那样的测试和cmove行:
test rax,rax
cmove rcx,qword ptr [rax]
但这些线基本上转化为
if (rax == 0) mov rcx, [rax]
如果你问我这真是太愚蠢了.如果rax == 0(即new返回0),那些行将导致空指针异常.如果rax不为0,则代码不执行任何操作.
同样,我的编译器VS 2013(12.0.21005.1 REL)不生成该代码.
还要注意我的输出是明智的.当novtable存在时,它只是做一个新的,没有别的.当novtable不存在时,它会有一个新的.如果new的结果不为null,则它将vftable的地址设置为正确的内存位置(由new返回).
还要注意,因为在c代码中,我们在d和d_2之后立即调用fs(),编译器足够聪明,可以将指向d和d_2的指针保存到临时寄存器中,以便以后使用:
保存d:
mov rdi,rax
保存d_2:
mov rbx,rax