c – 在多态类中避免虚拟表

根据
this page,Microsoft的扩展属性__declspec(novtable)“阻止编译器生成代码以初始化类的构造函数和析构函数中的vfptr …使用这种形式的__declspec可以导致代码大小的显着减少.”

我用Visual Studio 2013 update 4,发布配置,x64编译了下面的代码,然后我获得了后面显示的汇编代码.

struct __declspec(novtable) textEmpty
{
    virtual void fs() = 0;
};

struct textEmpty2
{
    virtual void fs() = 0;
};

struct Y : textEmpty
{
    void fs() override;
};

void Y::fs()
{
    wcout << sizeof( * this ) << endl;
}

struct Y2 : textEmpty2
{
    void fs() override;
};

void Y2::fs()
{
    wcout << sizeof( * this ) << endl;
}

int main()
{
    Y * d_ = new Y;
    Y2 * d_2 = new Y2;
    d_->fs();
    d_2->fs();
    return 0;
}
    Y * d_ = new Y;
mov         ecx,8
call        operator new (07FF7AEED1090h)
test        rax,rax
je          main+26h (07FF7AEEA2A66h)
lea         rdx,[Y::`vftable' (07FF7AEF189B0h)]
mov         qword ptr [rax],rdx
    Y2 * d_2 = new Y2;
mov         ecx,8
call        operator new (07FF7AEED1090h)
lea         rcx,[Y2::`vftable' (07FF7AEF189C0h)]
test        rax,rax
cmove       rcx,qword ptr [rax]
mov         qword ptr [rax],rcx

问题1.我在两个构造函数中计算相同数量的指令.鉴于微软关于减少代码大小的__declspec(novtable)的说法,我错过了什么?

问题2.在汇编代码中,Y2 * d_2 = new Y2;,第三行修改RCX,第五行也是如此. RCX未在第四行中使用.我缺少副作用吗?

更新编译标志位于下方,是,/ O2已设置.此外,我尝试禁用语言扩展并启用它.结果是一样的.

/GS /GL /W3 /Gy /Zc:wchar_t /Zi /Gm- /O2 /sdl /Fd”x64\Release\vc120.pdb” /fp:precise /D “WIN32” /D “NDEBUG” /D “_CONSOLE” /D “_LIB” /D “_UNICODE” /D “UNICODE” /errorReport:prompt /WX- /Zc:forScope /Gd /Oi /MT /Fa”x64\Release\” /EHsc /nologo /Za /Fo”x64\Release\”

最佳答案 好问题.我会试一试……

问题#1:

__declspec(novtable)确实减少了代码大小,但仅适用于具有该属性的类,如文档所指定:

In many cases, this removes the only references to the vtable that are
associated with the class and, thus, the linker will remove it. Using
this form of __declspec can result in a significant reduction in code
size.

这意味着您不会在子类中看到此效果.我已将您的代码修改为:

struct __declspec(novtable) textEmpty {
    virtual void fs() {};
};
struct textEmpty2 {
    virtual void fs() {};
};
struct Y : textEmpty {
    void fs() override;
};
void Y::fs() {
    wcout << sizeof(*this) << endl;
}
struct Y2 : textEmpty2 {
    void fs() override;
};
void Y2::fs()     {
    wcout << sizeof(*this) << endl;
}
int main() {
    textEmpty* e = new textEmpty;
    textEmpty2* e2 = new textEmpty2;
    Y * d_ = new Y;
    Y2 * d_2 = new Y2;
    d_->fs();
    d_2->fs();
    return 0;
}

汇编语言输出是:

    textEmpty* e = new textEmpty;
000000013FFB12BA  mov         ecx,8  
000000013FFB12BF  call        qword ptr [__imp_operator new (013FFB3178h)]  
    textEmpty2* e2 = new textEmpty2;
000000013FFB12C5  mov         ecx,8  
000000013FFB12CA  call        qword ptr [__imp_operator new (013FFB3178h)]  
000000013FFB12D0  test        rax,rax  
000000013FFB12D3  je          main+2Fh (013FFB12DFh)  
000000013FFB12D5  lea         rcx,[textEmpty2::`vftable' (013FFB3348h)]  
000000013FFB12DC  mov         qword ptr [rax],rcx  
    Y * d_ = new Y;
000000013FFB12DF  mov         ecx,8  
000000013FFB12E4  call        qword ptr [__imp_operator new (013FFB3178h)]  
000000013FFB12EA  mov         rdi,rax  
000000013FFB12ED  test        rax,rax  
000000013FFB12F0  je          main+4Eh (013FFB12FEh)  
000000013FFB12F2  lea         rax,[Y::`vftable' (013FFB32F0h)]  
000000013FFB12F9  mov         qword ptr [rdi],rax  
000000013FFB12FC  jmp         main+50h (013FFB1300h)  
000000013FFB12FE  xor         edi,edi  
    Y2 * d_2 = new Y2;
000000013FFB1300  mov         ecx,8  
000000013FFB1305  call        qword ptr [__imp_operator new (013FFB3178h)]  
000000013FFB130B  mov         rbx,rax  
000000013FFB130E  test        rax,rax  
000000013FFB1311  je          main+6Fh (013FFB131Fh)  
000000013FFB1313  lea         rax,[Y2::`vftable' (013FFB3300h)]  
000000013FFB131A  mov         qword ptr [rbx],rax  
000000013FFB131D  jmp         main+71h (013FFB1321h)  
000000013FFB131F  xor         ebx,ebx  

现在有意义吗?当在具有novtable的类(即textEmpty)上调用new时,编译器不会生成vftable指针初始化代码.另一方面,其他三个没有novtable属性的类的新语句会生成vftable指针初始化代码.

问题2:

出于某种原因,我的编译器会输出不同的东西这是我的旗帜:

/GS /GL /W3 /Gy /Zc:wchar_t /Zi /Gm- /O2 /Fd”x64\Release\vc120.pdb”
/fp:precise /D “WIN32” /D “NDEBUG” /D “_CONSOLE” /D “_LIB” /D
“_UNICODE” /D “UNICODE” /errorReport:prompt /WX- /Zc:forScope /Gd /Oi
/MD /Fa”x64\Release\” /EHsc /nologo /Fo”x64\Release\”
/Fp”x64\Release\sotestaaa.pch”

我的输出没有像输出那样的测试和cmove行:

test        rax,rax
cmove       rcx,qword ptr [rax]

但这些线基本上转化为

 if (rax == 0) mov rcx, [rax]

如果你问我这真是太愚蠢了.如果rax == 0(即new返回0),那些行将导致空指针异常.如果rax不为0,则代码不执行任何操作.

同样,我的编译器VS 2013(12.0.21005.1 REL)不生成该代码.

还要注意我的输出是明智的.当novtable存在时,它只是做一个新的,没有别的.当novtable不存在时,它会有一个新的.如果new的结果不为null,则它将vftable的地址设置为正确的内存位置(由new返回).

还要注意,因为在c代码中,我们在d和d_2之后立即调用fs(),编译器足够聪明,可以将指向d和d_2的指针保存到临时寄存器中,以便以后使用:

保存d:

  mov         rdi,rax

保存d_2:

  mov         rbx,rax 
点赞