c – 为什么boost :: circular_buffer在我的基准测试中这么慢?

阅读
rationale,boost :: circular_buffer看起来很有希望:

Suitability for real-time and performance critical applications.

Fast constant-time insertion and removal of elements from the front and back.

当我运行一个模拟我的用例的简单基准测试时,将其用作字节缓冲区:

>写一个更大的块
>读取较小的块直到空
>重复一遍

性能绝对糟糕,比我自己的hack和spsc_queue慢了超过4000x.

lin : 101  // 10240x
lock: 109  // 10240x
circ: 427  // 10x

请注意,circular的loopcount为10,其他的loopcount为10 * 1024.参见工作示例here.

我使用它是完全错误还是只是没有设计基本/ POD类型?

编辑:

采用提供的更改的基准测试并不能完全解决MSVC2015上的问题.还有100倍的因素.

lin : 69   // 10240x
lock: 79   // 10240x
circ: 9688 // 10240x 

一次插入几个项目是如此之慢是有问题的.分配将在此特殊情况下起作用,因为缓冲区在插入之前已耗尽,但这不是一般解决方案.在恢复中,spsc_queue在所有前端获胜,其快速,可以在不耗尽的情况下使用,并且可以在多线程环境中使用(在单个生产者单个消费者场景中).

最佳答案 首先,确保基准测试是合理的.如果您不使用计算结果,编译器会在您最不期望的时候将其作为死代码消除.

>你的循环删除看起来不是最理想的.请改用:

buffer.erase_begin(1024); // or indeed, use checked size see below

UPDATE

>第二件影响性能的事情 – 严重 – 是插入调用.在你的用例中,你可以使用assign,就像在竞争者中一样,被编译成mempcy或memmove.
>确保禁用调试(定义NDEBUG和/或BOOST_CB_DISABLE_DEBUG)

这是我使用Noniushttp://paste.ubuntu.com/15222217/的重构基准

时钟分辨率:平均值为18.6412 ns(40960002次迭代)

benchmarking linear
collecting 100 samples, 1 iterations each, in estimated 3.93727 s
mean: 39.0804 ms, lb 39.0567 ms, ub 39.1051 ms, ci 0.95
std dev: 124.19 μs, lb 111.153 μs, ub 141.079 μs, ci 0.95
found 0 outliers among 100 samples (0%)
variance is unaffected by outliers

benchmarking lockfree
collecting 100 samples, 1 iterations each, in estimated 4.78513 s
mean: 37.0188 ms, lb 37.0106 ms, ub 37.0277 ms, ci 0.95
std dev: 43.5788 μs, lb 37.3685 μs, ub 52.8458 μs, ci 0.95
found 3 outliers among 100 samples (3%)
variance is unaffected by outliers

benchmarking circular
collecting 100 samples, 1 iterations each, in estimated 9.78763 s
mean: 62.884 ms, lb 62.8657 ms, ub 62.9041 ms, ci 0.95
std dev: 98.0325 μs, lb 85.6543 μs, ub 119.395 μs, ci 0.95
found 1 outliers among 100 samples (1%)
variance is unaffected by outliers

互动结果:http://stackoverflow-sehe.s3.amazonaws.com/57c2bfea-3e9d-4503-8d23-3b88209fc3ce/stats.html

《c – 为什么boost :: circular_buffer在我的基准测试中这么慢?》

没有nonius:Live On Coliru

产量

lin : 101 (checksum: -1741910392)
lock: 89 (checksum: -1741910392)
circ: 102 (checksum: -1741910392)
点赞