我已经将一些任务转换为在动态后端上运行.
任务无声地失败[没有记录错误,没有重试,没有] ~20%的时间(最小值:10%,最大值:60%,样本:大,长期).将任务从后端切换回来会恢复重试并将故障率恢复到~0%.
有任何想法吗?
最佳答案 将其转换为后端会加剧问题但不是问题.
我指定了task_retry_limit,队列是推送队列.使用后端指定实例数. (我相信你可以通过快速增加请求来复制这个问题在大家的前面).
任务失败503:实例在达到task_retry_limit之前不可用.这在“任务队列”中暂时可见,但不会显示在“日志”中.
我应该使用拉队列.即使我的用例是愚蠢的,我可能会因为多个503而导致任务死亡:实例不可用记录某些东西,因此它看起来不像幻像任务.