有时，由于网络/互联网连接问题或目标服务/应用程序的负载，从 Zaqar 发送到订阅者的通知可能会失败。这意味着如果端点存在无法接收通知的问题，则不会进行重试。对于用户或应用程序来说，在没有通知的情况下会丢失重要消息。为了解决这个问题，Zaqar 在 pike 版本中支持了通知传递策略 [1]。

问题描述¶

现在 Zaqar 在 Pike 版本中仅支持线性重试退避函数，它从最小延迟到最大延迟线性增加延迟时间。现在我们将支持 Zaqar 中的更多重试退避函数。

幸运的是，AWS SNS 服务已经支持该策略，这对于 Zaqar 来说是一个很好的参考 [2]。

提议的变更¶

为了明确我们想要做什么，有一些问题需要回答

您可以从以下四种重试退避函数中选择：

正如我们在 [2] 的“退避阶段”章节中看到的图片，该截图显示了每个重试退避函数如何影响退避期间消息的延迟。纵轴表示与 10 次重试中的每次重试相关的秒数延迟。横轴表示重试次数。最小延迟为 5 秒，最大延迟为 260 秒。

通常，我们假设最小延迟为 MIN，最大延迟为 MAX，总重试次数为 NUM。从以上三个元素，我们可以得出这四种重试退避函数的公式。

线性。

LINEAR_INTERVAL = ( MAX - MIN ) / NUM time1 = MIN time2 = MIN + LINEAR_INTERVAL*1 time3 = MIN + LINEAR_INTERVAL*2 timen = MIN + LINEAR_INTERVAL*(n-1) timeN = MAX

线性重试退避函数已经在 Pike 版本中实现，我们仅在此处列出供参考和比较。
几何

我们假设几何级数的公比为 K：time1 = MIN time2 = K * MIN time3 = K^2 * MIN timen = K^(n-1) * MIN timeN = K^(NUM-1) * MIN = MAX

所以

K^(NUM-1) = MAX/MIN lg[ K^(NUM-1) ] = lg( MAX/MIN ) (NUM-1) * lg(K) = lg( MAX/MIN ) lg(K) = lg( MAX/MIN ) / (NUM-1) K = 10^[ lg( MAX/MIN ) / (NUM-1) ]

最终

timen = {10^[ lg( MAX/MIN ) / (NUM-1) ]}^(n-1) * MIN
指数。

我们假设指数级数的幂指数为 k，系数为 p

指数级数的通用函数是：y = p * k^x

time1 = MIN = p*k^1 timeN = MAX = p*k^NUM MAX/MIN = k^(NUM-1) lg(MAX/MIN) = (NUM-1)*lg(k) lg(k) = lg(MAX/MIN)/ (NUM-1) k = 10^[lg(MAX/MIN)/ (NUM-1)] p = MIN/{10^[lg(MAX/MIN)/ (NUM-1)]}

最终

timen = p*k^n timen = MIN/{10^[lg(MAX/MIN)/ (NUM-1)]} * {10^[lg(MAX/MIN)/ (NUM-1)]} ^n
算术。

我们假设算术级数的公差为 d

time1 = MIN time2 = time1 + d*1 time3 = time2 + d*2 time4 = time3 + d*3

timen = timen-1 + d*(n-1)

timeN = timeN-1 + d*(NUM-1) = MAX

所以：timeN - time1 = NUM*(NUM-1)/2*d

d = 2*(MAX-MIN)/[NUM*(NUM-1)]

timen - time1 = n*(n-1)/2 * { 2*(MAX-MIN)/[NUM*(NUM-1)] }

最终

timen = n*(n-1)/2 * { 2*(MAX-MIN)/[NUM*(NUM-1)] } + MIN

N/A

N/A

Q-2