在云环境中与libfaketime的使用产生冲突问题 #190

chmkeily · 2020-10-16T12:33:54Z

在使用了libfaketime的云容器机器上部署phxpaxos时，发现当将faketime时间往前改时，会导致phxpaxos进程无法正常退出（基本还会同时触发高cpu占用），卡死在UDPSend::run()的m_oSendQueue.peek(poData, 1000)处。

原因是phxpaxos中下列代码中调用_cond.wait_for会采用std::chrono::system_clock::now()计算时间，与此时libfaketime中实际不同步，导致wait_for总是异常地立即返回no_timeout（详见libstdc++中condition_variable的__wait_until_impl接口），但此时m_oSendQueue当然是空的，导致以下代码死循环：

     bool peek(T& t, int timeoutMS) {
        while (empty()) {
            if (_cond.wait_for(_lock, std::chrono::milliseconds(timeoutMS)) == std::cv_status::timeout) {
                return false;
            }
        }
        t = _storage.front();
        return true;
    }

这个问题导致在云容器环境中，不方便通过修改libfaketime来协助测试，请问大家都怎么处理这个问题的？
换用启用clock_gettime的libstdc++？或者直接hook std::chrono::system_clock::now()会有什么风险吗？

The text was updated successfully, but these errors were encountered:

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

在云环境中与libfaketime的使用产生冲突问题 #190

在云环境中与libfaketime的使用产生冲突问题 #190

chmkeily commented Oct 16, 2020 •

edited

Loading

在云环境中与libfaketime的使用产生冲突问题 #190

在云环境中与libfaketime的使用产生冲突问题 #190

Comments

chmkeily commented Oct 16, 2020 • edited Loading

chmkeily commented Oct 16, 2020 •

edited

Loading