我讲一个故事: 有个客户最近跟我们反馈,在 xx 上的业务在 xx 偶尔 connect time out ,偶尔 read time out,请求协查。 老实讲,这个问题非常糟糕,搞技术的人遇到这个问题需要大量的沟通来确认,什么时候,什么业务域名或 IP ,哪些地域的 IP ,请求哪些目标对象发生了报错。
我的建议: 1. 如果你提问,请把一个问题按照 5W2H 描述清楚,高效沟通。 2. 作为技术人员,需要在面对压力时,有消化压力,正确沉稳应对的方法。比如:弄清楚业务架构拓扑、业务逻辑处理关系,影响面等关键信息,这样你会有很好的方法和心态去面对掌控局面。 3. 技术问题的第一感觉非常重要,这个需要在日常技术问题中扎实挖深训练和积累,比如你看到 connect time out 就知道是四层的问题,看到 read time out 是七层的问题,如果业务逻辑复杂,也可能是因为四层问题导致微服务组件没有及时响应返回数据导致全局 read time out 。