果然世界就是一个巨大的草台班子,大公司也避免不了

3 天前
 itechnology

之前不是在这里说过 拿了一个大厂的外包岗位 offer 吗,我当时最终决定去的这个。

目前上了十多天班,感觉就是大厂原来也是个草台班子。

我是做 Java 的,一般来说,大部分公司正常的做法是 SkyWalking + 日志平台(比如 ELK )来排查问题。

这个项目组排查问题只能通过 SkyWalking 你敢信?你想通过日志打印的某个关键字来搜一下具体错误日志?对不起,没有办法。

比如,上周给我派了一个生产 BUG 让我解决,这个 BUG 是在 mq 消费过程中产生的(这个是重点)。

由于将 mq 集成到 SkyWalking 中,导致它的日志没法在 SkyWalking 中找到,取而代之的是把消费过程中发生的异常保存到 MySQL 的一张日志表中,。

我通过这张日志表排查到是一个 SQL 执行出错了,但具体的 SQL 错误信息没有,然后又因为没有日志平台,导致一个很简单的问题(如果有日志平台,直接去日志平台看一眼详细错误就知道了)花了很长时间。

最后解决办法是一张张表去看是否有生成记录(这个 mq 消费过程中会插入很多张表),如果某张表没有生成记录,那问题就发生在这张表上,最后再一个个字段去排查,发现原来是字段值超长了。。。

……

除此之外,还有很多一眼草台班子的地方

不过有一说一,有些地方还是还是做的不错的,比如各种权限管控、各种文档也比较齐全

2796 次点击
所在节点    职场话题
15 条回复
cctv6
3 天前
说实话,skywalking + 日志平台 肯定是少数,别看网上说得多,真的用上的却不多。推动部署这些东西,也是阻力重重。
VeryZero
3 天前
@cdlnls 我们公司技术部门就几十个人,日志平台每个环境都有一套。定位问题都是分钟级。

运维总共就 3 个人。这只有想不想做的问题。
dcdlove
3 天前
反正我们公司日志平台就是 docker 容器 的查看日志命令 建议无数次用 elk 或者其他日志平台,这帮蠢货就是不搞,每次接口报错还要前端配合给他们请求接口地址和请求参数,接口数据校验都不做
cctv6
3 天前
其实我想说的阻力,就是来自技术负责人,和开发,运维在生产环境上加东西是要负责的,也是需要授权的。部署配置这些服务简单,但是要配置好还需要开发支持 需要调整日志输出。以及权限问题,日志谁能看,能看什么。
cctv6
3 天前
Niphor
3 天前
有 SkyWalking 就不错了,现在都还只能登服务器看日志文件
freeup
3 天前
所谓大厂是因为商业模式的成功而累积了资本才成为的大厂,其研发侧肯定也是只能说比上不足比下有余,至少大部分不是很多人想象中的那种大厂该有的研发环境
harlen
3 天前
有 SkyWalking 就不错了.日志我们都看不了。代码还是手动复制粘贴部署的
flmn
3 天前
skywalking 都用上了,真不草台。

我们排错 tail ,less ,grep
ldx78203199
3 天前
。。。同感,我们都是直接上机器,还有我所在大厂运维是支撑所有部分的,所以大部分的 RD 自己就是运维,有问题就上机器梭哈查
ivanMeng
3 天前
想起前些年日子 直接当一线开发 半当运维 因为公司就一个运维、看日志 直接上生产多个机器 分屏 tail grep 的
IIce
3 天前
@cdlnls 感觉最大的阻力应该是开发,前司部门也没有 elk, 后来有人搭了一套出来,但是开发要改代码,有的人就各种不情愿,最后也不了了之了
itechnology
3 天前
@Niphor
@flmn 你们还能登服务器看日志,这边所有开发人员都没有登录服务器的权限,只有专门发版的人员才有,看日志只有 skywalking 这一个地方
flmn
2 天前
@itechnology 要不说草台呢
sunwei0325
2 天前
skywalking 不是 APM 工具吗? 看日志不是去 Kibana 吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://ex.noerr.eu.org/t/1159771

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX