V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
5261
V2EX  ›  问与答

要降 it 成本 ,运维开发大佬们,帮忙分析分析这个 it 成本账单

  •  1
     
  •   5261 · 19 天前 · 6119 次点击

    目前项目是微服务设计,单服务双节点部署,除了合并服务或者变成单点能降低费用外,其他的也不知道有没有降的空间了

    97 条回复    2025-06-25 22:49:06 +08:00
    cnscud
        1
    cnscud  
       19 天前
    从 ECS 和 RDS 入手, 例如应用迁到 k8s. (做好挨骂的准备)
    xixibb
        2
    xixibb  
       19 天前
    这么点费用还降本,那就看你们商务谈判能力了,单个的系统优化没啥用处。
    rebounce
        3
    rebounce  
       19 天前
    下云。
    fitme
        4
    fitme  
       19 天前
    ecs 多少台,只能从 ecs 和 rds 了
    Antihank
        5
    Antihank  
       19 天前
    业务节点换成按量付费,然后晚上关停。
    Vraw5
        6
    Vraw5  
       19 天前
    最快的肯定从大头降的最快,ECS 一台按 600 算,将近 50 台 ECS ,现在假如每台利用率 50%,干到 70%,立省一万二
    sheeta
        7
    sheeta  
       19 天前
    微服务换成单体, bushi
    whp1473
        8
    whp1473  
       19 天前
    @cnscud 你这是升成本吧。
    (1)合并服务为 1 个,假设原来 32G 服务,现在 1 个服务 4G 也能起来,降低机器到 8G ,机器直接单节点+保活脚本,牺牲一定时间可用性
    (2)还有种就是本地机房或托管机房,大数据服务器 8 台 * 4K = 32K ,然后 MySQL+应用服务 1 台 8K ,4 万可以搞定
    jimrok
        9
    jimrok  
       19 天前
    ECS 和 RDS 是大头,备份自己做,一个月备份要 2k 多?你数据量大吗?数据量大的话将历史数据拆分到单节点的 mysql ,提供有限的查询服务。
    NamelessRain
        10
    NamelessRain  
       19 天前
    简单 拿出两个月的总费用 12w 块钱 买 12 台服务器放机房托管 两个月后开始只需要付机房的托管费每台 500 块钱+3000 的 1000M 的宽带费 第三个月开始每个月节省 6W
    avv
        11
    avv  
       19 天前
    企业部署私有云。密集型计算的部署到私有云
    min
        12
    min  
       19 天前
    这不是非常简单么?
    ECS 规格数量减半
    RDS 规格减半
    搞定
    5261
        13
    5261  
    OP
       19 天前
    @fitme ecs 节点差不多 140 台了
    seth19960929
        14
    seth19960929  
       19 天前
    运维你只能让商务去谈有没有返利优惠
    你也可以让后端去优化一下服务, 排查一下是否可以优化
    xiayun
        15
    xiayun  
       19 天前
    下云,这没什么好调整的 成本和产品都很明显,除非自己能维护数据库和大数据集群
    5261
        16
    5261  
    OP
       19 天前
    @jimrok 你说到这个 我就不得不说了 业务的主从库,还有大数据的 rds 库, 业务的数据量部分表记录已经过亿了,不过业务上这些数据确实没啥用,理论上应该是可以删除,就算是导出到本地存储,那磁盘空间也不老少啊
    5261
        17
    5261  
    OP
       19 天前
    @xiayun 下不了云,运维才被裁!要求开发这边降 it 成本
    defunct9
        18
    defunct9  
       19 天前
    唉,每个月都在研究这种账单,都快成 Finops 了。首先,去跟阿里的 agent 谈,整单 7 折。然后逐项逐项优化。
    hugowangnz
        19
    hugowangnz  
       19 天前
    降低 ECS 成本,迁移业务到 ACK 或者 ACK serverless ,某些无状态业务可以考虑迁移到函数计算。实际上 RDS 也可以考虑 serverless
    5261
        20
    5261  
    OP
       19 天前
    @defunct9 已经是享受到集团下的折扣了,这个估计无解
    xiayun
        21
    xiayun  
       19 天前
    @5261 #17 运维被裁了 还调整个 P······你们在云上的估计都是在用业务 让财务跟阿里云谈谈能不能再打打折,其它只能看看使用率高不高 规格能不能降降
    5261
        22
    5261  
    OP
       19 天前
    @xiayun 哎,运维被裁是爽了,难的是留下来的还要继续干活,我估摸着只能把风险和老板沟通清楚,要么降低配置,要么就是单节点部署
    dko
        23
    dko  
       19 天前
    把你们云厂商的销售喊过来,说你要降本让他想办法,你这个账单应该有专门的销售了
    defunct9
        24
    defunct9  
       19 天前   ❤️ 3
    楼上都是扯的,自己搭,rds 回退到某个时间点怎么搞,手搓啊,我是搓过,要了半条命。还是用 rds 的一键回退痛快。还有其它服务,redis 、rabbitmq 、kafka 都自建,崩了一个节点还手搓,搓死吧。
    jimrok
        25
    jimrok  
       19 天前
    @5261 不过也不会省钱,只是云厂的费用转移给开发去修代码了。
    tuotu
        26
    tuotu  
       19 天前
    @5261 #20 我是火山引擎,我觉得有解,小而美:aXN0dW90dQ== 详细聊聊不
    xiayun
        27
    xiayun  
       19 天前
    @5261 #22 ecs 和 rds 是大头,降规格或者小服务合并到几台实例上,上 K8s 就不要想了 运维都没有····
    tuotu
        28
    tuotu  
       19 天前
    @defunct9 #24 哈哈哈哈哈哈
    wqhui
        29
    wqhui  
       19 天前   ❤️ 1
    rds 一个月 1w?配置有点高了,如果峰值都用不到这么多就减配
    @defunct9 #24 自建是这样的,不出事就便宜,出事就麻烦大了,要养个会弄各种组件的运维团队比几台服务器贵
    5261
        30
    5261  
    OP
       19 天前
    @wqhui 4 个 rds 节点
    defunct9
        31
    defunct9  
       19 天前
    rds 真不高,我们 PolarDB ,每个月基本 1 万数据费用,加上 3 年 30 万计算费用,大概每个月 2 万块。
    249239432
        32
    249239432  
       19 天前
    rds 用得还是比较爽的,还是不建议换
    ecs 的话找个线路好的 bgp 机房托管服务器就好了,一台双路 e5 2696v4 44 核 88 线程,才几千块,三台还不够你跑几百个节点?
    ala2008
        33
    ala2008  
       19 天前
    我们做过,降配置,降带宽,服务合并,减少服务器数量,抓大头
    duanxianze
        34
    duanxianze  
       19 天前
    数据库还是别乱搞,能降的估计就是 ecs,阿里不给降就换其他家,还不行就下云租机房,cdn 也可以多找几家
    njmaojing
        35
    njmaojing  
       19 天前   ❤️ 1
    咋老是有人推荐机房托管呢?
    OP 这个规模,140 的 ECS ,还有 RDS ,VPN 等等,你线下成本会比阿里云便宜?数据库性能会比 RDS 高?易用性会比 RDS 强?机房容灾会比阿里云好?还要算上运维成本,宽带成本等等等等
    OP 这种:
    服务先上单体?😁
    nicholasxuu
        36
    nicholasxuu  
       19 天前
    有峰谷用量吗?
    rds 换 serverless ,k8s 上弹性节点(或者可以考虑 ECI )?
    idblife
        37
    idblife  
       19 天前
    后端代码优化减少 ecs 用量?
    dnsjia
        38
    dnsjia  
       19 天前
    1. 分析资源利用率
    2. 合并服务
    3. 成本分摊
    tabliu
        39
    tabliu  
       19 天前
    最简单的当然是找靠谱的代理,把折扣压下去
    kinghly
        40
    kinghly  
       19 天前 via Android
    裁几个人就好了[dog]
    Goooooos
        41
    Goooooos  
       19 天前
    微服务粒度降低点,合并一些边缘服务
    wudanyang
        42
    wudanyang  
       19 天前
    什么规模的业务?
    zedpass
        43
    zedpass  
       19 天前
    你们有一百多台 ECS 的话,换 K8S 可能真能降低成本,机器利用率会提升一下
    fitme
        44
    fitme  
       19 天前   ❤️ 1
    @5261 140 台都把运维裁了,那还省啥钱,钱都省了呀,用钱买阿里云服务就好了。要不然风险你担
    hayhong123
        45
    hayhong123  
       19 天前
    看着像是阿里云 现在折扣多少啊 理论上阿里云现在可以谈到月付 3 折左右
    nabanbaba
        46
    nabanbaba  
       19 天前
    要更低折扣
    降低重要性底的服务冗余程度,云环境相对比较稳定,对可用性影响我觉得还 ok
    提升资源利用率,特别是 ECS RDS
    这些算是比较好实施的了
    至于上 k8s ,可能对你门团队成本比较高,不一定划算
    yyttrr
        47
    yyttrr  
       19 天前
    先按照业务拆财务单元,明确每一笔成本是哪个组哪个部门的再开始降本
    不是简单的纯运维操作能解决的
    sampeng
        48
    sampeng  
       19 天前 via iPhone
    140 台 ecs 你平均负载多少啊?
    3 个方案
    1 ,直接砍办半规格,看这资源量,调度其实 k8s 合适,我一台机器塞 100 多个 pod…因为不是所有服务都是要独占的
    2 ,所有包月直接包年,包年直接省 20%,不是包年包月,是买 12 个月。就是一年省 10w+。你还啥事没干。60 万一年,可以跟阿里牵框架合同了,最低线了,折扣还可以更低。
    3 ,买节省计划,灵活,优惠力度没第二点大,但是灵活得多。
    sampeng
        49
    sampeng  
       19 天前 via iPhone
    降成本的核心是负载率。你要是每台机器平均不到 50%踏实砍半。很多研发,包括运维开机器都是你要什么就开什么,一用负载从来没超过 5%…
    q958951326
        50
    q958951326  
       19 天前
    是不是可以用阿里云 DDH (专有宿主机)?
    5261
        51
    5261  
    OP
       19 天前
    @sampeng 确实,其实每台负载都不咋高,我估计后面会合并部分服务,然后降配置
    sampeng
        52
    sampeng  
       19 天前
    @5261 不要这样做。这样其实是把成本转移到研发头上了。你直接砍机器配置就完事了。是肉眼可见的快速降成本的方式。最后没办法的办法才是合服务。
    xuanbg
        53
    xuanbg  
       19 天前
    既然微服务了,为啥不容器化呢?每台 ECS 跑多个容器,甚至一套服务的全部容器都跑在一台 ECS 上面。这样,双节点只需要 2 台 ECS 。
    Liftman
        54
    Liftman  
       19 天前
    web 应用防火墙可以自己部。
    privil
        55
    privil  
       19 天前
    @5261 #22 运维工资很高吗?我这都是先干研发,研发工资高。哈哈
    yplam
        56
    yplam  
       19 天前 via Android
    纯 API 应用?感觉流量跟 ECS RDS 的配置不对称,
    xubeiyou
        57
    xubeiyou  
       19 天前
    云就是这样 前几年看起来便宜 但是实际上不如私有服务器- - 建议就是梳理应用实际所需配置 然后资源调度合理规划下 剔除掉一些多余的过剩的
    iyaozhen
        58
    iyaozhen  
       19 天前
    你这个每台什么规格 多少台 CPU 利用率啥的都没有,怎么降?拍大腿?
    tomczhen
        59
    tomczhen  
       19 天前
    既然可以裁掉运维降成本,那就继续裁几个研发,以后运维和研发就靠各位 v 友无私赞助,成本不就降下来了。
    sslfans
        60
    sslfans  
       19 天前
    ecs 搞成弹性扩容。使用竞价实例。不要包月包年这种。爽死你
    sumarker
        61
    sumarker  
    PRO
       19 天前
    感觉只能从 ECS 上下手, 看业务重心在哪边,如果用户侧多,那就换成小而多的做负载均衡;如果内部计算多,就上大内存的
    54xavier
        62
    54xavier  
       19 天前
    找个 IDC 托管自己的私有服务器
    5261
        63
    5261  
    OP
       19 天前
    @tomczhen 研发也裁到极致了!不然不会动运维
    youyouzi
        64
    youyouzi  
       19 天前
    @5261 #63 裁保洁吧,裁前台,电费水费纸巾费自理
    rawburuser
        65
    rawburuser  
       19 天前
    跟阿里商务谈判,使用阿里的节省计划,我们使用节省计划前每个月费用 9 万左右,使用后每个月七万左右,就是节省计划配置比较麻烦
    tokoy
        66
    tokoy  
       19 天前
    直接和阿里云或者腾讯云谈判,不打折就换云。
    fly0512
        67
    fly0512  
       19 天前
    1 、ecs 的负载控制在合理范围,负载低了就砍一些机器或者合并
    2 、ecs 选型,amd cpu 的相比 intel 的型号价格会便宜一些,很多场景 cpu 用不出区别
    3 、rds 的备份费用较高,可以考虑 rds 备份周期调短,长期备份自己做
    mad1ife
        68
    mad1ife  
       19 天前
    一个月 7 万也要省,你省下的成本代价是付出了稳定性,别的不说,1w 的 rds 成本你自建数据库找有能力的 dba ,人力成本不是 1w 的好几倍?
    从计费方式上优化,例如 ECS 包月,看看能不能替换成 SP ,商务谈判折扣够的话;
    从使用率角度上,哪些 Service 无状态非重要,用更便宜的 Spot 实例跑;
    5261
        69
    5261  
    OP
       19 天前
    @fly0512 第三点确实,准备调整下了,这点建议确实好,但是 ecs 选型 要是把现有的 cpu 切换感觉不太能行,怕要重启啥的,很麻烦
    thinkwei2012
        70
    thinkwei2012  
       19 天前
    ECS 按使用率降规格是最实际靠谱的
    Jokesy
        71
    Jokesy  
       19 天前
    @5261 #63 别说一个运维都没留下。CICD ,自动化,Linux 等等,你们研发负责吗?
    5261
        72
    5261  
    OP
       19 天前
    @thinkwei2012 是使用率? 只能按 内存、cpu 使用率吧? 这个好像不太好按一个维度
    @Jokesy 是的
    fitme
        73
    fitme  
       19 天前
    @Jokesy 现有架子搭好了,基本都是复制粘贴就能用
    ymy3232
        74
    ymy3232  
       19 天前
    ECS 换弹性竞价的 ECI ,我们 4w 降到 2000 。
    mengyigewen1128
        75
    mengyigewen1128  
       19 天前
    找一些负载低的服务迁移,缩 ecs 台数,立竿见影。需要兼职么 我可以搞一搞。
    BelovedOne
        76
    BelovedOne  
       19 天前
    6w 也要降啊,真把公司当自己家呢。
    5261
        77
    5261  
    OP
       19 天前
    @BelovedOne 不降就要被干了,就问要不要降吧
    BelovedOne
        78
    BelovedOne  
       19 天前
    @5261 干人也是个办法,一个人 3 ~ 4w 的成本,干掉就达标了。
    Jokesy
        79
    Jokesy  
       19 天前
    @5261 #72 6666666666 ,牛掰 等到时间出大问题,看是领导背锅,还是你们这些研发背锅
    BeforeTooLate
        80
    BeforeTooLate  
       19 天前
    一开始看成了一年 6w...哈哈哈
    ssiitotoo
        81
    ssiitotoo  
       19 天前
    首先看看业务上有没有可以砍的 那种在线上跑着 但是没有任何用处的砍掉,不行就换 k8s 把 单个 pod 资源分配低点 扩缩也方便些
    Foxkeh
        82
    Foxkeh  
       19 天前
    持续监控 CPU 和内存负载, 考虑降配到相应规格的突发实例
    zhangxudong
        83
    zhangxudong  
       19 天前
    ECS 直接按 5 年买,直接变成 3 折优惠,这不直接省一大笔
    littlesky87906
        84
    littlesky87906  
       19 天前
    k8s 配合 ecs 抢占式实例弹性扩缩容,能把 ECS 正本降到现在的 1/10
    5261
        85
    5261  
    OP
       19 天前
    @littlesky87906 大胸弟,没运维了,运维都被干了,我咋 k8s 啊,这是要我开发死啊
    ropon
        86
    ropon  
       19 天前
    140 台 ecs ,每个月费用才 2.9w 么
    wenxueywx
        87
    wenxueywx  
       19 天前
    提一个
    1. 考虑 ECS 换成托管 k8s ,没有运维可以找阿里云支持
    2. 不清楚 你 rds 用的什么系列,还需要挂只读实例,如果是原来的高可用系列,可以换成双节点的集群系列,从节点直接就可以提供读能力,你的只读实例就可以干掉了。
    3. 数据库 DBS 策略 备份时间缩短
    4. 数据传输 DTS ?看看能不能干掉
    coolcoffee
        88
    coolcoffee  
       19 天前
    如果之前都没全容器化部署就别想着用 k8s 了,吃力不讨好。

    如果真的要搞 k8s ,那么也需要用到磁盘持久化的都继续用外部服务,比如 RDS 、Redis 这些,不然集群节点升级的时候带崩集群的应用,自建真正做到高可用的地步成本不会比买服务低多少。
    me1onsoda
        89
    me1onsoda  
       19 天前
    就这么点账单我觉得下云费用可能更多
    straysheep
        90
    straysheep  
       19 天前
    这么多实例和服务,居然把运维砍掉,现在开发真的太不容易了
    dengjunwen
        91
    dengjunwen  
       19 天前 via Android
    我有一个供应商,可以打 6-7 折,具体要看自己
    5261
        92
    5261  
    OP
       19 天前
    @wenxueywx 好的,dts 是类似监听 binlog 那种服务
    sampeng
        93
    sampeng  
       19 天前 via iPhone
    你们要砍云上成本很正常,一个月流量,cdn ,负载均衡等加起来才 3000 什么概念?我按平均 0.5/g 算。不到 4T…还没我家一个月流量多…什么概念?就是 6 万块钱的云端成本,却只带来 3-4T 的流量…性价比太低太低了。
    YaakovZiv
        94
    YaakovZiv  
       19 天前
    ECS 上应用无论是改造容器化还是迁移到 k8s ,人力成本都会大幅度增加,短期是增加的,招人后推进流水线自动化,减少 ECS 开支,运行稳定后,开始裁员,逐渐降低人力成本,总成本就降低了,最后变成团队只有少量开发人员。
    BadAngel
        95
    BadAngel  
       19 天前
    联系华为云搬迁,反正搬完了还给补助
    反正大家都是你搬我的我搬你的
    hweining
        96
    hweining  
       19 天前
    1 ,阿里云尽量找代理去谈价格,续费比老用户便宜,检查 CPU/内存利用率(如峰值<50%可降配 1-2 档),试试计算资源降配,非核心服务改用 弹性伸缩组( ESS ) + 按量实例(闲时缩容);
    2 ,EC2 和 RDS 占了支出大头,试试 ECS 降配+弹性伸缩是否可以满足需求,rds 若 QPS<1000 ,可改用 高可用版(非三节点)(节省 20-30%),高频查询使用 redis ,但需考虑缓存一致性;
    3 ,WAF 规则合并,关闭非必要防护规则(如静态资源无需 SQL 注入防护),用云防火墙替代部分 WAF 功能;
    5261
        97
    5261  
    OP
       19 天前
    @hweining 好,我都一一记录,后面再一项一项过!

    1 、ecs 我肯定是优先结合业务情况,释放一些限制的节点,然后一些管理后台的节点合并,甚至变单节点部署,这样一轮过后再结合实际使用率来调整,主要没运维了,很多事情都要自己摸索,有点消耗时间
    2 、waf 不知道当时是不是配合三级等保开的,主要这其中有些域名统一走了 waf 的 ssl 证书配置,到时候还得改
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2694 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 14:58 · PVG 22:58 · LAX 07:58 · JFK 10:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.