V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
canteon
0.04D
V2EX  ›  Amazon Web Services

aws 服务挂掉了,弗吉尼亚区

  •  1
     
  •   canteon · 1 天前 · 7008 次点击
    第 1 条附言  ·  19 小时 26 分钟前
    已经恢复了,用 chatgpt 大概总结下,时间已经换成北京时间。跟实际遇到的一样,先是 krio 直接坏了,发现是弗吉尼亚区,同时 aws ,DynamoDB 崩溃,ses 崩溃, 中间其实应该还有 cloudfront 控制台无法访问。

    在 10 月 20 日下午 2:49 到 10 月 20 日下午 5:24 (北京时间) 之间,
    AWS 在 美国东部( US-EAST-1 )区域 出现了 错误率上升和延迟增加 的问题。

    依赖该区域端点的服务(如 IAM 、DynamoDB Global Tables )也受到了影响。

    在 下午 3:26 ,AWS 确认故障原因是 DynamoDB 区域服务的 DNS 解析问题。
    在 下午 5:24 解决 DNS 问题后,服务开始恢复,但 EC2 实例启动系统 因依赖 DynamoDB 而继续受影响。

    随后,网络负载均衡器( NLB )健康检查 也受到波及,导致 Lambda 、DynamoDB 、CloudWatch 等多项服务的 网络连接出现问题。

    在 10 月 21 日凌晨 12:38 ,网络负载均衡器健康检查恢复。
    AWS 在恢复期间 暂时限制( throttle ) 了部分操作(如 EC2 启动、SQS 队列触发的 Lambda 执行、异步 Lambda 调用),并逐步解除限制。

    最终在 10 月 21 日早上 6:01 ,所有 AWS 服务完全恢复正常。
    不过,AWS Config 、Redshift 、Connect 等部分服务仍有 消息积压,预计将在接下来数小时内处理完毕。

    AWS 官方将稍后发布该事件的详细总结报告。
    79 条回复    2025-10-21 17:42:45 +08:00
    ShuaiGeLiu
        1
    ShuaiGeLiu  
       1 天前
    是的,亚马逊商城都有几率刷不出来产品。
    ChevalierLxc
        2
    ChevalierLxc  
       1 天前
    好像是影响全球业务了,很多 region 都挂了,不仅仅是 ue1
    canteon
        3
    canteon  
    OP
       1 天前
    @ShuaiGeLiu 云服务挂掉了,cloudfront 打不开
    qiyuey
        5
    qiyuey  
       1 天前
    npm 503 和这个有关吗?
    lxdlam
        6
    lxdlam  
       1 天前   ❤️ 5
    AWS 核心控制面在 us-east-1 ,业务在 us-east-1 的受影响,业务不在 us-east-1 的也受影响,太精彩了
    burnsby
        7
    burnsby  
       1 天前
    claude 官网都使用不了了
    xooass
        8
    xooass  
       1 天前
    我还以为我的亚马逊 SPAPI 账号被封了... apikey 更新不了
    Uplay
        9
    Uplay  
       1 天前
    亚马逊直接登录不上去了
    kingfire
        10
    kingfire  
       1 天前
    cursor 也挂了,打不开 dashboard 了
    pingdog
        11
    pingdog  
       1 天前 via Android
    估计升级某个组件后雪崩效应,等回退
    aws 上次也是
    liqingyou2093
        12
    liqingyou2093  
       1 天前
    刚配置了 cloudfront, 有毒吧
    qiaobeier
        13
    qiaobeier  
       1 天前
    我司也是,Prod 用了 AWS SQS ,挂逼了。连 Git 服务都挂,白瞎收那么多钱。
    burby
        14
    burby  
       1 天前
    我们运维说整个美东都受影响了....
    dream10201
        15
    dream10201  
       1 天前
    hub.docker.com 也崩了
    2962051004
        16
    2962051004  
       1 天前
    npmjs 也挂了
    netnr
        17
    netnr  
       1 天前
    vercel 也受影响了?状态页有错误事件
    HK560
        18
    HK560  
       1 天前
    我就说特么怎么死活拉不了镜像
    sometime
        19
    sometime  
       1 天前
    fan123199
        20
    fan123199  
       1 天前
    我们好几个网页都挂了,因为 vercel 也在上面-_-
    szdubinbin
        21
    szdubinbin  
       1 天前   ❤️ 3
    postman 也 G 了,还在用的千万不要手贱啊 ,同事发现 postman 上接口全空了吓得尿都出来。
    tinybug
        22
    tinybug  
       1 天前   ❤️ 1
    onlyfans 也 load 不出来了
    miken2234
        23
    miken2234  
       1 天前
    poe 也挂了
    szdubinbin
        24
    szdubinbin  
       1 天前
    @tinybug ???
    v2306
        25
    v2306  
       1 天前
    @tinybug 666
    sunnygaofan
        26
    sunnygaofan  
       1 天前
    影响范围还挺广的,一堆在用的挂了 postman, vercel,npm,docker 卧槽,不是只是一个可用区挂了吗
    canteon
        27
    canteon  
    OP
       1 天前
    @sunnygaofan 6 楼说了真实情况,他今天就更新这个区
    10240
        28
    10240  
       1 天前
    perplexity 扑街中
    NeoMatrix
        29
    NeoMatrix  
       1 天前
    挺多 app 受影响的,估计股价要跌了。
    Mi1kTea
        30
    Mi1kTea  
       1 天前
    业务在 GCP 上,但是镜像是 dockerhub ,结果 aws 挂了,镜像拉不了了,悲催
    Smilencer
        31
    Smilencer  
       1 天前
    东大笑了
    liuliuliuliu
        32
    liuliuliuliu  
    PRO
       1 天前
    利好微软 Azure ?现在买微软股票还来得及吗?
    rm0gang0rf
        33
    rm0gang0rf  
       1 天前
    系统没瘫, 附加服务全瘫了, 下班
    mytsing520
        34
    mytsing520  
    PRO
       1 天前
    epicGames 扑街中
    messyidea
        35
    messyidea  
       1 天前
    postman 也挂了
    nanjoyoshino
        36
    nanjoyoshino  
       1 天前
    cursor 补全没了,还以为是梯子问题,浪费我排查半天
    sheepyoung
        37
    sheepyoung  
       1 天前   ❤️ 1
    supercell 游戏全挂了
    loveshuyuan
        38
    loveshuyuan  
       1 天前
    jira 也挂了
    Moishine
        39
    Moishine  
       1 天前 via iPhone
    已经中招😂
    JayShen
        40
    JayShen  
       1 天前   ❤️ 1
    中招了。。。会不会是 vibe coding 出 bug 了 哈哈
    cat9life
        41
    cat9life  
       1 天前
    刚看到这个帖子.. 浪费了好长时间 😂
    tomzhang
        42
    tomzhang  
       1 天前
    dockerhub 也崩了
    jaysonmac
        43
    jaysonmac  
       1 天前
    各种服务都挂了,只能说 aws 牛逼😂
    sugars
        44
    sugars  
    PRO
       1 天前
    难怪我的 postman workspace 和 environments 全空了,吓死我了啊
    craftsmanship
        45
    craftsmanship  
       1 天前 via Android
    十分精彩🤓
    fkdtz
        46
    fkdtz  
       1 天前
    整个晋西北都乱成一锅粥了
    🍚
    chenqh
        47
    chenqh  
       1 天前
    aws 挂了?azure 和谷歌云怎么没挂?不是多云架构的吗?
    liuxh7
        48
    liuxh7  
       1 天前
    alexa app 也挂了,我说测试怎么测不了
    albertofwb
        49
    albertofwb  
       1 天前
    tmd 我就说 怎么我的 .github ci docker build 总是失败 ....
    Randomjo
        50
    Randomjo  
       1 天前
    上周五我用 vercel 试一下部署个小网页,今天再部就不行了。我想半天搞好久都不知道发生什么事情了。
    tmd 的结果是 aws 寄了
    m1nm13
        51
    m1nm13  
       1 天前
    docker hub 炸飞了
    canteon
        52
    canteon  
    OP
       1 天前
    @chenqh 看 6 楼,现在已经知道的 cloudfront 已经恢复了。DynamoDB 还在死机中
    abcdecsf
        53
    abcdecsf  
       1 天前
    @nanjoyoshino 我就说。。。
    Rickkkkkkk
        54
    Rickkkkkkk  
       1 天前
    典型的业务隔离,但依赖没隔离。
    sugars
        55
    sugars  
    PRO
       1 天前
    postman 已恢复正常
    dingjs
        56
    dingjs  
       1 天前
    biubiuF
        57
    biubiuF  
       1 天前 via iPhone
    临着下班 dynamodb 服务恢复了,日了狗
    canteon
        58
    canteon  
    OP
       1 天前
    @biubiuF 没事 还有 ses 还在恢复呢
    michael2016
        59
    michael2016  
       1 天前
    美东承载了大半个互联网,赔钱吧
    hoythan
        60
    hoythan  
       1 天前
    希望下班之前 Docker 不要恢复
    sjdhome
        61
    sjdhome  
       1 天前
    Slack 也 [受影响]( https://slack-status.com/) 了
    iugo
        62
    iugo  
       1 天前
    Miao18
        63
    Miao18  
       1 天前
    坏消息:在下班前慢慢恢复了。
    好消息:没法干活,提前走了。
    shitcode
        64
    shitcode  
       1 天前
    @sugars 没有吧,workspaces 还是刷不出
    hoythan
        65
    hoythan  
       1 天前   ❤️ 1
    @hoythan 妈的下班最后 20 分钟恢复了
    fuchaofather
        66
    fuchaofather  
       1 天前
    @tinybug bro ,现在呢,很急
    savingrun
        67
    savingrun  
       1 天前
    postman GG 了
    11000111010
        68
    11000111010  
       1 天前
    听说是慢慢恢复了 https://imgur.com/a/DDVpi72
    11000111010
        69
    11000111010  
       1 天前
    听说是慢慢恢复了 这次的后果会是什么呢?
    https://imgur.com/a/DDVpi72
    coldle
        70
    coldle  
       1 天前
    真就行行业业都得抖三抖 🤣
    justdoit123
        71
    justdoit123  
       1 天前
    ebs 还是有问题,k8s pv/pvc/pod 会出现卡死的状态,绑定关系也无法真正解除。nnd
    dingdangnao
        72
    dingdangnao  
       1 天前
    iCloud 和 iTunes 服务好像也崩了😂
    yingqi1
        73
    yingqi1  
       1 天前
    ec2 到现在也没恢复,服了,下游 kes 也是
    ltltfuture
        74
    ltltfuture  
       1 天前
    看看这回要赔多少了
    xiaket
        75
    xiaket  
       19 小时 50 分钟前
    昨天 zoom 里面 AWS 的 TAM 说是 dynamoDB 的 frontend 有问题. 所以级联导致了很多其他服务有问题(比如 EKS)
    kingcanfish
        76
    kingcanfish  
       18 小时 0 分钟前
    接下来就是等 aws 的事故报告了
    jojobalabala
        77
    jojobalabala  
       14 小时 2 分钟前
    west 有影响吗? 服务器莫名其妙脱域了,其他到没影响,理论上不受关联,但这时间节点那么巧呢
    canteon
        78
    canteon  
    OP
       13 小时 35 分钟前
    @jojobalabala aws 好多服务最基础都跟这个区有关系,cloudfront iam vpc ,因为最早就只有这一个区,后面才开始有 region 的概念。但是吧看起来他们并没有区分,99.9999 的稳定性被打破了
    Binlabs
        79
    Binlabs  
       10 小时 40 分钟前
    草台班子
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   948 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 107ms · UTC 20:22 · PVG 04:22 · LAX 13:22 · JFK 16:22
    ♥ Do have faith in what you're doing.