9 月 27 日周五上交所遭遇了堵单问题,当天的交易量大幅下降。为了解决问题,上交所最后选择了重启交易系统,问题随后真的解决了。财新援引专业人士的消息报道,交易所的操作系统较为古老,在处理高并发任务时遇到瓶颈,尤其是在内存管理方面;当系统负载过高,内存被耗尽,导致程序无法正常处理请求,甚至完全卡死。「在这种情况下,重启系统可以清理内存,释放被占用的资源,从而让系统恢复正常。这种现象在较老的系统中更为常见,因为它们的内存管理和资源调配机制相对简单,不如现代操作系统那样高效。」这位专业人士说,可以增加几条简单的操作系统命令,将缓存中的数据写入硬盘,释放内存空间。上交所的交易系统源自德意志交易所的 Xetra 交易系统,而该系统是基于一款 VAX/VMS 的操作系统,由 DEC 在 1970 年代末推出,DEC 早已停止开发,了解该系统的专业人士也非常少。
     1 
                    
                    cJ8SxGOWRH0LSelC      2024-10-14 17:15:54 +08:00    能跑就别轻易动。 重启就能解决, 多么幸福。 
                 | 
            
     2 
                    
                    cvbnt      2024-10-14 17:17:46 +08:00 via Android 
                    
                    大型系统难的是业务逻辑 
                 | 
            
     3 
                    
                    RightHand      2024-10-14 17:18:15 +08:00 via Android    20 多年的屎堆,谁敢动 
                 | 
            
     4 
                    
                    Noicdi      2024-10-14 17:24:26 +08:00 via iPhone 
                    
                    我们系统想升级个 Linux 发行版的大版本都一堆问题,何况上交所这个系统。 
                上交所想升级估计是往 Linux 转移,又是底层架构又是业务代码,谁敢动啊这😧  | 
            
     5 
                    
                    felixlong      2024-10-14 21:32:35 +08:00 
                    
                    维护这个系统的人应该很爽呀。不用担心 35 岁被裁:) 
                 | 
            
     7 
                    
                    jdgui      2024-10-14 22:16:50 +08:00 
                    
                    他最早设立的时候的代码,估计都是找外国公司买的代码。后面不知道加了多少版本的代码进去。 
                大部分人维护的系统,撑死只有几年的开发时间。整个 v 站没有几个有维护三十几年的代码吧。 重启能解决就挺好的了。这玩意如果能花大价钱去重构一次,可能会好一点。但是没有收益的事情谁去做  | 
            
     8 
                    
                    I3tZ9NgHU44xmaA4      2024-10-14 22:22:14 +08:00 
                    
                    @felixlong 九代单传传下来的谋生秘技,传里不传外,传子不传女 
                 | 
            
     9 
                    
                    lesismal      2024-10-14 22:23:25 +08:00 
                    
                    平滑过度的话, 单独开发一套新系统, 一部分用户数据复制/迁移过去, 代理层分流这部分用户流量给新系统, 灰度一段时间如果功能都稳定就可以考虑继续迁移直到全切过去. 
                至于性能, 新系统的话, 随便哪个大厂的一流团队支援下, 就像当年阿里支援 12306 一样, 性能都能搞定的.  | 
            
     10 
                    
                    hefish      2024-10-14 22:30:18 +08:00 
                    
                    早年听大佬吹牛时讲过,说上交所的多处理器系统是一条指令,多个 cpu 跑,然后表决结果的。当时觉得牛逼的不行。。。 
                要真如 op 所讲,还是基于 vax/vms 的,到今天肯定是相对落后了。  | 
            
     11 
                    
                    Od37v61n5s89gXx8      2024-10-14 22:31:17 +08:00 via iPhone 
                    
                    @felixlong 正式工可得有关系,临时工就是来背锅的,爽不爽不取决于工作内容 
                 | 
            
     12 
                    
                    yxzblue      2024-10-14 22:50:35 +08:00 
                    
                    很爽有没有。没人能动得了,也不会轻易堆屎需求进去。出了问题,重启就行,也不用加班加点修 bug 。简直是程序员的福音。 
                 | 
            
     13 
                    
                    hermanarturo      2024-10-14 22:55:38 +08:00 
                    
                    交易所这点工资能留得住啥人 
                 | 
            
     14 
                    
                    mohumohu      2024-10-14 22:56:00 +08:00    复盘上交所爆单宕机事件:问题源于信创 最后靠重启系统解决 
                9 月 27 日,上交所因系统负载过高导致交易缓慢异常,部分券商客户端崩溃。尽管成交量不大,但交易堵塞依然严重。9 月 29 日,问题通过重启系统解决。专业人士指出,问题源于上交所老旧的系统在高负载下内存耗尽,而信创改造导致的兼容性问题也可能是关键原因之一。 相比之下,深交所的交易系统尚未出现异常。据悉,深交所的系统早期源于 IBM 的一套技术,后买下版权自主研发出了第五代交易系统⸺STSV5 ,完全基于开放平台和分布式架构,于 2016 年 6 月上线。 cnbeta  | 
            
     15 
                    
                    1145148964      2024-10-14 23:01:09 +08:00 
                    
                    必然是有人需要做一些事情才坏的。 
                 | 
            
     16 
                    
                    03      2024-10-14 23:03:33 +08:00 via Android    @lesismal 部分?灰度?交易所可不像互联网一部分用户打不开或者卡了也没什么。到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司 
                 | 
            
     17 
                    
                    ivvei      2024-10-14 23:41:52 +08:00 
                    
                    不难。就是上交所垃圾罢了。垃圾人办垃圾事。 
                不过这类报道里的“专业人士”也是垃圾,不知道是本人屁都不懂,还是记者听个一知半解就瞎写。  | 
            
     18 
                    
                    chendy      2024-10-15 08:29:43 +08:00 
                    
                    不是很难是非常难 
                这种系统能通过重启解决已经算好的了 有多少系统,意外关机一次就再也没起来过…  | 
            
     19 
                    
                    Leon777      2024-10-15 08:56:11 +08:00 via iPhone 
                    
                    在这种单位的技术部门干活就讲究一个不求有功但求无过,升级了没出问题没功劳,出了问题你背锅检讨上会批评 
                 | 
            
     20 
                    
                    jimrok      2024-10-15 08:57:15 +08:00 
                    
                    这种系统非常庞大,对接的外部系统也非常多,没有几个人能懂整个系统的全貌。虽然周末券商也配合做系统测试,但只有半天时间,只能做些小的修复。要想更新这个系统,除非有人做破坏性的创新才行。 
                 | 
            
     21 
                    
                    mosfet      2024-10-15 09:04:00 +08:00    上交所基本靠外包 
                深交所有自己开发迭代的能力  | 
            
     22 
                    
                    iorilu      2024-10-15 09:16:06 +08:00 
                    
                    很惊险阿 
                要是重启不成功, 就完球了 这种老系统, 重启一次都是大事, 不成功很正常  | 
            
     24 
                    
                    cheng812      2024-10-15 09:23:21 +08:00     | 
            
     25 
                    
                    yc8332      2024-10-15 09:24:47 +08:00 
                    
                    这种系统怎么可能临时升级。。。你以为都像互联网行业啊 
                 | 
            
     26 
                    
                    Sawyerhou      2024-10-15 10:36:31 +08:00 
                    
                    这么复杂的系统,谁感动啊,别说更新系统,换个内存条都瑟瑟发抖。 
                 | 
            
     27 
                    
                    lesismal      2024-10-15 13:05:28 +08:00 
                    
                    @03 #16 要是信心和实力足够, 直接上一套新的也行.  
                按照其他层说的, 如果是采购的别人现成的不好改造, 那灰度确实很难搞. 如果可以改造, 那么: > 到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司 灰度可以从很小的用户数量开始, 可没说你得一半新一半旧; 可以是内部或者相关机构开放一部分账户进行测试, 可没说必须都让普通用户先上去直接当炮灰 > 部分?灰度?交易所可不像互联网一部分用户打不开或者卡了也没什么。 所有用户全用不了的影响大, 还是少量人不能用影响大? 别瞧不起互联网, 支付宝微信这些 FIN Tech, 哪个不是涉及钱的 撮合系统的算法服务部分应该是没太大压力, 因为本来就可以按照股票 id 分散到不同的撮合节点, 卡住主要是订单和结算这些数据事务性相关的, 解决这部分性能, 撮合系统把交易来源和结算的部分按照用户分流到新旧不同的系统就可以了, 但业务上肯定影响挺大的, 改造肯定是要喝一壶的  | 
            
     28 
                    
                    lesismal      2024-10-15 13:12:57 +08:00 
                    
                    > 到时候如果同样订单一个系统能成交,另一个不能,或者一个价格好一个价格坏怕不是要吃官司 
                @03 而且, 如果照这么说, 价格高低好歹能成交, 节前那次被卡单的连成交都成交不了让人家上不了车, 早都该去告上交所了  | 
            
     29 
                    
                    94      2024-10-15 14:03:52 +08:00 
                    
                    谁来牵头,谁来负责? 
                我不知道在场的有多少人会愿意赌上自己的工作,去主动提“升级”这个系统?  | 
            
     30 
                    
                    lhDream      2024-10-15 14:04:47 +08:00 
                    
                    别说了,准备做个 T,结果卖卖不出去,撤撤不了,第二天一看,直接下车了 
                 | 
            
     31 
                    
                    www12222      2024-10-15 14:37:15 +08:00 
                    
                    上交所听说老人跑了还多,招了一堆 7-8k 的应届生,能做成这样不错了 
                 | 
            
     32 
                    
                    ccxuy      2024-10-15 17:03:04 +08:00 
                    
                    https://www.hyrumslaw.com/ 
                海拉姆法则,越大型的软件应用,使用规模越大,就会出现 bug for bug 的使用,哪怕是一些隐含的约束都会被利用起来,你做变更就会牵一发动全身。  | 
            
     33 
                    
                    ccxuy      2024-10-15 17:05:44 +08:00 
                    
                    现在业界的建议一般是既然变更困难又得用大型软件,比如 Linux ,还是花些功夫频繁点接轨到主线稳定版本,这样能兼顾 bug 、漏洞和平滑一些变更难度 
                 | 
            
     34 
                    
                    cskeleton      2024-10-15 20:32:05 +08:00     | 
            
     35 
                    
                    lisxour      2024-10-16 09:35:47 +08:00 
                    
                    简单来说,就是屎山搞不动了 
                 | 
            
     36 
                    
                    lesismal      2024-10-16 22:51:26 +08:00 
                    
                    @cskeleton  
                看下#27 这句: " 灰度可以从很小的用户数量开始, 可没说你得一半新一半旧; 可以是内部或者相关机构开放一部分账户进行测试, 可没说必须都让普通用户先上去直接当炮灰 " 再看下#28, 节前那么多被卡单的, 为啥不去告上交所.  | 
            
     37 
                    
                    cskeleton      2024-10-17 10:59:36 +08:00 
                    
                    @lesismal #36 内部或者相关机构指哪些不太了解。我能想到的,这种平台不存在内部测试账号吧,都是真实交易。相关机构我应该就是投行、保险、公募、私募这些吧,这些如果因为系统问题影响了收益,咋算呢? 
                另外我觉得这么搞小道消息要传得飞起,“庄家都是用的新系统,比散户的速度快,优先级高”。 被卡单的我觉得可以去告。为啥不去告这个要问他们我肯定不知道。  |