AI 编程热潮推动 GitHub 爆发增长,平台频发故障后启动底层基础设施重构

久久百科 网络资讯 1

4 月 29 日消息,GitHub 依旧是开发者领域的主流平台,围绕代码托管、团队协作与开源开发形成了庞大的生态体系。即便在被微软收购之后,GitHub 仍保持自然增长态势,这一势头一直延续到去年。而 2025 年初,AI 编程热潮开始进一步推高 GitHub 的使用量。此后,随着智能体在开发者群体中成为主流,GitHub 的用户使用规模迎来了前所未有的爆发式增长。

注意到,GitHub 于 2025 年 10 月启动了一项扩容计划,目标是将平台承载能力提升至原有 10 倍,以此应对激增的需求。然而到 2026 年 2 月,公司意识到,未来的业务规模或将达到当前的 30 倍,必须提前做好布局。这种空前的增长压力,已严重拖累了平台的稳定性。事实上,过去数月间,GitHub 不仅发生过数次影响广大开发者的重大故障,还出现了多起小规模服务中断事件。

今日,GitHub 团队发布官方博客,就平台现状作出说明。概括而言,团队目前正在重构部分底层基础设施,旨在提升平台的可用性、可扩展性与抗故障能力。人工智能赋能的软件开发,使得代码仓库创建、合并请求活跃度、接口调用、自动化流程以及大型仓库负载等各项业务均迎来极速增长。以 GitHub 如今的体量来看,任何子系统中微小的效率短板,久而久之都会演变成严重的系统性问题。

对于复杂的网络服务而言,服务中断本是常见现象,但 GitHub 频发的故障已引发用户公开抱怨。知名项目 Ghostty 的开发者米切尔・桥本今日也发布博客表示,由于近几个月平台频繁出现稳定性问题,他决定将 Ghostly 项目从 GitHub 迁移至其他平台。

为解决用户面临的各类问题,GitHub 团队现已确立优先级排序:优先保障服务可用性,其次扩充承载容量,最后再迭代新功能。过去几个月里,团队已完成多项优化,化解了多处性能瓶颈。同时,GitHub 将部分算力需求迁移至微软 Azure 云平台后,得以根据业务负载灵活弹性扩容。为进一步降低故障影响,GitHub 正将 Git、GitHub Actions 等核心关键服务与其他业务负载进行物理隔离。官方还证实,正在推进多云架构建设,以全面提升平台的容灾抗风险能力。

GitHub 还披露了近期两起故障事件的详细情况:

4 月 23 日,平台出现功能回退问题,导致合并队列功能异常,此次故障共计影响 658 个代码仓库、2092 个合并请求。

4 月 27 日,平台 Elasticsearch 搜索引擎子系统突发独立故障,目前官方仍在开展根本原因分析。GitHub 表示,本次事件未造成任何数据丢失,Git 基础操作与开放接口服务均未受波及,但依赖搜索功能的部分页面无法展示检索结果,给用户使用造成了明显困扰。

GitHub 在博客文末再次致歉,并承诺将持续致力于提升服务可用性、增强平台抗故障能力,同时优化故障发生期间及事后的官方沟通机制。