2022年6月8日上午,由中国信通院系统稳定性实验室(CAICT STARLab)和中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同发起的“信创环境下系统稳定性保障实践分享沙龙”成功举办,沙龙通过云大说、DataFunTalk、DBAplus、TakinTalks等多种渠道直播,观看2000余人次。
中国信通院分布式系统稳定性实验室技术负责人王超伦介绍了信通院在信创领域系统稳定性方面所做的工作。首先介绍了信通院稳定性工作的开展背景、行业痛点以及在信通院行程卡系统稳定性保障方面所做的工作。之后介绍了分布式系统稳定性实验室(以下简称“实验室”)成员单位、专家以及活动情况。分别介绍了实验室开展的六条工作主线,包括系统稳定性保障体系、系统稳定性保障技术平台、稳定性服务商、全链路压测/拨测、系统灾备能力、数据产品稳定性测试等六个方面的研究进展,自研混沌测试工具Databench-C,以及对STAR稳定性评估评测结果的分析。最后分享了实验室未来的工作计划。
中国信通院STAR稳定性评测
数据产品稳定性测试(STAR-P):
面向分布式数据产品的测试,考察产品能否在诸多因素的影响下平稳运行。通过维持高负载并注入计算、存储、网络、线程等扰动对产品施加压力,并测量产品对压力的反应,评估产品在各种扰动场景下能否长时间可用并维持一定性能。由信通院提供测试用机房环境。完成测试的企业包括:京东科技、阿里云、智臾科技、恒生电子等。
系统稳定性保障体系评估(STAR-A):
面向分布式系统运营方,评估相关团队保障系统平稳运行的能力,即控制系统内部隐患,在故障发生时维持服务,排查故障并恢复系统的能力。评估内容包括设计与开发流程管控、测试与评估、监控与应急、基础设施保障、管理保障等。由信通院评估小组进行现场评估。完成评估的企业包括:浙江移动、工商银行、招商银行、农业银行、中原银行、数字广东、威海市大数据中心等。
稳定性保障平台能力评测(STAR-T):
面向稳定性保障技术平台的功能评测,考察机构稳定性平台建设的完善程度。评测覆盖稳定性保障工作的相关工具或平台,包括监控告警平台、压测工具、故障演练平台、应急响应平台、发布平台等关键技术组件的基本功能。由信通院评测小组进行现场评测。
系统全链路压测/拨测服务(STAR-S):
面向系统自身的稳定性的压测/拨测服务。包括“全链路压测专项”和“系统可用性监控专项”两个独立项目,由信通院提供压测/拨测服务,并出具官方测试报告,度量系统自身的承载能力和可用性。完成压测专项的系统包括:陕西一码通、宁夏健康码、粤信签等。完成可用性监控专项的企业包括:东方证券、新华网、支付宝、光大银行等。
分布式系统稳定性实验室简介
分布式系统稳定性实验室(STARLab)是中国信息通信研究院旗下系统稳定性研究机构。集产学研多方力量,聚焦IT产业核心系统的稳定性保障与建设工作,助力我国关键数字基础设施建设和信息化转型又快又稳。
联系人:王超伦 13011807607
wangchaolun@caict.ac.cn