基于混沌工程理念在测试领域的探索与实践.docx
《基于混沌工程理念在测试领域的探索与实践.docx》由会员分享,可在线阅读,更多相关《基于混沌工程理念在测试领域的探索与实践.docx(11页珍藏版)》请在第壹文秘上搜索。
1、基于混沌工程理念在测试领域的探索与实践顺应分布式架构转型趋势,工商银行基于混沌工程理念开展了可靠性测试实践与探索,依托“自研+开源”的方式打造可靠性测试的工具支撑体系,并通过实施内外双层管理措施与分级分类推广策略,切实保障了可靠性测试的落地实施,显著提升了分布式服务架构的稳定性和业务连续性。近年来,伴随分布式、云计算等新兴技术的快速发展,银行信息系统正逐步从单体集中式架构向分布式架构转型,以实现灵活、高效服务。顺应这一趋势,工商银行积极响应技术发展变化,基于分布式、云计算技术搭建了全新的开放平台核心银行系统,并同步构建了较为成熟的分布式服务架构体系。为更好地保证系统稳定性和业务连续性,工商银行
2、基于混沌工程理念在测试领域开展了深度探索及实践。一、运用混沌工程原理增强系统稳定性截至目前,工商银行基于分布式架构体系,已成功实现了分布式、服务化、容器化及DevOps等多项变革,大幅提升了从系统开发到上线运行的便捷性。与此同时,为进一步减少故障影响、增强系统稳定性,工商银行于2019年开展了基于混沌工程理念的可靠性测试,并依托故障演练平台实施了常态化与专项深度测试,以夯实分布式应用的高可用服务能力。1 .强化可靠性测试工具支撑为构建混沌工程故障演练工具体系,工商银行采用“自研+开源”方式打造可视化混沌工程故障演练平台,提供了故障演练配置管理、性能实时查询、演练结果分析报告自动生成等多项能力,
3、成功实现从故障场景设计、故障场景注入及撤销到故障结果智能分析的一站式服务。混沌工程故障演练工具体系如图1所示。一是建设故障演练平台,提供故障注入能力。故障演练平台屏蔽应用底层部署差异性,将物理机、虚拟机、容器等多种基础部署环境透明化,抽象形成了系统、应用、容器三方面故障演练能力,可高效支持CPU满载、磁盘IO高、数据库访问延时等百余种故障类型演练,并基于园区、应用、节点提供了分级分类的故障快速编排能力(如图2所示),大幅降低了可靠性测试的操作门槛。园区级别系统层面应用级别应用层面节点级别容器层面图2分级分类的故障快速编排能力二是建设高可用专家库,提升故障演练精准度。通过生产问题总结、可靠性测试
4、实践、业界场景等探索建立高可用测试模型,高可用专家库覆盖了应用层、数据库层、平台层、缓存层、消息中间件层、路由层等六大类70余种测试案例。在此基础上,故障演练平台根据被测试系统的技术架构特点,可自动匹配高可用专家库的测试案例,并“一键式”生成故障演练测试任务。高可用专家库架构如图3所示。CPUDiskNetworkMemoryJVMProcessMySQLServletDubboDockerK8s专家库kafka消息中间件MQ路由层厂F5SLB上下游服前置机异分布式批数据库访数据库抛数据库负分布式事容器资源IO限流异缓存访问kafka集至MQ集群异F5异常SLB异常图3高可用专家库架构三是构建
5、自动化支撑体系,持续提升故障演练水平。基于故障演练平台、性能测试工具和应用监控系统,工商银行打造了故障演练自动化体系(如图4所示)。该体系可根据当期版本架构变化选取测试对象,并获取测试对象稳态时的TPS,交易响应时间、交易成功率等监控指标,进而预设自动化执行目标;此后,故障演练平台调用性能测试工具,即可发起压力测试并调起自动化脚本执行,同时基于测试结果判断自动化执行前后关键指标的变化情况,分析系统优化提升改进方向;最终,通过不断扩大自动化执行范围,循环调起自动化执行流程,实现可持续与常态化的高可用服务守护。分析测试结果调起自动化泅试识别要监控的指标设定测试目标选定假设配置演iS下发故隆注入介质
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 混沌 工程 理念 测试 领域 探索 实践