SRE 在十多年前在 Google 提出并应用,随着 DevOps 发展,SRE 开始被大家熟知。我们都知道SRE是一个体系化的工程,SRE体系的建设涉及的内容繁多,比如日常需求处理、容量规划、资源部署、监控告警、预案梳理、灾备演练、OnCall值班、应急事件响应、故障处理、运维自动化建设等等。那么如此繁冗的体系,该如何落地?
6月10日,由DGA数字化治理方阵、STARlab分布式系统稳定性实验室指导,高效运维社区、DevOp时代社区主办、bilibili 协办的“行“稳”致远 - SRE 稳定性工程实践沙龙”将在上海隆重召开,体系化的讲解SRE建设的思考与经验。
此前,我们曾举办过多场主题沙龙,如 DevOps、AIOps、持续测试等相关议题方向。沙龙主要面向开发、测试、运维等中高端技术人员,目的在于帮助IT技术从业者更系统的学习和了解相关知识体系。
商务赞助及合作:周 静:130 7118 2180(微信同号) 任 怡:132 6958 7068(微信同号)
报名咨询:李伟:130 2108 2989(微信同号)
渠道合作:刘欣:158 0111 5386(微信同号)
活动现场群
Twitter
Linkedin
我在 @百格活动 发现一个不错的活动#行“稳”致远 - SRE 稳定性工程实践沙龙#,分享给大家
演讲主题:
大模型时代研发运营领域的场景应用趋势展望
议题简介:
在人工智能技术的飞速发展与深度学习的广泛应用下,我们正步入“大模型时代”。本次将深入探讨大模型时代背景下,研发运营领域的应用场景、创新实践以及未来发展趋势,借助大模型技术提升研发效能、优化运营策略,以应对日益激烈的市场竞争与复杂多变的业务需求。
演讲提纲:
1、大模型时代背景概述
2、大模型在研发运营领域的应用现状
3、大模型驱动的研发运营新场景展望
听众收益:
1、了解大模型在软件研发运营领域的发展现状,应用场景及未来发展趋势
2、了解大模型在软件研发运营领域的标准体系建设情况
3.、探索行业,垂直领域大模型建设思路
个人简介:
尚梦宸,DGA-分布式系统稳定性实验室负责人,AIOps 国际标准编辑人,从事 DevOps、AIOps、SRE 等发展研究与行业标准制定工作,是《研发运营一体化( DevOps )能力成熟度模型》系列标准,《云计算智能化运维( AIOps )能力成熟度模型》系列标准、《中国 AIOps 现状调查报告(2022)》等的编写成员之一。
演讲主题:
B站 SRE 稳定性工程探索与实践
议题简介:
传统运维已无法满足现阶段互联网分布式架构下的可靠性保障,SRE 就是终极破局之法吗?SRE 该如何转型,转型中需要哪些支持,转型后的可靠性工程如何实践?本次分享就这些问题给大家带来B站 SRE 的思考、探索与实践,深度介绍我们的可靠性工程框架。
演讲提纲:
1、传统运维与 Google SRE 的演进与区别;
2、人、组织、制度为 SRE 转型保驾护航;
3、SRE 转型后如何开展可靠性工程;
4、可靠性工程框架与实战
听众收益:
1、运维转型 SRE 中遇到的困难和如何破局;
2、SRE 可靠性工程在互联网公司的实际框架;
3、了解 SRE 如何解构与落地可靠性工程
个人简介:
武安闯,先后负责中间件高可用、在线业务保障和 SRE 可靠性工程;《2021.07.13 我们是这样崩的》文章作者;从0到1带领运维向 SRE 转型,建设B站稳定性体系;主导建设 SRE 转型、SLO 工程、容量管理体系、高可用架构、多活容灾等专项;当前专注SRE可靠性体系规划建设和落地实践