GOPS 全球运维大会由高效运维社区(GreatOPS)、开放运维联盟(OOPSA)和 DevOps 时代社区联合主办,指导单位为云计算开源产业联盟、FinOps产业推进方阵。全球运维大会是国内第一个运维行业大会,面向互联网、金融、通信及传统行业广大运维技术人员,旨在传播先进技术思想和理念,分享业内最佳实践。
迄今为止,GOPS 已经举行了十九次,大会参会嘉宾累计突破7万人次,国内每一站均为本地区最大规模的高端运维盛会,满意度和推荐度高达97%以上。
第二十届 GOPS 全球运维大会将于2023年4月7-8日在南山区深圳湾万丽酒店召开
。大会将为期2天,侧重方向是云原生、DevOps、AIOps、DevSecOps、BizDevOps等技术领域。特设了如互联网大厂企业专场、银行/证券名企数字化转型案例专场、云原生架构专场、DevOps/AIOps最佳实践专场、可观测性技术实践专场等特色专场。
GOPS 主要面向运维行业的中高端技术人员,包括运维、开发、测试、架构师等群体。目的在于帮助IT技术从业者系统学习了解相关知识体系,让创新技术推动社会进步。您将会看到国内外知名企业的相关技术案例,也能与国内顶尖的技术专家探讨技术实践,使企业可以根据最佳实践确定自己的选型方案,并提前预估相关的风险和收益,实现技术落地。
商务赞助及合作:
周静:130 7118 2180(微信同号)任怡:132 6958 7068(微信同号)
门票咨询:
李伟:130 2108 2989(微信同号) 高维:132 6188 5689(微信同号)
渠道合作:
刘欣:158 0111 5386(微信同号)
议题申报:
刘 杰:156 5212 7323(微信同号),柴安雅芳:130 2108 6279(微信同号)
Twitter
Linkedin
我在 @百格活动 发现一个不错的活动#GOPS 全球运维大会2023 · 深圳站#,分享给大家
演讲主题:
走进云时代 — 招行软件工程管理演进
议题简介:
2020年初,依托前期建设的私有云平台,招行启动上云工作,历时三年在不停业、不停机、客户无感的情况下达成全面上云,实现了“在高速飞行的飞机上换掉发动机”,大幅提升了业务响应力和弹性能力。
作为支撑全面上云的重要组成部分,软件工程管理发挥了重要的底盘和引擎作用,在招行高度规范化的研发过程体系的基础上,持续改进软件工程管理体系,打造一站式BizDevOps工具平台,推动业技融合,提升员工软件工程素养。经过多年努力,科技的交付速度、质量、效率等各项指标有了明显变化,业务和科技高效协同,有力支持了招行业务发展和金融科技战略的落地。
走进云时代,面临强监管、数字化深度转型、智能化迅猛发展等新的挑战,软件工程管理迈入3.0时代,招行也有了一些新的思考和探索。
个人简介:
曾服务于华为、外资企业,在招行服务20年,工程管理、项目管理、测试管理、团队管理资深专家。牵头负责跨行网银、人行电子商业汇票、二代支付、招行第二代核心系统、招行第三代核心系统等大项目或项目群管理。牵头完成招行测试中心TMMI体系升级。牵头建设招行成都软件中心,覆盖云计算、人工智能、大数据、区块链等技术领域的研发,从零做起,五年时间达到2800人的规模。牵头招行从OnCloud到InCloud变革后适配云的软件工程管理体系建设以及EPG工程管理机制改进。
主会场演讲主题:在AIGC时代驾驭数字化力量,推动数字化变革
议题简介:
我们正加速迈进数字化时代,大语言模型的快速应用,又将智能化推向的了高潮。这是一个暂时的流行?还是一个长期且根本的变革?我们该如何行动?本次分享,将基于讲师近期对大语言模型在实际业务中的应用和探索,分析实际案例,为你分享当数字化变革遇上大语言模型,我们该如何应对和拥抱。
演讲提纲:
1、从流量垄断到业务和个体赋能——应用生态将发生怎样的变化;
2、从 SaaS 到 SaaS 和 MaaS 的深度融合——大语言模型对软件开发生态会带来怎样的影响;
3、 BizDevOps 的将成为现实——大语言模型对业务交付和创新链条带来的变化;
4、业技融合,驾驭数字化和智能化的力量——我们应该如何重塑业务、技术的关系和协同方式,从提示词工程落地实践讲起
听众收益:
1、深层次和系统地理解大语言模型给业务、技术和组织带来的影响;
2、了解如何在实际工作中应用落地
BizDevOps 专场演讲主题:当 BizDevOps 遇上大语言模型 —— 开启指数级效能增长之旅
议题简介:
本次分享,将基于讲师实际业务中应用大语言模型的实践,为你分享AIGC给BizDevOps带来的全新机遇和挑战
演讲提纲:
1、 AIGC时代,软件生态的变化,将如何重新设定研发效能改进的上下文
2、以Bi、Dev、Ops为线索,考察AIGC在业务创新和研发交付运维中的应用场景
3、贯穿BizDevOps的价值交付链路,应用AIGC重塑软件创新和交付的价值链
4、AIGC带来范式迁移的背景下,重新反思和设计效能度量
5、工程师应该如何拥抱和应对AIGC带来的机会和冲击
听众收益:
1、了解来自最新和前沿的一手实践
2、深层次和系统地理解大语言对软件生态带来的变革
3、系统地分析AIGC在软件创新、研发交付中的应用
个人简介:
何勉,前阿里巴巴集团和阿里云云效研发效能方法团队负责人。现为上海优川信息创始人。何勉是畅销书《精益产品开发 原则、方法与实施》作者,《必致( BizDevOps )白皮书》发起人和撰稿人。何勉曾担任华为特聘精益看板教练,是华为精益看板方法奠基人;曾担任招商银行研发中心研发体系咨询顾问,是招商银行精益开发方法体系的设计和构建者,负责了招商银行精益产品开发体系的设计和落地。
演讲主题:
大型SRE组织设计与建设
主题简介:
某大型互联网公司的SRE岗位建设,包括职能、晋级标准、落地方案、过渡计划
收益:可以给正在转型或即将转型的运维团队一定的参考,包括如何基于现有架构的过渡方案,减少转型对业务及现团队的冲击
个人简介:
曾就职于东软集团,为能源行业定制信息化体系,加入腾讯后负责运维团队管理。2012年负责互动娱乐事业群研发运营基础PaaS(蓝鲸)的设计、建设和运营。结合微服务、云、大数据等理念及前沿技术,通过PaaS实现研发运营一体化,并通过SaaS化产品,助力支撑团队转型升级,推动 DevOps 生态及 AIOps 落地。
演讲主题:
人工智能驱动下的开发者体验
议题简介:
在AI驱动变革的时代下,生成式AI代表着整个软件开发的未来已经不再是梦想,在微软为Azure、Office、Visual Studio一系列产品推出Copilot之后,如何运用AI进行开发作业已经变成了工程师的一种必备技能,在这种情境下工程师应该要如何调适、如何成长呢? 作为资深工程师或IT主管的人又应该如何带领团队、如何给予协助呢? 在这个AI驱动变革的时代下要怎么做才能让团队既能完成任务又能顺利的成长呢? 本session正是要针对这些问题提出解决之道。
演讲提纲:
1、说明AI驱动变革的核心要素;
2、AI时代引导着全新的开发者体验;
3、IT部门如何面对新开发者体验的挑战
听众收益:
1、认识AI驱动变革的核心要素;
2、了解AI时代的新开发者体验;
3、认知IT部门应对新开发者体验的解决方案
个人简介:
李智桦,《精实开发与看板方法》、《Windows Azure云端开发》、《WF工作流程引擎程序设计》等书的作者。为专业的软件工程顾问、Scrum及广告牌课程教学的讲师。担任过四家信息公司的研发部经理。擅长新创公司的项目开发工作,拥有超过40年以上的程序撰写经验。曾任多家著名企业的敏捷顾问。目前专注于协助企业由传统开发转换至敏捷开发的敏捷顾问。爱好撰写程序,是 Open Source 的拥护者,开放自己所有的程序代码。
演讲主题:
操作系统在中国的演进之路
议题简介:
在云原生浪潮席卷的行业大背景下,伴随着各种业务架构的快速迭代,业务的容器化、微服务化、Serverless 化,对底层的基础设施 (包括核心的 OS) 提出了新的挑战和要求,仅仅只是为上云场景做操作系统适配或优化已经无法满足新的业务需求。那么国产操作系统如何针对云原生场景和需求来进行重构设计,全面拥抱云原生的演进之路?这里将采用一个详细案例来为大家介绍。
个人简介:
单致豪,现任腾讯开源联盟主席,专注在云原生、微服务、边缘计算、大数据、操作系统等领域的开源生态建设。为腾讯建立健康的开源生态努力,致力于以开源方式加速技术和产品的创新。作为腾源会导师,开展与开发者和开源组织的开源创新协作。同时,担任Linux基金会董事会成员、TARS基金会董事主席、FinOps基金会董事成员、NextArch基金会TOC、OpenCloudOS社区秘书长、Akraino边缘计算TSC、开放原子开源基金会TOC、木兰开源社区TOC、中国云原生产业联盟技术专家、开源社顾问委员。曾获InfoQ十大开源杰出贡献人物、中国信通院尖峰开源人物、COPU中国优秀开源人物、SegmentFault中国开源先锋、GOPS微服务年度风云人物、Go中国最具价值专家。
演讲主题:
XOps+SRE构筑大运维体系,赋能企业迈进高质量发展新格局
主题简介:
随着技术的不断迭代,对企业IT提出了越来越高的要求,如何更好的服务于业务发展,快速响应客户需求变得愈发重要。这也驱动着软件研发、运维正在向着多元化快速发展,XOps与SRE运营体系随之而来,包括DevOps、AIOps、BizDevOps、DevSecOps、SRE等技术开始在各行各业逐渐落地应用。本次议题,将重点围绕XOps+SRE构筑大运维体系展开深度研讨,为大型企业持续赋能,实现高质量发展。
个人简介:
牛晓玲,DevOps标准工作组组长,DevOps 国际标准编辑人。长期从事云计算研究的相关工作,包括云服务业务功能测试以及运维管理系统审查等相关工作。参与编写《云计算服务协议参考框架》、《对象存储》、《云数据库》、《研发运营一体化能力成熟度模型》系列标准、《云计算运维智能化通用评估方法》等多个云服务评估方法标准20余项。
演讲主题:
10000+研发团队:工行 BizDevOps 体系及平台建设之路
主题简介:
如何通过建设企业级的端到端价值交付平台和电子看板体系,建立起贯穿研发全生命周期的价值流模型和多层次的可视化手段,来解决业务和科技融合过程中的复杂管理场景以及大规模团队协作的问题。
演讲提纲:
1、端到端的价值交付平台建设思路
2、智慧屏和电子看板实战经验分享
3、三层可视化管理体系的管理思想
听众受益:
1、了解大型银行如何通过创新的管理模式和丰富的技术手段,建立起面向业务价值交付的BizDevOps工具链。
2、面对10000+的研发团队,如何通过数据驱动的可视化手段,建立自组织的团队协作模式,来提升团队的研发效能。
个人简介:
中国工商银行BizDevOps平台建设负责人,工银e企研牵头架构师,负责开发中心研发管理领域的数字化转型工作。
演讲主题:
工行 DevOps 持续交付标准化应用级部署实践
主题简介:
介绍工行的持续交付标准化理念,针对工行软件开发中心在持续部署阶段存在的多组织协调、多版本并行导致DevOps落地成本高风险大等问题,结合持续交付标准化提出分层投产组织方案,通过规范部署环境、投产单元、投产组织,实现应用级部署的可复用、可验证及端到端的可视化,提升研发和运维效能。
演讲提纲:
1、DevOps持续交付标准化
2、分层投产组织方案
3、后续展望
听众收益:
了解在复杂组织中落地DevOps时,如何通过规范部署环境、投产单元、投产组织,降低实施门槛和风险,提高实施成效。
个人简介:
DevOps工具链的产品经理,长期从事持续交付产品设计、实施相关工作,致力于建设工行的持续交付标准化工具链,推进持续交付标准化理念在企业中落地,在效能提升、DevOps实践领域有丰富经验。
演讲主题:
工行监控运维架构实践
议题简介:
互联网金融时代下,金融产品和服务模式出现了日新月异的变化,传统单体架构无法满足业务快速多变的需求,为此工商银行广泛运用云计算和分布式技术以支撑金融业务的快速发展。随着工行分布式转型工作的不断深入,应用架构的复杂性日益增加,交易量也不断攀升,银行内部对IT系统运维支撑能力提出了更高的要求。本次分享介绍了工商银行在可观测、流量治理、AIOps、混沌工程等方面的相关实践。
演讲提纲:
1、监控运维系统面临的挑战
2、工行运维支持体系实践
1)可观测能力
2)流量防护与治理
3)AIOps
4)混沌工程实践。
听众收益:
了解金融行业在监控运维系统上所面临的挑战,以及工行运维支持体系在可观测性、流量治理、智能化运维和混沌演练的相关实践。
个人简介:
目前任职于中国工商银行软件开发中心云计算实验室,承担云计算实验室新技术领域研究工作。入行以来先后参与工行API开放平台和分布式技术体系的研发工作,负责相关产品规划及核心架构设计,在分布式系统监控运维方面具有丰富经验。
演讲主题:
基于IPv6+技术底座的自动驾驶网络实践
议题简介:
本主题基于入围“网信办IPv6技术创新和融合应用综合试点工作”的研究课题,由多个前瞻性的IPv6+子课题组成,目标是使用IPv6+技术底座和全信创的软硬件系统构建端到端智能、业务可视、应用感知的自动驾驶网络,为应用提供灵活、可定制的网络服务。
演讲提纲:
1、研究课题简介
2、技术创新点
3、推广情况和效益
听众收益:
1、熟悉IPv6+技术的基本概念和宏观政策
2、了解IPv6+技术的主要应用场景和优势
3、掌握基于IPv6+技术的自动驾驶网络总体架构和先进性
个人简介:
许青邦,中国农业银行数据中心专家,华为、华三、思科IE认证工程师,主要负责农行基础网络架构规划、新技术研究等工作,主导规划了ABC ONE智能网络模型,推动VxLAN、SRv6等前沿网络技术在行内快速落地,相关项目获得了人民银行、信通院、IDC等权威机构奖项。
演讲主题:
低代码架构下的云服务统一部署策略
议题简介:
针对在低代码模式下服务部署、运维模式进行交流介绍。结合低代码开发模式的特点,与大家探讨在通过低代码模式搭建的产品运维特点。通过低代码项目的整体运转模式的介绍向大家展示低代码开发与传统开发在整个流程上的差异点。
低代码开发的核心思想是让使用者通过可视化的方式,以更少的编码,更快速地构建和交付应用软件,全方位降低软件的开发、配置、部署和培训的成本,赋能每一个员工,让每个人都拥有开发的能力。在低代码模式下,普通的产品开发人员不再关注与底层的部署、运维等机制,由平台负责统一的部署运维工作,在这种情况下,一套统一的部署策略就显得尤为重要。
本次演讲,主要通过我们在低代码上的研究与实践,与大家进行部署策略的交流。
演讲提纲:
1、低代码模式与传统模式的差异
2、低代码下运维部署工作与传统项目的异同点
3、目前在低代码运维领域的一些实践探索
4、对于后续低代码运维的一些规划
听众收益:
1、了解低代码开发模式
2、了解低代码的运维模式
3、可以和传统的运维模式做一些对比
个人简介:
毕业于西安交通大学,任职于中国银行软件中心西安分中心,担任研发经理职务。长期从事一线系统建设工作,有丰富的产品开发经验。对于软件产品的全生命周期有深入的理解,在低代码领域有深入的研究,先后参与实施了中国银行手机银行建设、开发银行建设、场景生态建设、企业级架构建设等多个重大项目。在整个低代码开发模式、运维部署等方面均有探索实践,对于自动化运维、主动预警等均有一定实践。
演讲主题:
银行数字化转型下的业技融合一揽子实践及BizDevOps 建设
议题简介:
银行业金融IT建设发展至今业技融合都是各家行第一要务。伴随着中行科技管理体制改革全面落地以及企业级架构建设全面铺开,业技融合发展踏上新征程。通过重塑科技人员驻分行客户经理队伍,加强专业研发队伍,打通业务到研发需求转化壁垒,助力分行发展,达到赋能范围更广。
演讲提纲:
1、数字化转型背景下业技融合的时代趋势与必然要求
2、我行业技融合的整体思路
阐述“需求研发”、“开发测试一体化”、“数字化运营”等一揽子方案
3、业技融合的具体实践与成果转化
阐述从“如何准确理解需求”到“如何用创新思维引领业务需求”的演进,选取重点案例做分享
4、业技融合的自身价值与推广价值
听众收益:
1、了解现在数字化转型背景下业技融合的时代趋势与必然要求
2、中行在业技融合演进策略
3、通过中行业技融合实践成果了解其价值
个人简介:
2012年入职中国银行软件中心,毕业于中南大学应用数学系,现任消费金融与私人银行业务研发部业务研发团队高级软件工程师(一)。先后经历过中国银行IT系统蓝图建设、海外卢森堡系统保密信息不出境系统建设、教育场景系统建设等多个系统的开发实践与产品经理经验。
演讲主题:
中行制品管理难题及企业级高效管理实践
议题简介:
随着敏捷开发、持续交付等技术的发展,软件制品种类迎来了爆发性增长。大型企业更面临着制品爆发所带来的制品分散、无唯一制品可信源、安全管理难、开发技术栈类型多无统一管理工具等问题。加之大型银行业开发侧与生产侧的网络隔离,对制品的流转以及协同带来更大挑战。制品作为企业最重要的信息资产之一,高效统一制品管理势在必行。
依托企业级制品库高阶目标为指引,建设企业级制品管理和交付工艺能力,构建一套针对大型银行企业级制品管理平台,来支撑大规模制品管理及流转场景,支持敏捷迭代流水线及自动部署能力,必然对助力大型银行企业数字化转型及提升软件交付效率有着重要意义。
听众收益:
1、了解企业级制品管理的设计理念,以及制品管理能力从敏捷迭代和自动部署方面对开发运维一体化的支撑模式。
2、了解企业级制品如何高效有序共享,如何进行规范权限管理和下载机制制定。
3、帮助大型银行业突破开发侧与生产侧的网络隔离导致制品的流转以及协同带来的挑战。
4、为面临制品分散、无唯一制品可信源、安全管理难等企业级制品管理问题的企业提供解决思路。
个人简介:
就职于中国银行软件中心,深度参与中国银行信息系统建设,目前主要负责中国银行企业级DevOps体系建设实施和质量保证,致力于持续提升企业级DevOps的赋能能力。
演讲主题:
中行制品管理难题及企业级高效管理实践
议题简介:
随着敏捷开发、持续交付等技术的发展,软件制品种类迎来了爆发性增长。大型企业更面临着制品爆发所带来的制品分散、无唯一制品可信源、安全管理难、开发技术栈类型多无统一管理工具等问题。加之大型银行业开发侧与生产侧的网络隔离,对制品的流转以及协同带来更大挑战。制品作为企业最重要的信息资产之一,高效统一制品管理势在必行。
依托企业级制品库高阶目标为指引,建设企业级制品管理和交付工艺能力,构建一套针对大型银行企业级制品管理平台,来支撑大规模制品管理及流转场景,支持敏捷迭代流水线及自动部署能力,必然对助力大型银行企业数字化转型及提升软件交付效率有着重要意义。
听众收益:
1、了解企业级制品管理的设计理念,以及制品管理能力从敏捷迭代和自动部署方面对开发运维一体化的支撑模式。
2、了解企业级制品如何高效有序共享,如何进行规范权限管理和下载机制制定。
3、帮助大型银行业突破开发侧与生产侧的网络隔离导致制品的流转以及协同带来的挑战。
4、为面临制品分散、无唯一制品可信源、安全管理难等企业级制品管理问题的企业提供解决思路。
个人简介:
2020年加入中国银行软件中心,毕业于悉尼大学软件工程专业,先后从事中国银行金融IC卡系统、联机批量交易系统建设,现为中国银行DevOps云平台“扶摇”主要负责人之一,担任组织级敏捷教练,协助多个金融产品完成传统瀑布到敏捷开发模式的转型,参与组织级效能度量系统的建设,具有丰富的敏捷转型实践经验。
演讲主题:
基于量化分析设计高可用架构,构建确定性运维能力
议题简介:
影响现网质量的要素不仅仅有后端的运维质量,还有产品的前端的高可用架构设计质量。通过RBD方法可以建立面向架构设计的量化SLO评估数学模型,在设计阶段评估出产品现网的质量结果的数学期望值,从而将架构缺陷在设计前端解决。本主题探讨基于高可用模型的量化评估方法,实现不同高可用方案的SLO的量化对比,解决如何选择现网可用度最高的方案最优解的问题。
个人简介:
华为公司20年分布式系统的开发、设计和运维经验。目前主要负责华为云SRE的服务韧性工作,持续致力于通过软件工程方法解决华为云的超大规模运维的问题。是“确定性运维”理念的主要提出人和实践者。
演讲主题:
进击的价值交付:招行适配云的 BizDevOps 进化
主题简介:
在招行从Incloud到Oncloud云时代变革背景下,BizDevOps工具链要打通从业务到开发再到运维的整个流程,充分发挥上云后的优势,实现业务、产品和运维的有机融合,形成高效的业务交付、运行和反馈闭环,打造一站式的研发管理平台。本议题将和你探讨,如何找到切入点,形成整体平台建设的解决方案,如何应对建设过程中遇到的管理、技术等多重挑战。
演讲提纲:
1、招行DevOps平台建设的背景
2、BizDevOps进化面临的挑战
3、招行BizDevOps平台建设现状
4、BizDevOps建设的未来展望
听众收益:
了解BizDevOps工具链从业务到开发、到运维打通的整个流程。了解BizDevOps产品如何发挥上云优势,实现业务、产品的有机融合,提升服务和体验。
个人简介:
招行服务19年,伴随招行信息技术部从200多人发展到10000多人的规模,获得了PMP、CSM、CSPO、CSP、DOF、DOP、AWS、CSAA认证。2015年开始牵头研究和推进招行DevOps持续交付实践落地,推动招行DevOps到BizDevOps升级,牵头建设流水线,并在2022年通过信通院(DevOps)能力成熟度模型“卓越级”评估,该案例也同时入选"2022IT新治理年度卓越创新案例"。
议题简介:
敬请期待
听众收益:建好一朵真用,好用,省用的私有云,服务上亿MAU的应用上云。在三年上云的过程中,指导思想,执行原则,方式方法,最佳实践,经验教训等,都可以作为相关建云,用云和运维运营云的同学参考。
个人简介:
资深IT工程师,长期专注在金融科技和IT一线。熟悉银行IT架构和系统管理。经历从大机时代、小机时代、云计算时代,到现在的云原生时代。十八年开放平台技术架构、运维体系建设老兵。亲历云原生技术快速发展若干关键时刻,有着丰富的云建设、云运维和云运营相关经验,对如何“建好云”、“用好云”和“用省云”有独到理解。
演讲主题:
云外到云上:招行信用卡系统上云实践
议题简介:
信用卡应用系统上云历经核心系统改造、核心业务功能验证、外围系统适配改造,核心数据移植和外围系统配合切换等阶段,顺利完成招行亿级信用卡客户从主机向云平台的无感平滑迁移,实现了信用卡应用系统的全面上云,全面走进了云时代。信用卡应用上云过程中系统架构、研发管理有哪些变化?大规模应用系统上云的过程是怎样的,有哪些经验?应用上云后架构要往什么方向演进?本主题为大家一一道来!
演讲提纲:
1、应用系统上云背景介绍
2、应用系统上云的思路
3、应用系统上云的过程
4、应用系统上云的收获
听众收益:
通过分享可以了解银行信用卡系统的架构演进情况,了解大型复杂银行应用系统上云的策略和方法以及上云投产、验证、迁移、切换的过程,可以为大规模应用系统的上云提供有益的借鉴和参考。
个人简介:
招商银行信用卡相关应用上云负责人,EPG专家组成员,精益技术教练。长期专注于信用卡业务领域相关系统设计、研发及工程管理,负责团队CCCQ配置管理体系的建设和成功推动团队devops工具体系平稳转型落地;参与了信用卡核心系统2.0和3.0版本升级的全过程,深度参与信用卡应用系统的全面上云过程。
演讲主题:
低门槛高可用:招行基于 OAM 的云原生应用管理实战
议题简介:
随着招行全面上云,如何降低云的使用复杂性,提升云上应用排障速度成为关键挑战。标准化、规范化的应用交付,完全以应用为中心的IaC技术是良好的解决办法。招行基于Open Application Model的标准实现Kubevela建设了云原生的应用管理平台。通过抽象标准的工作负载,实现业务开发者、运维人员、平台建设者的关注点分离。让业务开发者关注到业务创新,通过描述式、代码化的方式使用云的能力,降低开发人员理解心智。完全以应用为中心的管理平台,让开发者通过遵守规范和标准,享受低门槛、高可用的应用交付体验。
演讲提纲:
1.OAM & KubeVela简介
2.应用管理核心引擎
3.降低云的使用复杂性
4.提升云上应用故障定界能力
5.快速切换隔离
6.社区共享共建
听众收益:
了解云原生应用管理的标准规范,如何降低云的使用复杂性,排障提速。如何通过描述式、代码化的方式使用云的能力,降低开发人员理解心智,让业务开发者关注到业务创新。
个人简介:
长期从事云计算和运维自动化相关的产品建设。负责落地实施了招行第一代PaaS平台和第二代基于容器的PaaS平台。负责建设招行整个运维自动化、数字化工具体系。从基础设施管理、Agent、CMDB到应用管理,从监控告警、运行可观测到运维数据分析系统等。
演讲主题:
大规模上云背后 :招行私有云 FinOps 实践
议题简介:
云计算发展至今,技术上已经高度成熟,企业希望通过上云获取成功,核心在于云使用模式和风险管理,云成本既是上云最大的风险之一,也是云技术迭代、云上协作模式和管理优化的核心驱动力,最大化云价值,实现云上成功,是一项综合技术、财务和业务的跨界融合工作,演讲者将结合自身工作经验,介绍大型私有云云成本运营体系的构建和管理实践。
演讲提纲:
1.规模化下云上效率和成本的冲突
2.私有云资源运营痛点
3.从交付端到消费端:云成本管理的商业化逻辑,
4.招行私有云成本运营体系落地实践
5.未来展望
听众收益:
云时代,大型企业面临的远不止技术问题,技术、财务、业务的跨界组合,是云转型成功的关键,演讲者拥有多年大规模的公、私有云运营管理经验,希望与大家共同探讨。
个人简介:
招行老兵,从IBM大机运维转型云计算并积极拥抱云原生,全程参与招行银行云计算建设和三年上云工作,先后牵头负责招行公有云运营管理体系、原生云平台运营,云成本运营体系、云运维体系的规划和建设,对公、私有云技术体系、云使用管理模式、云财务管理有深刻的认识和丰富的实践经验,致力于打造云计算的最佳应用和管理实践,实现云上质量、成本、效率和价值产出的最优解。
演讲主题:
数字孪生在数据中心场景下的探索与实践
议题简介:
数据中心作为数据流转枢纽和业务承载平台,是数字化经济的重要基础设施,也是最为复杂的系统之一。数字孪生作为产业数字化的核心技术之一,是当下数字技术领域的焦点,其应用场景、技术变革、产业趋势是各界关注的焦点。从web2.0到web3.0,通过虚实交互,探索全新的管理模式,应对数据中心的需求和挑战,以便更好的反哺业务,支撑业务全面线上化、数字化。
个人简介:
长期从事金融行业架构和技术管理工作,目前主要负责公司技术平台和公共服务的建设运营。
演讲主题:
证券老兵自述:券商规模化敏捷避坑指南
议题简介:
中金财富证券自2020年开始进行全敏捷组织的转型。为支撑业务的快速发展,金融科技人员内嵌到敏捷团队,规模也迅速扩张到500人。金融科技团队的人员组成,也从传统的开发、运维为主,变为一个包含产品、SM、开发、测试、运维的产品小队。如何帮助团队管理者迅速有效的按照敏捷理念将小队协同起来,以快速、高质量,交付用户价值为目标,是我们推动规模化敏捷的核心诉求。为推动规模化敏捷的落地,我们成立了EPG&DevOps团队,以统一的敏捷研发流程规范和统一的研发工具平台为基础,结合敏捷的相关实践,小步快跑,持续增量的推动金融科技的规模化敏捷。
演讲提纲:
1、引言:介绍该主题的背景和目的
2、规模化前的挑战
3、从0到1的敏捷实践
4、规模化后的收益
听众收益:
1、了解进行敏捷转型可能会遇到的坑
2、敏捷转型解决思路
3、敏捷转型能带来的收益
个人简介:
证券老兵,敏捷新人。在证券行业有十多年的从业经验,干过开发,做过测试,也做过项目管理。2020年随着公司的全敏捷组织转型,开始学习和了解敏捷、DevOps相关理念和实践。持续学习,持续改进。
演讲主题:
大型券商智能化运维场景探索与实践
议题简介:
通过智能化驱动运维数字化转型,解决传统IT运维依靠人驱动系统造成的服务能力局限,是当前券商保障业务稳定运行与高质量发展的共识。
国信证券作为大型券商券商承担着更高的用户量和业务并发压力、更极致的用户体验要求和更严苛的监管要求,在庞大且复杂的系统架构、海量的业务和运维数据的艰巨挑战下,如何保障智能运维不同业务的落地效果?如何触类旁通赋能现有运维工具体系?如何针对变更、应急、测试等运维场景快速构建智能化解决方案?且看大型券商智能化运维场景探索与实践。
演讲提纲:
1、数智化时代驱动传统运维转型
2、一体化中台落实智能运维建设
3、国信证券智能化运维场景构建
4、智能化应用落地运营经验探索
听众收益:
1、 了解券商系统运维数字化转型的痛点经验
2、 了解国信证券当前运维智能化的体系架构
3、 了解券商运维智能场景化方案的探索案例
个人简介:
国信证券资深算法工程师,智能运维负责人,具有十余年金融、安全等领域的算法从业经验。
演讲主题:
金融行业DevSecOps安全测试体系建设与实践
议题简介:
随着各行各业IT数字化程度不断提升,IT行业持续多年爆发式增长,黑客攻击、数据泄露事件层出不穷,安全测试成为保障软件安全、保护用户数据以及守护公司信息资产的重要措施。本议题基于软件安全开发生命周期,从“安全左移”与“安全右移”的角度结合DevSecOps安全工具链与人工渗透测试,深入探讨金融证券行业安全测试体系建设与实践。
演讲提纲:
1、SDL与安全评估
2、DevSecOps安全工具链与人工渗透测试
3、漏洞全生命周期运营与管理
听众收益:
1、金融证券行业领先的SDL流程建设与管理经验
2、全面的安全测试体系建设与漏洞运营管理经验
个人简介:
刘国隆,华泰证券信息安全专家、注册信息隐私技术专家(IAPP-CIPT)、PMP,曾就职于华为技术有限公司,拥有多年的安全和隐私保护从业经历。
在SDL/DevSecOps、应用安全设计、安全代码审计、WEB/移动安全测试、GDPR数据安全与隐私保护等领域具有丰富的经验。目前主要专注于应用安全测试体系建设、项目安全风险评估、DevSecOps落地、漏洞全生命周期运营与管理等。
演讲主题:
招商基金基于低代码平台的运维数智化实践探索
议题简介:
近些年,各个行业的运维部门都在进行数智化转型。证券基金行业的运维部门作为整个公司后台中的后台部门,如何才能在做好系统稳定性保障的基础上开展数智化转型,提供更多的“价值”,是每一个运维人值得思考的问题。我司运维团队,在充分收集业务、开发、测试和安全团队需求的情况下,并且结合自身对于行业系统特性的深刻理解,基于低代码平台展开了针对我司运维数智化转型工作的实践。基于低代码平台的开发高效性,我司完成了“大数据一体化devops平台”、“O32交易系统运营平台”、“FinOps业务系统成本容量管理平台”、“缺陷跟踪管理平台”、“HW自动化处置平台”等,以上平台通过低代码的方式不但节约了大量的采购成本,同时能够更加切合我司实际业务场景,功能需求迭代快速,深受使用方好评。
演讲提纲:
1、招商基金运维团队数智化转型探索背景参考;
2、招商基金低代码平台能力简介;
3、招商基金运维基于低代码数智化转型落地实践场景(会详细介绍我司落地的几个场景,“大数据一体化devops平台”、“O32交易系统运营平台”、“FinOps业务系统成本容量管理平台”、“缺陷跟踪管理平台”、“HW自动化处置平台”);
4、招商基金运维基于低代码数智化转型后续规划;
听众收益:
1、证券基金运维团队进行数智化转型思路;
2、低代码平台给运维团队带来的价值;
3、招商基金“大数据一体化devops平台”、“O32交易系统运营平台”、“FinOps业务系统成本容量管理平台”、“缺陷跟踪管理平台”、“HW自动化处置平台”建设效果和思路借鉴
个人简介:
现任招商基金公司信息技术部架构师(基础架构方向)。硕士研究生学历,曾就职于蚂蚁金服金融云团队。擅长领域:云计算IAAS和PAAS平台规划与建设、系统架构设计、API治理、微服务网关、可观测性建设、一体化运维平台建设、DevSecOps、SRE、信创在基金行业落地等。ITIL认证,并在IEEE Computer发表论文” on-demand security architecture”,撰写专利“一种数据保护方法、装置及数据保护系统”(专利号:201010538235.8)。GOPS全球运维大会优秀讲师,信通院混沌工程工作组成员,信通院一云多芯稳定性工作组成员,TWT社区专家,互联网产业联盟零信任产业标准工作组成员,基金行业信息安全白皮书编者成员,DevOps Master认证等。
演讲主题:
大型银行产品线级交付DevOps实践
主题简介:
介绍DevOps发展建设历程及在数字化转型过程中的探索与实践;针对大行跨多系统业务要求的复杂性、技术栈的多样性,制品种类繁多,线上化协同复杂等困难,如何提供支持产品线级的DevOps解决方案;结合敏捷研发六大域的建设思路,描绘以业务价值交付为核心的大DevOps平台建设规划。
个人简介:
10年以上IT从业经验,先后任职于NEC(中国),甲骨文研发中心,中信银行和建信金科,具有丰富的产品研发,架构设计及项目管理经验,对敏捷研发及DevOps体系有深入的理解,现担任建信金科基础技术中心DevOps平台产品经理,主要负责平台的建设,规划与推广。
演讲主题:
数字化转型下的软件供应链安全及DevSecOps实践
议题简介:
介绍DevSecOps方案在企业中的建设方案,以及证券行业面临的软件供应链风险及解决方案的思考。
演讲提纲:
1、证券行业软件开发的特点
2、安信证券DevSecOps实践
3、开源软件治理的方向
4、软件供应链治理方向
听众收益:
1、学习DevSecOps方案落地的经验
2、了解证券行业面临的软件供应链风险
3、学习软件供应链治理的方案
个人简介:
多年专注于金融行业的开发安全实践,现在安信证券负责软件安全开发方案规划与落地和软件供应链治理方案的探索,对金融行业的软件安全开发方面具有独到的见解。
演讲主题:
广发证券一站式自动化测试体系建设
议题简介:
介绍一站式自动化测试平台背景,券商行业自动化测试面临哪些共性问题,一站式自动化测试平台基于这些共性问题提出的解决方案,在广发证券的实施效果展示。演讲提纲:
1、一站式自动化测试平台发展现状简介
2、平台建设背景及创新型解决方案
3、基于一站式平台的广发自动化测试体系发展及后续规划
听众收益:
1、券商自动化测试面临的特有问题及解决方案
2、自动化测试体系化建设方向
个人简介:
工作9年,曾就职于美团、阿里等。有研发、性能测试、自动化测试、敏捷DevOps转型等相关工作经验。2019年加入广发证券,从事质量体系建设、自动化基础设施平台建设,拥有丰富的质量保障经验,负责一站式自动化测试平台的规划与建设落地,支持广发证券90+系统完成全场景自动化测试实践。
演讲主题:
中国联通 DevSecOps 安全高效研运一体化实践分享
议题简介:
中国联通坚决贯彻落实国家战略,大力推进数字化转型,践行DevSecOps理念,在实践过程中形成了共平台、共能力、共技术栈、共研发体系的数字化技术底座,为上云应用提供集项目协作、代码管理、统一制品、自动化测试、敏捷发布及智能运维于一体的安全高效研运环境,以数据支撑和指引业务运营,以可视化、智能化驱动研发运维,守护数字化研发供应链安全、稳定、可靠运行。
演讲提纲:
1、敏捷研发:构建企业级端到端数字化研发体系,助力企业研发效能持续提升
2、智能运维:联通云运维体系在DevOps的落地实践,以自动化、智能化手段实现运维闭环管理,面向应用提供安全稳定的云上环境
3、安全保障:探索安全左移的安全运营思路,总结研发、构建、集成以及运行时的安全管理实践
听众收益:
1、了解中国联通数字化研运体系实践方案,促进行业DevOps实践经验共建共享
2、了解一站式研运平台建设思路,为研发、运维、运营提供安全高效的平台支撑
个人简介:
王晓峰,男,高级工程师,任职于中国联通软件研究院,公共平台与架构研发事业部副总经理。深度参与中国联通IT集约化建设,负责中国联通IT系统架构、建设及运营,在企业数字化转型过程中,负责数字化研发平台、数字化底座联通云PaaS平台、PaaS中间件、信创及企业架构规划。多次荣获中国联通科技进步奖、管理创新奖及企业劳动模范等称号。
演讲主题:
业技融合风向标!BizDevOps 标准最新解读和动态分享
议题简介:
当前,数字生产力飞速发展,众多企业逐步开始探索和尝试通过研发转型赋能业技融合、业务价值的整体优化、创新、重构和提升,在不断获取个性化、动态化的业务价值的同时,实现企业高质量发展。国家金融监管总局发布的《关于银行业保险业数字化转型的指导意见》已明确指出,在数字化时代要做到“业技融合”。人民银行发布的《金融科技发展规划(2022-2025年)》已将“业务研发运营一体化(BizDevOps)”写入”加快金融服务智慧再造“章节。
中国信通院联合云计算开源产业联盟发布的《中国DevOps现状调查报告(2022)》中指出超四成企业已引入 BizDevOps,但多数处于探索阶段,行业内缺乏相关标准和标杆引领。可见,各企业数字化转型进程差别较大,对于已引入 BizDevOps 的企业而言,转型已进入深水区,更注重转型为业务所带的价值与贡献,引入BizDevOps 并开展不同程度的探索、实践已成为必然趋势。
在此背景下,由中国信通院牵头联合近60家企业单位共同制定国内首个业技融合管理标准——《研发运营一体化(DevOps)能力成熟度模型 第9部分:业务价值交付管理(BizDevOps)》。
本次演讲将对业技融合(BizDevOps)标准最新动态进行分享与解读,并揭示行业内领先实践做法,敬请期待!
个人简介:
刘昭炜,中国信通院云大所审计与治理部业务主管,新加坡南洋理工大学硕士。从事开发运维方面的相关研究工作,参与编写《研发运营一体化(DevOps)能力成熟度模型》系列标准、《研发运营一体化(DevOps)通用效能度量模型》等标准。参与多篇白皮书、调查报告等编制工作,包括《中国DevOps现状调查报告(2021、2022)》等。参与评估DevOps能力成熟度评估超过20个项目,具有丰富的标准编制及评估测试经验。
演讲主题:
研发运营体系下的系统稳定性与可观测性能力实践
主题简介:
随着数字化改革的不断创新与推进,以单个体传统的业务系统为对象的运维方式已经不能适应数字化改革的推进步伐,业务跨场景协同越来越复杂,衍生应用越来越多样,保障系统高效、稳定、精细、安全已不完全是运维的职责。“大运维”应运而生。
演讲提纲:
1、构建新时代“大运维”体系
2、系统稳定性与可靠性实践
3、可观测性能力实践
4、智能化运维能力成熟度系列标准介绍
听众收益:
1、了解新时代“大运维”体系框架
2、了解系统稳定性与可靠性能力建设架构
3、了解如何通过提升系统可观测性增强运营能力
4、智能化运维能力成熟度评估最新动态
个人简介:
AIOps国际标准编辑人,从事DevOps, AIOps等发展研究与行业标准制定工作,是《研发运营一体化(DevOps)能力成熟度模型》系列标准,《云计算智能化运维(AIOps)能力成熟度模型》系列标准、《中国AIOps现状调查报告(2022)》等的编写成员之一。
演讲主题:
20万节点:字节跳动大规模集群联邦系统实践
议题简介:
随着字节跳动内部各业务系统云原生化的演进,k8s 集群数量和规模极速增长,集群维护成本不断提高,同时数量众多,形态各异的集群也为用户选择集群部署带来认知负担。为解决上述问题,我们自研了大规模集群联邦系统 KubeAdmiral,为用户提供统一的服务部署入口,方便任务负载在多集群之间流转,为打造统一资源池,提高资源利用率奠定基础。
演讲提纲:
1、背景介绍
2、字节跳动集群联邦:KubeAdmiral
3、业务负载全局调度实践
4、大规模集群联邦性能优化
听众收益:
了解生产环境下,大规模集群联邦系统落地面临的挑战和应对措施,包括但不限于:
1、联邦系统性能优化
2、业务负载全局调度实践
3、如何在联邦集群为业务提供一致的体验
个人简介:
博士毕业于中国科学院,目前在字节跳动专注于云原生领域,负责大规模集群联邦系统的构建,以及云原生多租户方案的设计和实践。
演讲主题:
Google Kubernetes Engine Autopilot:容器与 Serverless 的协奏曲
议题简介:
容器(Container)和无服务器架构(Serverless)都是云原生领域广受关注的技术架构。容器和无服务器架构有着各自不同的技术特点和应用场景。容器为用户提供了一个可控的管理边界和自定义的空间。无服务器架构则着眼于进一步降低规模化运维的难度和成本。本演讲将介绍 Google Cloud 如何通过创新,将容器与无服务器架构进行融合,发挥其各自的优势,提供一种容器应用运维和管理的全新体验。
演讲提纲:
1、容器 vs Serverless
3、容器的 Serverless 化
4、Serverless 的容器化
5、GKE Autopilot
听众收益:
1、清晰地理解容器与 Serverless 架构的异同点
2、了解如何更高效地进行容器应用的运维与管理
3、了解云原生架构领域的最新技术趋势与动向
个人简介:
陈耿,Google Cloud 资深架构师,活跃于开源云原生技术的推广,著有多部云原生技术的著作。
演讲主题:
无服务器架构在企业应用集成场景中的应用
议题简介:
无服务器(Serverless) 强调的是一种架构思想和服务模型,让开发运维人员者无需更多关心基础架构(服务器等),而是专注到应用程序业务逻辑上。Serverless 也是下一代计算引擎,是云原生的未来。本次分享将通过无服务架构快速实现企业应用集成。
演讲提纲:
无服务器架构概览
企业应用集成需求分析
通过无服务架构快速实现企业应用集成的案例分享
无服务架构在企业落地的最佳实践
听众收益:
1、了解云计算基础架构未来技术趋势
2、了解企业应用集成在云计算环境下的业务场景
3、通过案例分享理解通过无服务器架构实现企业应用集成的方案
个人简介:
马腾,微软(中国)有限公司资深架构师,在IT领域有超过20年的工作经验,近十年生专注于云原生、人工智能和数据分析等技术领域,他曾在众多云计算公司工作,如Oracle、阿里云和微软等。他曾为多家大型企业和互联网客户设计并实施了云计算解决方案架构,并深入探究技术细节。马先生积极参与云原生基金会(CNCF)的工作,致力于推广K8S、Helm等技术发展,并多次在Oracle Open World、阿里云栖大会、微软Tech Ready、InforQ等技术峰会和论坛上分享他的技术架构经验。
演讲主题:
激荡十四年:运维老兵的云上/云下技术实践
议题简介:
这十四年互联网行业及云技术快速发展,回头望去运维的工作发生了质的变化,技术战场从传统IDC转而上云,技术模式从刀耕火种的人肉运维逐步转向devops自动化运维,弹性伸缩、云原生、大数据、chatgpt……云计算重新定义运维,云技术进入新时代。那么,如何在业务快速奔跑的高速路上换轮胎,如何保障业务高峰如丝般顺滑,如何建设稳定的SRE体系,作为业内资深人士,将从云技术实践的甲乙方视角一一深度解答,聊一聊云技术从业者如何不断升级,以应对千行百业的数字化转型及海量业务增长,全面实现技术价值最大化。
演讲提纲:
1.业务背景及云技术挑战
2.传统云下技术实践
3.企业数字化转型技术实践
4.千行百业的云上业务护航及平台化支撑
5.SRE稳定性体系建设与运营
6.云运维趋势与未来展望
听众收益:
通过分享可了解互联网十年来的游戏技术架构发展,互联网电商、社交、直播等多行业云上护航保障经验,以及在行业甲乙方双重视角下的devops体系化建设经验、云上最佳实践等,同时可作为业内运维的技术进阶方向指导和链接业务价值建议干货。
个人简介:
十四年互联网行业技术架构、运维SRE体系建设老兵,早期就职游戏公司,经历了从刀耕火种到业务井喷下的运维自动化体系建设及落地;先后就职UCloud、阿里云,经历了云技术快速发展的关键时刻,有丰富的云运维devops经验,长期专注互联网行业技术服务保障工作,聚焦电商、泛娱乐、教育、产互等行业客户,打造结合客户业务及云上最佳实践方案、赋能,擅长行业架构、云实践、疑难问题攻坚等。
演讲主题:
新型云上内容分发服务的稳定性实践
议题简介:
随着内容分发成本不断上升,业内逐渐开始探索新型自建内容分发上云的可行性,利用边缘节点的内容分发与智能调度带宽方案开始在真实业务中得到尝试,但是该架构对云资源可用性要求极高,对现有云上业务稳定性产生了很大挑战。本次主题将分享阿里巴巴在新型内容分发架构探索过程中提升业务稳定性的实践。
演讲提纲:
● 新型云上内容分发与智能调度体系架构
○ 新架构的特点与应用场景
○ 新架构对云上业务稳定性的挑战
● 新型云上内容分发业务的稳定性保障
○ 阿里巴巴云上护航体系
○ 新型存储资源稳定性建设
○ 监控预警体系建设
○ 容量评估与全链路压测
○ 应急预案与故障演练
● 新型架构下的客户业务护航案例
个人简介:
阿里巴巴系统运维与业务稳定性保障专家,致力于高并发场景下的云上业务可用性研究,具备丰富的互联网、教育等行业云上业务运维经验。
演讲主题:
泛娱乐云原生技术服务演进及云上SRE体系实战
议题简介:
云原生是指企业在逐步云化各个阶段的过程,产品服务能力跟技术服务能力 分别是两个核心指标,本主题主要为观众分享在互联网时代下企业如何利用云原生能力逐步完成云计算转型,在转型过程中如何保障业务的高性能高可靠能力,以及云计算能够为企业解决哪些业务痛点找到新的业务赛道。
演讲提纲:
1、泛娱乐行业业务新赛道及技术挑战
2、泛娱乐行业云原生能力介绍
3、在云原生中的技术服务
听众收益:
1、了解什么是产品、技术服务能力
2、公共云下如何借助云厂商的技术服务能力完成云原生构建与转型
3、企业使用云产品或自建云期间如何通过产品以及SRE构建来提升建设质量
个人简介:
王超(Evan),花名明稀,拥有超十年的互联网SRE以及泛娱乐业务保障实战经验,深耕于技术服务领域多年,目前在大型云厂商公共云技术服务团队担任技术总监,团队以资深专家组成,为公司头部客户提供稳定性保障。
演讲主题:
泛娱乐云原生技术服务演进及云上SRE体系实战
议题简介:
云原生是指企业在逐步云化各个阶段的过程,产品服务能力跟技术服务能力 分别是两个核心指标,本主题主要为观众分享在互联网时代下企业如何利用云原生能力逐步完成云计算转型,在转型过程中如何保障业务的高性能高可靠能力,以及云计算能够为企业解决哪些业务痛点找到新的业务赛道。
演讲提纲:
1、泛娱乐行业业务新赛道及技术挑战
2、泛娱乐行业云原生能力介绍
3、在云原生中的技术服务
听众收益:
1、了解什么是产品、技术服务能力
2、公共云下如何借助云厂商的技术服务能力完成云原生构建与转型
3、企业使用云产品或自建云期间如何通过产品以及SRE构建来提升建设质量
个人简介:
李斯达(Stat),花名木仔,拥有超十年的互联网从业经验,互联网时代云计算的老兵,深耕于IaaS领域多年,目前就职于大型云厂商公共云技术服务团队,华互分队负责人,负责多家互联网行业头部、独角兽客户。
演讲主题:
阿里基于内核剖析的故障分析和智能运维实践
议题简介:
通过阿里云大量的运维经验, 云应用复杂的问题单纯从应用自身或者的内核的已有指标难以定位。都需要深入内核的深入分析, 但内核故障的诊断和运维本身具有较高复杂度,要求运维人员具备较高的技术门槛和经验积累,业界具备这部分能力的人才严重不足,从客户调查发现大量中小客户都只能放任故障的发生,因此亟需自动化和智能化的内核诊断和运维系统赋能客户,减小故障诊断和运维的难度。作为阿里巴巴操作系统部门系统服务团队,我们提供阿里巴巴全集团内核故障的诊断分析和修复服务,并对阿里云内核疑难问题提供兜底服务,我们基于历史处理过的所有内核故障做系统性梳理和总结,进行大量深入内核的运维探索并贡献到龙蜥社区。
演讲提纲:
1、运维的现状和挑战
2、更好的运维体验
3、SysOM 2.0功能分享
听众收益:
1.向你展示传统开源监控和定位手段在实际大规模真实场景下的不足和困境,了解运维同学心里的痛。
2.了解龙蜥社区SysOM运维系统如何基于内核的深度定制,让问题不仅知其然,还知其所以然。
个人简介:
目前致力于阿里超大规模数据中心的稳定性和可靠性建设,新硬件与软件的协同设计等基础技术领域的研发与工程化落地。主要研究领域包括:SOC芯片的前端构建、仿真,电信级Linux内核研发,百万级系统智能运维,以及行业应用的全生栈软硬件技术及其融合应用。 曾参与中国嵌入式系统学科体系建设,国家电网智能电网国家标准的制定。
演讲主题:
SRE驱动的研发工业化改造
议题简介:
介绍腾讯游戏工业化流水线的建设历程,从大型手游和平精英项目团队研发过程中的效率卡点出发,以游戏dailybuild为案例,逐一讲解代码仓库、构建、制品部署加速、度量、工作流等研发全流程的SRE解决方案;
演讲提纲:
1、研发工业化流水线建设的背景
2、代码仓库的性能优化
3、软硬协同提升游戏构建效率
4、以工作流打造高效统一的研发工具链
听众收益:
1、学习大型游戏研发效率提升的经验;
2、技能左移,使用CD的经验来赋能CI;
3、指导运维转型,深入并深入参与到研发环节,在架构设计层面参与业务的可用性设计;
个人简介:
腾讯IEG自研游戏SRE负责人,高级工程师,2010年加入腾讯,先后担任欢乐斗地主、和平精英等数十款游戏的技术运营负责人。目前专注于自研游戏SRE运维支撑体系、游戏工业化流水线建设等相关的工作;
演讲主题:
敏捷感知,精准决策:基于 AI 与数据驱动的通信网络智能运维实践
议题简介:
随着5G时代的到来,ICT网络技术越来越先进,使能更加丰富的业务形态,同时,网络复杂度也呈指数上升,故障发生频率更高,故障表现越来越复杂,传统的依靠人的经验和知识的运维模式难以快速解决故障问题,可能导致用户体验下降,威胁运营商生存。随着 AI 算法理论的逐步成熟以及算力的极大提升,AI能力可替代很多传统的人工重复劳动,解决更多的复杂度更高的问题。华为基于多年丰富的通信网络运维经验以及运维创新实践,提出了AI驱动的人机协同的智能运维解决方案,本次交流主要分享华为ICT领域(云化核心网、无线、传输)的智能运维实践,期待与大家有更多思想的碰撞。
演讲提纲:
1、通信网络发展趋势及运维挑战
2、通信网络未来运维模式
3、华为智能运维实践
听众收益:
1、了解当前通信网络运维现状及挑战
2、了解通信网络运维趋势与技术方向
3、了解华为基于AI与数据驱动的智能运维实践
个人简介:
刘裕良,中国科学院自动化研究所博士,现为华为诺亚方舟实验室研究员。2016年开始参与ICT智能运维相关工作,主要从事小样本学习、数据异常检测、根因推荐、智能诊断、时空聚类、关联挖掘、预训练模型、Zero-Touch Operation等方向研究。在研究工作中提出的V-Sharpness、iRCRR、根因基、MSGR、AdaSTE等算法和框架,已成功应用到AUTIN等相关产品。具有丰富的AI算法设计、优化、落地经验,同时熟悉无线、传输、核心网的基本运维机制,理解运维语言和运维痛点。
演讲主题:
基于 DevOps 的大规模团队火车发布实战
议题简介:
重点介绍大规模团队如何通过需求管理、分支策略、质量建设、发布流程管控等DevOps实践,实现微服务火车发布模式的转型和落地。
演讲提纲:
1、火车发布简介
2、大型团队的发布困境与解决方案
3、大型团队火车发布转型实践
听众收益:
1、对微服务火车发布有更全面的认知
2、大型团队,复杂协同背景落地火车流程的关键点
个人简介:
现任字节基础架构DevOps 解决方案架构师,主要负责火车发布交付流程在各大业务线的方案设计、推广与落地指导。
演讲主题:
研发工业化管线的SRE设计与演示
议题简介:
随着云计算、大数据、AI等前沿科技的发展,传统的研发模式,越来越难满足企业快速发展的需求。研发效能提升也成了继商业模式、技术突破之后的另一核心竞争力。尤其是在大型互联网公司或传统企业,当某个环节哪怕只有少量优化的时候,由于其规模效应(比如集群规模,用户流量等)的放大作用,最终提效和成本节约也会是相当可观的。为了让更多企业掌握研发工业化管线带来的提效和降本的方法,本专题主要分享腾讯游戏业务研发工业化管线的SRE设计以及开发实践案例,深入浅出游戏业务研发效能的改进手段,专场上还会通过小游戏演示研发工业化管线的实践场景。
演讲提纲:
1、分享腾讯游戏业务研发工业化管线的背景和心路历程
2、结合研效产品分享如何助力游戏业务研发效能提升
3、现场演示小游戏的研发工业化管线案例
听众收益:
a.大规模百人以上项目团队研发效能提升实施方法和落地框架目标
b.结合腾讯实际的场景和痛点,阐述研发效能提升的重要性
c.通过打造CI的通用能力(流水线、代码分析、编译加速、PRE-CI等)助力企业研发效能提升,提高开发团队的满意度
个人简介:
刘章雄,腾讯 IEG 蓝鲸技术总监,负责腾讯 CI 的产品规划和业务研效提升,先后在蓝鲸内负责持续部署和大数据平台建设,有多年的运营规划以及持续交付经验,熟悉数百人规模的项目研发效能提升解决方案以及数万研发人员共用的海量持续交付平台设计和实践。
演讲主题:
10EB+数据量:字节跳动大规模 HDFS 存储运维实践
议题简介:
基于字节跳动独特的HDFS架构,分享在大规模分布式场景下(15w+节点,20EB+数据量)运维挑战和线上实践
演讲提纲:
1.字节跳动HDFS架构及业务生态
2.自动化-运维运营平台的构建
3.数据化-data insgiht体系构建(离线+实时)
4.业务治理(热表、元数据、小文件、预算及资源交付)
5.多机房架构及容量治理
-容灾、水位预测、机房调节、集群均衡、跨机房带宽治理
6.成本优化
7.未来演进
听众收益:
1、大规模分布式场景下稳定性及智能化运维如何构建
2、大规模分布式下典型业务治理及如何运营
3、大规模分布式下的容灾和容量管理
4、大规模分布式下的成本优化如何做
个人简介:
多年运维经验,一直专注云计算和大数据领域,目前在字节跳动负责大数据存储、块存储、文件存储运维,核心关注方向为稳定性、成本优化、平台效率。
演讲主题:
中国企业敏捷实践⼆⼗一年答卷
议题简介:
2022年敏捷诞生21年,敏捷在中国企业的传播和落地也有十几年的时间。敏捷适合中国企业么?中国企业如何看待敏捷实践的价值?中国企业能否诞生独特的敏捷实践创新。历时4个月,全国938位敏捷从业者参与和20名敏捷专家深度访谈和解析写就《中国企业敏捷实践白皮书》2022版。莅临大会《白皮书》为您揭晓敏捷实践在中国企业的生根,发芽,开花和结果。演讲提纲:
Part I 2022年中国企业敏捷实践趋势
(1) ⾸选敏捷管理实践是站⽴晨会
(2) ⾸选敏捷⼯程实践是持续集成
(3) ⾸选迭代周期是2周
(4) ⾸选⼤规模敏捷框架是Scrum of Scrums
(5)⾸选采⽤敏捷获益是加速软件交付
(6)⾸选企业⼤规模敏捷障碍是组织拒绝变化的阻力
Part II 中国特⾊的敏捷实践
(1)结对设计
(2)AB Test价值交付
(3)自动化测试
(4)1周快速交付
Part III 感谢
听众收益:
1、了解2022年中国企业的敏捷实践的现状
2、从年度TOP10年度最佳敏捷实践得到启发
个人简介:
国内知名敏捷专家,微信摇一摇奠基人,EXIN认证首批敏捷教练暨评估师,腾讯学院特聘高级讲师,唯一对外授课的前腾讯P12项目专家,11年腾讯工作经验20年移动互联网从业经验。
演讲主题:
研发团队的敏捷进化史
议题简介:
在Worktile经历几年发展之后,我们于 2019年启动开发PingCode研发管理工具,3年时间迅速完成PMF,并占据赛道领先位置。研发团队从20人左右的草根时代到如今100多人的进化时代,我们通过对敏捷理解、引入到持续的演进和改良,通过PingCode工具矩阵,走出一条敏捷实践经验和最佳实践。希望通过本次演讲,将我们进10年的研发管理和敏捷实践之路与参会者分享,共同为了提升研发效能而努力。
演讲提纲:
1、敏捷赋予了我们什么?
2、PingCode的敏捷进化和实践全景
3、我们用PingCode创造PingCode
4、见证超过1000+研发客户的经验和成长
5、我们不仅生产工具,还有普惠敏捷这件事
听众收益:
1、敏捷开发的实践经验总结
2、工具赋能敏捷开发的价值
3、企业数字化转型与敏捷的必然关联
个人简介:
前微软高级项目经理 ,微软MVP,敏捷大会、Qcon大会、各大研发管理峰会高级特聘嘉宾讲师。14年软件开发和高级架构设计经验,10年研发团队管理经验,以及敏捷转型和落地的咨询经验。
演讲主题:
从反馈出发为敏捷实践增效
议题简介:
虽然有各种敏捷实践,而这些实践也的确为所有敏捷的拥护者提供一个开始敏捷的方法,但敏捷始终是一种价值。任何人都应该为自己的组织情境打造属于自己的敏捷实践,才能够发会敏捷的最大价值。如果说敏捷拥抱变化,那么持续寻求反馈就是敏捷面对变化的手段。此次将分享将透过深入白皮书的实践案例,来了解如何把敏捷实践内化为组织实践。
演讲提纲:
1、透过敏捷熟练度模型,思索敏捷实践的落地
2、从价值流角度,探寻反馈调适实践
3、深入白皮书实践案例
听众收益:
1、对敏捷实践于团队内的状态有直观地判断与了解
2、了解反馈于敏捷里的重要性
3、了解深化敏捷实践的概念与方法
个人简介:
钻研软件工程并且接轨实务经验超过十五年,范围涉及软件设计、流程、云计算、人工智慧,并且历练新产品开发与交付、(跨国)团队建立、企业营运等种种议题,并且深耕变革管理、DevOps、信息安全、与隐私保护等领域,是一名创业者、审查员、和教育者。期许自己能够协助更多追求成长的人与组织获得成功。译有《非监督式学习|使用Python》、《Python for DevOps|学习精准有效的自动化》、《AI策略|人与企业的数位转型》和《敏捷开发的艺术,第二版》,并且有《用品质构筑数位转型成功的基石》等著作。
演讲主题:
打造敏捷“绿洲”
议题简介:
企业随着业务的发展、规模的扩张,部门墙越来越多、越来越厚,资源协调、配置也越发艰难,影响了业务的敏感性、长远性、特别是跨部门合作项目的开展效率;忽视核心战略能力价值的培育,这就需要打破部门边界,构建合作模式,因此,自上而下,在领导层统一观念、达成共识,明确利益共同体的目标。
演讲提纲:
1、建立协作模式
2、建设协作标准
3、建设配套度量和绩效管理
听众收益:
1、帮助听众了解跨团队合作的模和标准。
2、掌握跨团队合作过程的一些技巧方法。
个人简介:
从事质量管理相关经验18年+,历经软件开发、测试、敏捷教练和研
发效能改进等角色,辅导 10+ 项目研发过程改进及转型。
演讲主题:
亿级用户下支付宝 APP 运维可观测体系建设与思考
议题简介:
蚂蚁集团作为国内领先的互联网企业,拥有着亿级安装量的App。本次演讲主要介绍了支付宝App端的运维可观测体系建设(包括支付宝客户端本身与小程序等监控),客户端观测体系与服务端可观测之间的联动等。同时重点介绍了背后可观测平台的核心技术与其难点的解决。具体包括基于埋点与日志的观测平台,日志实时计算架构,分析型时序数据库 CeresDB 等。
演讲提纲:
1、蚂蚁客户端可观测体系介绍
2、客户端观测技术与服务端的异同与难点
- 多维度分析的难点
- 非收敛性的时间线(时间线膨胀)
3、客户端观测平台核心技术分享
- 分析型时序数据库 CeresDB(已开源)
- 日志实时计算
- 智能告警平台
听众收益:
1、了解支撑国民App “支付宝”背后的客户端稳定性保障的可观测技术体系
2、理解客户端可观测性平台与服务端可观测的不同以及其中的技术难点,技术选型与技术演进方面的思考
3、了解到这些技术难点的解决方案,其中技术选型与技术演进方面的思考。这里面重点技术组件与其实现原理。
个人简介:
2015年加入阿里集团,此后一直在可观测性领域工作,是在该领域摸爬滚打了8年的老兵。阿里工作期间,是电商可观测系统 Sunfire 的创始团队成员。17年转岗至蚂蚁集团,随后协同并带领团队逐步升级蚂蚁监控到蚂蚁统一可观测平台 antmonitor。过程产出了可观测实时采集计算平台 Pontus,开源时序数据库 CeresDB,开源可观测平台 HoloInsight 等关键技术成果。当前负责蚂蚁可观测技术与架构团队,整体推进蚂蚁集团可观测领域的核心技术研发与架构演进工作。
演讲主题:
分布式数字体验监控与测试服务建设实践
议题简介:
数字体验监测平台致力于打造一套从性能数据采集、问题挖掘到数据分析优化、体验指标防劣化的数字体验闭环能力,为应用性能监测及优化提供持续监测能力和问题优化解决方案,从而持续保障和提升产品的用户体验。数字体验监测平台依托于大规模的分布式边缘设备节点,通过自研的设备远程投屏及操作方案解决边缘环境复杂、人力测试覆盖率低、成本大等问题;通过自研客户端工具链实现多种性能数据的标准采集流程及方案,并结合体验监测平台能力提供完整的性能指标采集、分析、持续监测及防劣化能力。
演讲提纲:
1、大规模体验测试痛点与思路
2、数字体验监测服务建设实践
3、分布式数字体验监测平台
4、应用体验监测性能优化实践案例
听众收益:
1、了解数字体验监测服务方案设计与技术框架
2、了解数字体验监测平台能力
3、了解数字体验监测在应用性能优化上的实际应用
个人简介:
邹振,曾就职于哈啰出行非功能测试团队担任后端技术专家岗位,负责和参与分布式性能压测平台、性能诊断平台、IOT通信模拟平台、故障演练平台、流量回放系统等开发工作。现就职于抖音专项测试团队,负责体验平台的分布式监测、技术中间件等方向的开发工作。
演讲主题:
分布式数字体验监测服务建设实践
议题简介:
数字体验监测平台致力于打造一套从性能数据采集、问题挖掘到数据分析优化、体验指标防劣化的数字体验闭环能力,为应用性能监测及优化提供持续监测能力和问题优化解决方案,从而持续保障和提升产品的用户体验。数字体验监测平台依托于大规模的分布式边缘设备节点,通过自研的设备远程投屏及操作方案解决边缘环境复杂、人力测试覆盖率低、成本大等问题;通过自研客户端工具链实现多种性能数据的标准采集流程及方案,并结合体验监测平台能力提供完整的性能指标采集、分析、持续监测及防劣化能力。
演讲提纲:
1、大规模体验测试痛点与思路
2、数字体验监测服务建设实践
3、分布式数字体验监测平台
4、应用体验监测性能优化实践案例
听众收益:
1、了解数字体验监测服务方案设计与技术框架
2、了解数字体验监测平台能力
3、了解数字体验监测在应用性能优化上的实际应用
个人简介:
骆原,2019年加入字节跳动,任抖音测试开发专家。曾在腾讯担任高级专项测试工程师,专注移动端专项测试与测试效率提升等。目前整体负责抖音数字体验监控平台建设
演讲主题:
字节跳动云原生大数据运维管理实践
议题简介:
云原生大数据是大数据平台新一代架构和运行形态。随着字节跳动内部业务的快速增长,传统大数据运维平台的劣势开始逐渐暴露。如组件繁多,安装运维复杂,与底层环境过度耦合;对业务方来说缺少开箱即用的日志、监控、告警功能等。在此背景下,我们进行了一系列云原生大数据运维管理实践。通过云原生的方式进行运维管理,最终达到弱化业务方对状态的感知,屏蔽环境的差异,统一不同环境下的使用体验。
听众收益:
1. 云原生大数据如何解决底层依赖重,对外输出困难的痛点
2. 以声明的方式接入运维管理优势
3. 云原生运维管理带来的便捷性、平滑性与成本优势
个人简介:
8年大数据及应用研发做作业经验,主导建设过数据中台、数据仓库等大数据产品的商业化落地。现负责火山引擎云原生大数据架构和研发工作,打造支撑公有云、混合云、字节云一体化的云原生大数据运维管理平台,目前已集成多款serverless产品,如flink、spark、mq、opensearch、cloudfs等,提供一站式的大数据产品体验。
演讲主题:
腾讯SRE质量运营体系建设与实践
议题简介:
提升产品稳定性是每个SRE团队的核心工作,但是稳定性提升又是非常复杂非常多元的,可持续投入的领域非常多。如何能够通过客观数据探明产品稳定性的不足,持续观测产品稳定性的改进提升,科学有效地决策人员投入是非常关键的。在此需求背景的基础上,参考业界领先的解决方案,实践Google SRE的核心理念,引入SLO与On-Call的管理机制。经过一年多的探索实践,建立起PCG质量运营体系,覆盖腾讯视频、QQ、腾讯文档、腾讯新闻、内部各平台中台等几十个产品,实现故障运营各环节的标准化,满足各个角色的使用需求,实现数据驱动,科学决策的质量运营体系。
演讲提纲:
1、质量体系总体建设思路 – 理论层面 与 产品层面,从顶层具象质量体系概念
2、质量体系建设过程中所走的实践与成果 – 包括SLO管理、On-Call机制落地、MTTx各环节标准化,质量数据模型落地,以及过程中所走的弯路与最终可以得到的收益。
3、未来要在质量体系建设中继续做的事情
听众收益:
1、从宏观视角了解SRE质量运营体系所包含的核心内容,了解如何科学的量化与提升产品稳定性
2、详细介绍SRE质量运营体系在鹅厂的落地经验,提供其间遇到问题的解决思路与所需工具,以及最终的价值收益
个人简介:
14年北京大学毕业,先后在工行、美团、腾讯任职,现任腾讯PCG SRE研发团队负责人,负责SRE相关领域的建设,主要领域包括质量运营体系、可观测平台、混沌工程、技术风险管理等。
演讲主题:
腾讯大规模监控系统设计实践
议题简介:
基于时间序列的监控系统是现代可观测体系的核心之一。当系统的数据规模和用户规模达到一定量级,时间序列引擎的设计成为主要挑战。本次我将分享腾讯智研如何通过自研和开源结合的方式,在应对规模问题和灵活性问题方面的实践经验。
演讲提纲:
o可观测体系中的时间序列
o大规模时间序列的挑战
架构介绍
o监控系统基本架构
o可扩展设计
o混合存储设计
o高性能引擎介绍
o其他亮点
听众收益:
1.了解面对万亿规模时序数据时遇到的问题和解法。
2.了解大型监控系统在可用性和扩展性上的设计。
3.了解腾讯在可观测性方面的探索。
个人简介:
张越,在基础架构和中间件领域拥有10+年研发经验,专注于分布式系统的可观测与实时分析方向。目前在腾讯负责智研可观测平台的设计工作。
演讲主题:
如何通过数字化运维助力腾讯大数据降本增效
议题简介:
随着AI、数据科学等领域的持续突破,近3年腾讯PCG大数据领域加速增长,规模、场景的快速增长也带来更复杂的运维需求。通过对大数据采集、传输、存储、计算、应用等环节的运维标准化,我们建立了立体的数字化运维能力,牵引质量管理、成本管理的建设。既保障了数据质量,同时资源效能提升了1倍以上,在业务降本增效过程中体现了大数据运维管理好、快、多、省的能力。
听众受益:
本次分享能让大家了解腾讯PCG大数据团队在运维领域,通过数据科学的方法驱动技术演进,实现更好的质量、成本管理。对大数据领域如何通过数据治理让数据发挥更高的价值也会有所涉及。在互联网行业降本增效的大背景下,希望能在运维价值的挖掘上给更多运维人有所启发。
个人简介:
腾讯PCG大数据平台部SRE负责人,13年互联网经验,9年大数据经验,负责腾讯PCG大数据中台建设以及质量保障、效能优化,擅长海量消息中间件、分布式存储、分布式计算、实时计算、数据治理等领域。
议题名称:国产自研大数据集群管理平台实践
议题介绍:京东科技自研国产化大数据集群管理平台,基于内部大数据集群日益增长的规模和数量,运维管理工作变的越来越繁杂,沉淀打造了一款支持多组件多版本适配国产信创的大数据管理平台。如何通过本平台建设完成对的大数据集群管理能力平台化,实现对大数据集群的资产管理、集群部署、服务管理、监控、告警、健康检查、用户管理、任务治理、审计等功能,并沉淀京东大数据运维经验到智能化自动诊断,以及国产化信创的适配经验,满足大规模多环境下自动化智能化管理需求。
演讲提纲:
1、发展历程,初期面临的痛点
2、建设经验介绍
3、带来的收益
听众收益:
1、了解一种大数据运维管理平台产品设计;
2、面临繁杂系统环境和集群需求,自动化处理的思路
个人介绍:2012年参加工作,10年运维和运维开发经验,曾职过世纪佳缘、360,现任京东技术保障部后端运维开发,5年京东经历,从事大数据管理平台产品设计和开发工作,公司青苗人才、高潜人才
演讲主题:
江苏电信IT运维转型之SRE体系建设实践
议题简介:
中国电信IT系统上云后,运维面临巨大挑战,通过建立SRE稳定运营保障体系,围绕故障时长次数双压降目标,聚焦“做细事前故障预防、敏捷响应事中故障处理、抓实事后故障改进”三个阶段,依托“团队、工具、清单、手段”四大运营驱动力,通过开展运营专项行动,建强稳定运营能力,沉淀IT基础运营规范,减少故障发生。打造“应用级、业务级、集群级、跨机房”四级应急体系,提升系统高可用性。构建“SRE系统运营评估四级体系”,通过以评促建、以评促改,挖掘疑难杂症,查漏补缺,指导系统提升运营运维能力。创新性打造“故障目标认领体系”与“零故障激励体系”,制定IT系统故障压降R0、R1、R2目标,充分调动各IT系统积极性,保障系统持续稳定运营。
演讲提纲:
1、困难与挑战
2、稳定性保障体系
3、运维工具
4、运营专项行动
听众收益:
1、了解中国电信IT系统上云后,如何构建集约化SRE运维体系
2、了解江苏电信AIOPS建设和实践经验
3、了解云上系统如何构建IT系统稳定性保障的可观测体系
4、了解江苏电信如何构建 “系统四级应急体系”、“SRE系统运营能力评估体系”、“故障目标认领体系”、“零故障激励体系”
个人简介:
中国电信集团云化架构师、内训师、云眼产品经理,江苏电信“劳动模范”获得者、江苏电信企业信息化部SRE团队负责人,牵头构建云上系统一体化SRE运维体系。参与中国电信IT上云、业务平台上云项目,负责江苏电信云上系统集约化监控。自研“虎威产数监控平台”,构建面向中国电信政企客户DICT业务的云网端到端的监控调度体系。
演讲主题:
SRE体系-快速修复一个故障的套路
主题简介:
通过分享故障修复的过程来讲述故障修复能力建设。讨论如何通过执行快恢的修复和系统设计让故障修复更加快速高效,从而缩短故障恢复时长。
演讲提纲:
1、如何快速修复一个故障的过程,快恢能力建设过程
2、软件系统发生故障阶段的可靠性设计、分析、实施并评估
3、新书推介
听众收益:
1、学习到如何快速修复一个故障的实践经验和方法论
2、更深刻认识到故障修复能力的建设方法
个人简介:
《SRE原理与实践:构建高可靠性互联网应用》作者;
历任虎牙直播SRE负责人、架构师,经历整个SRE体系建设过程,拥有20年软件开发、架构、运维经验;
演讲主题:
广东移动业务支撑系统AIOps应用实践
议题简介:
广东移动IT线条从2019年开始做AIOPS相关预研,紧扣集团IT公司规划,2020年从“质量保障、效率提升、成本管理”三大方向开始建设AIOPS场景,到2023年依托新一代数智化运维平台,已经形成了较为完备的AIOPS体系,也有了较为丰富的应用实践经验,希望与业界分享交流。
演讲提纲:
1、广东移动AIOPS建设历程
2、广东移动AIOPS推广实践经验
3、对于吸收运维新理念新技术的展望
听众收益:
1、了解广东移动 AlOps 建设和实践经验
2、在业务支撑系统中哪些 AlOps 场景效用较大
3、大型运维平台建设、运维能力推广的心得
个人简介:
中国移动IT运维专家,电信业务支撑系统运维专家,广东移动AIOPS体系负责人。历经运维工程师、运维主管、项目经理、运维工具开发、运维平台设计等多种岗位,信通院AIOPS能力成熟度技术规范编制专家,目前负责广东移动业务支撑系统、管理支撑系统运维平台能力的整体建设规划。
演讲主题:
赋能一线运维人员:中国移动集中化AIOps应用故障运维实践
议题简介:
AIOps作为当前热门话题,运维工作的大势所趋,最近几年各行各业进行了大量的探索。但受限于AIOps技术不成熟、体系不完善的现状,AIOps的投入受益比开始受到市场的质疑。我们相信AIOps是未来运维工作的必然发展方向,也认识到AIOps距离成长为SRE一样的方法论和体系还有一段路要做,但今天这段路已经不是太长了。中国移动集中化AIOps作为国内最早探索AIOps技术产品,一度面临着能力凌乱,复用困难,无法服务于一线运维人员的众多难题。从2019年至今在中国移动11省业务系统上进行了近四年的探索研究,我们逐渐掌握了AIOps能力体系构建之道,AIOps算法技术破局之术,构建了一批可以直接服务于一线运维人员的精品能力,形成了AIOps运营之术,形成了AIOps能力规划设计、建设、运营的方法论,让AIOps真正走出理论,奔向实践。
演讲提纲:
1、AIOps问题现状及现有技术、运营难点
2、中国移动集中化AIOps能力体系构建之道
3、中国移动集中化AIOps破局之法
4、中国移动集中化AIOps运营之术
听众收益:
1、如何甄选AIOps建设范围,构建AIOps能力体系
2、如何破解AIOps当前技术难题,构建精品AIOps能力
3、如何用好AIOps,在一线运维工作中构建最佳AIOps精细化运营实践
个人简介:
中国移动“十百千”专家,具备十年以上省级业支系统架构设计、技术运营经验,参与多次大型省级割接;自主构建集中化AIOps体系,牵头完成AIOps全场景能力的建设运营。
演讲主题:
以价值和效能为导向:网络智能化技术提升业务体验的探索
议题简介:
随着5G网络的演进和VoNR等业务的快速商用,通信运营商的网络规模越来越大,运维工作量快速增长。面对业务的快速发展和规模商用,用户体验成为决定业务成败的关键因素。因此需要提升业务体验,实现从“人口红利”向“人心红利”的重要转变。通过应用网络智能化技术,基于O域大数据构建AI模型并开展训练,实现对业务质量的精准评估和诊断。以价值和效能为导向,重构传统运维模式,助力业务体验持续提升。
演讲提纲:
1、运营商核心业务现状与挑战
2、基于特征挖掘、深度学习算法构建业务感知模型
3、网络智能化技术应用成果分享
听众收益:
1、如何通过网络智能化技术重构传统运维生产流程
2、AI算法在网络中的适用场景及效果
3、如何基于业务场景进行精准特征挖掘
个人简介:
浙江移动SRE研发负责人,负责SRE团队开发管理、平台架构设计和人员数智化转型。
核心网运维专家,多年移动通信网络从业经验,精通软交换、NFV、SDN、VoLTE、EPC、5GC等相关技术。
演讲主题:
解放运维双手,容器云智能化运维实践
议题简介:
面向容器云环境下的Pod等资源对象,基于告警数据、指标数据、通过异常检测、关联规则等多种AI算法进行模型训练,基于根因定位匹配治愈方案,自动化作业调度容器云的API服务,实现容器云的智能化治理目标,聚焦关注Pod对象运行时服务质量(SL0)。
演讲提纲:
1.背景介绍:
聚焦容器云Pod运行时服务质量;
(随着容器化上云的进程加速,不同业务类型的工作负载,对调度系统都有不同的特性需求,运行时稳定性是其业务成功的关键。因此对Kubernetes管控面性能和节点运行时稳定性的诉求,是当前调度系统面临的实际挑战。本课题聚焦关注Pod对象运行时服务质量,当Pod的运行时服务水平不符合预期时,如何实现资源的合理调度,进而趋向智能化保障应用可用性。)
2.建设内容:
围绕容器云POD关联的资源对象,接入多维度容器云各类指标、告警、以及业务数据,提升容器云智能化治理水平见成效。
建设方案:
建设举措:
举措1:自动化获取容器资源对象模型数据,构建面向应用的资源管理
举措2:组件化、全面化接入治理指标数据,驱动POD调度达标SLO
举措3:指标丰富、算法多样,迭代提升Pod原生探针调度能力
举措4:多场景感知运维流量波动,动态阈值超限或根因指标触发容器调度
3.创新点及应用成效
1)场景创新:区别于原生的存活、就绪、启动探针,本课题检测指标更丰富、算法机制更丰富、综合判定更科学、运行更安全;
2)算法创新:引入无监督和有监督共用的方式,规避无监督算法的准确性问题;
3)能力创新:自愈能力可直接调度K8S原生的APIserver,无需人工介入;同时支持OOS运维作业编排,避免次生故障。
4.能力演进方向
1)组件化探索;
2)基于SLA感知的最优调度能力迭代;
3)沉淀适配容器化环境智能治理的算法(无需历史数据);
听众受益:
基于容器平台的资源管理、运维监控、组件服务等核心能力,结合AIOPS多维运维流量感知场景,打造基于服务质量(SLO)的闭环调度治理能力,提升系统的稳定性。
个人简介:
田国良,目前就职于江苏移动公司,主要从事IT核心系统的运维支撑工作。在AIOPS能力建设部署方面有深厚的知识沉淀,潜心研究利用大数据、容器平台,结合AI强大的分析、决策能力应对运维困局,立志通过注智赋能,提升智能化运营水平,将IT员工从基础性、重复性工作中解放出来。作为第一发明人取得专利13项,取得Devops master、PMI-ACP、ORACLE-OCP,CISP等证书,并多次荣获科技与业务创新奖项。
演讲主题:
OWASP CI/CD十大安全挑战及DevSecOps实践
议题简介:
介绍现在OWASP最新推出的CI/CD十大安全挑战,以及在DevSecOps实践过程中需要注意的问题以及解决方案。
演讲提纲:
1、介绍OWASP最新的CI/CD十大安全风险
2、介绍一下DevSecOps中的CI/CD集成中需要注意的问题点与解决方案
3、探讨一下DevSecOps的CI/CD的未来趋势与风险点应对
听众收益:
1、了解CI/CD的通用的安全风险都有哪些
2、了解在DevSecOps过程中需要关注的风险点以及应对策略
3、了解DevSecOps的CI/CD的未来方向
个人简介:
CISSP,某金融外企高级安全架构师,大中华区安全负责人,AWS认证的解决方案架构师和AWS认证安全专家,OWASP中国广东区域负责人,ISC2华南分会和ISC2西南分会会员,CSA中国深圳分会会员。
华中科技大学软件工程专业硕士,持有CISSP、AWS认证解决方案架构师、AWS认证安全专家等资质证书。
拥有20年IT工作经验,10年信息安全工作经验,主要涉及应用安全领域,特别是应用安全架构领域,擅长主流的云安全,云原生安全,容器安全,API安全,DevSecOps等业界最热门领域。
演讲主题:
从工具化到平台化!vivo 互联网 DevOps 建设的快速变迁
议题简介:
vivo互联网短短几年的时间,DevOps快速经历从手工化、脚本自动化、开源工具化、产品平台化等几个阶段,实现了DevOps几个阶段的快速变迁,在这些阶段的背后到底蕴藏着怎样的设计思路与实现路径,又经历了哪些优秀的措施经验,又遭遇了哪些坑等等,那让我们一起来探讨吧。
演讲提纲:
一、vivo互联网业务发展形态
二、vivo互联网主流研发交付流程
三、vivo互联网DevOps发展历程及规模
四、vivo互联网DevOps最佳实践经验
五、vivo互联网DevOps未来发展
听众收益:
1、通过了解vivo互联网业务发展的形态及主流研发流程,了解DevOps的建设出发点和产品形态;
2、通过了解vivo的DevOps从脚本化到平台化的发展历程,掌握DevOps从理论到实践过程最佳实践。
个人简介:
10余年云计算相关软件架构与研发管理经验,长期负责敏捷研发、持续交付、DevOps等相关平台的架构和研发管理工作,对云计算、云原生等理念有较为深入的理解。曾多次主导和参与研发效能流程规范、平台工具等实践,曾主导苏宁易购上万人使用的研发云平台建设落地,助力业务高效能交付。目前致力于在vivo互联网主要负责规划和落地vivo互联网研发效能提升及持续交付相关平台规划建设,持续助力业务研发效能提升。
演讲主题:
货拉拉基于混合云的大数据SRE体系建设实践
议题介绍:货拉拉业务高速增长中,大数据作为助力公司业务高质量增长的驱动,需要一个稳定、安全、高效的大数据体系,大数据基础架构作为大数据的基石至关重要。通过大数据在线、实时、离线服务稳定性保障体系、大数据自动化运维体系、大数据云原生运维能力等几个方面的大数据SRE体系建设,打造一个可靠的基础架构,支撑大数据价值稳定、持续输出。
演讲提纲:
1、货拉拉大数据稳定性体系建设实践
2、货拉拉大数据自动化运维平台建设实践
3、后续规划
听众收益:
1、了解货拉拉大数据分场景稳定性保障体系的建设方法
2、了解大数据SRE运维平台的建设思路
个人简介:
深圳依时货拉拉科技有限公司, 大数据SRE负责人,负责大规模大数据集群和相关生态系统的稳定性保障,以及参与大数据安全体系建设、成本控制等方向的工作,有多年的跨云架构体系经验
演讲主题:
电力调度自动化系统数字化运维提升之路
议题简介:
电力调度自动化系统是对电网进行监控的重要工具,主要对各项调度数据进行智能化分析、处理,从而保障电力企业的安全、平稳生产。因此调度自动化系统的安全稳定运行关系着整个电网的安全。
个人简介:
长期从事电力调度自动化工作,作为自动化专业带头人,负责南方(以广东起步)电力现货技术支持系统、广东调频辅助服务技术支持系统等开发。负责自动发电控制、全省电力调度计划、新能源及储能控制、稳定断面、热电联产等核心高级应用的研发组织、运行维护等工作,负责虚拟电厂、需求响应等功能的调度侧主站功能研发工作。
演讲主题:
大促亿级流量下:京东H5应用的可观测性保障实践
主题简介:现如今客户端Hybrid开发技术已经非常成熟,越来越多的业务为了降本提效,都会优先使用H5这种轻量高效的实现方式去快速试错,实现业务价值。随着这一趋势而来的,还有不可避免的挑战:如何保障H5业务用户体验的可观测性。在此背景下,我们设计了一套完整的观测体系,产出了很多实践案例以及方法论,比如通过搭建主动上报观测能力,实现了CDN静态资源观测及容灾、CMS楼层级别监控等,结合Google Lighthouse提炼出H5用户体验评分模型;更进一步建立自动化被动观测工具,实现H5质量门禁,OCR敏感词检测等。本次分享会逐级介绍H5观测最佳实践、技术案例及方法论,最终形成一套完整的H5观测体系。
演讲提纲:
1、京东H5观测体系的背景和介绍
2、深度探索主动观测,打造核心可观测指标
3、让观测降本提效,实现自动化被动观测
4、全链路观测及质量保障的实践与思考
听众收益:
1、了解京东如何构建H5观测体系以及过程中难点。
2、逐级认识观测方案,体验不同方案的价值。
3、通过实际案例分享,体会如何快速落地一个较完善的H5观测平台
个人简介:
主要负责京东客户端及跨端技术的可观测平台建设与实践,包括针对APP,H5及小程序等应用性能及异常数据监控与优化工作。主导设计了H5监控能力从0到1的落地,有较丰富的观测实践经验,经历了多次618,双11以及春晚核心活动亿级别流量的考验,目前京东内部已有90%的H5应用接入这套监控体系。
演讲主题:
低代码和DevOps,助力实现企业数字化转型和应用创新
议题简介:
低代码的本质是对程序开发过程的重构,将可读性差,只有经过专业学习和训练才能掌握的代码编程开发模式,变成可读性强,普通人都能掌握的开发模式。它通过简单易懂的操作,降低使用门槛,让更多的人可以直接参与系统开发,减少需求方与开发者间的沟通损耗。
如何将低代码与Devops结合,更好的助力实现企业数字化转型和应用创新?
低代码致力于通过应用程序加速交付业务价值,而DevOps的重点是应用程序构建之后的交付和维护。如果能将低代码与DevOps更好的结合,则为负责交付和维护基础设施和应用程序的运营团队带来了与构建应用程序的开发团队相同的敏捷性水平。让组织中的每个人都能在直观的低代码环境中构建和共享应用,从而降低成本并推动创新。
演讲提纲:
1、低代码的背景与现状
2、如何使用低代码应用程序开发平台
3、如何在DevOps中使用低代码解决方案
听众收益:
了解低代码平台,以及DevOps和低代码方法面临的挑战和具有的优势,并为企业获得提供更有效的解决方案。
个人简介:
石宇菁,北京邮电大学硕士毕业,入职中国联通软件研究院公共平台与架构研发事业部,担任中国联通数字化研发平台低代码项目经理,带领团队自主研发低代码平台,实现应用的快速交付,助力企业数字化转型。
演讲主题:
无感平滑迁移:海量高并发数据库国产化改造及应用
议题简介:
在基础设施国产化的大背景下,数据库作为最核心的基础设施之一,有着改造难度大、业务连续性要求高、牵扯系统多等问题。如何保证数据库国产化的平滑进行?迁移过程中需要做哪些改造?有哪些经验?中国移动政企业务支撑中心经过摸索,针对政企业务的多个系统,在数据库选型、核心业务功能改造、外围工具适配,数据迁移验证等多阶段,实践出一套无感平滑迁移的经验,助力政企业务多套数据库的实现平滑迁移。
演讲提纲:
1、数据库国产化的背景
2、数据库国产化改造的挑战
3、数据库国产化改造的探索与实践
4、数据库国产化总结收获
5、未来展望
听众收益:
通过分享可以了解现阶段主流的分布式数据库架构,中国移动政企系统数据库架构的演进情况,了解在海量高并发场景下如何做到对业务无感的数据库平滑替换。
个人简介:
现任于中国移动通信集团信息技术中心政企业务中心数据库专家、数据库架构师,主要负责数据库国产化在政企中心的落地,历任腾讯网媒DBA、乐信数据SRE负责人、业务SRE中心总监,有丰富的数据库、中间件、业务运维经验,主导过多种业务场景下数据层高性能、高可用架构设计、业务全链路容灾体系建设、SRE体系落地等大型项目;
演讲主题:
智能运维中的数据管理和数据探索
主题简介:
高效的数据管理是实现智能运维有效落地的关键基础。即使再好的算法,如果没有高质量的数据的支持,也将是无米之炊。报告将首先介绍和分析智能运维场景中的数据管理的现状,然后讨论运维数据管理中遇到的问题,最后分享团队在运维数据管理中的一些成果和经验。
听众收益:报告希望达到两个目的,一个是帮助听众了解数据管理对于智能运维的意义和重要性;另外通过分享团队的一些经验,让听众了解一些有效的技术。
个人简介:
大数据管理与挖掘、智能运维数据分析、物联网大数据管理。曾获得教育部自然科学二等奖(第三完成人)。主持或主要参与科技部重点研发计划、国家青年973、自然科学重点/面上基金、上海市科委、上海市经信委的多个项目,以及华为、上汽、微软、IBM、EMC等企业的资助项目。
演讲主题:
B站多活架构解析、最佳实践与管控治理
议题简介:
本次分享将会介绍B站的多活架构方案及多活业务划分,以在线业务多活建设的实践案例,从SRE的视角谈谈多活有效性验证及持续治理的思路,以及对多活的收益和成本管理的理解。
演讲提纲:
1、B站多活架构的演进
2、多活建设实践与治理
3、多活收益与成本管理
听众收益:
1、了解B站的业务多活架构;
2、了解业务多活建设的实践过程中SRE需要重点关注的事项;
3、了解多活建设的收益和成本管理
个人简介:
负责在线业务SRE相关工作,深度参与B站多个在线业务多活建设项目。当前继续专注于核心业务多活建设推进、多活管控能力提升、多活切量演练等工作。
演讲主题:
安全为先:QUIC 通讯协议性能与安全优化实践
议题简介:
高速且安全的网络接入服务是互联网技术服务厂商的共同追求。现如今QUIC协议是一个新的通讯协议如火如荼,各大厂商都在使用和推进,并且ITEF已经制定基于UDP的传输协议并希望最终取代所有基于TCP的HTTP请求。然而QUIC的一些新的特性其安全情况如何,其在性能优化的具体的实现过程中会遇到的一些什么样的问题,该如何解决,大规模使用QUIC会有哪些问题呢这些都值得我们深入研究和探讨。
演讲提纲:
1.Quic协议的关键特性与安全
2.OPPO的Quic优化实践
3.未来的持续优化与安全增强
听众收益:
了解Quic协议的产生背景及关键优秀特性,了解Quic协议的安全性分析
个人简介:
OPPO网络优化领域技术专家,多年网络协议栈开发经验。目前主要负责OPPO的移动端网络库、接入层安全的架构设计和研发工作。从0-1建设了OPPO特色的QUIC(HTTP/3)协议,并成功在OPPO各个业务的进行上线,对网络传输效率以及安全有较大的提升。
演讲主题:
先鉴者明,预见者赢:中国航信 AIOps 探索与实践
议题简介:
中国航信是唯一一家以信息服务为主业的中央企业,所运营的信息系统被列为国务院监管的八大重点系统之一。所负责建设并运维的民航商务核心系统已经历近40年的发展历程,系统可用性满足99.999%。本次演讲将全面介绍中国航信面对新形势新挑战,在全面落实国家政策要求的基础上,顺应技术发展趋势,以关键信息基础设施为核心,以松耦合、强管理为特征,打造高质量、可持续的现代化综合信息技术运维体系。从分级管理、变更管理、运控指挥、监控告警、事件处理、配置管理、全视角故障分析机制等不同方面展示航信强大的运维实力。
个人简介:
曹伟先生具有超过15年的国家行业级关键核心信息系统规划建设与运维管理经验,以及丰富的政企云计算与智能运维项目落地经验,目前负责中国航信在数字新基建与产业数字化领域的业务拓展。
演讲主题:
众安保险内部开发者平台之路
议题简介:
通过分享可以了解众安保险工程效率为业务开发提供更好的服务之路上走过了哪些阶段,在金融、保险及传统企业上如何最大化工程效率的价值、经历了哪些问题及这些问题的最佳实践,在基础设施服务和更好的工程效率之路上面临的挑战及对于未来的思考。
个人简介:
拥有14年软件开发经验、6年以上DevOps行业经验,曾任职腾讯云CODING研发负责人,对云原生场景下的研发效率有深刻的理解和认知,喜欢研究前沿技术。
演讲主题:
OpenCloudOS下一代云原生开源操作系统及DevOps实践
议题简介:
OpenCloudOS 社区是由操作系统、软硬件厂商与个人共同倡议发起的操作系统社区项目,提供自主可控、绿色节能、安全可靠、高性能的下一代云原生操作系统,与生态伙伴一起打造中立的操作系统开源生态。
在本次演讲中,我们将分享OpenCloudOS作为下一代云原生操作系统的重要特性,并讲解OpenCloudOS在研发和测试中的DevOps实践。
演讲提纲:
1. OpenCloudOS云原生操作系统介绍
2. OpenCloudOS DevOps实践
3. OpenCloudOS社区介绍听众收益:
听众受益:
了解OpenCloudOS作为下一代云原生操作系统的重要特性,以及OpenCloudOS自动化构建和自动化测试的一些实践,并对OpenCloudOS社区有更进一步的了解。
个人简介:
腾讯操作系统研发高级工程师。负责OpenCloudOS和腾讯操作系统的研发工作,主导了OpenCloudOS和TencentOS Server多个版本产品的研发和运营,在操作系统体系结构,应用开发,系统适配等具有丰富经验。
演讲主题:
零成本为 Prometheus 指标注入自定义标签
议题简介:
丰富的标签支持能力是 Metrics 系统能够实现应用可观测性的灵魂和先决条件。开发者会绞尽脑汁向指标中注入标签,并希望指标系统能 Offload 大量标签的注入以便降低插码工作量,因此诞生了广受欢迎的 Prometheus Service Discovery 和 Relabling 等机制。然而对于任何一个时序数据库来讲,标签数量的增长至少意味着资源消耗的线性增长,而标签 Cardinality 的增长甚至可能导致爆炸式的资源消耗增长。我们分享 DeepFlow 作为 Prometheus backend 的解决方案,实现无限的自定义标签注入能力,同时几乎不会带来资源消耗的增长。
演讲提纲:
1、Prometheus 数据存储和查询的痛点,及社区常见解决方案
2、自动为指标数据注入来自 K8s 和其他服务注册中心的自定义标签
3、基于 ClickHouse 消除自定义标签的资源消耗,并解决高基数问题
听众收益:
1、了解一种全新的 Tag 与 Metrics 分离采集、编码存储的高效机制
2、了解如何利用 K8s Label/Annotation、Prometheus Service Discovery 机制零成本注入自定义业务标签
个人简介:
向阳,云杉网络产品研发总监。2013年获得清华大学计算机系博士学位,期间独立实现了世界上第一个全球BGP劫持实时监测系统,获得了网络测量领域国际顶级会议IMC颁发的社区贡献奖,也是该会议首次颁发奖项给中国大陆科研人员。2013年加入云杉网络,现负责DeepFlow产品线,致力于打造一款零侵扰云原生应用可观测性平台产品。
演讲主题:
构建简单易用的以应用管理为核心的企业平台工程实践
议题简介:
随着云原生技术蓬勃发展以及云平台被广泛采纳,各种新技术、新工具、新架构不断涌现。这导致企业运维人员需要管理和维护的技术平台和架构复杂度不断上升,为运维工作带来极大挑战。另外,由于“左移”策略逐渐被接受,研发人员需要掌握更多的知识,包括各类安全测试工具以及K8S等,导致认知负荷增加。以上两方面的问题在近年来愈发突出。
如何让研发人员回归到纯粹高效且具有创造性的代码开发本身?如何让运维团队能够便捷地配置和管理基础架构,统一管理安全、K8S环境及各种工具集成?平台工程或许是最佳答案。本次分享将介绍企业如何借助平台工程减轻运维和研发团队负担,提升团队成员工作满意度,打造云原生时代降本增效的高效能团队。
演讲提纲:
1、当前技术浪潮下,企业技术团队所面临的效能挑战
2、如何构建以应用管理为核心的平台工程
3、如何借助平台工程提高技术团队效率
听众收益:
1、了解什么是平台工程
2、了解平台工程和DevOps的关系
3、了解平台工程的构建与实现
个人简介:
秦小康,Seal 联合创始人及CEO。前SUSE大中华区总裁,全⾯负责SUSE在中国大陆、中国香港、中国澳⻔、中国台湾的团队建设及业务发展。
秦小康⼀直专注于深耕⼤中华区市场,拥有超过15年的云计算和开源领域发展及运营经验,先后在Rancher Labs、Citrix、Oracle、RedHat等知名软件企业担任高级管理职务。在SUSE完成收购Rancher Labs全球业务之前,秦⼩康担任Rancher Labs⼤中华区总经理,从0到1搭建了Rancher Labs⼤中华区团队。在秦⼩康的带领下,Rancher Labs在⼤中华区的业务年复合增⻓率超越300%。
演讲主题:
在DevOps各个环节实现SQL质量管理
议题简介:
本次主要探讨如何在企业开发、测试、发布、生产的各个阶段引入SQL质量管控,实现数据库开发质量的闭环管理。我们将从质量量化、规范化、流程化和自动化等方面入手,做到提高数据库开发质量、降低生产数据库问题率。
演讲提纲:
1、SQL质量面临哪些问题
2、优化SQL质量关联哪些环节?
3、如何解决每个环节的问题?
听众收益:
1、如何观测有效观测SQL质量问题
2、如何规范化SQL质量
3、如何落地SQL质量管理
个人简介:
爱可生云树数据库管理平台和数据库生态产品研发负责人,主导了云树®数据库运维管理平台、数据库自服务平台、SQL质量管理平台、开源产品SQL审核产品SQLE及数据复制传输产品DTLE的研发,实现了产品在金融核心业务的落地实践,助力企业在各个环节高效可靠的使用数据和数据库。
演讲主题:
Zabbix专业服务助力企业监控运维
议题简介:
自2001年发布以来,Zabbix逐渐发展成为全球最受欢迎的开源监控解决方案之一,广泛被国内各个行业企业级用户采用,本次演讲将给大家介绍Zabbix中国客户案例和全面的服务体系,让我们从不同的角度来了解一下Zabbix对企业级用户的支持。
演讲提纲:
○ Zabbix专业服务体系
○ Zabbix如何助力企业级用户
○ Zabbix监控系统成熟度评估服务
个人简介:
毕业于上海交通大学,从IBM Tivoli到Zabbix,专注数据中心监控22年。现任Zabbix中国区总代理-上海宏时数据系统有限公司总经理。
演讲主题:
监控无边界 - Zabbix与信创生态的融合
议题简介:
信创产业作为国家战略,意志坚定,毫不动摇,去年以来各部门先后发布的《“十四五”国家信息化规划》《“十四五”数字经济发展规划》《“十四五”政务信息化规划》等将全面助推信创产业发展,同时,Zabbix作为当下最热门的开源监控系统之一,在国内拥有非常广大的用户基础,因此,Zabbix如何实现信创生态的融合,成为了国内Zabbix用户重点关注的内容。
演讲提纲:
1、 信创的始末缘由
2、 信创的发展现状
3、 Zabbix与信创生态融合
4、 Zabbix对中国用户的独白
个人简介:
系统项目管理专家,长期从事在ITOM、ITOA领域,对IT运维管理体系有着深刻的理解。拥有12年数据中心监控运维系统管理与实施经验,负责过几十个金融、保险行业的项目管理、咨询与架构工作,如交通银行、浙江农信、太平洋保险、太平保险、东方航空等项目。
演讲主题:
以运维对象为核心的运维平台架构实践
议题简介:
当你被自动化、可观测、FinOps、DevOps、SRE、平台工程这些名词扰乱了思路,迷失了方向。那是时候回归运维管理的本质了,就是以运维对象为核心来进行平台的架构设计,围绕运维对象来构建满足质量、成本、效率、安全的数字化运维平台。
个人简介:
赵舜东,昵称“赵班长”,高效运维社区核心成员,GOPS 全球运维大会金牌讲师,阿里云MVP,中国 SaltStack 用户组发起人;《 SaltStack 入门与实践》、《运维知识体系》和《缓存知识体系》作者;现任速云科技 CEO,专注于 DevOps 和自动化运维。