智能驱动--小米大数据运维实践
2018年6月30日
SRE/智能运维
刘亚运
小米大数据、AI平台、容器云SRE负责人

刘亚运  小米大数据、AI平台、容器云SRE负责人,主导大数据运维平台体系从0构建,同时也参与小米自动化智能化运维体系构建,经历了小米高速增长的6年,在保障服务可用性和自动化运维方面经验丰富。


  • 分享简介


    互联网高速发展的今天,海量大数据集群自动化智能化管理和监控是一个挑战, 全自动化的集群运维体系构建,可以为企业在人力和成本上做出很大的节约。一个创业公司大数据集群规模从0到数万台规模短短的几年时间,我们在管理和监控上面临着很大的挑战。迎接挑战,从机器管理到集群,部署到监控,自动化到智能化等各方面展开,分享大数据运维体系平台构建的一些经验。

  • 分享提纲

    一1.1 平台架构演变

    1.2 大数据技术框架

    1.3 大数据运维存在的问题

    二 小米大数据运维平台体系构建

    2.1   运维规范

    2.2   部署系统体系设计

    2.3   统一监控和统一告警

    2.4   集群安全账号系统设计

    2.5   资源可视化,成本化

    2.6   安全审计

    三  大数据思维做运维监控

    3.1 设计与实现

    3.2 大数据思维

    四 智能化大数据运维探索与思考

    4.1  探索

    4.2  思考


  • 分享收益

    分享收益:

    目标:从自动化走向智能化等方面的设计实现,对即将做、正在做、已经做的大数据运维相关企业都有受益

    成功点:大数据运维体系构建给予启迪和指导,如何做安全,如何做管理,如何做监控,如何控制成本。

    收益:从机器管理到集群,部署到监控,自动化到智能化等各方面展开,了解大数据运维体系平台构建的一些经验。


热门推荐