云计算深度学习平台架构与实践的必经之路
定义云深度学习平台什么是云深度学习?随着机器学习的发展,单机运行的机器学习任务存在缺少资源隔离、无法动态伸缩等问题,因此要用到基于云计算的基础架构服务。云机器学习平台并不是一个全新的概念,Google、微软、亚马逊等都有相应的服务,本文列举几个比较典型的例子。
基于 ANSIBLE 自动化运维实践
运维这个话题很痛苦,做任何产品都离不开运维。以前的运维那么痛苦,大家却并未做多大的努力去改变这个现状,为什么?因为原来你要自己去建机房、自己去采购、去调研机房、采购服务器、采购带宽,中间出了任何问题很大可能都是机房的问题。在云时代,尤其是在AWS出现之后,运维的方式又发生了什么变化?