云操作(CloudOps)是云计算迁移和开发故事中的一个长尾。它发生在组织部署基于云计算的解决方案并在很长一段时间内对其进行操作之后。Cloudops决定迁移或开发工作的成功以及用户和客户体验的成功。
目前一些在云操作(CloudOps)中出了一些问题,这需要引起注意。首先是太多类型的操作工具,例如管理和监视。这些工具增加了操作的复杂性,可能导致人为错误,进而导致操作问题。另一个问题是组织低估了推动云计算所需的资源。由于很多组织正在转向异构的、多云的部署,因此在过去四年中,人们所管理的资源数量增加了两倍,但大多数运维人员的规模保持不变。第三是缺乏跨云安全解决方案。一般来说,组织无法在每个公共云上扩展原生安全服务,并且开始出现风险和脆弱性。而安全不只是事后考虑的事项。
尽管这是最常见的问题,但出错的不仅仅是这里提到的问题。人们需要花费一些时间来了解所有这些问题。同时,寻找通用的整体解决方案。以下是一些有关云操作(CloudOps)的建议:
寻找操作任务和工具的共同点。力求从操作中消除很多复杂性,但要规范使用的工具数量。其中包括跨云计算和平台的通用安全工具,以及通用管理和监视工具,例如AIops工具。
通过一些计划,组歌可以将云操作(CloudOps)工具的数量减少一半。这种减少带来了更低的风险和更少的驱动运营所需的资源或人员)。但是不要骗自欺欺人。这种方法将改变操作处理和剧本。其目标是找到最优化的解决方案,它需要最少的工具和人员。同时,解决方案应提高操作的有效性和正常运行时间。如果认真对待这种共同性的方法,大多数问题都会消失。
专注于持续改进。经常观察运维团队反复地做某事,即使他们怀疑有更好的方法。这包括加工和工具。云操作(CloudOps)的持续改进鼓励团队质疑过程和工具的各个方面。那些倡导这种方法的人经常发现,变革没有像他们希望的那样容易被接受。如果授权那些从事日常云操作(CloudOps)工作的人员有权启动工具和过程的概念验证,以寻求新的更好的解决方案。
并不是说那些犯错误的人并不擅长此事。像其他任何技术学科一样,不断发展和完善只是游戏中的一部分。如果组织的团队或项目遇到问题,需要查看操作工具、资源和安全性,并着眼于常见任务和工具。然后授权组织的员工进行持续改进。通过正确的方法,技能将得到提高,问题将得到解决或者完全避免。