上云用云 | 企业云成本管控,你真的做对了吗?(附指标模板下载)

​企业要管理好云上成本,首先要构建完善的成本监控和管理体系。业内代表性的做法是,根据事前规划、事中监控和事后评估三个阶段,分别制定各自阶段的规则。

Photo by Shahadat Rahman
出处:Kyligence

如今,越来越多企业选择将应用迁移至云原生架构。但据 2021 年 CNCF FinOps Kubernetes Report 调研报告显示,迁移至 Kubernetes 平台后,68% 的受访者表示所在企业计算资源成本有所增加,36% 的受访者表示成本飙升超过 20%。

初创公司 Milkie Way 在对 Firebase 和 Cloud Run 进行内部测试期间,一不小心在几个小时里就在云上烧掉了 72,000 美元(如下图所示),差点导致这家公司破产。

1659077602-图1-云成本管控场景-1024x469-1
https://blog.tomilkieway.com/72k-1/

ConvertKit 是发展最快的全功能电子邮件服务提供商 (ESP) 之一,其官网有一篇长文《2021年,ConvertKit 在 AWS 上花费超 1 百万美金》,详细列出了 2021 年 CovertKit 在 AWS 上的花费,并思考下一步优化云成本的措施。

不难看出,即使是资源利用率更高、更为灵活的云原生架构,企业也存在以下的痛点:

  • 云成本迅速增长,管理具有滞后性:对于管理者而言,最头痛的事之一就是云成本在无形中迅速增长。如果成本的监控和管理不善,IT 人员的某个误操作,就可能会给公司带来经济损失。
  • 不少员工拥有权限,云上资源管理难:企业内很多员工都有使用云资源的权限,管理难度大,由于不了解规则而导致资源浪费的情况并不少见,而公司往往只会象征性惩罚一下,损失的金额只能默默“认栽”。

1. 一套完整的云成本监控和管理体系如何构建?

Kyligence 为众多云上客户提供了数据分析与管理的服务,同时内部也有云平台上进行开发、测试的需求。接下来我们将以 Kyligence 为例,分享企业如何利用 Kyligence Zen 以关键业务目标管理和追踪相关性指标,帮助组织对齐管理目标,实现云成本全方位可监测。

​企业要管理好云上成本,首先要构建完善的成本监控和管理体系。业内代表性的做法是,根据事前规划、事中监控和事后评估三个阶段,分别制定各自阶段的规则。Kyligence 也遵循了这个流程:

  • 事前规划:基于用途进行云资源的审批和规划;
  • 事中监控:对所有云资源的使用情况进行持续的监控;
  • 事后评估:对所有云账单数据建立一套指标体系,定期对指标进行管理和分析。分析的结论又会进一步反馈到后续的云资源规划当中。

为了节省云上资源,企业需要实现云成本的全方位监控。在 Kyligence 企业的云成本管控实践中,有以下几个主要角色:

1659347793-image1-1024x396-1

Kyligence 使用了智能指标驱动的管理和决策平台——Kyligence Zen 来对云账单数据进行评估和分析。

1.1 提供指标目录,解决指标统计口径不一致的问题

Tom 可以在界面中通过交互方式自助完成指标定义,也可以使用低代码的入口来创建高级指标。另外,定义完成的指标可以一键发布,方便 Tom 在组织内发布、共享、维护,指标口径清晰易理解,增强数据信任。随着组织的发展和增长,指标目录支持灵活的指标扩展和指标治理。

1659370882-image-2-1024x561-1
查看指标详细信息
1659078016-图4-云成本管控场景-1024x331-1
使用看板查看指标
1.2 提供指标管理体系,帮助组织对齐管理目标

得益于 Kyligence Zen 的目标管理功能,Tom, Serena, Yang 都可通过在 Zen 中创建目标(Goal),以关键业务目标管理和追踪相关性指标。不同目标之间也可以在组织内进行协同、对齐、共享。Kyligence Zen 提供了管理者视角,通过目标管理功能可以清晰地进行目标拆解,数字化追踪云成本预算风险

1659370896-Goal-1024x563-1
通过目标来管理指标
1.3 提供指标 API / BI 连接能力,实现云成本全方位可监测

提供标准查询 API 接口,方便用户进一步扩充指标的使用场景。例如,用户可以利用 IM  即时通讯工具(例如飞书)提供的群聊机器人,联动指标查询 API 将指标结果发送到群聊中,让利益相关者随时随地都能接收到云成本相关信息。

1659078561-图6-云成本管控
机器人在飞书群聊中发送指标结果

Kyligence Zen 支持快速的云账单数据源接入,并提供了一套实用的云上成本管控指标模板(文末可免费下载体验),用户在接入云平台的账单数据后,可以快速上手指标创建和分析,即刻获得云成本流向的洞察。在降低总体成本的同时,构建管理的可观测性,实现以统一的云成本指标驱动管理。

要建立管理的可观测性,首先需要保证数据都是带上标签的。云上资源的账单标签可以通过各个云平台自带的 Tags 体系来实现。

1659078067-图7-云成本管控-1024x421-1

例如我们规定用户在使用云资源时,对所有云资源都打上标签标记,以便于后续的云成本分析。各个云平台带有标记的账单数据可以接入我们的 Kyligence Zen 指标平台,进行下一步的指标分析。我们在这个指标平台上定义了云账单相关的指标,后续只需要更新云账单数据,指标数据也会随之刷新。

2. 结语

​有了 Kyligence Zen 这样的 SaaS 指标管理平台,业务用户如 Tom, Serena, Yang 可以实现自助定义和使用指标,云成本相关的数据需求无需再依赖开发人员;数据工程师可以节省大量数据开发和治理的精力;管理层可以直观一览所有云成本相关的经营和管理指标。

企业面临的云成本风险在透明直观的指标体系和 Kyligence Zen 平台的护航下大幅降低。有定期自动的推送及各部门统一随时查看的指标看板,类似前文提及的 Milkie Way 云成本失控的案例将很难发生。

同时,Kyligence Zen 提供的指标数据服务,也将大大方便企业进行云成本数据分析和成本优化,而降低的云成本有助于企业利润的增长。

Zoom 公司在 2021 年一季度的财报中称,其毛利率从前一季度的 69.4% 上升至 73.9%,这主要是由于其在公共云资源的优化上下了很大功夫。Spotify 自研追踪云计算开支的工具,同时鼓励工程师们掌握云计算支出的所有权,使其每年节省了几百万美元的云计算开支。

总而言之,在“企业全面上云”的浪潮之中,Kyligence Zen 指标管理平台可以很好地解决云成本管控这个场景中的挑战,帮助企业内部建立可观测的管理系统,对齐所有团队的运营过程。

除了云成本管控场景,Kyligence Zen 在今后的迭代和发展中将会越来越体现出其适配各式管理场景的独特优势,敬请期待。

下载云成本管控指标模板含样例数据:

发条评论

你的电邮不会被公开。有*标记为必填。