以上图中一组关系型数据库服务为例,来说说从上线到下线会经历哪些过程。
资源池本身是静态的,一个资源从初始化到运行状态,它需要进行分配部署。在运行过程中可能会经历故障,也可能不经历故障直接走向下线状态,这是非常理想的。
在云平台中,它的维护过程不是人为也不是异常产生的,而是平台本身产生的。也就是说我们平台可能会产生这样的预警或自动调整,采取一系列的维护措施,最终实现一个下线的过程。
资源池-整合密度
数据库中每一组实例的大小都是不一样的。大小分为期望大小和实际大小,运行一段时间后期望大小和实际大小是有区别的。
所以我们就需要分维度去计算当前所面临的这套数据库的实例到底需要哪些资源,从硬件资源、服务资源来计算它到底需要多大的规格。有了这个信息之后,我们就可以把它井然有序地组装到数据库服务池里面。
任务调度
任务调度有三大核心特性必须要做到,就是标准化、自动化和模块化。
备份恢复
真正备份的目的是用于恢复。恢复首先就是从库的问题,要搭建从库,做节点迁移。定点恢复经常会出现两种情况,一种是确实业务上有需求,另一种是真的出现了问题需要去找到某个时间点的数据。误操作恢复比较经典,一般都是开发“背锅”,但其实DBS的误操作更多。80%的企业目前都还没有做恢复测试。脱敏过滤就是将一些敏感信息进行过滤。
只有备份必须满足恢复场景,才能做出有效的备份。
满足恢复场景的一些主要备份工具有lvm、tar、mysqlhotcopy等等。
高可用