选择部署架构

部署CloudStack的具体架构会因规模及用途的不同而变化。这一章节会包含一些典型的部署构架:用于测试和试验的小型架构,以及用于生产环境的大型全冗余架构。

小型部署

Small-Scale Deployment

这个图演示了CloudStack在小型部署时的网络结构。

  • 防火墙提供了到Internet的连接.此防火墙被配置成NAT模式,它会将来自Internet的HTTP访问和API调用转发到管理服务器。而管理服务器的网络属于管理网络。

  • 一个二层交换机连接所有的物理服务器和存储服务器。

  • 单一的NFS服务器需要能同时提供主存储和辅助存储。

  • 管理服务器连接至管理网络

大规模冗余设置

Large-Scale Redundant Setup

这个图演示了CloudStack在大规模部署时的网络结构。

  • 三层交换层处于数据机房的核心位置。应该部署类似VRRP的冗余路由协议实现设备热备份。通常,高端的核心交换机上包含防火墙模块。如果三层交换机上没有集成防火墙功能,也可以使用独立防火墙设备。防火墙一般会配置成NAT模式,它能提供如下功能:

    • 将来自Internet的HTTP访问和API调用转发到管理节点服务器。管理服务器的网络属于管理网络.

    • 当云跨越多个区域(Zone)时,防火墙之间应该启用site-to-site VPN,以便让不同区域中的服务器之间可以直接互通。

  • layer-2的接入交换层连接到每个提供点(POD),也可以用多个交换机堆叠来增加端口数量。无论哪种情况下,都应该部署冗余的二层交换机。

  • 管理服务器集群(包括前端负载均衡节点,管理节点及MYSQL数据库节点)通过两个负载均衡节点接入管理网络。

  • 辅助存储服务器接入管理网络。

  • 每一个机柜提供点(POD)包括存储和计算节点服务器。每一个存储和计算节点服务器都需要有冗余网卡连接到不同的 layer-2 接入交换机上。

独立的存储网络

在前面章节中,提及了大规模冗余部署,存储的数据流量过大可能使得管理网络过载。部署时可选择将存储网络分离出来。存储协议如iSCSI,对网络延迟非常敏感。独立的存储网络能够使其不受来宾网络流量波动的影响。

多节点管理服务器

CloudStack管理服务器可以部署一个或多个前端服务器并连接单一的MySQL数据库。可视需求使用一对硬件负载均衡对Web请求进行分流。另一备份管理节点可使用远端站点的MySQL复制数据以增加灾难恢复能力。

Multi-Node Management Server

系统管理人员必须决定如下事项:

  • 是否需要使用负载均衡器。

  • 需要部署多少台管理节点服务器。

  • 如何部署MYSQL复制以便启用灾难恢复。

多站点部署

运用CloudStack的区域技术可以很容易的将其扩散为多站点模式。下图就显示了一个多站点部署的示例

Example Of A Multi-Site Deployment

在数据中心1内有主管理节点和区域1。MySQL数据库实时复制到数据中心2内的辅助管理节点中。

Separate Storage Network

这个图展示了使用独立存储网络的设计。每一个物理服务器有四块网卡,其中两块连接到提供点级别的交换机,而另外两块网卡连接到用于存储网络的交换机。

有两种方式配置存储网络:

  • 为NFS配置网卡绑定和冗余交换机。在NFS部署中,冗余的交换机和网卡绑定仍然处于同一网络。(同一个CIDR 段 + 默认网关地址)

  • iSCSI能同时利用两个独立的存储网络(两个拥有各自默认网关的不同CIDR段)。支持iSCSI多路径的客户端能在两个独立的存储网络中实现故障切换和负载均衡。

NIC Bonding And Multipath I/O

此图展示了网卡绑定与多路径IO(MPIO)之间的区别,网卡绑定的配置仅涉及一个网段,MPIO涉及两个独立的网段。

选择Hypervisor

CloudStack支持多种流行的Hypervisor,你可以在所有的主机上使用一种,也可以使用不同的Hypervisor,但在同一个群集内的主机必须使用相同的Hypervisor。

你可能已经安装并运行了特定的hypervisor节点,在这种情况下,你的Hypervisor选择已经确定了。如果还处于初步规划阶段,那么就需要决定那种Hypervisor能切合你的需求。各种Hypervisor的利弊讨论不在本文档之列。但无论如何,CloudStack可以支持每种Hypervisor的那些功能的详细信息还是能够帮到你的。下面的表格就提供了这些信息:

功能特点

XenServer 6.0.2 vSphere 4.1/5.0 KVM - RHEL 6.2

裸设备

网络限速

在区域内用于基本网络模式的安全组

iSCSI

光纤通道

本地磁盘

高可用

是(原生)

本地磁盘快照

用本地盘作为数据磁盘

工作负载均衡

DRS-分布式资源调度

手工在主机之间进行虚拟机的热迁移

使用本地链路与虚拟路由器(VR)直接通讯来保护管理网络的IP流量

最佳实践

部署云计算服务是一项挑战。这需要在很多不同的技术之间做出选择,CLOUDSTACK以其配置灵活性可以使用很多种方法将不同的技术进行整合和配置。这个章节包含了一些在云计算部署中的建议及需求。

这些内容应该被视为建议而不是绝对性的。然而,我们鼓励想要部署云计算的朋友们,除了这些建议内容之外,最好从CLOUDSTACK的项目邮件列表中获取更多建议指南性内容。

实施最佳实践

  • 强烈建议在系统部署至生产环境之前,有一个完全模拟生产环境的集成系统。对于已经在CloudStack中做了自定义修改的系统来说,更为重要了。

  • 应该为安装,学习和测试系统预留充足的时间。简单网络模式的安装可以在几个小时内完成。但首次尝试安装高级网络模式通常需要花费几天的时间,完全安装则需要更长的时间。正式生产环境上线前,通常需要4-8周用以排除集成过程中的问题,你也可从cloudstack-users的邮件列表里得到更多帮助。

最佳实践安装

  • 每一个主机都应该配置为只接受已知设备的连接,如CLOUDSTACK管理节点或相关的网络监控软件。

  • 如果需要达到一定的高密度,可以在每个机柜提供点里部署多个集群。

  • 主存储的挂载点或是LUN不应超过6TB大小。每个集群中使用多个小一些的主存储比只用一个超大主存储的效果要好。

  • 在主存储上输出共享数据时,可用限制访问IP地址的方法避免数据丢失。更多详情,可参考”Linux NFS on Local Disks and DAS” “Linux NFS on iSCSI”这些章节。

  • 网卡绑定技术可以明显的增加系统的可靠性。

  • 当有大量服务器支持相当多的虚拟机时,推荐在存储访问的网络上采用将10G的带宽。

  • 主机可创建的虚拟机的能力,主要取决于提供给客户虚拟机的内存。因为主机的存储和CPU均可超配,但内存却基本不可以。所以内存是在系统容量设计时的主要限制因素。

  • (XenServer)可以为Xenserver的dom0分配更多的内存来让其支持更多的虚拟机。我们推荐为dom0设置的内存数值为2940 MB。至于具体操作,可以参见如下URL:http://support.citrix.com/article/CTX126531。这篇文章可同时适用于XenServer 5.6和6.0版本。

维护最佳实践

  • 监视主机的磁盘空间。很多主机故障的原因都是日志将主机的硬盘空间占满导致的。

  • 要监控每个集群里的虚拟机总量,如果达到了hypervisor所能承受的最大虚拟机数量时,就要禁止向此集群分配虚机。并且,要确定预留一定的安全迁移容量,以防止群集中有主机故障,这将增大其他主机运行虚拟机压力,就像是重新部署一批虚拟机一样。咨询你选择 hypervisor的文档,找到每台主机所能支持的最大虚拟机数量,并将此数值作为默认限制配置在CLOUDSTACK的全局设置里。监控每个群集中虚拟机的活动,保持虚拟机数量在安全线内,以防止偶然的主机故障。例如:如果集群里有N个主机,如果要让集群中一主机在任意时间停机,那么,此集群最多允许的虚拟机数量值为:(N-1) * (每宿主机最大虚拟量数量限值)。一旦达到此数量,必须在CLOUDSTACK的UI里禁止向此群集增加新的虚拟机。

警告

不及时更新相关系统补丁可能会导致虚拟机数据损失或消失。

必须保证应用了hypervisor提供商提供的所有补丁。通过提供商提供的渠道,随时追踪hypervisor开发商的补丁发布情况,并且在有最新补丁发布之后,第一时间进行更新。CLOUDSTACK并不会提醒你hypervisor开发商的系统补丁更新情况。保持hypervisor的补丁更新是很重要的。hypervisor开发商也可能会拒绝为没有更新补丁的系统提供支持。