虚拟化使用软件的方法重新定义划分IT资源,可以实现IT资源的动态分配、灵活调度、跨域共享,提高IT资源利用率,使IT资源能够真正成为社会基础设施,服务于各行各业中灵活多变的应用需求。
对于整个VMware虚拟化系统平台的构建,我们的理念是希望设计成一个具备以下特点的系统:
1)合理性
方案中应结合硬件、软件以及虚拟化的最佳实践,制定符合同仁堂股份有限公司VMware虚拟化项目的规划方案。
2)高可用性
随着未来更多应用系统的广泛使用,虚拟数据中心需要提供更高级别的稳定服务,并具备当异常或灾难发生时的快速恢复机制。系统稳定性和可靠性直接关系到系统应用能否正常运行。因此在系统设计中,高可靠性至关重要。
3)高扩展性
整个数据中心系统应当具备极强的灵活扩展性。为了适应整个应用的未来变化,现在搭建的IT基础架构,必须具备高可扩展性和灵活的资源调配。包括虚拟计算资源、虚拟存储池、存储系统管理、系统容灾等一系列的技术实现方式,为适应未来应用开发和扩展,奠定坚实的基础。
4)平滑过渡
系统的建设是逐步完善的过程,本次系统的建设应保障相关系统的稳定,在工程割接时平滑过渡,不会影响到生产应用。
5)易于管理监控
建立一套易于管理的IT基础架构,用户可以通过一个简单图形界面管理整个数据中心的所有IT资源,及时发现计算机系统运行中的问题或者潜在的危险,使整个数据中心处于一个运行良好的状态中。
对于此次同仁堂股份有限公司项目架构拓扑中,分别对于服务器、光纤交换机、SAN存储以及软件做简要说明:
1)虚拟化物理服务器
此次使用的服务器分为HP DL580G9(E7 48XX系列CPU)和HP DL380G9(E5 26XX系列CPU)两种,为了保证所有资源的统一利用,我们建议将HP DL580G7和380G9放置在统一的一个集群内,从而可以使群集内的资源更加有效利用。由于两种服务器CPU型号不一致,我们建议在群集内开启EVC功能,通过EVC模式保证CPU增强vMotion兼容性,从而实现计划内迁移功能。
2)虚拟化服务器基础架构平台
使用一套VMware vSphere 6.0企业级服务器虚拟化管理平台软件,搭建同仁堂股份有限公司虚拟化服务器群基础架构。
3)SAN存储和光纤交换机
使用至少2台光纤交换机搭建冗余的存储区域网络。
为了满足集中存储需求,规划采用EMC存储,考虑到大量服务器的集中存储,以及业务数据地不断增长,以满足此次的使用需求。存储系统设计适用于与多台主机连接,并且确保无任何单点故障如:电源,风扇,控制器,背板等主要部件采用冗余体系结构,支持热插拔和故障隔离,支持不停机在线维护和更换。
此次项目的主体部分是所有服务器均全新搭建ESXI Server和1台vCenter控管中心,以下详细介绍各部分的规划。
1)ESXI Server
基础架构环境中使用所有物理服务器安装VMware ESXi Server6.0操作系统,它是vSphere虚拟架构套件中基础组成部分,直接部署在物理服务器裸机上,将物理服务器的cpu、内存、存储、网络等资源逻辑化分配到虚拟机中进行使用。并且利用VMware 高可用性、动态资源调配等功能提高了虚拟机的服务级别。
为了保证操作系统的安全性以及冗余性,建议在本地硬盘上安装,本地两块硬盘做RAID1。
在EMC的集中存储中新建一台Windows2012R2虚拟机,并在其上安装部署VMware vCenter Server 6.0管理软件,并将此台虚拟机放置到共享存储中,利用VMware高可用群集保证应用连续性。
在整个虚拟化平台架构当中,存储的配置至关重要,因为所有的虚拟机文件都存储在存储设备上,存储的I/O性能及链路,会直接影响虚拟化平台的运行。所以在规划SAN存储时,我们充分考虑I/O性能及链路冗余。
每台物理服务器均配置了两块8 Gb FC Single-port HBA卡,将两块HBA卡分别连接至两台光纤交换机,并将EMC光纤存储的双控制器分别连接到两台光纤交换机中,从而保证存储区域网络的整体冗余性和性能可靠性。
此次项目中涉及的物理服务器中建议配置有8个网络接口,从而为了保证虚拟机和VMkernel的网络冗余性,建议按照以下方式部署:
具体虚拟网络分配可以下面为例:
注:关于虚拟机有跨网段的需求,为了满足这一要求,我们将每台服务器上用于虚拟机通讯的物理网卡,连接到物理交换机的Trunk口上。在虚拟交换机上创建不同的端口组,并标识上相应的VLan ID,这样,通过这一端口便可以实现不同虚拟机跨网段的需求。
通过将所有的虚拟化主机组建成同一个群集,使资源更加有效利用,对于群集的具体配置可依照下面所述操作。为了保障群集中所有应用业务系统虚拟机的正常运行,我们将针对高可用性(HA)、分布式资源分配(DRS)、容错(FT)群集做详细的规划。部署时,数据中心内的多台 ESXI Server主机都置于单个 VMware DRS/HA群集中。
1)DRS规划
vSphere Distributed Resource Scheduler (DRS) 可以跨 vSphere虚拟化服务器持续地监视利用率,并可根据业务需求在虚拟机之间智能分配可用资源。
VMware DRS 可将物理主机的群集作为单个计算资源进行管理。可以将虚拟机分配到群集,DRS 会找到运行该虚拟机的相应主机。DRS 放置虚拟机的方式可确保群集中的负载保持平衡,并强制执行群集范围内的资源分配策略(例如,预留、优先级和限制)。启动虚拟机时,DRS 在主机上执行虚拟机的初始放置。当群集条件更改(例如,负载和可用资源)时,DRS 可根据需要将虚拟机自动迁移到其他主机。
向群集添加新的物理服务器时,借助 DRS,虚拟机能够立即自动利用新资源,因为它负责分发运行的虚拟机。可将 DRS 配置为自动执行虚拟机放置、虚拟机迁移和主机电源操作,或为数据中心管理员提供可用于评估并对其进行手动操作的建议。
对于配置群集自动化级别上,我们选择全自动化的管理方式。让vCenter结合服务器的资源利用情况,自动化地迁移虚拟机,以达到充分利用资源的效果。
VMware vSphere High Availability (HA)可为虚拟机中运行的应用提供易于使用、经济高效的高可用性。一旦物理服务器出现故障,VMware HA可在具有本群集内备用容量的其他生产服务器中自动重新启动受影响的虚拟机。若操作系统出现故障,vSphere HA会在同一台物理服务器上重新启动受影响的虚拟机。
在配置HA策略时,我们要启用“主机监控”,这样,群集内的ESXI主机间会交换网络检测信号,当检测不到主机的网络信号后,会判断出主机故障。这样就会启用HA机制,将释放故障主机上运行虚拟机的控制权限,由其它的ESXI Server接管虚拟机的运行。
其次,为了保证启用HA机制时,不影响群集中的虚拟机运行,确保群集中的故障切换容量,我们也要启用“接入控制”。当违反HA策略时,不启动受限制的虚拟机。同时,设置HA虚拟机的重新启动优先级,默认为中等,然后根据虚拟机应用系统的重要级别,设置虚拟机重新启动的优先级别。
除了保护因为硬件故障导致HA机制生效外,也要保护虚拟机系统的运行是否正常,在这里我们启用“虚拟机监控状态”。每个虚拟机系统,都会安装VMware Tools,启用虚拟机监控后,监控功能会检测虚拟机的VMware Tools信号,如果在给定的时间内没有收到监测信号,便重新启动虚拟机,以便防止虚拟机系统死机现象。
VMware Fault Tolerance(FT)功能可以在单个群集内创建应用业务系统虚拟机的一个完全相同的副本,副本的虚拟机同样处于活动状态,接受请求服务信息,并运行程序。主虚拟机和副本虚拟机实时同步,当虚拟化物理服务器出现意外宕机时,开启FT的虚拟机会自动切换到副本虚拟机上运行,从而保障应用业务系统的0中断。
在系统运行过程中,难免会产生资源竞争的问题。为了解决因资源竞争产生影响虚拟机运行的问题,我们建议针对不同的系统应用,划分不同的资源池。
对于资源池我们设定资源池CPU、内存的上限和预留值。
在虚拟机的CPU配置方面,我们的原则是在不影响系统性能的情况下,配置vCPUs的数量越少越好。因为如果为虚拟机配置的vCPUs多了以后,不但在CPU调度时会消耗更多不必要的资源,还会增加CPU的Ready时间。所以尽量少地分配vCPUs数量。
VMware在内存使用方面,有几种优化方法:一、透明页面共享,二、内存压缩,三、交换文件。按照先后级别,我们尽可能不让交换文件的出现。因为当有交换文件出现时,也就意味着内存的过量分配。为了不影响虚拟机的性能,我们要尽可能地不让内存过量分配。我们在优化虚拟机性能时,尽量让相同操作系统的虚拟机运行在相当的主机上,安装相同的补丁级别。为每个虚拟机配置内存预留。
4)虚拟机CPU和内容热添加扩展
热添加使管理员可以在虚拟机需要时为其增加 RAM 和 CPU 资源,同时不会中断虚拟机的使用。这样可减少停机时间并确保虚拟机中的应用始终拥有所需的资源。
即使制定了最好的规划,应用所需的资源有时还是超出预期,Sphere支持热添加vCPU和内存以及热添加/热扩展虚拟磁盘,从而实现虚拟机资源的动态添加。通过在不中断应用或终端用户的情况下为虚拟机调配添加vCPU,内存和硬盘,热添加和热扩展能力允许IT为应用添加可用资源。所有虚拟机都支持虚拟磁盘的热添加/热扩展。所有在物理服务器上本地支持热添加vCPU/内存的客户操作系统,都支持虚拟机CPU/内存的热添加。
在实际应用中,除了管理员之外,肯定也会有不同的用户。为了满足不同用户的不同需求,我们建议结合现有的域环境,为不同的用户,赋于不同的用户权限。如:网络管理员,存储管理员,虚拟机超级用户等。
生产环境中,我们建议删除初识管理员用户,建立一个管理员组,然后将管理员权限赋于管理员组。为业务系统管理员根本虚拟机用户权限,对于协同管理用户根本只读权限。
警报是由特定事件触发的预配置操作。通过定义警报的对象的“Alarms”选项卡,可以查看、修改和删除现有的警报。为了更好地了解虚拟化平台的运行情况,我们要针对整个虚拟化平台设置不同的警报级别,比如:主机CPU、内存过量使用报警,虚拟机资源紧张报警。
对于此次同仁堂股份有限公司需要迁移的应用系统,通过我们所收集的应用系统情况,预计为35台Hyper-v虚拟机以及15台物理机应用系统,每个应用系统至少需要4vcpu和16G内存,故服务器需要为系统迁移预留出至少100核处理器(考虑到业务系统消耗CPU情况,我们建议CPU整合比1:2即可)以及800G实际内存。
此次迁移我们均通过VMware自带的vCenter Converter Standalone软件进行迁移实现,当前需要整合的应用系统包含2种类型:
1)运行在Hyper-v主机的部分虚拟机,保障在非生产时间迁移,迁移前需关闭Hyper-v虚拟机。
2)运行在生产物理服务器的操作系统,迁移时按照应用的访问和重要程度进行逐步迁移(对于应用较空闲的可以优先迁移,迁移成功完成后建议等到源应用可以进行临时停机时在进行开启虚拟机并使用;应用中存在数据更新较频繁服务器,建议先对应用数据备份,之后在业务闲时停止应用服务进行迁移,从而保证数据的一致性,避免在迁移的过程中数据持续变化导致迁移后数据不一致现象)。
VMware vCenter Converter Standalone对于Hyper-v虚拟机迁移的过程主要是:
VMware vCenter Converter Standalone对于Windows物理服务器迁移的过程主要是:
VMware vCenter Converter Standalone 6是一款功能强大的企业级产品,用于管理和自动实现大规模转换,可以将公司中的应用环境用于任何 P2V 和 V2V 迁移项目。可以自动化和简化物理机转换到虚拟机以及虚拟机格式之间转换的过程。使用 VMware vCenter Converter Standalone 6直观的向导驱动界面,可将物理机、虚拟机和系统映像转换为虚拟机。受支持转换的类型主要为:
为了使同仁堂股份有限公司管理员或维护人员清晰明了识别当前虚拟化的性能问题或故障问题,我们建议搭建Vmware vRealize Operations运维管理平台,通过此平台可使虚拟化使用者或管理员更全面地了解基础设施所有层的情况。它可收集和分析性能数据、关联异常现象,并可识别出构成性能问题的根本原因。它提供的容量管理可优化资源使用率,基于策略的配置管理则可确保合规性并消除数量剧增和配置偏差问题。
vRealize Operations Manager 6.0的体系结构最重要的一点就是所有的数据分析任务和图形界面展现的UI界面均通过一个单独的虚拟机实现,该虚拟机的体系结构如下图所示。
每个组件的主要功能如下。
这种全新的体系结构非常有利于系统的横向扩展从而适应更加复杂的生产环境。
vRealize Operations 提供的功能界面可让管理员清晰判别当前环境中的问题所在,并可给出问题状态的原因,让管理员一目了然。
基本功能为:
操作仪表板显示了虚拟基础设施的健康状态、风险和效率。
快速识别异常、故障和受压的工作负载,它直接影响着基础设施的性能和健康状况。
深入地分析影响虚拟机、主机、数据存储、集群的性能和健康状况。
在终端用户受影响之前,自动的溯源分析,预先通知建设问题并给出指导建议。
获取针对性能、容量和配置问题的清楚的说明和建议的解决方案。将工作流与智能警报相关联以在达到临界阈值时自动启动纠正操作。
针对运行状况恶化或性能下降的情况,可直观地追溯到基础架构和客户操作系统级别的特定配置变更。
通过各个领域的基础设施,来识别资源的约束和瓶颈。
通过性能趋势、前瞻性预测、扩展预测等方法,深入的了解当前和未来的资源需求、容量管理的使用和规划。
回收未使用的资源,在没有性能影响的前提下优化整合率和虚拟机密度。
持续确保 vSphere 强化虚拟和物理基础架构所有方面的合规性。详细的模板可参照数百个强化条件向管理员表明环境状况,以便可以快速追溯到不合规的领域并进行修复。
基于用户角色(例如 VI 管理员和存储管理员)进行授权,从而针对个人控制其对于对象、功能、操作和报告的访问。
通过在组级别定义阈值、警报和配置设置来确定关键工作负载的优先级。要进行更高级的监控,可以为特定工作负载类型、应用或集群创建自定义策略。
自动生成和发送不同格式的容量报告。
考虑到所有应用业务系统的大量部署,我们可以借助vRealize Automation(vRA)搭建起云管理平台,通过自助式门户和目录向应用业务使用者提供预定义基础架构进行自动化调配,从而快速实现价值。这些功能可促使企业加大创新力度,并且能够提高企业的敏捷性以及降低IT成本,同时还能确保符合行业和公司的法规和策略。此外,vRA还能够简化和自动化将任何自定义或打包应用调配到任何已批准的云的过程,从而缩短应用的上市时间。可重复使用的标准化应用组件能够降低成本,并且有助于确保合规性,此外还能调配到多个云,因而可提高业务敏捷性。
在基础架构虚拟化层面,vRealize Automation可让用户通过服务portal轻松访问IT服务,而这些服务,无论是计算、桌面还是应用,都是通过服务蓝本调配的。该解决方案还提供策略引擎,从而确保用户能够访问经授权的服务,同时确保将服务调配到正确的环境并将审批和调配流程自动化。在应用层面,vRA可让用户通过可重复使用的组件构建应用蓝本,并且将这些蓝本与所有可用云的部署配置文件关联起来。
vRA通过自动化的方法提供给企业和用户流畅的IT服务资源管理,解决了异构平台和非集中管理带来了各种挑战:
图:vRA流畅地管理
VMware vRealize Automation(vRA)位于VMware软件定义的数据中心的最高级管理层面,它不仅可以管理基础计算资源,也可以管理桌面资源。vRA提供了一个可以跨不同云提供商的,管理和调配虚拟机、云虚拟机和物理机,并管理它们的生命周期资源的自助式门户。企业异构硬件环境可以通过vRA来进行集中化和标准化的调配和管理。
对于管理虚拟机,可以对VMware vCloud Director环境、vSphere服务器虚拟化环境虚拟机进行管理,并且可以管理Microsoft Hyper-V、Citrix Xenserver、Redhat KVM等虚拟化环境。对于物理机,支持管理主流x86服务器厂商的服务器,包括HP(通过iLO),DELL(通过iDRAC),CISCO(通过UCSM),IBM(需要作一定的定制开发),此外还可以管理外部公有云如VMware vCloud Director和Amazon AWS虚拟环境的云资源。
vRA自身不具备虚拟化资源的能力,而是与虚拟化平台协作,提供调配和管理虚拟化平台所创建的虚拟机和产生的虚拟计算资源的能力。要完成上述调配和管理的功能,vRA需要使用包含在平台结构内的代理。类似地,vRA并不直接管理云虚拟机,而是直接与云服务交互,来调配和管理云平台创建的虚拟机。对于管理物理机器,vRA直接与每个系统的管理接口通信来执行诸如操作系统安装、重启、重调配等操作。
我们将针对同仁堂股份有限公司云计算数据中心的服务调配进行规划设计,即:基础架构即服务调配规划,我们将从vRealize Atuomation角色部署、服务规划和IaaS规划三个方面对该计算中心的基础架构服务调配进行全面的规划设计。
部署vRealize Automation需要完成对如下三个组件角色的部署。
该组件是一个预先配置的虚拟设备,可以为vRealize Automation环境提供Single Sign-On(SSO)功能。它作为开放式虚拟机格式(OVF)模板提供,系统管理员可以将虚拟设备部署到现有的虚拟化基础架构中。SSO是一个采用安全令牌交换机制的身份验证代理程序,它与企业身份存储(Active Directory或LDAP)进行交互来验证用户身份,系统管理员可以配置SSO设置,以提供对VMware Identity Applicance控制台的访问。
该组件也是一个预先配置的虚拟设备,用于部署vRealize Automation服务器。它作为开放式虚拟机格式(OVF)模板提供,系统管理员可以将虚拟设备部署到现有的虚拟化基础架构中。服务器包括vRealize Automation Appliance控制台,后者为云服务自助置备和管理以及编写、管理和监管操作提供了一个单一门户。
基础架构即服务组件可以跨虚拟和物理、专用和公用或者混合云基础架构快速建模和置备服务器及桌面。系统管理员在Windows计算机上(虚拟或者物理机)安装Iaas组件,然后即可通过用户界面控制台的“Infrastructure”选项卡使用IaaS功能。IaaS有多个组件,可以安装在自定义配置中来满足组织的需求。
根据数据中心被管理的虚拟机的数量的不同,角色部署的架构也不同,我们为同仁堂股份有限公司选择以下部署方式,架构图如下图所示。
图:小环境部署
按照部署的总应用业务数为128为例,我们将Identity Appliance和vCloud Automation CenterAppliance组件分别导入到VMware服务器虚拟化平台,并在虚拟化平台上安装一台Windows Server 2012R2用于部署IaaS组件,上述三个组件的配置需求如下表所示,我们会严格按照这个需求进行部署实施。
表:vRA三个组件对硬件的需求
本部分将介绍vRA的服务规划,主要是工作流和对租户的规划设计。
图:工作流
整个工作流由六步组成,云计算使用者提出请求后,流程进入“审批”环节,这一步会生成工作单,审批通过后,vRA将会运行自定义的脚本来完成对资源的调配。资源调配成功后,该申请者就可以使用调配好的资源,这就是“管理”环节。接下来如果租期到期了或者使用者主动释放资源后,该资源将会被“淘汰”,然后进入“归档”环节。
租户是 vRealize Automation 部署内的组织单元。租户可以表示从服务提供者处订阅云服务的企业或公司内的业务单元。每个租户都有自己的专用配置,租户之间共享某些系统级配置。
所有用户身份验证都通过认证服务器进行处理。每个租户都有一个或多个用于提供身份验证的身份存储,例如 Active Directory 服务器。
系统管理员可执行基本租户设置,包括为每个租户至少指定一个身份存储和一个租户管理员。此后,租户管理员可以配置其他身份存储,从身份存储为用户或组分配角色。租户管理员也可以在自己的租户内创建自定义组,以及将身份存储中定义的用户和组添加到自定义组。像身份存储组和用户一样,您可以为自定义组分配角色,在审批策略中将其指定为审批者。
租户管理员还可以在其租户内创建业务组。业务组是一组用户,通常与业务线、部门或其他组织单位相对应,可以与一组目录服务和基础架构资源关联。可以将用户、身份存储组和自定义组添加到业务组。
vRealize Automation 支持单租户部署或多租户部署,根据同仁堂股份有限公司应用业务环境的具体情况,我们建议单租户部署。在单租户部署中,所有配置都可以出现在默认租户中。租户管理员可以管理用户和组,配置特定于租户的品牌、通知、业务策略和目录服务。所有用户都通过同一 URL 登录到 vRealize Automation 控制台,但用户可使用的功能由其角色确定。
在单租户方案中,将系统管理员和租户管理员角色分配给同一个人很常见,但仍然有两个不同的帐户。系统管理员帐户始终是 administrator@vsphere.local。租户管理员必须是某个租户身份存储中的用户,例如用户名@mycompany.com。
VMware vRealize Automation的基础架构即服务 (IaaS) 功能可以跨虚拟和物理、专用和公用或混合云基础架构快速建模和置备服务器及桌面。要使资源受 vRealize Automation 管理、为用户分配资源、准备置备计算机及创建计算机蓝图,IaaS 管理员、租户管理员和架构管理员需要进行一些准备工作。
下面是使 IaaS 实例完全正常运行所需的一系列步骤。