首页 VMWare vSAN监控和故障排除指南

VMWare vSAN监控和故障排除指南

举报
开通vip

VMWare vSAN监控和故障排除指南VMWarevSAN监控和故障排除指南VMwarevSphere7.0VMwarevSAN7.0目录关于vSAN监控和故障排除51vSAN简介62监控vSAN群集7监控vSAN容量7监控物理设备9监控加入vSAN数据存储的设备10监控vSAN群集中的虚拟对象10关于vSAN群集重新同步10在vSAN群集中监控重新同步任务11限制vSAN群集中的重新同步活动12关于vSAN群集重新平衡13监控被动重新平衡13配置自动重新平衡13使用vSAN默认警报14查看vSAN默认警报14使用VMkernel观察创建警报14为vS...

VMWare vSAN监控和故障排除指南
VMWarevSAN监控和故障排除指南VMwarevSphere7.0VMwarevSAN7.0目录关于vSAN监控和故障排除51vSAN简介62监控vSAN群集7监控vSAN容量7监控物理设备9监控加入vSAN数据存储的设备10监控vSAN群集中的虚拟对象10关于vSAN群集重新同步10在vSAN群集中监控重新同步任务11限制vSAN群集中的重新同步活动12关于vSAN群集重新平衡13监控被动重新平衡13配置自动重新平衡13使用vSAN默认警报14查看vSAN默认警报14使用VMkernel观察创建警报14为vSAN事件创建vCenterServer警报153监控vSAN运行状况17关于vSAN运行状况服务17检查vSAN运行状况18从ESXiHostClient监控vSAN19主动测试194监控vSAN性能21关于vSAN性能服务21配置vSAN性能服务22使用保存的时间范围22查看vSAN群集性能23查看vSAN主机性能24查看vSAN虚拟机性能25使用vSAN性能诊断255处理故障以及对vSAN进行故障排除27上载vSAN支持包27VMware,Inc.3对vSAN使用Esxcli命令28使用vsantop命令行工具31ESXi主机上的vSAN配置可能失败31不合规虚拟机对象不会立即合规32vSAN群集配置问题32处理vSAN中的故障33vSAN故障处理33对vSAN进行故障排除39更换现有的硬件组件43关闭并重新启动vSAN群集45vSAN监控和故障排除VMware,Inc.4关于vSAN监控和故障排除《vSAN监控和故障排除》介绍了如何使用vSphereClient、esxcli和RVC命令以及其他工具来监控VMwarevSAN®以及进行故障排除。目标读者本 手册 华为质量管理手册 下载焊接手册下载团建手册下载团建手册下载ld手册下载 的目标用户为要监控vSAN操作和性能或者对vSAN群集问题进行故障排除的任何人。本手册的目标读者为熟悉虚拟机技术和数据中心操作且具有丰富经验的系统管理员。本手册假设您熟悉VMwarevSphere,包括VMwareESXi、vCenterServer和vSphereClient。有关vSAN以及如何创建vSAN群集的详细信息,请参见《vSAN规划和部署指南》。有关vSAN功能以及如何配置vSAN群集的详细信息,请参见《管理VMwarevSAN》。VMware,Inc.5vSAN简介1VMwarevSAN是作为ESXi管理程序的一部分本机运行的分布式软件层。vSAN可汇总主机群集的本地或直接连接容量设备,并创建在vSAN群集的所有主机之间共享的单个存储池。虽然vSAN支持HA、vMotion和DRS等需要共享存储的VMware功能,但它无需外部共享存储,并且简化了存储配置和虚拟机置备活动。VMware,Inc.6监控vSAN群集2您可以监控vSAN群集以及与其相关的所有对象。可以监控vSAN环境中的所有对象,包括加入vSAN群集和vSAN数据存储的主机。有关监控vSAN群集中的对象和存储资源的详细信息,请参见《vSphere监控和性能》文档。本章讨论了以下主题:n监控vSAN容量n监控物理设备n监控加入vSAN数据存储的设备n监控vSAN群集中的虚拟对象n关于vSAN群集重新同步n关于vSAN群集重新平衡n使用vSAN默认警报n使用VMkernel观察创建警报监控vSAN容量可以监控vSAN数据存储的容量、分析使用情况以及查看群集级别的容量细目。群集“摘要”页面包含vSAN容量的摘要信息。还可以在“容量”监控中查看更多详细信息。VMware,Inc.7步骤1导航到vSAN群集。2单击监控选项卡。3在“vSAN”下,单击容量以查看vSAN容量信息。结果n“容量概览”显示vSAN数据存储的存储容量,包括总空间、已用空间、可用空间、预留空间以及在vSAN磁盘上实际写入或以物理方式消耗的空间。对于启用了去重和压缩的群集,可以查看压缩节省量和压缩比率。n“可用容量分析”帮助您在将去重率保持为1的同时根据选择的存储策略估算可用空间。n“去重和压缩之前的使用情况细目”显示基于虚拟机使用情况、用户对象和系统使用情况等类别的使用情况细目。可以通过图形方式显示使用情况类别。单击图形可查看不同的使用情况类别。以下是可用的不同使用情况类别:vSAN监控和故障排除VMware,Inc.8类别描述虚拟机使用情况显示以下信息:n虚拟机主对象-显示虚拟机命名空间对象。n交换对象-显示虚拟机交换文件。nVMDK-驻留在vSAN数据存储上的VMDK对象消耗的容量,可分类为主数据和副本使用情况。主数据包括写入物理磁盘的实际用户数据,不包括任何开销。副本使用情况显示虚拟磁盘的RAID开销。n虚拟机内存快照-虚拟机的内存快照文件。n块容器卷(连接到虚拟机)-连接到虚拟机的容器对象消耗的容量。nvSphereReplication永久状态文件-vSAN对象,用于在源站点上存储持久状态文件(PersistentStateFile,PSF)。用户对象显示iSCSI对象、未连接到虚拟机的块容器卷、用户创建的文件、ISO文件、虚拟机模板、文件共享、文件容器卷,以及目标站点上vSphereReplication服务使用的vSAN对象。系统使用情况显示以下信息:n性能管理对象-启用性能服务时,为存储性能衡量指标而创建的对象消耗的容量。n文件系统开销-容量驱动器上磁盘文件系统占用的开销。n校验和开销-存储所有校验和时产生的开销。n去重和压缩开销-获得去重和压缩所带来的益处时产生的开销。仅当启用去重和压缩后,才会显示此数据。n瞬态空间-群集中的临时空间使用情况。在启用去重和压缩功能时,由于磁盘空间进行回收和重新分配,因此可能需要几分钟才能在“容量”监控中反映容量更新。有关去重和压缩的详细信息,请参见《管理VMwarevSAN》中的“使用去重和压缩”。可以查看vSAN数据存储中容量使用情况的历史 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 。单击容量历史记录,选择时间范围,然后单击显示结果。监控物理设备可以监控vSAN群集中使用的主机、缓存设备和容量设备。步骤1导航到vSAN群集。2单击监控选项卡。3单击物理磁盘可查看群集中的所有主机、缓存设备以及容量设备。vSAN将显示有关容量设备的信息,例如,总容量、已用容量、预留容量、物理位置等。物理位置基于vSAN主机上的缓存设备和容量设备的硬件位置。vSAN监控和故障排除VMware,Inc.9监控加入vSAN数据存储的设备验证备份vSAN数据存储的设备的状态。您可以检查设备是否出现问题。步骤1导航到“存储”。2选择vSAN数据存储。3单击配置选项卡。可以查看有关vSAN数据存储的常规信息,包括容量、功能和默认存储策略。4显示有关本地设备的信息。a单击磁盘管理,然后选择要在页面底部的表中显示本地设备的磁盘组。b单击容量可查看群集中有关已置备和已用容量的信息,还可以按对象类型或数据类型查看已用容量的细目。监控vSAN群集中的虚拟对象您可以查看vSAN群集中的虚拟对象的状态。一个或多个主机无法与vSAN数据存储通信时,可能不会显示有关虚拟对象的信息。步骤1导航到vSAN群集。2单击监控选项卡。3在vSAN下,选择虚拟对象以查看vSAN群集中的相应虚拟对象。a在页面顶部的受影响的清单对象区域中选择一种对象类型可显示每个对象的相关信息,例如运行状况和可用性、存储策略以及vSANUUID。您还可以查看vSphereReplication对象。b在其中一个虚拟对象上选中复选框,然后单击查看放置详细信息可打开“物理放置”对话框。可以查看设备信息,例如名称、标识符或UUID、用于每个虚拟机的设备数以及在主机间的镜像方式。c在“物理放置”对话框中,选中按主机放置对组件分组复选框可按主机和按磁盘组织对象。注在群集级别,容器卷筛选器显示已分离的容器卷。要查看已连接的卷,请选择容器连接到的虚拟机。关于vSAN群集重新同步可以监控vSAN群集中正在重新同步的虚拟机对象的状态。当硬件设备、主机或网络出现故障,或将主机置于维护模式时,vSAN将在vSAN群集中启动重新同步。但是,vSAN可能会暂时等待故障组件恢复联机,然后再启动重新同步任务。vSAN监控和故障排除VMware,Inc.10以下事件将在群集中触发重新同步操作:n编辑虚拟机(VM)存储策略。更改虚拟机存储策略设置时,vSAN可能启动对象重新创建,随后会重新同步对象。某些策略更改可能会导致vSAN创建对象的其他版本,并与以前的版本重新同步。完成重新同步后,将弃用原始对象。vSAN可确保虚拟机继续运行,且重新同步过程不会中断虚拟机的操作。该过程可能需要更多临时容量。n出现故障后,重新启动主机。n从永久或长期故障中恢复主机。如果主机超过60分钟不可用(默认),vSAN将创建数据副本以恢复完整的策略合规性。n将主机置于维护模式之前,使用“迁移全部数据”模式撤出数据。n超过容量设备的容量阈值。vSAN群集中的容量设备接近或超过80%的阈值水平时,会触发重新同步。如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的IOPS。在vSAN群集中监控重新同步任务要评估正在重新同步的对象的状态,可以监控正在进行的重新同步任务。前提条件确认vSAN群集中的主机运行的是ESXi6.5或更高版本。步骤1导航到vSAN群集。2选择监控选项卡。3单击vSAN。4选择重新同步对象。5跟踪虚拟机对象的重新同步进度。对象修复时间定义将主机置于失败状态或维护模式之后修复不合规对象之前vSAN等待的时间。默认设置为60分钟。要更改设置,请编辑对象修复定时器(配置>vSAN>服务>高级选项)。此外,还可以查看有关已重新同步的对象的以下信息:对象描述重新同步对象总计vSAN群集中要重新同步的对象总数。要重新同步的剩余字节重新同步完成之前剩余的数据(以字节为单位)。vSAN监控和故障排除VMware,Inc.11对象描述总重新同步ETA完成重新同步的估计剩余时间。要重新同步的对象将归为活动、已排队和已挂起三类。正在主动同步的对象属于活动类别。位于重新同步队列中的对象为已排队的对象。正在主动同步但现在处于已挂起状态的对象属于已挂起类别。已调度的重新同步要重新同步的剩余对象数。可以将已调度的重新同步分为两类:已调度和挂起。已调度类别显示因延迟计时器尚未过期而未重新同步的对象。计时器过期后,便开始重新同步对象。挂起类别显示延迟计时器已过期而无法重新同步的对象。出现这种情况的原因可能是,当前群集中的资源不足或不满足群集上设置的vSANFTT策略。您还可以根据各种筛选器(如意图和状态)查看重新同步对象。使用显示数,可以将视图修改为显示对象数量。限制vSAN群集中的重新同步活动您可以减少用于在vSAN群集中的磁盘组上执行重新同步的IOPS数。重新同步限制设置适用于整个群集,以每个磁盘组为基础进行应用。如果虚拟机因重新同步导致的延迟而无响应,可以限制用于重新同步的IOPS数。仅当因重新同步导致群集中延迟加剧,或主机上重新同步流量过高时,考虑限制重新同步。重新同步限制可能会增加完成重新同步所需的时间。可能会延迟不合规虚拟机的重新保护。步骤1导航到vSAN群集。2选择监控选项卡。3单击vSAN。4选择重新同步对象,然后单击重新同步限制。5(可选)单击显示当前每个主机的重新同步流量以查看重新同步活动。6选中为重新同步对象流量启用限制复选框。7移动滑块以设置限制,如下所述:n向右移动滑块可增加允许用于重新同步的吞吐量。n向左移动滑块可减少允许用于重新同步的吞吐量。常规做法是将吞吐量限制到原有数量的一半并为群集预留一段适应时间。如果需要进一步操作,则再次将吞吐量减半直至群集稳定为止。8单击应用或确定。vSAN监控和故障排除VMware,Inc.12关于vSAN群集重新平衡当群集中任何容量设备中存储的数据达到总容量的80%时,vSAN将自动重新平衡群集,直到所有容量设备上的可用空间都低于阈值。群集重新平衡会在群集中平均分配资源,以保持一致的性能和可用性。以下操作可能会导致磁盘容量达到80%并启动群集重新平衡:n群集上出现硬件故障。n使用撤出所有数据选项将vSAN主机置于维护模式。n分配了PFTT=0的对象位于vSAN主机上时,使用确保数据可访问性将主机置于维护模式。注要为维护和重新保护操作提供足够空间,并最大程度地减少vSAN群集中的自动重新平衡事件,应当随时留有30%的可用容量。监控被动重新平衡默认情况下,当容量设备中存储的数据达到总容量的80%时,vSAN会启动被动重新平衡。若要监控群集中的再平衡操作,请运行以下RVC命令:nvsan.check_limits。验证群集中的磁盘空间使用情况是否平衡。nvsan.whatif_host_failures。分析每个主机的当前容量使用情况,解释单个主机故障是否可以强制群集耗尽空间以重新保护,并分析主机故障可能对群集容量、缓存预留和群集组件产生什么影响。作为命令输出显示的物理容量使用情况是vSAN群集中所有设备的平均使用情况。nvsan.resync_dashboard。监控群集中的任何重新构建任务。有关RVC命令选项的信息,请参见《RVC命令参考指南》。配置自动重新平衡默认情况下,vSAN会自动重新平衡磁盘组上的数据。您可以为自动重新平衡配置相关设置。由于设备的I/O模式不均衡,或者添加主机或容量设备时,vSAN群集可能会变得不平衡。如果群集变得不平衡,则vSAN会自动重新平衡磁盘。该操作会将组件从使用过度的磁盘移到未充分利用的磁盘中。可以启用或禁用自动重新平衡,并配置差异阈值以触发自动重新平衡。如果群集中任意两个磁盘之间的容量差异达到重新平衡阈值,则vSAN将开始重新平衡群集。磁盘重新平衡可能会影响vSAN群集的I/O性能。为避免此性能影响,可以在需要最佳性能时关闭自动重新平衡。步骤1导航到vSAN群集。2单击配置选项卡。3在“vSAN”下,选择服务。vSAN监控和故障排除VMware,Inc.134单击以编辑高级选项。5单击以启用或禁用自动重新平衡。可以将差异阈值更改为20到75之间的任何百分比值。后续步骤可以使用vSANHealthService检查磁盘平衡。展开“群集”类别,然后选择vSAN磁盘平衡。使用vSAN默认警报您可以使用默认的vSAN警报监控群集、主机和现有vSAN许可证。激活与警报对应的事件或满足警报中指定的一个或所有条件时,会自动触发默认警报。您不能编辑条件或删除默认警报。要配置特定于要求的警报,请为vSAN创建自定义警报。请参见为vSAN事件创建vCenterServer警报。有关监控警报、事件和编辑现有警报设置的信息,请参见《vSphere监控和性能》文档。查看vSAN默认警报可以使用默认的vSAN警报监控群集、主机,分析任何新事件,以及评估群集的整体运行状况。步骤1导航到vSAN群集。2单击配置,然后单击警报定义。3在搜索框中键入vSAN作为搜索项,以显示特定于vSAN的警报。键入vSANHealthService警报,以搜索vSANHealthService警报。此时将显示默认的vSAN警报。4在警报列表中,单击每个警报可以查看警报定义。使用VMkernel观察创建警报VMkernel观察(VOB)是可以用来设置vSAN警报的系统事件,这些事件可以监控vSAN群集中的性能和网络连接问题并进行故障排除。在vSAN中,这些事件称为观察。vSAN的VMwareESXi观察ID每个VOB事件与一个标识符(ID)关联。在vCenterServer中创建vSAN警报之前,必须确定要创建警示的vSAN事件的相应VOBID。您可以在VMwareESXi观察日志文件(vobd.log)中创建警示。例如,使用以下VOBID为群集中的所有设备故障创建警示。nesx.problem.vob.vsan.lsom.diskerrornesx.problem.vob.vsan.pdl.offlinevSAN监控和故障排除VMware,Inc.14要查看vSAN的VOBID列表,请打开位于ESXi主机上/var/log目录中的vobd.log文件。该日志文件包含以下可用于创建vSAN警报的VOBID。表2-1.vSAN的VOBIDVOBID描述esx.audit.vsan.clustering.enabledvSAN群集服务处于启用状态。esx.clear.vob.vsan.pdl.onlinevSAN设备已联机。esx.clear.vsan.clustering.enabledvSAN群集服务处于启用状态。esx.clear.vsan.vsan.network.availablevSAN具有一个活动网络配置。esx.clear.vsan.vsan.vmknic.ready之前报告的vmknic已经获得有效IP。esx.problem.vob.vsan.lsom.componentthresholdvSAN接近节点组件计数限制。esx.problem.vob.vsan.lsom.diskerrorvSAN设备处于永久错误状态。esx.problem.vob.vsan.lsom.diskgrouplimitvSAN无法创建磁盘组。esx.problem.vob.vsan.lsom.disklimitvSAN无法将设备添加到磁盘组。esx.problem.vob.vsan.lsom.diskunhealthyvSAN磁盘不正常。esx.problem.vob.vsan.pdl.offlinevSAN设备处于脱机状态。esx.problem.vsan.clustering.disabledvSAN群集服务处于禁用状态。esx.problem.vsan.lsom.congestionthresholdvSAN设备内存或SSD拥堵已更新。esx.problem.vsan.net.not.ready将不含有效IP地址的vmknic添加到vSAN网络配置。vSAN网络尚未就绪时会出现这种情况。esx.problem.vsan.net.redundancy.lostvSAN网络配置没有所需冗余。esx.problem.vsan.no.network.connectivityvSAN没有使用中的现有网络连接配置。esx.problem.vsan.vmknic.not.ready将不含有效IP地址的vmknic添加到vSAN网络配置。为vSAN事件创建vCenterServer警报您可以创建警报以监控选定vSAN对象(包括群集、主机、数据存储、网络和虚拟机)上的事件。前提条件必须具有所需的Alarms.CreateAlarm或Alarm.ModifyAlarm特权级别步骤1导航到vSAN群集。2在配置选项卡上,选择警报定义,然后单击添加。3在“名称和目标”页面中,输入新警报的名称和描述。4从目标类型下拉菜单中,选择希望此警报监控的清单对象的类型,然后单击下一步。根据所选要监控目标的类型,目标后显示的摘要会有所不同。vSAN监控和故障排除VMware,Inc.155在“警报规则”页面中,从下拉菜单中选择触发器。此时会显示组合的事件触发器。只能为单个事件设置规则。对于多个事件,必须创建多个规则。6单击添加参数以从下拉菜单中选择一个参数。a从下拉菜单中选择运算符。b从下拉菜单中选择一个选项,以设置用于触发警报的阈值。c从下拉菜单中选择警报的严重性。可以将条件设置为显示为警告或显示为严重,但不能同时设置为这两者。您必须为“警告”和“严重”状态创建单独的警报定义。7选择发送电子邮件通知以在触发警报时发送电子邮件通知。8在电子邮件收件人文本框中,输入收件人地址。使用逗号分隔多个地址。9选择发送SNMP陷阱以在vCenterServer实例上触发警报时发送陷阱。10选择运行脚本以在触发警报时运行脚本。11在运行此脚本文本框中,输入以下脚本或命令:对于此类命令...输入以下内容...EXE可执行文件命令的完整路径名。例如,要在C:\tools目录中运行cmd.exe命令,请键入:c:\tools\cmd.exeBAT批处理文件命令的完整路径名(作为c:\windows\system32\cmd.exe命令的参数)。例如,要在C:\tools目录中运行cmd.bat命令,请键入:c:\windows\system32\cmd.exe/cc:\tools\cmd.bat12从下拉菜单中选择高级操作。您可以为虚拟机和主机定义高级操作。您可以为警报添加多个高级操作。13单击下一步以设置“重置规则”。14选择将警报重置为绿色,然后单击下一步以查看警报定义。15选中启用此警报以启用该警报,然后单击创建。结果此时该警报已配置完毕。vSAN监控和故障排除VMware,Inc.16监控vSAN运行状况3可以查看vSAN群集的整体运行状况,包括硬件兼容性、网络连接配置和操作、高级vSAN配置选项、存储设备运行状况以及虚拟机对象运行状况。本章讨论了以下主题:n关于vSAN运行状况服务n检查vSAN运行状况n从ESXiHostClient监控vSANn主动测试关于vSAN运行状况服务vSAN运行状况服务用于监控vSAN群集的运行状况。可以使用vSAN运行状况检查来监控群集组件的状态,诊断问题并对问题进行故障排除。运行状况检查涵盖硬件兼容性、网络配置和操作、高级vSAN配置选项、存储设备运行状况以及虚拟机对象。vSAN运行状况检查分为以下几个类别。每个类别包含单独的运行状况检查。VMware,Inc.17表3-1.vSAN运行状况检查类别运行状况检查类别描述硬件兼容性监控群集组件以确保这些组件使用受支持的硬件、软件和驱动程序。性能服务监控vSAN性能服务的运行状况。网络监控vSAN网络运行状况。物理磁盘监控vSAN群集中物理设备的运行状况。数据监控vSAN数据运行状况。群集监控vSAN群集运行状况。容量利用率监控vSAN群集容量。联机运行状况监控vSAN群集运行状况,并发送到VMware分析后端系统进行高级分析。您必须参与客户体验改善计划,才能使用联机运行状况检查。vSAN内部版本建议监控针对vSphereLifecycleManager的vSAN内部版本建议。vSANiSCSI目标服务监控iSCSI目标服务,包括网络配置和运行时状态。加密监控vSAN加密运行状况。延伸群集监控延伸群集的运行状况(如果适用)。有关“将见证设备升级到vSphere7.0或更高版本时需要特别小心”的详细信息,请参见知识库文章76948。超融合群集配置合规性监控主机的状态以及通过快速入门工作流配置的设置。vSAN会定期重新测试每个运行状况检查并更新结果。要立即运行运行状况检查并更新结果,请单击重新测试按钮。加入客户体验改善计划后,您可以运行运行状况检查,并将数据发送到VMware进行高级分析。单击重新测试联机运行状况按钮。有关vSAN运行状况检查的详细信息,请参见《VMwareVirtualSAN运行状况检查插件指南》。监控主机上的vSAN运行状况ESXi主机客户端是基于浏览器的界面,用于管理单个ESXi主机。在vCenterServer不可用时,可以使用它来管理主机。HostClient提供的选项卡可用于在主机级别管理和监控vSAN。nvSAN选项卡显示vSAN的基本配置。n主机选项卡显示已加入vSAN群集的主机。n运行状况选项卡显示了主机级别的运行状况检查。检查vSAN运行状况可以查看vSAN运行状况检查的状态,以验证vSAN群集的配置和运行。前提条件vSAN监控和故障排除VMware,Inc.18步骤1导航到vSAN群集。2单击监控选项卡。3在vSAN下,选择Skyline运行状况可查看vSAN运行状况检查类别。n如果“测试结果”列显示“警告”(黄色)或“失败”(红色)图标,可展开该类别查看各个运行状况检查的结果。n选择某个运行状况检查可查看详细信息。n在“信息”部分中,可以单击AskVMware按钮打开知识库文章,其中介绍了运行状况检查并提供了如何解决问题的信息。n可以单击运行状况检查上的警报静默,以便不显示任何警告或故障。从ESXiHostClient监控vSAN您可以通过ESXiHostClient监控vSAN运行状况和基本配置。步骤1打开浏览器,输入主机的IP地址。浏览器会重定向到主机客户端的登录页面。2输入主机的用户名和密码,然后单击登录。3在主机客户端导航器中,单击存储。4在主页中,单击vSAN数据存储,以显示导航器中的监控链接。5单击选项卡以查看主机的vSAN信息。a单击vSAN选项卡以显示vSAN的基本配置。b单击主机选项卡以显示已加入vSAN群集的主机。c单击运行状况选项卡以显示主机级别的运行状况检查。6(可选)在vSAN选项卡上,单击编辑设置以更正主机级别的配置问题。选择与您的vSAN群集配置相匹配的值,然后单击保存。主动测试可以在vSAN群集上启动运行状况测试,以验证群集组件是否按预期运行。运行虚拟机创建测试以验证vSAN群集运行状况。运行该测试将在群集中的每个主机上创建一个虚拟机。该测试将创建一个虚拟机,然后将其删除。如果成功执行虚拟机创建和删除任务,则假定群集组件按预期运行,并且群集完全正常。运行网络性能测试以检测并诊断连接问题,并确保主机之间的网络带宽支持vSAN的要求。测试在群集中的主机之间执行。它验证主机之间的网络带宽,并在带宽小于850Mbps时报告警告。vSAN监控和故障排除VMware,Inc.19要访问主动测试,请在vSphereClient中选择vSAN群集,然后单击“监控”选项卡。单击vSAN>主动测试。vSAN监控和故障排除VMware,Inc.20监控vSAN性能4可以监控vSAN群集的性能。提供群集、主机、物理磁盘、虚拟机和虚拟磁盘的性能图表。本章讨论了以下主题:n关于vSAN性能服务n配置vSAN性能服务n使用保存的时间范围n查看vSAN群集性能n查看vSAN主机性能n查看vSAN虚拟机性能n使用vSAN性能诊断关于vSAN性能服务可以使用vSAN性能服务监控vSAN环境的性能,并调查潜在的问题。性能服务收集并分析性能统计信息,并以图 表格 关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载 式显示这些数据。可以使用性能图表管理工作负载并确定问题的根本原因。VMware,Inc.21启用vSAN性能服务时,群集摘要会显示vSAN性能统计信息概览,包括IOPS、吞吐量以及延迟。可以查看vSAN群集的详细性能统计信息,以及群集中每个主机、磁盘组以及磁盘的详细性能统计信息。还可以查看虚拟机和虚拟磁盘的性能图表。配置vSAN性能服务使用vSAN性能服务监控vSAN群集、主机、磁盘和虚拟机的性能。注在vSphereClient中创建vSAN群集时,性能服务处于禁用状态。您可以启用并配置性能服务。为支持性能服务,vSAN将使用统计信息数据库对象来收集统计数据。该统计信息数据库是群集的vSAN数据存储中的一个命名空间对象。前提条件nvSAN群集中的所有主机必须运行ESXi6.5或更高版本。n配置vSAN性能服务之前,确保群集已正确配置,并且所有运行状况问题均已解决。步骤1导航到vSAN群集。2单击配置选项卡。3在“vSAN”下,选择服务。4单击性能服务编辑按钮。5单击以启用vSAN性能服务。6选择用于统计信息数据库对象的存储策略。7(可选)单击以启用详细模式。仅当启用vSAN性能服务后,才会显示此复选框。启用后,vSAN会收集其他性能衡量指标,并将其保存到统计信息数据库对象。如果启用详细模式超过5天,则会出现一条警告消息,指示详细模式可能会占用大量资源。确保不要长时间启用。8(可选)单击以启用网络诊断模式。仅当启用vSAN性能服务后,才会显示此复选框。启用后,vSAN会收集其他网络性能衡量指标,并将其保存到RAM磁盘统计信息对象。如果启用网络诊断模式超过一天,则会出现一条警告消息,指示网络诊断模式可能会占用大量资源。确保不要长时间启用。9单击应用。使用保存的时间范围可以从性能视图的时间范围选取器中选择保存的时间范围。可以使用自定义名称手动保存时间范围。运行存储性能测试时,会自动保存选定的时间范围。可以为任一性能视图保存时间范围。前提条件nvSAN性能服务必须已打开。vSAN监控和故障排除VMware,Inc.22nvSAN群集中的所有主机必须运行ESXi6.5或更高版本。步骤1导航到vSAN群集。2单击监控选项卡,然后单击性能。3选择任意选项卡,例如vSAN-后端。在时间范围下拉列表中,选择保存。4输入选定时间范围的名称。5确认您的更改。查看vSAN群集性能可以使用vSAN群集性能图表监控群集中的工作负载和确定问题的根本原因。当性能服务处于打开状态时,群集摘要将显示vSAN性能统计信息概览,包括vSANIOPS、吞吐量和延迟。在群集级别上,可以查看虚拟机消耗以及vSAN后端的详细统计信息图表。注要查看iSCSI性能图表,vSAN群集中的所有主机必须运行ESXi6.5或更高版本。前提条件必须先打开vSAN性能服务,然后才能查看性能图表。步骤1导航到vSAN群集。2单击监控选项卡。3在“vSAN”下,选择性能。4选择虚拟机。为您的查询选择时间范围。vSAN可以显示群集上运行的客户端的性能图表,包括IOPS、吞吐量、延迟、拥堵以及未完成I/O。这些图表上的统计信息是从群集内的主机中汇总的。5选择后端。为您的查询选择时间范围。vSAN可以显示群集后端操作的性能图表,包括IOPS、吞吐量、延迟、拥堵以及未完成I/O。这些图表上的统计信息是从群集内的主机中汇总的。6选择iSCSI,然后选择iSCSI目标或LUN。为您的查询选择时间范围。vSAN可以显示iSCSI目标或LUN的性能图表,包括IOPS、带宽、延迟和未完成I/O。7单击刷新或显示结果以更新显示。vSAN监控和故障排除VMware,Inc.23查看vSAN主机性能可以使用vSAN主机性能图表监控主机的工作负载并确定问题的根本原因。可以查看vSAN主机、磁盘组和单个存储设备的性能图表。当性能服务处于打开状态时,主机摘要将显示每个主机及其附加磁盘的性能统计信息。在主机级别上,可以查看虚拟机消耗以及vSAN后端的详细统计信息图表,包括IOPS、吞吐量、延迟和拥堵。可以使用其他图表查看本地客户端缓存读取IOPS和命中率。在磁盘组级别上,可以查看磁盘组的统计信息。在磁盘级别上,可以查看单个存储设备的统计信息。前提条件必须先打开vSAN性能服务,然后才能查看性能图表。要查看以下性能图表,vSAN群集中的主机必须运行ESXi6.5或更高版本:物理适配器、VMkernal适配器、VMkernal适配器聚合、iSCSI、vSAN-后端重新同步I/O、重新同步IOPS、重新同步吞吐量、磁盘组重新同步延迟。步骤1导航到vSAN群集,然后选择一个主机。2单击监控选项卡。3在“vSAN”下,选择性能。4选择虚拟机。为您的查询选择时间范围。vSAN可以显示主机上运行的客户端的性能图表,包括IOPS、吞吐量、延迟、拥堵以及未完成I/O。5选择后端。为您的查询选择时间范围。vSAN可以显示主机后端操作的性能图表,包括IOPS、吞吐量、延迟、拥堵、未完成I/O以及重新同步I/O。6选择磁盘,然后选择一个磁盘组。为您的查询选择时间范围。vSAN可以显示磁盘组的性能图表,包括前端(客户机)IOPS、吞吐量和延迟,以及开销IOPS和延迟,也可以显示读取缓存的命中率、逐出、写入缓冲区可用空间百分比、容量和使用情况、缓存磁盘离台率、拥堵、未完成I/O、未完成I/O大小、延迟I/O百分比、延迟I/O平均延迟、内部队列IOPS、内部队列吞吐量、重新同步IOPS、重新同步吞吐量以及重新同步延迟。7选择物理适配器,然后选择一个网卡。为您的查询选择时间范围。vSAN可以显示物理网卡(pNIC)的性能图表,包括吞吐量、每秒数据包数以及丢包率。8选择主机网络,然后选择一个VMkernel适配器,例如vmk1。为您的查询选择时间范围。vSAN可以显示vSAN使用的网络适配器中处理的所有网络I/O的性能图表,包括吞吐量、每秒数据包数以及丢包率。9选择iSCSI。为您的查询选择时间范围。vSAN可以显示主机上所有iSCSI服务的性能图表,包括IOPS、带宽、延迟以及未完成I/O。10单击刷新或显示结果以更新显示。vSAN监控和故障排除VMware,Inc.24查看vSAN虚拟机性能可以使用vSAN虚拟机性能图表监控虚拟机和虚拟磁盘的工作负载。当性能服务处于打开状态时,您可以查看虚拟机性能和虚拟磁盘性能的详细统计信息图表。在主机之间进行迁移时无法收集虚拟机性能统计信息,因此您可能会注意到虚拟机性能图表中存在几分钟的差距。注性能服务仅支持使用虚拟SCSI控制器的虚拟磁盘,不支持使用其他控制器(例如IDE)的虚拟磁盘。前提条件必须先打开vSAN性能服务,然后才能查看性能图表。步骤1导航到vSAN群集,然后选择一个虚拟机。2单击监控选项卡。3在“vSAN”下,选择性能。4选择虚拟机。为您的查询选择时间范围。vSAN可以显示虚拟机的性能图表,包括IOPS、吞吐量和延迟。5选择虚拟磁盘。为您的查询选择时间范围。vSAN可以显示虚拟磁盘的性能图表,包括IOPS、延迟的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化IOPS、虚拟SCSIIOPS、虚拟SCSI吞吐量以及虚拟SCSI延迟。6单击刷新或显示结果以更新显示。使用vSAN性能诊断可以使用vSAN性能诊断提高vSAN群集的性能并解决性能问题。vSAN性能诊断工具可分析之前运行的、从vSAN性能服务收集的基准测试。它可以检测问题,建议修复步骤,并提供支持性能图表以供进一步了解。vSAN性能服务提供用于分析vSAN性能诊断的数据。vSAN使用CEIP向VMware发送数据以供分析。注请勿使用vSAN性能诊断对生产vSAN群集的性能进行常规评估。前提条件nvSAN性能服务必须已打开。nvCenterServer需要访问Internet以下载ISO映像和修补程序。n您必须参与客户体验改进计划(CEIP)。步骤1导航到vSAN群集。2单击监控选项卡。3在vSAN下,选择性能诊断。vSAN监控和故障排除VMware,Inc.254从下拉菜单中选择基准测试目标。可以基于您要实现的性能改进(如最大IOPS、最大吞吐量或最短延迟)来选择目标。5为您的查询选择时间范围。默认时间范围为最近的小时。可以将范围增大为包括过去的24小时,或者在过去的90天内指定一个自定义时间范围。如果使用了HCIbench工具在vSAN群集上运行性能基准测试,则这些测试的时间范围将出现在下拉菜单中。6单击显示结果。结果单击显示结果时,vSAN将性能数据传输到vSphere后端分析服务器。分析数据后,vSAN性能诊断工具将显示可能影响所选目标的基准测试性能的问题列表。可以通过单击来展开每个问题,以查看有关每个问题的更多详细信息,如受影响项目的列表。也可以单击查看更多或AskVMware显示知识库文章,其中介绍了解决问题以及实现性能目标的建议。vSAN监控和故障排除VMware,Inc.26处理故障以及对vSAN进行故障排除5如果在使用vSAN时遇到问题,可以使用故障排除主题。这些主题可帮助您了解问题并为您提供解决办法(如果有)。本章讨论了以下主题:n上载vSAN支持包n对vSAN使用Esxcli命令n使用vsantop命令行工具nESXi主机上的vSAN配置可能失败n不合规虚拟机对象不会立即合规nvSAN群集配置问题n处理vSAN中的故障n关闭并重新启动vSAN群集上载vSAN支持包您可以上载vSAN支持包,以便VMware服务技术人员可以分析诊断信息。处理支持请求时,VMware技术支持通常会请求vSAN群集的诊断信息。支持包是一个存档,其中包含与环境相关的诊断信息,例如,产品特定日志、配置文件等。vSAN会自动上载支持包,在将支持数据发送到VMware之前不允许您查看、模糊处理或编辑数据内容。vSAN将连接到域名为vmware.com的目标服务器的FTP端口21或HTTPS端口443,以便自动上载支持包。注支持包中收集的数据可能会被视为敏感信息。如果您的支持数据中包含监管数据(如个人、医疗或财务数据),您可能希望避免上载支持包。步骤1在vSphereClient中右键单击vSAN群集。2选择菜单vSAN>上载支持包...VMware,Inc.273输入服务请求ID和问题描述。4单击上载。对vSAN使用Esxcli命令使用Esxcli命令可获取有关vSAN的信息,以及对您的vSAN环境进行故障排除。可用命令如下:命令描述esxclivsannetworklist确认哪些VMkernel适配器可用于vSAN通信。esxclivsanstoragelist列出由vSAN声明的存储磁盘。esxclivsanclusterget获取vSAN群集信息。esxclivsanhealth获取vSAN群集运行状况。esxclivsandebug获取vSAN群集调试信息。使用esxclivsandebug命令可调试vSAN群集并对群集进行故障排除,尤其是vCenterServer不可用时。使用:esxclivsandebug{cmd}[cmdoptions]调试命令:命令描述esxclivsandebugdisk调试vSAN物理磁盘。esxclivsandebugobject调试vSAN对象。esxclivsandebugresync调试vSAN重新同步对象。esxclivsandebugcontroller调试vSAN磁盘控制器。esxclivsandebuglimit调试vSAN限制。esxclivsandebugvmdk调试vSANVMDK。esxclivsandebug命令示例:esxclivsandebugdisksummarygetOverallHealth:greenComponentMetadataHealth:greenMemoryPools(heaps):greenMemoryPools(slabs):greenesxclivsandebugdisklistUUID:52e1d1fa-af0e-0c6c-f219-e5e1d224b469Name:mpx.vmhba1:C0:T1:L0SSD:FalseOverallHealth:greenCongestionHealth:State:greenCongestionValue:0vSAN监控和故障排除VMware,Inc.28CongestionArea:noneInCmmds:trueInVsi:trueMetadataHealth:greenOperationalHealth:greenSpaceHealth:State:greenCapacity:107365793792bytesUsed:1434451968bytesReserved:150994944bytesesxclivsandebugobjecthealthsummarygetHealthStatusNumberOfObjects-----------------------------------------------------------------reduced-availability-with-no-rebuild-delay-timer0reduced-availability-with-active-rebuild0inaccessible0data-move0healthy1nonavailability-related-incompliance0nonavailability-related-reconfig0reduced-availability-with-no-rebuild0esxclivsandebugobjectlistObjectUUID:47cbdc58-e01c-9e33-dada-020010d5dfa3Version:5Health:healthyOwner:Policy:stripeWidth:1CSN:1spbmProfileName:vSANDefaultStoragePolicyspbmProfileId:aa6d5a82-1c88-45da-85d3-3d74b91a5badforceProvisioning:0cacheReservation:0proportionalCapacity:[0,100]spbmProfileGenerationNumber:0hostFailuresToTolerate:1Configuration:RAID_1Component:47cbdc58-6928-333f-0c51-020010d5dfa3ComponentState:ACTIVE,AddressSpace(B):273804165120(255.00GB),DiskUUID:52e95956-42cf-4d30-9cbe-763c616614d5,DiskName:mpx.vmhba1..Votes:1,CapacityUsed(B):373293056(0.35GB),PhysicalCapacityUsed(B):369098752(0.34GB),HostName:sc-rdops...Component:47cbdc58-eebf-363f-cf2b-020010d5dfa3ComponentState:ACTIVE,AddressSpace(B):273804165120(255.00GB),DiskUUID:52d11301-1720-9901-eb0a-157d68b3e4fc,DiskName:mpx.vmh...Votes:1,CapacityUsed(B):373293056(0.35GB),PhysicalCapacityUsed(B):369098752(0.34GB),HostName:sc-rdops-vm..Witness:47cbdc58-21d2-383f-e45a-020010d5dfa3ComponentState:ACTIVE,AddressSpace(B):0(0.00GB),DiskUUID:52bfd405-160b-96ba-cf42-09da8c2d7023,DiskName:mpx.vmh...vSAN监控和故障排除VMware,Inc.29Votes:1,CapacityUsed(B):12582912(0.01GB),PhysicalCapacityUsed(B):4194304(0.00GB),HostName:sc-rdops-vm...Type:vmnamespacePath:/vmfs/volumes/vsan:52134fafd48ad6d6-bf03cb6af0f21b8d/NewVirtualMachineGroupUUID:00000000-0000-0000-0000-000000000000DirectoryName:NewVirtualMachineesxclivsandebugcontrollerlistDeviceName:vmhba1DeviceDisplayName:LSILogic/SymbiosLogic53c1030PCI-XFusion-MPTDualUlt..UsedByVSAN:truePCIID:1000/0030/15ad/1976DriverName:mptspiDriverVersion:4.23.01.00-10vmwMaxSupportedQueueDepth:127esxclivsandebuglimitgetComponentLimitHealth:greenMaxComponents:750FreeComponents:748DiskFreeSpaceHealth:greenLowestFreeDiskSpace:99%UsedDiskSpace:1807745024bytesUsedDiskSpace(GB):1.68GBTotalDiskSpace:107365793792bytesTotalDiskSpace(GB):99.99GBReadCacheFreeReservationHealth:greenReservedReadCacheSize:0bytesReservedReadCacheSize(GB):0.00GBTotalReadCacheSize:0bytesTotalReadCacheSize(GB):0.00GBesxclivsandebugvmdklistObject:50cbdc58-506f-c4c2-0bde-020010d5dfa3Health:healthyType:vdiskPath:/vmfs/volumes/vsan:52134fafd48ad6d6-bf03cb6af0f21b8d/47cbdc58-e01c-9e33-dada-020010d5dfa3/NewVirtualMachine.vmdkDirectoryName:N/AesxclivsandebugresynclistObjectComponentBytesLeftToResyncGBLeftToResync--------------------------------------------------------------------------31cfdc58-e68d...Component:23d1dc58...5368709120.5031cfdc58-e68d...Component:23d1dc58...10737418241.0031cfdc58-e68d...Component:23d1dc58...10737418241.00vSAN监控和故障排除VMware,Inc.30使用vsantop命令行工具使用ESXi主机上运行的vsantop命令行工具来查看实时vSAN性能衡量指标。您可以使用此工具监控vSAN性能。要在vsantop中显示不同的性能视图和衡量指标,请输入以下命令:命令描述^L重绘屏幕Space更新显示h或?帮助;显示此文本q退出f/F添加或移除字段o/O更改显示字段的顺序s设置更新之间的延迟(秒)#设置要显示的实例数E更改所选实体类型L更改字段的长度l将显示限于特定节点ID.按列、相同编号排序两次可更改排序顺序ESXi主机上的vSAN配置可能失败某些情况下,在特定主机上配置vSAN的任务可能会失败。问题加入vSAN群集的ESXi主机无法配置vSAN。原因如果主机不满足硬件要求或遇到其他问题,vSAN可能无法配置主机。例如,主机上的内存不足可能会阻止配置vSAN。解决 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 1将导致出现故障的主机置于维护模式。2将主机移出vSAN群集。3解决阻止主机配置vSAN的问题。4退出维护模式。5将主机移回vSAN群集。vSAN监控和故障排除VMware,Inc.31不合规虚拟机对象不会立即合规使用检查合规性按钮时,虚拟机对象的状态不会从“不合规”更改为“合规”,尽管vSAN资源已可用并符合虚拟机配置文件。问题使用强制置备时,即使vSAN群集中的可用资源不符合在虚拟机配置文件中指定的策略,您也可以置备虚拟机对象。可以创建对象,但其保持不合规状态。如果群集中的存储资源可用(例如
本文档为【VMWare vSAN监控和故障排除指南】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥17.94 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
IT人
暂无简介~
格式:pdf
大小:1MB
软件:PDF阅读器
页数:0
分类:互联网
上传时间:2020-07-23
浏览量:79