Dell EMC OpenManage Enterprise Power Manager 1.1 版 用户指南 June 2020 Rev.
注意、小心和警告 注: “注意”表示帮助您更好地使用该产品的重要信息。 小心: “小心”表示可能会损坏硬件或导致数据丢失,并告诉您如何避免此类问题。 警告: “警告”表示可能会导致财产损失、人身伤害甚至死亡。 © 2019 - 2020 Dell Inc. 或其子公司。保留所有权利。Dell、EMC 和其他商标是 Dell Inc.
目录 章 1: Power Manager 简介................................................................................................................ 5 章 2: 此版本中的新功能.....................................................................................................................6 章 3: 兼容性表................................................................................................................................. 7 Power Manager 中支持的设备................................................................................
温度触发策略...................................................................................................................................................................... 28 创建策略...............................................................................................................................................................................28 查看策略......................................................................................................................................................
1 Power Manager 简介 Dell EMC OpenManage Enterprise Power Manager 是 Dell EMC OpenManage Enterprise (OME) 控制台的扩展程序,它通过精密的机制 更清楚地展示功耗、异常情况和利用率。此外,对于服务器、机箱以及包含服务器和机箱的自定义组,Power Manager 还会针对与 其相关的功耗和散热事件发出警报并出具报告。报告有助于更紧密地控制、更快地响应、提高准确性以及获得更广泛的情报帮助决 策制定。 结合 PowerEdge 服务器或模块化系统(拥有 iDRAC Enterprise 或 iDRAC Datacenter 许可证或支持的机箱以及 OpenManage Enterprise 高级许可证)一起使用时,Power Manager 可利用来自 OME 控制台的信息为平台提供功耗报告。Power Manager 随后与每台托管设 备上的 iDRAC(Integrated Dell Remote Access Controller,集成式戴尔远程访问控制器)或机箱管理控制器 (CMC) 通信,提供功耗管 理数据和
2 此版本中的新功能 • • • • • • • • • • • • • 6 Power Manager 现在最高可以支持 6,000 台设备。 在升级 OpenManage Enterprise 之后,如果已安装的 Power Manager 版本与最新版本的 OpenManage Enterprise 不兼容,则 Power Manager 扩展程序会处于禁用状态。 可灵活地下载 Power Manager 文件,并在方便时安装扩展程序。 可对 Power Manager 中所有功能的信息进行排序和筛选。 支持在为组配置功率上限值(以瓦特或百分比为单位)。 Power Manager 的专用登录页面。 小组件改进,优化了用户体验。 支持通过为受管设备应用应急功率削减 (EPR),创建和维护温度触发策略,以防止因散热基础架构故障而导致设备过热受损。 支持在现有的内置报告中查看温度触发策略的详细信息。 可查看超出功率和温度阈值的前 10 个设备和组。 支持 Dell EMC VxRail 系统。 支持搭载 AMD 处理器且具有 iDRAC 4.10.10.
3 兼容性表 主题: • • Power Manager 中支持的设备 基于角色的 Power Manager 用户权限 Power Manager 中支持的设备 Power Manager 支持下列 Dell EMC PowerEdge 服务器和机箱。 表.
表.
表. 2: Power Manager 和 OpenManage Enterprise 的兼容性表 (续) Power Manager 版本 OpenManage Enterprise 版本 Power Manager 1.0 • • • • OpenManage Enterprise 3.2 OpenManage Enterprise 3.2.1 OpenManage Enterprise 3.3 OpenManage Enterprise 3.3.1 支持的协议 Power Manager 支持以下协议: • • 对于服务器和机箱,Power Manager 仅支持 Web Services for Management (WSMAN) 协议。 对于 PowerEdge MX7000 机箱,Power Manager 仅支持 Representational State Transfer (REST) 协议。 硬件要求 下表根据要通过 Power Manager 监视的设备数量列出了最低硬件配置。 表.
表.
4 许可证要求 使用 OpenManage Enterprise 高级许可证和 iDRAC 许可证以运用 Power Manager 的所有功能。下表介绍了使用 Power Manager 所需 的许可证组合。 表.
5 可扩展性和性能 Power Manager 最高可支持 6,000 台目标设备。 在 Power Manager 内配置适当的功率和温度采样间隔非常重要,因为采样间隔会显著影响系统的性能和资源消耗,包括网络带宽消 耗、数据库大小和趋势图的显示延迟。 Power Manager 中的默认功率和温度采样间隔是 15 分钟。这一值适用于设备数量低于 1,000 台的小型或中型环境。但是,当环境中 的托管设备超过 1,000 台时,该时间间隔将自动设置为 30 分钟。 12 可扩展性和性能
6 Power Manager 工作流 本节提供的概要信息旨在帮助管理员入门使用 Power Manager。 前提条件 确保满足以下前提条件: 1. 在 Dell EMC OpenManage Enterprise 中发现设备。 2. 发现设备后,在 Dell EMC OpenManage Enterprise 中创建静态组。 有关发现设备和创建静态组的更多信息,请参阅 OpenManage Enterprise 用户指南。 关于此任务 要使用 Power Manager 监视设备和组的功率和温度数据,请执行以下步骤: 步骤 1. 在目标设备的 iDRAC 上添加 OpenManage Enterprise 高级许可证。 2. 将受支持的设备或静态组添加到 Power Manager。 注: 只有受 Power Manager 支持的设备可添加到组中。有关受支持设备的更多信息,请参阅受支持设备列表。 3.
7 Power Manager 使用入门 主题: • • • • 安装 Power Manager 添加设备到 Power Manager 将组添加到 Power Manager 查看已添加到 Power Manager 的设备和组 安装 Power Manager 要监视设备或组的功率和散热数据,请在 OpenManage Enterprise 上安装 Power Manager 扩展程序。 前提条件 确保满足以下前提条件: • 成功连接到存储库: ○ 如果联机连接,请访问 downloads.dell.com 门户 ○ 如果脱机连接,请使用所需的扩展程序目录和扩展程序安装文件来配置服务器。 关于此任务 注: 在 OpenManage Enterprise 上安装扩展将重新启动一体机服务。 要安装该扩展程序,请执行以下步骤: 步骤 1. 启动 Dell EMC OpenManage Enterprise。 2. 在应用程序设置中,单击控制台和扩展程序。 此时将显示“控制台和扩展程序”页面。 3. 在 Power Manager 部分中,依次单击更多操作 > 安装。 此时会显示安装扩展程序窗口。 4.
添加设备到 Power Manager 要收集和监视设备的功率、热利用率和通风数据,需将设备添加到 Power Manager 中。 前提条件 确保满足以下前提条件: • • • • 在 OpenManage Enterprise 中发现了设备。有关发现设备的信息,参阅 OpenManage Enterprise 用户指南。 服务器拥有 OpenManage Enterprise 高级许可。有关添加许可证的信息,请参阅 OpenManage Enterprise 用户指南。 在“OpenManage Enterprise”中,模块化服务器不处于代理状态。 关于此任务 注: 要立即查看支持 Power Manager 的设备,请在 OpenManage Enterprise 上运行清点。 要添加设备,需执行下列步骤: 步骤 1. 启动 OpenManage Enterprise。 2. 在电源管理中,单击设备和组。 此时将显示设备和组选项卡。 3. 依次单击单个设备 > 添加设备。 此时将显示添加设备至 Power Manager 页面。 4.
步骤 1. 启动 OpenManage Enterprise。 2. 在电源管理中,单击设备和组。 此时将显示设备和组选项卡。 3. 在组选项卡中,单击添加组。 将显示添加组至 Power Manager 页面。 4. 在左侧窗格中,从静态组类别中选择一个组,然后单击添加所选项。 添加到 Power Manager 的组和添加的组的总数都将显示在组页面中。 注: 所有单独设备和所选组内的设备,都会添加到 Power Manager 中,并连同设备总数一起显示在所有受监视设备选项卡 中。 后续步骤 仅第一次:将组添加到 Power Manager 后,组中的服务器数量会显示为零。因此,在 OpenManage Enterprise 中运行清点后,单击设 备和组选项卡上的刷新 Power Manager 功能列表选项。 要在 OpenManage Enterprise 中运行清点,请执行以下步骤: 1. 在 OpenManage Enterprise 中,单击设备。 此时将显示所有设备页面。 2. 在快速链接部分中,单击运行清点。 此时将显示清点页面。 3. 在清点作业名称中,提供作业的名称。 4.
• • • • 在服务编号字段中提供系统服务编号 型号 类型 托管状态 所有受监视设备选项卡将显示以下筛选条件: • • • • • • • • 运行状态 电源状态 连接状态 在名称字段中提供主机名称 在服务编号字段中提供系统服务编号 型号 类型 组的一部分 6. 要清除筛选器,请单击清除所有筛选器。 7.
8 维护 Power Manager 主题: • • • • • • • 设置首选项 更新 Power Manager 禁用 Power Manager 启用 Power Manager 移除设备 移除组 卸载 Power Manager 设置首选项 使用这些配置选项来监视设备和组的功率和温度单位。根据数据中心的建议设置采样间隔。 关于此任务 要设置单位和采样间隔,需执行以下步骤: 步骤 1. 在 OpenManage Enterprise 中,依次单击电源管理 > 设置。 此时会显示设置窗口。 2. 单击编辑。 随即显示编辑 Power Manager 首选项窗口。 3. 选择所列选项的值,然后单击应用。 下表提供了 Power Manager 中所示属性的详细信息。 表.
表.
表. 8: 有关必填的数据间隔和持续时间的详细信息 (续) 字段 必需 值范围 默认值为否。 重置 WSMAN 功率指标数据 是 默认值为已禁用。 • • 已禁用 已启用 更新 Power Manager 关于此任务 要在 OpenManage Enterprise 中更新 Power Manager,请执行以下操作: 步骤 1. 配置存储库的位置以检查更新。有关详细信息,请参阅配置 OpenManage Enterprise 以获取 Power Manager 更新。 2. 升级 Power Manager。有关更多信息,请参阅升级 Power Manager。 配置 OpenManage Enterprise 以获取 Power Manager 更新 关于此任务 在 downloads.dell.com 或离线位置上检查 Power Manager 更新。要配置 OpenManage Enterprise 以查看更新,请执行以下操 作: 步骤 1. 启动 Dell EMC OpenManage Enterprise。 2.
关于此任务 要更新 Power Manager,请执行以下步骤: 步骤 1. 启动“OpenManage Enterprise”。 2. 依次单击应用程序设置 > 控制台和扩展。 将显示控制台和扩展页面。 3. 在 Power Manager 部分中,单击可用更新。 此时将显示更新扩展页面。 4. 要查看此版本的更新,请单击发行说明链接。 此时将显示支持页面。 5. 要下载更新,请单击下载扩展。 此时扩展已下载,并且下载状态显示为绿色色带。 6.
步骤 1. 启动“OpenManage Enterprise”。 2. 在应用程序设置中,单击控制台和扩展选项卡。 将显示控制台和扩展页面。 3. 在 Power Manager 部分中,单击 > 更多操作 > 启用。 随即显示启用窗口。 4. 单击启用扩展。 5. 在确认窗口中,选择我同意在升级之前已截取 OM Enterprise 设备的快照,然后单击确认启用。 此时将显示正在使用 OpenManage Enterprise 的用户数量信息,并显示正在运行的作业详情。 移除设备 要停止监视设备,将其从 Power Manager 中移除。 前提条件 确保满足以下前提条件: • 设备未启用应急功率削减 (EPR)。 关于此任务 注: 如果将设备从 OpenManage Enterprise 中移除,则会自动将该设备从 Power Manager 中移除。 注: 当设备单独及作为组的一部分添加到 Power Manager 时,请确保已从 Power Manager 移除设备的所有实例,以便停止监 视设备。 要移除设备,需执行以下步骤: 步骤 1.
3. 单击组选项卡。 此时将显示组选项卡。 4. 选择您想要移除的组,然后单击移除组。 将显示移除组确认窗口。 5. 要确认移除,单击移除。 将会从 Power Manager 移除组。 卸载 Power Manager 卸载 Power Manager 并删除 Power Manager 收集的所有数据。 前提条件 确保满足以下前提条件: • • 设备未启用应急功率削减 (EPR)。查看应急功率削减页面上所有设备和组的 EPR 状态。 没有处于活动状态的策略。 关于此任务 要卸载 Power Manager,请执行以下步骤: 步骤 1. 启动“OpenManage Enterprise”。 2. 在应用程序设置中,单击控制台和扩展选项卡。 将显示控制台和扩展页面。 3. 在 Power Manager 部分中,单击卸载选项。 此时将显示卸载扩展页面。 4. 单击卸载扩展。 此时将显示确认页面。 5.
9 在 Power Manager 中查看指标和监视历史记录 Power Manager 可直观呈现所收集的所有设备和组的数据。 前提条件 确保满足以下前提条件: • 设备或组已添加至 Power Manager。有关详细信息,参阅“将设备添加到 Power Manager”Power Manager 和“将组添加到 Power Manager”Power Manager。 关于此任务 要查看 Power Manager 指标,需执行以下步骤: 步骤 1. 在“OpenManage Enterprise”中,执行下列步骤之一: • 对于设备: a. 单击“设备”。 随即显示在 OpenManage Enterprise 中查找到的所有设备。 b. 在设备列表中单击一个设备名称。 • “概览”页面上会显示该设备的详情。 c. 要查看 Power Manager 相关信息,单击“指标”页面。 对于组: a. 依次单击“设备”>“静态组”>“组名称” > > 。 随即显示属于静态组的所有设备。 b. 要查看 Power Manager 相关信息,单击“组详情”。 2.
表.
10 在电力下降期间管理数据中心 应急功率削减 (EPR) 功能可帮助在电力紧急情况下立即降低设备的功耗。例如,如果发生电源故障,导致您的设备依靠 UPS 运行, 则您可以应用 EPR,减少受管设备的功耗。 EPR 还有助于防止因散热基础架构故障而导致设备过热受损。对一组设备使用温度触发策略,以在其平均进气温度超过指定阈值时 启用 EPR。 注: 在设备上应用 EPR 会将功率限制在很低水平,这会影响性能或完全关闭设备。应用 EPR 的所有设备都将受到影响。仅在紧 急情况下使用此功能。 下面是服务器、机箱和组可用的 EPR 选项。 • 限制 — 设置为最低功耗状态。 注: 机箱仅支持限制选项。 • 关闭 — 关闭服务器 在设备和组上应用了 EPR 后,在设备和组页面上,设备和组会被标记为已启用 EPR(限制)或已启用 EPR(关闭)。应用了 EPR 的设备和组的摘要会显示在 Power Manager 中的应急功率削减页面上。 主题: • • • 启用应急功率削减 查看应急功率削减 禁用应急功率削减 启用应急功率削减 在断电期间,启用设备上的应急功率削减 (EPR) 功能,使设备以最小功率运行。
注: 对于拥有 iDRAC DC 或 iDRAC Enterprise 许可和机箱的服务器,支持节流选项。 • 关闭 — 正常关闭所有选择的设备或选定组中的设备。 注: 如果组中包含服务器和机箱且您选择了关闭选项,那么由于“关闭”选项仅适用于服务器,因此仅会关闭组中的服务 器。 3. 在确认页面上单击是。 已针对所选设备或组启用 EPR。此时策略和 EPR 选项卡上显示一个红色条状指示标识,并应用了 EPR 类型选项。 查看应急功率削减 关于此任务 要查看应用于设备或组的应急功率削减 (EPR),请执行以下步骤: 步骤 1. 启动 Dell EMC OpenManage Enterprise。 2. 单击“电源管理”>“应急功率削减” > 。 此时将显示“应急功率削减”选项卡。 3.
11 策略 Power Manager 支持两种类型的策略,您可以使用它们来监测数据中心设备的功率和温度。 主题: • • • • • • • • 静态策略 温度触发策略 创建策略 查看策略 编辑策略 禁用策略 启用策略 删除策略 静态策略 静态策略包含多种设置,有助于调节特定设备或某个组的功耗。电源管理策略可以在不同情况下发挥作用。例如,您可以创建策略 来实现: • • • 确保功耗不会超出电路的承受能力。 根据设备或组的工作负载来规划功耗使用,例如,要减少数据中心内的整体功耗,请在工作负载较少时应用低功率上限的策略。 提高机架密度。例如,要提高机架密度或组中设备的数量,可以为组设置功率上限并添加更多服务器。策略的上限将功率限制在 指定的限值范围内。 注: 给组应用策略后,如果将更多设备添加到组中,功耗超过功率上限,则会在警报日志中收到警报。 例如,在一台设备上应用了功率上限值为 1,000 瓦的活动策略,然后在同一设备上应用了功率上限值为 1,500 瓦的另一个活动策略, 则会在该设备上应用功率上限值为 1,000 瓦的策略,因为此策略限制更严格。 温度触发策略 温度触发策略可用于防止因散热基
步骤 1. 在 OpenManage Enterprise 中,依次单击电源管理 > 策略。 此时将显示策略选项卡。 2. 单击创建。 此时将显示创建策略向导。 3. 在常规部分中,输入以下信息,然后单击下一步。 • 在类型中,选择策略类型。 注: 创建策略后,您不能在编辑时更改策略的类型。 • 在名称和说明字段中提供策略名称和说明。 要在创建后启用策略,默认情况下启用选项为选中状态。 4. 在设备/组部分,选择所需选项: • 要添加设备: a. 选择设备选项,然后单击选择设备。 • 此时会显示选择设备页面。 b. 选择设备并单击添加所选项。 要添加组: a. 选择组选项,然后单击选择组。 此时会显示选择组页面。 b. 选择组并单击添加所选项。 注: 您可以在创建策略时仅选择一台设备或一个组。 注: 为设备创建策略后,您将无法更改策略以将其应用到组。同样,为组创建策略后,您将无法更改策略以将其应用到设 备。 5. 单击下一步。 6.
在策略计划中,选择值并单击下一步。 a. 如果策略必须总是在启用时处于活动状态,在时间跨度中,选择总是。否则,单击范围,提供策略在启用时须处于活动状态 的时间范围。 b. 如果策略必须总是在启用时处于活动状态,在天数中,选择总是。否则,单击每日,选择启用时策略处于活动状态的特定天 数。 c. 在活动日期中,选择启用时策略处于活动状态的日期范围。 对于温度触发策略: 单击下一步,因为无法安排温度触发策略。 8. 在摘要中,查看已提供的详细信息,并单击完成。 策略创建成功。 下表提供了有关策略向导中所有字段的更多信息。 表.
表.
选择您的筛选类别并查看数据。以下是可用类别列表: ○ ○ ○ ○ ○ “状态”— 根据策略的状态筛选策略。受支持的筛选条件包括“所有”、“已启用”、“已禁用”。 “名称”— 根据策略的名称筛选策略。 “描述”— 根据策略的描述筛选策略。 “类型”— 根据策略的类型筛选策略。受支持的筛选条件包括“所有”、“静态”和“温度触发”。 “分配至”— 根据分配至的设备或组筛选策略。 要筛选并查看数据,请单击“高级筛选器”。 要清除筛选器,请单击“清除所有筛选器”。 • 要按字母顺序对任何列进行排序,请单击列名称,以使箭头随列名称显示。 要查看为设备创建的所有策略 — 依次单击“设备”>“指标”>“策略” > > • 此时将显示应用于设备的所有策略详情。 要查看为组创建的所有策略 — 单击“设备”,选中具有静态成员身份的自定义组,单击“组详情”,然后单击“策略”。 将显示应用于组的策略详情。 编辑策略 根据设备或组的功耗历史记录或进气平均温度来更新策略。 关于此任务 注: 您不能编辑设备或组的选择。 注: 对于温度触发策略,如果应用 EPR 后温度阈值增加,那么 Power Manager 会在更新后的温度阈
b. 在常规部分中,取消选中启用复选框,然后单击下一步,直至您到达摘要部分,然后单击完成。 策略已成功禁用。 启用策略 启用策略时,将激活设备和组的相关策略。 关于此任务 要启用策略,需执行以下步骤: 步骤 1. 在 OpenManage Enterprise 中,依次单击电源管理 > 策略。 此时将显示策略选项卡。 2. 使用以下任一方法启用策略: • • 创建或编辑策略时,从创建功率策略向导中选择启用选项。 请选择要启用的策略,然后单击启用。 3. 在确认窗口中,单击是。 策略随即成功启用,并会显示一个与该策略对应的对号标记。 删除策略 通过删除以移除不需要的旧策略。删除有效策略后,应用于设备或组的功耗限制或进气平均温度阈值也将自动移除。 关于此任务 注: 如果您要删除活动的温度触发策略,该组的应急功率削减 (EPR) 将自动移除。 要删除策略,请执行以下步骤: 步骤 1. 在 OpenManage Enterprise 中,依次单击电源管理 > 策略。 此时将显示策略选项卡。 2. 选择要删除的策略,然后单击删除。 3.
12 阈值 可以使用阈值指定设备和组上的功率和温度指标的警告和临界限值。如果超出所配置的限值,Power Manager 会通过 OpenManage Enterprise 生成警报,并通知您限值超出情况。功率状态和温度以图表形式显示在“指标”或“组详情”选项卡中。 主题: • • • • 创建警报阈值 查看警报阈值 编辑警报阈值 删除警报阈值 创建警报阈值 要监视设备和组是否超出阈值,请指定功率和温度的阈值。 前提条件 确保已将设备或组添加到 Power Manager。 关于此任务 要配置功率和温度的警报阈值,请执行以下步骤: 步骤 1. 在“OpenManage Enterprise”中,执行下列步骤之一: • 对于设备: a. 单击“设备”。 随即显示在 OpenManage Enterprise 中查找到的所有设备。 b. 在设备列表中单击一个设备名称。 • “概览”页面上会显示该设备的详情。 c. 要查看 Power Manager 相关信息,单击“指标”页面。 对于组: a. 依次单击“设备”>“静态组”>“组名称” > > 。 随即显示属于静态组的所有设备。 b.
表. 13: 瓦特和摄氏度刻度的警报阈值范围详细信息 字段 必需 值范围 警告上限 否 限制:1–29307121 的整数 严重上限 否 限制:1–29307121 的整数 严重下限 否 限制:-10 至 60 度 警告下限 否 限制:-10 至 60 度 警告上限 否 限制:-10 至 60 度 严重上限 否 限制:-10 至 60 度 功率(瓦) 温度(摄氏度) 表.
b. 要查看 Power Manager 相关信息,单击“组详情”。 2. 在警报阈值选项卡中查看功率和温度状态。 收集于显示上次收集时间。 刻度上的指针指示平均功率和散热数据。 Power Manager 根据设备和先前收集的读数显示功率和温度的最小值和最大值。如果未设置阈值或阈值已被清除,则刻度显示为 灰色。只有在已设置阈值的情况下,才会显示警告/严重的上限和下限值。要查看有关超出情况的更多信息,请参阅警报页面上 的警报日志和监视页面上的审核日志。 编辑警报阈值 根据设备利用率变化或组内设备更新来更新警报阈值。 前提条件 确保已将设备或组添加到 Power Manager。 关于此任务 若要为设备或组编辑阈值,请执行以下步骤: 步骤 1. 在“OpenManage Enterprise”中,执行下列步骤之一: • 对于设备: a. 单击“设备”。 随即显示在 OpenManage Enterprise 中查找到的所有设备。 b. 在设备列表中单击一个设备名称。 • “概览”页面上会显示该设备的详情。 c. 要查看 Power Manager 相关信息,单击“指标”页面。 对于组: a.
• c. 要查看 Power Manager 相关信息,单击“指标”页面。 对于组: a. 依次单击“设备”>“静态组”>“组名称” > > 。 随即显示属于静态组的所有设备。 b. 要查看 Power Manager 相关信息,单击“组详情”。 2. 在警报阈值选项卡中,单击编辑。 此时将显示编辑警报阈值页面。 3.
13 警报 在监视阈值时,如果您希望在设备或组的功率超过所设限值,或受监视的组发生更改的情况下收到通知,警报将非常有用。 警报会在出现以下情况时生成: • • • • • 值超出定义的警报阈值时 设备或组的值恢复到正常状态时。 超出活动策略的策略上限时。 应用了活动策略的组发生变化时。 在组上应用策略以及添加了新设备或从组中删除了设备时。 您可以转至 OpenManage Enterprise > 警报 > 警报日志来查看警报: 有关管理警报的信息,请参阅 OpenManage Enterprise 用户指南。 主题: • 创建警报策略 创建警报策略 要接收与 Power Manager 相关的警报,请在创建警报策略时选择 Power Manager 特定的子类别。 关于此任务 有关创建警报策略的信息,请参阅 OpenManage Enterprise 用户指南。 步骤 1. 启动 OpenManage Enterprise,然后依次单击警报 > 警报策略。 此时会显示警报策略页面。 2. 在警报策略页面中,单击创建。 此时将显示创建警报策略向导。 3.
14 Power Manager 的小组件 小组件可以让您快速访问选择的组,以查看其功率和散热历史记录。此外,还可以查看服务器、机箱和组中能耗最高的设备。 主题: • • • 在 OpenManage Enterprise 控制板中添加或移除組,以监视 Power Manager 数据 查看 Power Manager 组的功率和散热历史记录 查看 10 大功率违规情况 在 OpenManage Enterprise 控制板中添加或移除 組,以监视 Power Manager 数据 添加您最喜爱的组,快速监视其功率和散热数据。 前提条件 确保满足以下前提条件: • • 已在 Power Manager 中添加组。 识别要监视的收藏组。 注: 您最多可以将三个组添加到控制板。 关于此任务 要将组添加到 OpenManage Enterprise 控制板,需执行以下步骤: 步骤 1. 启动 OpenManage Enterprise,然后导航到 Power Manager 部分。 2. 要将组添加或移动到功率历史记录或散热历史记录图表,请单击添加组。 此时将显示将组添加到控制板。 3.
查看前五个高能耗设备 关于此任务 在 OpenManage Enterprise 控制板的 Power Manager 部分中查看能耗更高的设备。 步骤 1. 启动 OpenManage Enterprise,然后导航到 Power Manager 部分。 2. 要查看前五个高能耗设备,请单击高能耗设备选项卡。 3. 使用筛选下拉菜单查看服务器、机箱和组的相关数据。 查看 OpenManage Enterprise 中发现的设备与 Power Manager 中添加的设备的比率 关于此任务 查看 OpenManage Enterprise 中与 Power Manager 兼容的设备与受 Power Manager 监视的设备数量之比。 步骤 1. 启动 OpenManage Enterprise,然后导航到 Power Manager 部分。 2.
关于此任务 要查看已违反规定功率阈值的设备和组的列表,请运行内置报告以获取“Power Manager:设备的指标阈值报告”和“Power Manager:组的指标阈值报告”。总功率违规数量是上限警告和上限严重警报违规数量的总和。总温度违规数量是上限警告、上限严 重警报、下限警告和下限严重警报违规数量的总和。 要查看严重违规情况,请执行以下步骤: 步骤 1. 启动 OpenManage Enterprise,然后导航到 Power Manager 部分。 2. 要查看违反温度阈值的设备,请导航至“10 大功温度违规情况”部分。 默认情况下,该部分将显示设备信息,如设备名称、服务编号、设备已违反规定温度阈值的次数,以及违反规定警报阈值的性质 等详细信息。 3. 要查看违反温度阈值的组,请从“实体类型”下拉菜单中选择“组”选项。 此时将显示组的信息,如组名称、服务编号、组已违反规定温度阈值的次数,以及违反规定警报阈值的性质等详细信息。 4. 要查看特定违规状态下的设备或组,请从“状态”下拉菜单中选择一个选项。 5.
15 Power Manager 中的报告 报告包含有关特定设备或某个组中的设备、作业、警报以及数据中心其他要素的信息。Power Manager 支持内置报告和用户定义的 报告。下载这些报告以查看 Power Manager 设备和组的状态。 您可以下载 HTML、CSV、PDF 或 XLS 格式的内置报告。以下内置报告可通过 OpenManage Enterprise 报告选项卡获取,以查看 Power Manager 相关数据: • • • • • Power Manager:设备的指标阈值报告 — 此报告显示所有 Power Manager 设备的指标和警报阈值详细信息,例如:设备名称、 设备详细信息、指标类型、针对设备设置的阈值以及值超出定义阈值的次数。 Power Manager:组的指标阈值报告 — 此报告显示所有 Power Manager 组的警报阈值详细信息,例如:组名称、指标类型、针 对组设置的阈值以及值超出定义阈值的次数。 Power Manager:组的策略报告 — 此报告显示所有的 Power Manager 策略详细信息,例如:组名称、策略名称、策略类型、策 略是否启用、有效策
b. 在确认页面中,单击是。 5. (可选)要创建查询,请单击筛选器部分下的编辑。创建查询,然后单击完成。有关创建查询的更多信息,参阅 OpenManage Enterprise 用户指南。 6. 在列选择、排序和分类中,使用复选框扩展类别、选择需要的字段,将其添加到列排序框中。 仅会为 Power Manager 设备填充设备指标阈值和设备功率和温度指标。 仅会为 Power Manager 组填充组、组指标阈值、组功率和温度指标和组功率策略列。 7. 要按字段排序,请使用排序方式下拉菜单,并使用方向下拉菜单对值进行升序和降序排序。 • • 如果您选择了指标阈值集中的某列,请选择您要查看信息的指标类型。 如果您选择了功率和温度指标集中的某列,请选择报告持续时间和汇总期间,以查看相应信息。 注: 创建自定义报告时,如果报告持续时间不是 1 天,请确保将汇总期间选为每日。 8.
16 常见问题 为何我无法查看指标? 原因:在删除所需的 iDRAC 或 DC 许可证或 OpenManage Enterprise 高级功能许可证后,用户界面 (UI) 上不再提供需要许可证才能 使用的功能。因此指标不可用,并且在下一个清点周期,Power Manager 不会再收集这些值。 改变图表显示的时间段时,为什么图表中的同一日期 有两个条目? 原因:查看 3 个月、6 个月或 1 年内的指标和监视历史记录图表时,数据将自动从 UTC 时区转换到您的当前时区并显示出来。由于 时区差异,图表中的同一天会有两个条目。所以,最后一个条目为当天的数据,倒数第二个条目为前一天的数据。 为什么我在“警报阈值”部分中看到的功率和温度值 略有不同? 原因:功率和温度值以 BTU/小时和华氏度单位提供,但会转换为瓦特和摄氏度。在显示时,值会再次转换并四舍五入为更大数字, 然后显示出来。因此,以 BTU/小时和华氏度单位显示时,值会略高一点。 为什么我的报告中的所有条目都有相同的功率上限或 阈值超出次数? 原因:在包含阈值超出属性和时间戳属性的内置或自定义报告中,对所有条目显示的超出次数始终是最新值。 为什么我
表. 15: 受支持设备和指标的列表 (续) 设备类型 支持的指标 第 13 代和第 14 代 PowerEdge 服务器 • • • • • • • 功率最大值、最小值和平均值 温度最大值和平均值 CPU 利用率最大值、最小值和平均值 输入输出利用率最大值、最小值和平均值 内存利用率最大值、最小值和平均值 系统通风 能耗 PowerEdge M1000e、VRTX、FX2 和 FX2s 机箱 • • • 功率最大值、最小值和平均值 瞬时温度 能耗 PowerEdge MX7000 机箱 • • • 功率最大值和最小值 温度最大值和最小值 能耗 注: 模块化服务器不支持系统通风值。 此外,如果满足所有条件并且仍无法查看 Power Manager 数据,请确保在您要了解的设备上启用服务器功率监测功能。要查看设备 的发现日志,请执行以下操作: 1. 在 OpenManage Enterprise 中,依次单击监视 > 作业。 此时将显示作业页面。 2. 搜索该设备的发现类型作业,然后选择作业。 3.
• • Power Manager 不支持交换机、存储托架、输入/输出模块等设备。 Power Manager 不支持通过操作系统(带内)发现的服务器。 为什么我无法安装 Power Manager? 原因:在两种情况下,Power Manager 可能会安装失败: • • 如果您在 OpenManage Enterprise 中选择了联机更新选项,请检查联机的网络连接是否成功。 如果已在 OpenManage Enterprise 中选择了离线更新选项,请确保 ome_powermanager_1.0.0.tar.gz 文件夹中包含扩展程 序目录上的所有文件以及签名文件和扩展程序安装包,包括 RPM。如果目录和 .
为什么某些警报不使用 SNMP 转发? 原因:以下事件不会作为 SNMP 警报转发: • • 设备成员身份或组内成员更改 设备管理,例如许可证状态更改 警报由 OpenManage Enterprise 或 Power Manager 生成,显示在不支持 SNMP 陷阱转发的系统运行状况类别和指标/电源配置子类别 中。 为什么无法转发某些电子邮件警报? 原因:以下事件不会作为 SNMP 警报转发: • • 设备成员身份或组内成员更改 设备管理,例如许可证状态更改 不支持 SNMP 陷阱转发。 为什么某些设备会自动从 Power Manager 中移除? 原因:如果 OpenManage Enterprise 高级许可证已过期或已从目标节点中删除,则在运行设备功能检查后,设备会从 Power Manager 中移除。 为什么我无法看到某些设备的温度指标? 原因:如果设备关闭,则不会显示这些设备的温度指标。 为什么我不能选择特定的子组? 原因:选择组时,也会选中该组中的所有子组。但是,在清除子组时,也会清除主组级别的选择。 为什么我在某些设备指标中看到无可用数据或无可用 信息的消息? 原因:尚未
• • • 警告下限超出次数 临界上限超出次数 警告上限超出次数 为什么我无法在指标图表中看到常规指标数据点? 原因:指标图表中的指标点不规则,说明未在该持续时间内收集该设备的相关数据。 为什么无法清除策略的复选框? 原因:如果正在启用、禁用或编辑策略,则功率策略页面上的策略复选框处于禁用状态。此类操作完成后,即可以取消选择该策 略。 如何查看旧指标数据? 原因:旧指标数据在几天后便不可用,原因是这些数据已被删除。此配置取决于是否在 Power Manager 首选项部分中选择了删除 Power Manager 数据选项。 为什么我使用阈值 REST API 设置的值未成功配置? 原因:如果值是在安装设备并将其添加到 Power Manager 之前使用阈值 REST API 设置的,则不会保留这些值。 解决方案:先安装设备并将其添加到 Power Manager,然后使用阈值 REST API 设置值。 48 常见问题
17 故障处理 为什么我无法在目标设备或组上应用应急功率削减 (EPR)? 情况: 当您尝试在设备上应用 EPR 时,EPR 运行可能会失败,此时会在审核日志中生成一个条目。 尝试在组上应用 EPR 选项时,EPR 运行可能失败并显示以下错误消息:目标设备在组中不可用,无法启用应急功率削减功能。 解决方案: 确保满足以下所有条件: • • 组中至少有一台设备符合应用 EPR 的条件。 限制选项适用于以下设备: • ○ 如果设备是服务器,则须应用 iDRAC Enterprise 许可。 ○ 如果设备是 PowerEdge M1000e 或 PowerEdge MX7000 机箱。 关闭选项仅适用于服务器。 用户界面上的功率和温度单位未更新 情景:您通过 REST API 更改了 Power Manager 中的功率和温度单位,然后查看用户界面,发现用户界面上的单位未更新。 解决方案: 更改功率和温度单位后,请转至 Power Manager 设置页面,然后查看指标选项卡。 当我尝试执行与扩展程序生命周期相关的操作(安装/ 卸载/启用/禁用)时,为什么 OpenManage Enterprise 无响
更改功率策略后未更新 情况: 在对活动策略的时间跨度作出更改时,该策略在设备上不被禁用。 解决方案: 您可以使用下列方法之一解决问题: • • 在设备上手动禁用策略。 在 Power Manager 中禁用策略,更改时间跨度,然后启用策略。 发生阈值警报后未生成事件 情况: 如果以下超出温度阈值的情况共同出现,则不生成事件: • • • • 警告下限到警告上限 临界下限到临界上限 警告上限到警告下限 临界上限到临界下限 解决方案: 提供切实可行的警告限值和临界限值,以免温度一旦变化即会产生警报。 使用 REST API 从组中移除设备时出错 情况: 当您尝试使用 REST API 移除属于多个组的设备时,将显示一条错误消息。 解决方案: 要移除属于多个组的设备,请从 OpenManage Enterprise 中的组移除该设备。此类更改会自动反映在 Power Manager 中。 审核日志中因组内成员变更产生多个警报 情况: 审核日志中有多个关于组内成员变更的条目。 解决方案: 通过 OpenManage Enterprise 更新静态组内成员时,审核日志和警报日志中会有多个条目反映此更新。
• • 在电源管理 > 电源策略页面中,选择策略,然后单击禁用。 在电源管理 > 电源策略页面中,选择策略,然后单击编辑。在创建功率策略向导中,取消选择启用选项并保存策略。 故障处理 51
18 您可能需要的其他信息 除了本指南以外,您还可以访问以下提供了关于 Dell EMC OpenManage Enterprise Power Manager 及其他相关产品的更多信息的说明 文件。 表. 16: 您可能需要的其他信息 说明文件 说明 可用性 Dell EMC OpenManage Enterprise Power Manager 发 提供有关 Power Manager 中的已知问题和解决 方法的信息。 Dell EMC OpenManage Enterprise Power Manager REST API 指南 提供有关使用表述性状态转移 (REST) API 集成 Power Manager 的信息,还包括使用 REST API 执行常见任务的示例。 1. 转至 Dell.com/OpenManageManuals。 2. 单击 Dell OpenManage Enterprise,并选择 所需的 OpenManage Enterprise 版本。 3.