Dell Online Diagnostics 版本 2.
注和小心 注:“注”表示可以帮助您更好地使用计算机的重要信息。 小心:“小心”表示如果不遵循说明,就有可能损坏硬件或导致数据丢失。 ____________________ 本文中的信息如有更改,恕不另行通知。 © 2013 Dell Inc. 保留所有权利。 未经 Dell Inc. 书面许可,严禁以任何形式复制这些材料。 本文中使用的商标:Dell™、 DELL 徽标、 PowerEdge™、 PowerVault™、和 OpenManage™ 是 Dell Inc. 的商标。Microsoft®、Windows Server® 是 Microsoft Corporation 在美国和其他国家 或地区的商标或注册商标。 Intel® 是 Intel Corporation 在美国 和其他国家 / 地区的注册商标。 Red Hat® 和 Red Hat® Enterprise Linux® 是 Red Hat, Inc. 在美国和其他国家或地区的注册商标。 SUSE® 是 Novell, Inc.
目录 1 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 此版本中的新功能 . 支持的操作系统 . . . . . . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . 5 Online Diagnostics 支持的设备 诊断程序功能 . . . . . . . . . . . . . . . . . 5 . . . . . . . . . . . . . . . . . . . . . . . . . 6 通过 Dell 支持网站访问说明文件. 2 5 . . . . . . . . . . . . . . 8 . . . . . . . . . . . . . . . 9 开始之前 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 注意事项 . . . . . . . . . . . . . . . .
3 使用 Dell Online Diagnostics . 使用 GUI . . . . . . . . . . . . 17 . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 菜单选项 . . . . . . 诊断程序界面 . . . 运行诊断测试 . . . 配置测试执行设置 使用命令行界面 . . . . . . . . . . . . . . . . . . . 17 18 22 24 . . . . . . . . . . . . . . . . . . . . . . . 24 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 主要 CLI 命令 . . . . . . . . . . . 使用 在 CLI 模式中中止 Online Diagnostics . . . . . . . . . . . . . .
简介 Dell Online Diagnostics 是一个独立的诊断程序,允许在生产环境中 Dell 系统的各种硬件组件上运行诊断测试,并帮助最大程度地延长 Dell 系统 正常运行的时间。 您可以使用图形用户界面 (GUI) 或命令行界面 (CLI) 在 Online Diagnostics 于系统中查找到的硬件上运行诊断测试。 此版本中的新功能 • 添加了在测试执行过程中对于严重错误的错误代码、验证代码和服务 标签信息。 • 支持运行 Windows 2012 的系统。 支持的操作系统 有关支持的操作系统,请参阅 Dell Online Diagnostics 版本 2.30 自述文 件,位于:dell.
• Dell 远程访问控制器 (DRAC 4 和 DRAC 5) • USB 控制器 • SAS 控制器 注:有关详情,请参阅对于 RAID 控制器、 SAS 控制器、 SCSI 控制器和 附加硬盘驱动器的诊断。 • 串行端口 • 磁带驱动器 • 磁带自动装载机和磁带库 注:有关详情,请参阅磁带驱动器、自动装载机和磁带库的诊断。 注:磁带自动装载机和磁带库的诊断测试在 Windows 2008 操作系统上 不可用。 • DIMM • 外部存储柜 诊断程序功能 Online Diagnostics 提供以下功能: • 查找设备 使 Online Diagnostics 能够列举并查找 Dell 系统上的所有可测试设备。 启动应用程序时进行列举。如果系统硬件发生了变化,请重新启动应 用程序以便重新列举系统上的设备。 • 设备和测试选择 使您能够选择设备和想要在选定设备上运行的诊断测试。请参阅运行 诊断测试。 • 诊断测试审核 允许您审核所选的诊断测试。 请参阅运行诊断测试。 • 诊断测试状况 允许您查看正在运行的诊断测试的状况。请参阅运行诊断测试。 • 诊断测试结
• 帮助 允许您查看各种设备和诊断测试的帮助信息。 要查看设备或诊断测试的说明,请选择设备或测试,并在 GUI 中选择 Help (帮助)选项卡,或运行 pediags --help 命令。 • 快速测试 允许您执行快速测试。此功能适用于选定的测试,并且在 GUI 中显示 的选项仅针对这些测试。请参阅 配置测试执行设置。 • 保存系统配置和结果 允许您保存系统配置和测试结果。请参阅使用 Dell Online Diagnostics。 • 通过次数 允许您以指定重复次数运行所选测试。 在 GUI 和 CLI 模式中,最小通过次数均为 1。在 GUI 模式中,最大通 过次数为 20,而在 CLI 模式中为 999。 • 运行时间 允许您指定诊断测试应该运行的持续时间 (以分钟计)。 注:该功能仅在 Online Diagnostics 的 CLI 版本中可用。 注:测试进行 72 小时或者完成 999 次通过之后 (以最先发生的为准), 测试停止执行。 • 自动登录 Online Diagnostics 以 XML 格式将诊断测试结果保存至自动生 成的文件 (result.
通过 Dell 支持网站访问说明文件 除了该指南之外,还可以在 Dell 支持网站 dell.com/support/manuals 上找 到以下指南。要访问这些说明文件: 1 转到 dell.
设置 Dell Online Diagnostics 本节说明设置 Dell Online Diagnostics 的过程。 开始之前 • 阅读设置要求,并确保系统符合或超过最低系统要求。请参阅最低系 统要求。 • 阅读随应用程序提供的 Online Diagnostics 自述文件。该自述文件除了 已知问题信息以外,还包括关于 Online Diagnostics 的最新信息。 注意事项 • Online Diagnostics 设计用于诊断单个系统的硬件问题。 • 硬盘驱动器诊断测试设计作为低优先级后台任务运行,以限制它们对 其它硬盘驱动器输入 / 输出操作的影响。 • Online Diagnostics 是一个全面的诊断工具,可诊断系统中所有的可测 试组件。在运行这些测试时,系统可能会出现性能下降,这可能会影 响您的生产环境性能。 注:建议不要在高峰负载时间 / 高需求时段运行并且关闭所有非必要 的应用程序,从而确保系统性能不会受到负面影响。 • Online Diagnostics 并不解决网络层出现的问题,除非是因正在运行诊 断的系统上的 NIC 造成问题。 • 当有其
设置和诊断程序要求 设置 Online Diagnostics 在本地运行诊断。 最低系统要求 • 至少 256 MB RAM。 • 最低 110 MB 系统驱动器可用空间 (C: [Windows 操作系统 ] 或 /opt [Linux 操作系统 ])。 • 安装在 Dell 系统上的受支持的操作系统。请参阅支持的操作系统。 • 安装有最新的设备驱动程序和固件,以便在 RAID 控制器、连接 RAID 的硬盘驱动器、磁带驱动器、磁带自动装载机和磁带库上运行 诊断程序。 注:请参阅设备附带的说明文件获得有关详情,或者从 support.dell.
表 2-1.
表 2-1. 设备相关性 (续) 设备 操作系统 相关性 Broadcom NIC Red Hat Enterprise Linux 和 SUSE Linux Enterprise bnx2 驱动程序 1.4.51 版或更高 版本。 默认行为 (如果 不符合相关性) Online Diagnostics GUI 可能无法正常 tg3 驱动程序 3.71 版或更高版本。 工作。 注:在 Red Hat Enterprise Linux 6 服务器 (64 位)上不支持 Broadcom NIC 测试、 NIC 通信测 试和 NIC 团队测试。 Emulex Red Hat 通过 Emulex 安装 HBAnywhere 光纤信道控制器未 光纤信道控 Enterprise 公用程序。要下载此公用程序, 枚举,诊断测试不 可用。 制器 Linux 和 SUSE 请执行以下操作: Linux 1 请访问位于 emulex.
表 2-1. 设备相关性 (续) 设备 操作系统 Brocade 光 Windows 纤信道 / 以 太网光纤信 道 (FCoE) 插卡 相关性 默认行为 (如果 不符合相关性) Brocade 插卡未枚 安装驱动程序和 HCM 公用程 序。要下载公用程序,请执行 举,诊断测试不可 用。 以下操作: 1 请访问位于 brocade.com 的 Brocade 网站。 2 单击 Services & Support (服务和支持) → Drivers & Downloads (驱动程序和 下载)。 3 单击 Download Now (立即下载)超链接。 4 在 OEM Models (OEM 型号)下,单击 Dell。 5 下载需要的 Windows 适配器 软件安装程序。 注:在 64 位 Linux 操作系统上不支持光纤信道控制器枚举和测试。 注:在以下 Dell 系统上不支持内存诊断程序,因为它们不支持 IPMI: SC420、 SC430、 SC440、 SC1420、 SC1430 和 T105。 注:有关支持的操作系统,请参阅 Dell Online Diagnostics 版本 2.
1 运行 .exe 文件以启动安装程序。 Welcome to the Dell Online Diagnostics 2.x.y Setup Wizard(欢迎使用 Dell Online Diagnostics 2.x.y 安装向导)屏幕将会出现。 2 单击 “Next”(下一步)。 系统显示 Dell 软件许可证协议。 3 单击 I Agree to accept the terms of the agreement (我同意接受协议 条款)。 4 单击 Install (安装)接受默认目录路径,或单击 Browse (浏览)导航 至您想要安装 Online Diagnostics 的目录,并单击 Install (安装)。 5 单击 Finish (完成)。 在 Linux 和 ESX 操作系统上安装 Online Diagnostics 执行以下步骤在运行支持的 Linux 或 ESX 操作系统的系统上安装 Online Diagnostics。 1 将 tar.gz 文件提取至需要的位置。提取的文件包含安装脚本 (install.
注:从 Start (开始)菜单启动 Online Diagnostics 的选项仅可由安装应 用程序的管理员使用。所有其他管理员必须使用安装文件夹内的 StartDiags 快捷方式运行应用程序。 注:要在 Windows Server 2008 (Core) 操作系统上运行 Online Diagnostics, 请运行 StartDiags.exe 程序以运行 GUI 或运行 pediags.exe 以运行 CLI,位 置是 x:\\online diagnostics\oldiags\bin,其中 x 为应用程 序安装到的驱动器。 注:在 Windows Server 2008 R2 版本或更高版本上,拥有管理员权限的 用户无法直接运行 Dell Online Diagnostics 应用程序。在 Windows Small Business Server 系统上,网络管理员没有运行 Dell Online Diagnostics 应 用程序的完全权限。要运行 Online Diagnostics 应用程序,请单击 Start (开始) → Programs
2 在 Package Management (软件包管理)窗口选择 Compatibility Arch Support (兼容性架构支持)复选框,并单击 Details (详情)。 这将会显示 Compatibility Arch Support Details (兼容性架构支持详 情)窗口。 3 选择 gtk、 pango 和 redhat-artwork 软件包以便安装,并单击 Close (关闭)。 4 在 Package Management (软件包管理)窗口单击 Update (升级)。 注:不支持运行多个 Online Diagnostics 实例。 在 CLI 模式下,请从 x:\\ online diagnostics\oldiags\bin (其中 x 为应用程序安装到的驱动器)运行 pediags 程序。 注:请勿从网络映射驱动器安装和运行 pediags 程序。某些网络诊断测试断 开与网络连接。 在 Windows 操作系统上卸载 Online Diagnostics 要卸载 Online Diagnostics,请单击 Star
使用 Dell Online Diagnostics 可以通过两种方式访问 Dell Online Diagnostics:从图形用户界面 (GUI) 和从命令行界面 (CLI)。本节介绍这两种界面。 使用 GUI 当以 GUI 模式启动 Online Diagnostics 时,出现初始屏幕指示设备查找进 度,直至枚举完成为止。初始屏幕还提供关于运行 Online Diagnostics 的 重要信息。仅当启动应用程序时,才会查找或枚举设备。如果您的系统硬 件更改过,请重新启动应用程序以便对您系统上的设备重新枚举。 小心:在枚举正在进行的过程中,从 Red Hat Enterprise Linux 或 SUSE Linux Enterprise Server 连接或移除 USB 或 CD/DVD 设备可能会导致系统挂起。 注:如果系统未能发现 USB 控制器,请确保在 BIOS 中启用 USB 控制器, 并且在 BIOS 设置菜单中将 USB 控制器支持设置为 ON with BIOS support (开,支持 BIOS)。 注:VMware ESX 不支持 GUI 模式。仅支持 CLI 模式。 菜单
诊断程序界面 Online Diagnostics GUI 分为两个部分: • 诊断选择 • 诊断信息 诊断选择 使用该部分选择并组织设备和检测显示的方式。 选择选项 使用该列表框组织检测和已检测到的设备显示的方式。您可以从该列表框 中选择三个选项的任何一项。 Group by 使用该选项组织 Select Test(s) to Run (选择要运行的测试)窗 connection 格显示,使其显示为树结构,将连接作为节点,相应的设备和 (按连接分组) 测试列在其下面。 Group by device 使用该选项组织 Select Test(s) to Run (选择要运行的测试)窗 (按设备分组) 格显示,使其显示为树结构,将设备作为节点,每个设备相应 的测试列在其下。如果设备呈灰色,则表示该设备没有相应的 测试。但是,您仍然可以查看该设备的配置信息。 Group by tests 使用该选项组织 Select Test(s) to Run (选择要运行的测试)窗 (按测试分组) 格显示,使其显示为树结构,将测试作为节点,相应 的设备列 在其下。 下表说明 Select Test(s) to
选择要运行的测试 使用该部分来选择设备并执行测试。该部分按照您在 Selection Options (选择选项)列表框中所选择的选项组织。 如果是按设备分组来显示: • 选择设备旁边的复选框可选择为该设备列出的所有测试。 • 您也可以展开该设备节点,并选择要运行的各个测试。 如果是按测试分组来显示: • 选择测试旁边的复选框可选择为该测试列出的所有设备。 • 您也可以展开测试节点,并选择要在其上运行测试的单个设备。 注:可以在诊断信息部分选择设备,并查看在 配置选项卡中高亮度显示的 相应配置详细信息。 诊断信息 使用该部分查看系统配置和运行状况信息。此外,您可以运行选定的测试 并查看这些测试的结果。 配置 使用该选项卡可查看已检测到设备的运行状况以及它们的配置信息。要查看 设备的配置信息,从 Select Test(s) to Run (选择要运行的测试)窗格选择该 设备。所选择设备的配置信息高亮度显示在该页中,并在以下标题下列出。 Device Name (设备名称):该设备的名称。 Device Attribute (设备属性):列出设备属性。以下为设备属性。 Status ( 状
选定的测试 使用该选项卡运行您在 Select Test(s) to Run (选择要运行的测试)窗格 中选择的测试。该选项卡包含以下部分: • Diagnostic Tests Selected (所选择的诊断测试):该列表框显示在 Select Test(s) to Run (选择要运行的测试)窗格中选择的所有测试。 • Diagnostic Options (诊断选项):使用 Tests Selected (选定的测试) 选项卡的这一部分运行选定的测试。该部分包含以下控件。 Run Tests (运行测试) 启动选定的测试。可以一次运行多个测试。 Quick Test ( 快速测试 ) 使用更快的算法执行特定的测试。如果在 Quick Test (快速测试)模式下运行后没有报告错误,而您仍然怀 疑被测试的硬件出现问题,建议您清除 (取消选择) Quick Test (快速测试)模式并再次运行相同的测试。 Number of Passes ( 通过次数 ) 指定所选测试的反复次数。最小值为 1,最大值为 20。 注:在 Status (状态)选项卡中双击特定测试的行,以便查看详细信息。
• Total Pass (总通过):如果您已选择测试的 Number of Passes (通过次数)选项,则表示您指定运行的总通过次数。 • Status (状态):表示测试的当前状态。在测试项目上双击可查看详 情,包括设备名称、设备说明、设备位置、测试名称和测试说明。以 下文本指示器指定测试状态: Completed 指定测试已经完成。 (已完成) Suspended 指定测试被暂挂。您可以手动暂挂测试。并不是所有的诊断测 (已暂挂) 试均支持 Suspended (暂挂)功能。 Aborted 指定测试被暂挂。您可以手动中止测试。并不是所有的诊断测 (已中止) 试均支持 Abort (中止)功能。 Executing 指定测试正在运行中。 (执行中) Ready (就绪) • 指定测试尚未启动,但已在执行队列中。您可以在测试处于 Ready (就绪)状态时中止任何测试。 Result (结果):以符号形式指定测试结果。例如,测试的 Status (状态)列可能显示为 Completed (已完成),但是 Result (结果) 列指定测试是否已成功完成。双击结果项目可以查看详情,例如设备
结果 使用该选项卡查看已执行测试的结果,以及有关每项测试结果的简要说明。 该选项卡中的 Result (结果)列简要说明测试结果。此外,您可以在列 中任意一处双击以查看相应的结果信息。例如,如果测试失败,Result (结果)列将显示出现的问题以及必须采取的任何措施。 单击鼠标右键可调出 Delete (删除) / Delete All Completed (删除全部 完成)菜单。选择 Delete (删除)可删除单个测试的测试结果,选择 Delete All Completed (删除全部完成)可从 Status (状态)选项卡和 Results (结果)选项卡删除所有已完成测试的全部测试结果。 运行诊断测试 要运行诊断程序,请按以下步骤进行: 1 启动应用程序。 2 在左边的 Diagnostic Selection (诊断选择)部分,从 Selection Options (选择选项)下拉菜单选择适当的选项。 • 选择 Group by connection (按连接分组)选项查看作为节点的连 接,相应的设备和测试显示在每项连接下面。 • 选择 Group by device (按设备分
• 要暂挂运行中的测试,在测试上单击鼠标右键并选择 Suspend (暂挂)。 • 要恢复暂挂的测试,在测试上单击鼠标右键并选择 Resume (恢复)。 Result (结果)列中的图标表示每项测试的状态。 • In Progress (正在进行)图标 ( • Aborted (中止)图标 ( ) 表示目前测试正在执行中。 ) 表示测试已被中止。 注:并不是所有的诊断测试均支持 Abort (中止)选项。如果测试的状 态为 Ready (就绪),则测试可以被中止。在 Executing (执行中)状 态下,只有支持 Abort (中止)选项的测试才可以中止。 • “Suspended”(暂挂)图标 ( 再次重新启动。 ) 表示检测被暂挂,可以在以后 注:并不是所有的诊断测试均支持 Suspended (暂挂)功能。 • OK (确定)图标 ( ) 表示已成功执行测试,未发现错误。 注:Abort (中止) / Suspend (暂挂) / Abort All (全部中止)选项在 列队完成后的几秒钟以后才可用。所有列队的测试必须在表中填写 Status (状态)列,使 Abo
配置测试执行设置 要配置测试执行设置以便使用更快的算法进行测试: 1 选择您想要运行的 诊断选择部分中的测试。 2 单击 Diagnostic Information (诊断信息)部分中的 Tests Selected (所选测试)选项卡。显示所有的选定测试。 3 选择底部 Diagnostic Options (诊断选项)部分中的 Quick Test (快速测试)复选框。如果该选项对于选择测试的其中一项可用, 则测试在该模式下运行。 注:Quick Test (快速测试)功能不是所有测试支持的测试模式。仅有 几项测试支持该功能。 注:如果在 Quick Test (快速测试)模式下运行后没有报告错误,而您 仍然怀疑硬件出现了问题,建议您取消选择 Quick Test (快速测试)模 式并再次运行测试。 4 使用 Number of Passes (通过次数)选项指定您想要测试运行的次数。 最小值为 1,最大值为 20。 注:Dell Remote Access Controller (DRAC) 诊断测试要求系统上配有 RAC 软件组件。有关详情,请参阅 《DRAC 用户指南》。 注:在
• pediags -- show all 列出所有设备分类和可用的测试。 • pediags < 设备类 > --help 显示您所指定的 文本帮助。例如,命令 pediags modem --help 显示所列调制解调器设备的帮助信息以及相关的其他测 试。 表示设备的软件包名称,例如网络和 cddvd。 • pediags < 设备类 > --show [device|test|all] [< 索引选项 >] [< 详细信息选项 >] [fmt=lst|tbl|xml] 显示设备分类、检测或两者的列表。默认选项为 all。该选项显示设备 分类和检测。您可以指定索引选项,并选择以何种格式显示输出。参 数应遵照它们所列的特定顺序,格式选项总是最后的参数。 例如,命令 pediags network --show test test-index=1,2,3 fmt=tbl 以表格形式显示索引编号为 1、 2 和 3 的测试。 如果您键入以下命令 pediags network --show device device-index=1,2,3 fm
• pediags < 设备类 > --run time= x (其中 x 表示想要测试运行 的分钟数)。 该命令允许您在指定期限运行诊断测试。例如 pediags scsidevdiag --run device-index=1 test-index=1 time=30 ,在设备索引为 1 的 SCSI 设备上运行 30 分钟索引为 1 的 诊断测试。测试进行 72 小时或者完成 999 次通过之后 (以最先发生的 为准),测试停止执行。 注: passes (通过)参数的运行时间限制为 3 天 (72 小时)。 支持的反复次数最低为 1,最高为 999。 注:始终以分钟数指定 time 参数,并在 --run 参数后面输入 time 参数。 使用 在 CLI 模式中中止 Online Diagnostics 使用 通过 --show 命令中止不会导致操作中止。运行测试 时,可以使用 在执行顺序中的任何时间点停止测试。可能 没有可用的输出,测试可能会退出,显示空白信息。如果 pediags 命令 的执行被中止则可能会出现这种情况,即使是在诊断
0 测试具有通过的结果。 1 测试具有警告结果。 2 测试具有失败结果。 3 因为相关性问题或运行时间问题应用程序失败。 退出代码 0、 1 和 2 仅适用于测试执行 (不论是多次还是一次通过)。退出 代码是所有已执行测试的总状态。例如在 20 次检测中,如果一次检测结果 为警告,另一次检测结果为失败,而所有其它检测均为成功,则最终退出 代码显示为 2。失败结果的退出代码,其优先级超过警告结果的退出代码。 计划诊断 使用操作系统的任务调度功能,您可以调度联机诊断程序以在您的系统上 运行诊断检测。 使用 Dell Online Diagnostics 27
使用 Dell Online Diagnostics
支持的设备 本节列出可以使用 Dell Online Diagnostics 进行测试的设备类别。 磁带驱动器、自动装载机和磁带库的诊断 有关 Online Diagnostics 所支持的设备列表,请参阅 Dell Online Diagnostics 版本 2.30 自述文件。 注:安装 Dell 认可的设备驱动程序以便对磁带驱动器、磁带自动装载机和 磁带库运行诊断测试。请参阅设备附带的说明文件。最新的设备驱动程序可 从 support.dell.
在运行 Windows 操作系统、 Red Hat Enterprise Linux 、SUSE Linux Enterprise Server 和 VMware ESX 的系统上支持的诊断程序 在运行 Windows 操作系统、 Red Hat Enterprise Linux 、 SUSE Linux Enterprise Server 和 VMware ESX 的系统上, Online Diagnostics 支持对多 种控制器和连接至这些控制器的硬盘驱动器的诊断。 有关 Online Diagnostics 所支持控制器的完整列表,请参阅位于 dell.com/ serviceabilitytools 的 Dell Online Diagnostics 版本 2.
存储诊断程序设备信息 表 A-1 列出了存储诊断程序的详细设备信息。 表 A-1.
表 A-1.
表 A-1. 存储诊断程序的其它设备信息 (续) 参数 说明 Time in COH when Incompatible media was last loaded.
表 A-1.
表 A-1. 存储诊断程序的其它设备信息 (续) 参数 说明 DensityCode (密度代码) 用除 00h 之外的 检查状况状态终止命令时所装载介质的 密度代码。 MMHShort 用检查状况状态终止命令时的介质移动小时数。 Repeat Bit (重复位) 0 - 表示传感键和附加传感代码信息在参数输入项中出现 一次。 1 - 表示传感键和传感代码信息在参数输入项中连续出现 多次。 Firmware Version (固件版本) 用 检查状况状态终止命令时的固件版本。 MMH Since Last Clean 用 检查状况状态终止命令时自上次成功清洗以来的介质 (自上次清洗以来的 运动小时数。 MMH) Opcode (操作代码) 用 检查状况状态终止命令时的操作代码。 Medium ID Number (介质 ID 号) 如果用 检查状况状态终止命令时介质存在。 MediumID Number (介质 ID 号)包含以下值: 1. 条形码字段值 2. 介质序列号 3.
存储诊断程序设备信息