Linux下怎么快速排查硬件故障
这篇文章主要介绍了Linux下怎么快速排查硬件故障的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Linux下怎么快速排查硬件故障文章都会有所收获,下面我们一起来看看吧。
Linux服务器在许多不同类型的基础架构中运行关键任务型业务应用程序,包括物理机、虚拟机、私有云、公共云和混合云。对于Linux系统管理员来说,了解如何管理Linux硬件基础架构很重要,包括与网络和存储有关的软件定义功能、Linux容器和Linux服务器上的多个工具。
排查并解决Linux上与硬件有关的问题可能需要一些时间。连经验丰富的系统管理员有时也要花几小时来解决莫名其妙的软硬件问题。
下列贴士帮助你更快速更轻松地为Linux中的硬件排查故障。许多不同的因素可能导致Linux硬件出现问题;在你开始尝试诊断之前,了解最常见的问题以及最有可能找到原因的环节是明智之举。
1.快速诊断设备、模块和驱动程序故障排查的第一步通常是显示Linux服务器上安装的硬件列表。你可以使用ls命令获取硬件的详细信息,比如lspci、lsblk、lscpu和lsscsi。比如说,这是lsblk命令的输出结果:
#lsblkNAMEMAJ:MINRMSIZEROTYPEMOUNTPOINTxvda202:0050G0disk├─xvda1202:101M0part└─xvda2202:2050G0part/xvdb202:16020G0disk└─xvdb1202:17020G0part
如果ls命令没有显示任何错误,使用初始化进程(比如systemd)查看Linux服务器的运行状况。systemd是启动用户空间、控制多个系统进程的最流行的初始化进程。比如说,这是systemctl status命令的输出结果:
#systemctlstatus●bastion.f347.internalState:runningJobs:0queuedFailed:0unitsSince:Wed2018-11-2801:29:05UTC;2daysagoCGroup:/├─1/usr/lib/systemd/systemd--switched-root--system--deserialize21├─kubepods.slice│├─kubepods-pod3881728a_f2af_11e8_af77_06af52f87498.slice││├─docker-88b27385f4bae77bba834fbd60a61d19026bae13d18eb147783ae27819c34967.scope│││└─23860/opt/bridge/bin/bridge--public-dir=/opt/bridge/static--config=/var/console-config/console-c││└─docker-a4433f0d523c7e5bc772ee4db1861e4fa56c4e63a2d48f6bc831458c2ce9fd2d.scope││└─23639/usr/bin/pod2.深入研究多个日志
dmesg让你可以搞清楚内核的最新信息中的错误和警示内容。比如说,这是dmesg | more命令的输出结果:
#dmesg|more....[1539.027419]IPv6:ADDRCONF(NETDEV_UP):eth0:linkisnotready[1539.042726]IPv6:ADDRCONF(NETDEV_UP):veth71f37018:linkisnotready[1539.048706]IPv6:ADDRCONF(NETDEV_CHANGE):veth71f37018:linkbecomesready[1539.055034]IPv6:ADDRCONF(NETDEV_CHANGE):eth0:linkbecomesready[1539.098550]deviceveth71f37018enteredpromiscuousmode[1541.450207]deviceveth71f37018leftpromiscuousmode[1542.493266]SELinux:mountinvalid.Samesuperblock,differentsecuritysettingsfor(devmqueue,typemqueue)[9965.292788]SELinux:mountinvalid.Samesuperblock,differentsecuritysettingsfor(devmqueue,typemqueue)[9965.449401]IPv6:ADDRCONF(NETDEV_UP):eth0:linkisnotready[9965.462738]IPv6:ADDRCONF(NETDEV_UP):vetheacc333c:linkisnotready[9965.468942]IPv6:ADDRCONF(NETDEV_CHANGE):vetheacc333c:linkbecomesready....
你还可以查看/var/log/messages文件中的所有Linux系统日志,在这里找到与特定问题有关的错误。如果你对硬件进行改动,比如挂载额外磁盘或添加以太网网卡,有必要通过tail命令实时密切关注信息。比如说,这是tail -f /var/log/messages命令的输出结果:
#tail-f/var/log/messagesDec113:20:33bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomainin-addr.arpaDec113:20:33bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomaincluster.localDec113:21:03bastiondnsmasq[30201]:settingupstreamserversfromDBusDec113:21:03bastiondnsmasq[30201]:usingnameserver192.199.0.2#53Dec113:21:03bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomainin-addr.arpaDec113:21:03bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomaincluster.localDec113:21:33bastiondnsmasq[30201]:settingupstreamserversfromDBusDec113:21:33bastiondnsmasq[30201]:usingnameserver192.199.0.2#53Dec113:21:33bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomainin-addr.arpaDec113:21:33bastiondnsmasq[30201]:usingnameserver127.0.0.1#53fordomaincluster.local3.分析网络功能
你可能在复杂的网络环境中有成千上万个云原生应用程序为业务服务提供服务;这些可能包括虚拟化、多云和混合云。这意味着你应该分析网络连接是否正常运行,这是故障排查的一部分。分析Linux服务器中网络功能的实用命令包括ip addr、traceroute、nslookup、dig和ping等。比如说,这是ip addr show命令的输出结果:
#ipaddrshow1:lo:mtu65536qdiscnoqueuestateUNKNOWNgroupdefaultqlen1000link/loopback00:00:00:00:00:00brd00:00:00:00:00:00inet127.0.0.1/8scopehostlovalid_lftforeverpreferred_lftforeverinet6::1/128scopehostvalid_lftforeverpreferred_lftforever2:eth0:mtu9001qdiscmqstateUPgroupdefaultqlen1000link/ether06:af:52:f8:74:98brdff:ff:ff:ff:ff:ffinet192.199.0.169/24brd192.199.0.255scopeglobalnoprefixroutedynamiceth0valid_lft3096secpreferred_lft3096secinet6fe80::4af:52ff:fef8:7498/64scopelinkvalid_lftforeverpreferred_lftforever3:docker0:mtu1500qdiscnoqueuestateDOWNgroupdefaultlink/ether02:42:67:fb:1a:a2brdff:ff:ff:ff:ff:ffinet172.17.0.1/16scopeglobaldocker0valid_lftforeverpreferred_lftforeverinet6fe80::42:67ff:fefb:1aa2/64scopelinkvalid_lftforeverpreferred_lftforever....
关于“Linux下怎么快速排查硬件故障”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“Linux下怎么快速排查硬件故障”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。