良许Linux教程网 干货合集 Centos 服务器系统内存故障排查

Centos 服务器系统内存故障排查

该笔记主要记录一下如何排查指定服务器中的指定内存条是否损坏。

Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查


1.内存故障排查

因为 68 – 71 软SBC服务器都是Centos7系统,所以我们可以通过以下命令来排查内存是否出现损坏。

grep "[0-9]" /sys/devices/system/edac/mc/mc/csrow/ch*_ce_count
Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查

1> count不为0表示有错误
2> mc代表第几个cpu,
3> csrow内存通道,
4> ch第几个内存

EDAC即error detection and correction(错误检测与纠正),是Linux系统内部的机制。在上面的日志中,可以清楚地看出是内存读错误。MC即memory controller(内存控制器)。CE则代表correctable error,是ECC内存中可以纠正的错误,相对地还有UE(uncorrectable error)。为了摸清是哪些内存出了问题,找出所有内存的CE计数,由上图可知,第四块内存出现了故障。

通过 dmidecode -t memory 命令,可以查看每个DIMM Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查

2.CPU排查 cat /sys/devices/system/cpu/cpu*/online

Centos 服务器系统内存故障排查Centos 服务器系统内存故障排查

以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !

137e00002230ad9f26e78-265x300
本文由 良许Linux教程网 发布,可自由转载、引用,但需署名作者且注明文章出处。如转载至微信公众号,请在文末添加作者公众号二维码。
良许

作者: 良许

良许,世界500强企业Linux开发工程师,公众号【良许Linux】的作者,全网拥有超30W粉丝。个人标签:创业者,CSDN学院讲师,副业达人,流量玩家,摄影爱好者。
上一篇
下一篇

发表评论

联系我们

联系我们

公众号:良许Linux

在线咨询: QQ交谈

邮箱: yychuyu@163.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部