欢迎光临散文网 会员登陆 & 注册

【NAS】raidz2 掉盘,阵列降级怎么办?

2022-03-13 18:32 作者:村雨Mura  | 我要投稿

truenas scale直接警报

池状态

TMD,刚买的希捷银河7e8,一个是不能休眠,另一个就是直接搁这摆烂报警。目前原因不是很清楚,如果不是我家猫作祟,就应该是硬盘的问题,或者线材的问题,后续有待观察

摘下对应盘做单独的检测,经典三黄警告

可能是店家混着卖,一个好的配一个坏的。

打算再给希捷一个机会,不行就直接西数了,噪音大就大吧,豁出去了

truenas组raidz是根据盘的健康度SMART信息来的,如果SMART黄色报警,例如上图三个黄色报警,它就直接降级提示你不能用了。但其实要是继续用的话,也是可以的。所以,经过这个事件我们可以看到,truenas的raidz可以提前预警,以保证硬盘都是一个很健康的状态,亚健康的那些盘都会被提前清除

---

今天盘到了,准备替换原来的盘。

原来的坏盘不要动,插上新盘,然后开始操作,这里直接图形界面操作,点击要更换的盘,然后直接选择替换就行了。我这里坏掉的是sdc盘,新加入的是sdf盘

然后会提示替换成功

成功之后回到主界面,会发现已经自动开始重新建立存储池了

重建过程可以看到很耗CPU,能注意到似乎是单线程在操作,多核多线程对于池的重建似乎没有帮助?

实际重建过程3小时重建1.2T,全部重建4T的数据大约需要9小时左右。重建不需要过多内存,消耗的是CPU,比较吃CPU的单核性能,对于e3、e5这样单核主频较低的CPU,速度稍慢,所以CPU直通host模式可能更好一些

经过7个小时候查看,基本已经快好了,这个过程内存几乎没怎么用,也就是说重建raidz是不怎么消耗CPU的

完成后提示

右上角的同步转圈的图标也没了

在重建的过程中,可以发现新加入的磁盘温度最高,达到了40°,如图最后一个盘

重建过程中,在PVE外面监控可以得知,磁盘写入大概在120M附近

整个重建完成用了7小时,然后一切恢复正常

以防万一,最后再做一次long类型的SMART检测和scrub,保证硬盘的健康度和数据的安全,看看是否会诱发新的问题

Scrub的过程比较消耗CPU和磁盘

CPU利用率一直是45%左右,而磁盘IO,主要是读取数据一直维持在接近700M的速度

相对而言,SMART检测基本没有太大消耗,不知道是什么原理

只是每次进行SMART检测就会提示预计完成的时间,8T硬盘大约是1小时多

个人建议每天都做short类型的SMART,每周做一次long类型的SMART


【NAS】raidz2 掉盘,阵列降级怎么办?的评论 (共 条)

分享到微博请遵守国家法律