欢迎光临散文网会员登陆 & 注册

【NAS】raidz2 掉盘，阵列降级怎么办？

2022-03-13 18:32 作者:村雨Mura 0人读过 | 我要投稿

truenas scale直接警报

池状态

TMD，刚买的希捷银河7e8，一个是不能休眠，另一个就是直接搁这摆烂报警。目前原因不是很清楚，如果不是我家猫作祟，就应该是硬盘的问题，或者线材的问题，后续有待观察

摘下对应盘做单独的检测，经典三黄警告

可能是店家混着卖，一个好的配一个坏的。

打算再给希捷一个机会，不行就直接西数了，噪音大就大吧，豁出去了

truenas组raidz是根据盘的健康度SMART信息来的，如果SMART黄色报警，例如上图三个黄色报警，它就直接降级提示你不能用了。但其实要是继续用的话，也是可以的。所以，经过这个事件我们可以看到，truenas的raidz可以提前预警，以保证硬盘都是一个很健康的状态，亚健康的那些盘都会被提前清除

---

今天盘到了，准备替换原来的盘。

原来的坏盘不要动，插上新盘，然后开始操作，这里直接图形界面操作，点击要更换的盘，然后直接选择替换就行了。我这里坏掉的是sdc盘，新加入的是sdf盘

然后会提示替换成功

成功之后回到主界面，会发现已经自动开始重新建立存储池了

重建过程可以看到很耗CPU，能注意到似乎是单线程在操作，多核多线程对于池的重建似乎没有帮助？

实际重建过程3小时重建1.2T，全部重建4T的数据大约需要9小时左右。重建不需要过多内存，消耗的是CPU，比较吃CPU的单核性能，对于e3、e5这样单核主频较低的CPU，速度稍慢，所以CPU直通host模式可能更好一些

经过7个小时候查看，基本已经快好了，这个过程内存几乎没怎么用，也就是说重建raidz是不怎么消耗CPU的

完成后提示

右上角的同步转圈的图标也没了

在重建的过程中，可以发现新加入的磁盘温度最高，达到了40°，如图最后一个盘

重建过程中，在PVE外面监控可以得知，磁盘写入大概在120M附近

整个重建完成用了7小时，然后一切恢复正常

以防万一，最后再做一次long类型的SMART检测和scrub，保证硬盘的健康度和数据的安全，看看是否会诱发新的问题

Scrub的过程比较消耗CPU和磁盘

CPU利用率一直是45%左右，而磁盘IO，主要是读取数据一直维持在接近700M的速度

相对而言，SMART检测基本没有太大消耗，不知道是什么原理

只是每次进行SMART检测就会提示预计完成的时间，8T硬盘大约是1小时多

个人建议每天都做short类型的SMART，每周做一次long类型的SMART

标签：

【NAS】raidz2 掉盘，阵列降级怎么办？的评论 (共条)