Wenn man Softraid verwendet, sollte einem klar sein, dass da eine monatliche Prüfung die Daten im Monitoring versaut.
Zum Unterschied von collectd und netdata hier ein Beispiel.
Ausgangssituation: In beide Tools wird auffallend hoher Load angezeigt, die Ursache liegt aber nicht an wild gewordenen Prozessen, eingeschleppte Schädlinge, sondern lediglich am 4 Wöchentlichen Rebuild des Raid1. Man muss halt nur wissen, welche Grafiken einem das verraten.
cat /proc/mdstat Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] md1 : active raid1 sdb2[1] sda2[2] 2929609152 blocks super 1.2 [2/2] [UU] [==============>......] check = 70.0% (2050771840/2929609152) finish=222.2min speed=65892K/sec bitmap: 5/22 pages [20KB], 65536KB chunk
md0 : active raid1 sdb1[1] sda1[2]
523712 blocks super 1.2 [2/2] [UU]
unused devices: <none>
Hier sieht man es auch sehr schön. Na klar, sda zeigt es genauso
Siehe auch http://zockertown.de/s9y/index.php?/archives/1630-Den-UEberblick-behalten-collectd-update.html
Hier noch das Ende. Leider kann man nicht minutengenau die Start und Ende Punkte erkennen. Aber das ist jammern auf hohem Niveau. Allerdings ist es bei netdata einfacher den Zeitpunkt zu erfassen.