Vor einiger Zeit habe ich den Verursacher von erhöhter Prozessorlast gesucht. Mangels detailierter Monitoring Graphen war ich da leider etwas behindert bei der Suche. Schliesslich hatte ich es dann doch gefunden, es war der 4 Wöchentliche Softraid Check, den ich gar nicht mehr auf dem Schirm hatte.
Das war der Anlaß das Monitoring etwas aufzubohren.
Collectd bietet das Plugin Processes.
Das lässt sich individuell für seine eigene Zwecke anpassen.
Ich habe folgende Konfiguration gemacht:
<Plugin "processes"> ProcessMatch pg_autovacuum "postgres:.*autovacuum" # Ergänzung um typische Verdächtige, wenn Proccess Count zu hoch ist ProcessMatch webuser "web???" ProcessMatch webcgi "php.cgi" ProcessMatch vmail "dovecot" </Plugin>
Die Idee dabei ist, dass man diese Prozessgruppen detailiert beobachten kann und nicht nur die normale Gesamtprozess Graphen.
Heute habe ich in meinem Imap Postfach aufgeräumt und diverse Archiv Ordner verschoben und indiziert. (Innerhalb von Thunderbird)
So sah das in der Graphik, aus man erkennt deutlich, in welchem Zeitraum das indizieren stattfand.
Das macht Hoffnung, für spätere Ernstfälle
Update 13.03.2020:
Mit den Notifications bin ich nun ein Stück weitergekommen.
Hier ein Ausschnitt aus der threshold.conf:
<Plugin "processes-vmail"> <Type "ps_count"> Instance "processes" Percentage false Hits 4 WarningMax 4 </Type> <Type "ps_rss"> Percentage false Hits 4 WarningMax 550000000 </Type> # ps_cputime. Ohne Angabe einer Instance gilt WarningMax für jeden <Type "ps_cputime"> Percentage false Hits 4 WarningMax 25000 </Type> </Plugin>
Ach, bevor ichs vergesse, während des experimentierens mit den Werten fand ich AutoRefresh auf den Detail Seiten ganz praktisch.
# In detail.php nach Header() ein Echo und gut.
header("Content-Type: text/html"); echo '<meta http-equiv="refresh" content="30"/>';