Unser Familien Server, der uns als Backup- Drucker- und Fileserver dient, ist mit einem Soft-Raid1 ausgestattet. Smart behauptet, die Platten sind beide in Ordnung. Nur ergab die Ausgabe von smartctl -l error /dev/sda einen Media Error, den ich mit sg_verify --lba=80326656 --verbose /dev/sda bestätigen konnte. Zu finden ist das tool im Paket sg3_utils. (apt-get install sg3_utils) Um den Garantiebedingungen von Samsung zu genügen musste nun ein offizielles Tool ran. Das ES_Tool von Samsung habe ich mir auf einen RW Rohling gebrannt und davon den Server gebootet. Nicht überrascht hat mich, das mittllerweile die Opensource Szene bei den Hardwareherstellern etabliert ist. Denn die Basis ist nicht irgend ein pissiges Dos, sondern das stabile Freedos. Wenn man keine Fenster braucht, um einen Rechner zu benutzen ist es das Top Produkt. (Ok, Polemik, denn mit TCP/IP ist's nicht mehr ganz so einfach, geht aber) Doch ich schweife ab. Also wie zu erwarten ergibt der Test genau dieselbe LBA Nummer als defekt. ... Und empfiehlt einen Erase. Dahinter verbirgt sich ein Low Level Format Umgangssprachlich: In Wirklichkeit wird natürlich nicht die Oberfläche erneut in Tracks, Sektoren und Service Bereichen eingeteilt, sondern es wird nur ein neues Remapping durchgeführt. Das heißt, es wird jeder Block mit einem Pattern beschrieben, und es wird verifiziert, ob er mit einem unter dem Grenzwert liegenden Aufwand korrekt gelesen werden konnte. Wenn ja, ok, sonst wird dieser Block aus einem Reservebereich verwendet und nach aussen, also dem Betriebssystem gegenüber als OK bezeichnet. Wenn die gesamte Anzahl der für den Plattentyp typischen Blöcke so neu geprüft und freigegeben worden ist, bezeichnet das Herstellertool die Platte als in Ordnung. Äber die Anzahl der notwendigen Remapvorgänge erfährt der Endanwender nichts. Man muß sich darauf verlassen, das die Platte nun wieder einsatzfähig ist.
Wie man den Screenshots zu entnehmen ist, muß man schon hart gesotten sein, volles Vertrauen in ein Tool zu haben, das nach erfolgreichem Abschluss des "Erase" (dem Low Level Format) behauptet, es hätte einen Fehler gefunden und empfiehlt (wieder) einen Erase. Nach drücken der Enter Taste sieht man ja, das der Test wohl erfolgreich war. Wie dem auch sei, ich habe dann den Rechner gebootet. Nee, halt, es ging nicht! Eine Weile hat's gebraucht, bis ich dahinter kam, das das Mainboard nur von dem ersten Laufwerk booten kann. Ich musste nur die Sata Strippen vertauschen, schon konnte ich booten und mit der bewährten Methode die frische "refurbished" Platte dem Raid wieder hinzufügen. Weil ich den Befehl sg_verify für diesen Artikel nicht mehr im Kopf hatte, habe ich den Befehl in der .bash_history gesucht und gleich noch mal ausprobiert. Ich hätte erwartet, das die Plattenfirmware mir nun einen fehlerfreien Block vorgaukelt, hat sie aber nicht! Es kommt der gleiche Lesefehler wie vor meiner Aktion.
Ärgerlich ist, das das resynchen der /dev/md0 nahezu fertig war, dieser Fehler aber das SoftRaid dazu bewog nun mit dem Syncen aufzuhören und mit dem /dev/md1 weiter zu machen.
cat /proc/mdstat Personalities : [raid1] md1 : active raid1 sdb2[2] sda2[1] 935786176 blocks [2/1] [_U] [====>................] recovery = 22.3% (209416448/935786176) finish=198.9min speed=60851K/sec md0 : active raid1 sdb1[2] sda1[1] 40162368 blocks [2/1] [_U] resync=DELAYED unused devices:
Jetzt bleibt mir nur noch abzuwarten, regelmäßig einen smartctl -t long /dev/sda abzusetzen und zu hoffen, das jetzt die Sache ausgestanden ist. Wenn ich mir da so meine dmesg angucke, habe ich meine Zweifel. Die schiere Anzahl und die Häufigkeit der sata Fehler ist beängstigend. Ich werde glaube ich mal zwei andere sata Platten eines anderen Herstellers nehmen und die inst System einbauen. Wenn ich damit keine Fehler bekomme, kommen die beiden Samsung in externe Gehäuse. Das haben sie davon. Oder hat jemand einen anderen Vorschlag?
"Spaßbremse: oder Samsung's Merkwürdigkeiten " vollständig lesen »