Sonntag, 01.07.2012
Schaltsekunde legt Linux-Server lahm
Als WDR.de-Redakteur Georg Berg Sonntagmorgen seinen Dienst aufgenommen hat, staunt er nicht schlecht: Einige Server von WDR.de, sportschau.de und WDR2.de reagieren ungewohnt langsam, einige sind zeitweise gar nicht zu erreichen. Auch das für die Bearbeitung der Texte und Bilder nötige Redaktionssystem arbeitet nicht so rund wie sonst. Da hilft nur eins: Die für solche Dinge zuständigen Techniker alarmieren, die allerdings auch nicht gleich wissen, wo die Ursache für das Problem liegt.
Nach intensiver Recherche wird aber klar: Schuld war die Schaltsekunde, die in der Nacht zum 1. Juli
eingelegt wurde - das Wochenende war also eine ganze Sekunde länger als sonst. Die Zusatzsekunde hat bei einigen Servern mit Linux-Betriebssystem einen folgenreichen Schluckauf verursacht. Anfällige Linux-Systeme haben pünktlich um zwei Uhr nachts, als die zusätzliche Sekunde eingeführt wurde, mit plötzlichen "Lasten" zu kämpfen. Normalerweise ein Anzeichen dafür, dass ein Server besonders viel zu tun hat, etwa weil viele Anfragen kommen. Aber nachts um 2 Uhr herrscht normalerweise Ruhe.
Das Problem: Die Server haben sich nicht von selbst wieder beruhigt. Um das Problem zu lösen, muss wahlweise die Uhrzeit neu gestellt oder der Server neu hochgefahren werden - allerdings machen Techniker das nicht so gerne, erst recht nicht, wenn die Ursache des Problems nicht bekannt ist.
Offensichtlich sind viele von der Problematik überrascht worden, selbst in der
Mozilla Foundation, wo der Firefox-Browser herkommt, hatte man mit dem Schaltsekunden-Schluckauf zu kämpfen. Betroffen waren vor allem Server, auf denen das Datenbanksystem MySQL oder Java (Tomcat) laufen. Der heimische PC war ebenso wenig betroffen wie Tablets oder Smartphones.
Die Beseitigung des Problems war in diesem Fall trivial. Betroffen waren aber vergleichsweise viele Systeme - man hat es vereinzelt beim Surfen im Web am Sonntagmorgen gemerkt. Hinzu kommt natürlich, dass Sonntag morgens nur wenige IT-Experten und Techniker Dienst haben, um so ein Problem zu lokalisieren und zu beseitigen.
Beeindruckend an der Sache ist, wie ein vergleichsweise simples und eigentlich unbedeutendes Ereignis - das Einfügen einer Sekunde -, zu ungeheuren, nicht vorhersehbaren Folgen führen kann. Schaltsekunden werden immer wieder eingefügt, derartige Probleme hat es allerdings bislang nicht gegeben.
Einige Onlinedienste wie Google sind sich immerhin des grundsätzlichen Problems bewusst und haben vorgebaut: An Tagen, an denen Schaltsekunden eingefügt werden, gilt im Google-Imperium eine ganz eigene Zeit. Die zusätzliche Sekunde wird in kleinen Einheiten über den Tag verteilt auf die Server übertragen - so kommt es zu keinerlei Problemen.
Der aktuelle Blog-Eintrag als Podcast
Ich nutze das eduroam-Universitaetsnetz und konnte mich heute (Montag) nicht einloggen. Suchte erst nach der Ursache auf meinem Rechner, aber ein Kollege hatte das gleiche Problem. Vielleicht ist dies die Erklaerung...
Chris26 am 2.07.12 3:57
Das ist ein Bug im Linux-Kernel, der schon seit Jahren bekannt ist. Angeblich wurde er behoben, sodass nur ältere Versionen betroffen sein sollten. Es gibt allerdings eine Kernel-Funktion, die bei Futexes verwendet wird - ein Synchronisationsmodell - in der das Problem anscheinend aus konzeptuellen Gründen weiter besteht. Google's Lösungsansatz zeigt, dass das Problem nicht trivial ist, aber in meiner Naivität - wie ich zugebe, habe ich nur oberflächliche Kenntnisse - glaube ich doch, dass es möglich sein sollte, es im Kernel selbst zu beheben.
KYL am 2.07.12 11:09
Seite empfehlen
über Social Bookmarks