Supercomputer

Muenchen - Garching - Standard-PCs - Google - Seti@home

Posted by eumel8 on July 20, 2012 · 5 mins read

10 Jahre ist es jetzt her, dass im Linux-Magazin ein Beitrag ueber GRID-Computing erschienen ist. GRID-Computing, das wird man in der Schule nicht gehabt haben, ist eine Form des verteilten und parallelen Rechnens in einer Grid, aeh Netz. So entsteht ein gewaltiger Computer, ein virtueller Supercomputer, dessen Nodes auch etliche tausend Kilometer entfernt sein koennen.
Google hat auch so einen Super-Computer, oder mehrere.Die Anforderung ist hier aber eher, Dienste und somit Rechenleistung an jeder Ecke der Welt anbieten zu koennen. Auch das ist Google. In einer Studie ueber Stromverbrauch in Rechenzentren hat man rausgefunden, dass Google in seinem Grid etwa 900.000 Rechner betreiben muss. Wenn es eine Doppelprozessor-Maschine mit je 4 Kernen als Standardhardware ist,  hat man es also mit einem Supercomputer mit 3,6 Millionen CPUs zu tun. Wenn jeder Rechner mit 16 GB RAM bestueckt ist, hat man 14,4 Petabyte RAM-Speicher zur Verfuegung.

2010 erschien in einer Sonderausgabe der iX ein Artikel ueber den Teilchenbeschleuniger des CERN., dem Large Hadron Collider. Sinn der Unternehmung ist die Suche nach dem Higgs-Teilchen, dem sogenannten Gottes-Teilchen. Wie die Tage der Presse zu entnehmen war, hat man nun tatsaechlich dieses Teilchen am CERN mit der Urknallmaschine gefunden.  Geholfen bei der Suche hat ein aus 7000 Computer bestehender Linux-Cluster im TIER 0 in Genf.  Dieser leitet seine Daten an  TIER 1 Knoten, das sind etwa ein dutzend Wissenschaftsrechenzentren, die mindestens mit 10 GBit/s Ethernet miteinander verbunden sind. Eines davon ist das GridKA in Karlsruhe. Von dort geht es an TIER 2 Knoten weiter, etwa 100 Rechenzentren von Universitaeten ueberall in der Welt. Die Ergebnisse gehen wieder zurueck nach Bern und werden dort auf Band geschrieben. Bei der Teilchenbeschleunigung gehen Wissenschaftler von 40 Millionen Ereignissen pro Sekunde aus. Der auszuwertende Datenstrom liegt bei 1 Petabyte - pro Sekunde. Informationen ueber das GRID CERN findet man unter www.egi.eu.

Ein anderes Ereignis machte dieser Tage auf sich aufmerksam. Die Einweihung des SuperMUC in Muenchen ging durch die Presse. Also eigentlich steht das Geraet in Garching, was so etwa ist, als waere das Oberurseler Brauhaus in Frankfurt, aber man arbeitet an viel groesseren Dingen, als wenn man sich an den paar Kilometern Entfernung aufhaelt. Der SuperMUC ist jetzt ein echter Supercomputer. Wenn man genauer hinsieht, ist es zwar wieder nur eine GRID, aber es fehlt die raeumliche Entfernung wie etwa beim CERN oder Google-Netzwerk. Alles ist mehr oder weniger in einem Raum. In der Liste der weltweit schnellsten Supercomputer ihrer Zeit wird er im Juli 2012 Platz 4 einnehmen und die Nummer 1 in Europa sein.  Die ersten industriell gerfertigen Supercomputer stammen von der Firma Cray. Der schnellste Computer seiner Zeit war 1976 die Cray-1. Sie konnte 250 Millionen Floating Point Operationen pro Sekunde durchfuehren. Der herkoemmliche Heim-PC  kann etwa 6 Milliarden, weswegen die Cray-1 nur noch im Deutschen Museum in Muenchen zu bewundern ist. Ein weiterer Meilenstein in der Liste der Supercomputer war der IBM Roadrunner. Seine Zeit war Mitte 2008 bis 2009 und setzte die Technologie von IBM Blue Gene fort. In diesem Projekt aus dem Jahre 1999 geht es IBM nicht mehr darum, den Supercomputer zu bauen, sondern ein skalierbares Computersystem, was fast beliebig erweitert werden kann. Da es beim Benchmark-Test der Top 500 keine Festlegungen der Bauweise eines Supercomputers gibt, finden sich etliche Blue Gene Systeme in den Top 10.

Herzstueck des SuperMUC ist der IBM x iDataPlex DX 360 M4 von IBM,  ein fast handelsueblicher PC, wenn man mal von der Wasserkuehlung absieht, aber auch das findet man heutzutage schon in "normalen" Rechenzentren. Er wurde 9400 mal verbaut  und hat so eine Rechenleistung von 155656 Prozessorkernen mit mehr als 300 TB RAM-Speicher. Der Festplattenspeicher umfasst mehrere Petabyte fuer verschiedene Nutzungen (pro Projekt, pro Speicherzeit). Ein "uname -a" am Systemprompt ist auch etwas ernuechternd: Es laeuft mit Suse Linux Enterprise 11 Servicepack 1 auf Kernel 2.6.32 und ist wohl somit eine bayerisch-fraenkische Coproduktion.

Links:

  • http://www.linuxhpc.org/
  • http://www.suse.com/products/highavailability/
  • http://www.gridcomputing.com/
  • http://www.globus.org/
  • http://setiathome.berkeley.edu/
  • http://www.heise.de/ix/artikel/2010/14/links/058.shtml