Net als de wegen waar ze aan liggen en de dijken waar ze achter liggen, zijn cloud datacentra een essentieel deel van onze nationale, en wereldwijde, infrastructuur. Georgios Andreadis studeerde aan de TU Delft af op de capaciteitsplanning van deze datacentra. Dankzij zijn onderzoek zullen ze in de toekomst goedkoper, efficiënter en duurzamer aan de steeds maar toenemende vraag naar rekenkracht kunnen voldoen.
‘Als ik vertel dat ik onderzoek doe naar computers, in plaats van met computers, dan roept dat zowel interesse als ongeloof op,’ zegt Georgios Andreadis. ‘De meeste mensen zien computers als iets vanzelfsprekends, als machines die gewoon doen wat ze doen. Maar er is zoveel aan computers dat niet triviaal is.’ Bij het eerstejaarscollege over Computer Organisation raakte Andreadis geboeid door de architectuur van computersystemen en hoe je die efficiënt kan managen. Uiteindelijk leidde deze interesse tot een masteronderzoek in de @Large Research groep van Alexandru Iosup, professor aan de Vrije Universiteit Amsterdam en, daarvoor, docent van dat eerstejaarscollege. Zijn groep is gespecialiseerd in computersystemen die massaal zijn wat betreft de hoeveelheid hardware, het aantal gebruikers of de hoeveelheid door de computer(s) uit te voeren taken.
Spreadsheets en vuistregels
‘Cloud datacentra bieden banken, de gezondheidszorg, regeringen, hulpverleningsdiensten en heel veel kleine bedrijven een digitale thuishaven – een plek van waaruit zij hun digitale diensten met hoge betrouwbaarheid kunnen aanbieden en waar ze hun gegevens veilig kunnen opslaan,’ zegt Iosup. ‘Net als wegen en dijken zijn ze een essentieel deel van onze infrastructuur geworden. Om de samenleving draaiende te houden moeten we op enig moment over voldoende capaciteit beschikken. Stel je voor dat het een paar dagen onmogelijk is om geld over te maken.’ Tot nu toe hebben cloud datacentra de kwaliteit en continuïteit van hun dienstverlening weten te garanderen door een flinke hoeveelheid overcapaciteit aan rekenkracht en data-opslagruimte aan te schaffen en te installeren. Iosup: ‘Cloud datacentra verbruiken nu al ongeveer twee procent van de wereldenergievoorziening, en dit neemt snel toe. Het is niet alleen onhoudbaar om steeds maar meer servers aan te schaffen, met het oog op het klimaat neigt het zelfs naar onverantwoordelijk gedrag.’ Verrassend genoeg, en in tegenstelling tot wegen en dijken, is er nog maar weinig kennis van, en onderzoek gedaan naar, capaciteitsplanning bij datacentra. Andreadis: ‘Grote spelers, zoals Google en Amazon, hebben hiervoor een eigen interne aanpak ontwikkeld. Maar tienduizenden kleine tot middelgrote datacentra plannen min of meer op basis van spreadsheets en vuistregels. Met mijn afstudeerscriptie pleit ik ervoor om hun capaciteitsplanning te baseren op een rigoureuze, kwantitatieve analyse.’
Geen vaste grond
Het eindresultaat van zijn afstuderen is de tool Capelin, genoemd naar een vissoort (de lodde in het Nederlands) die een belangrijke plek inneemt in de voedselketen van walvissen en vele soorten vis en zeevogels. Iosup: ‘We vinden onze tool een essentiële bouwstof voor datacentra. We wilden bovendien een naam die de tand des tijds kan doorstaan en die in klank wat overlap heeft met capaciteitsplanning.’ Capelin ondersteunt degenen die zich met capaciteitsplanning bezighouden bij hun keuze voor nieuwe hardware zodat die past bij wat hun klanten nodig hebben. Zoals zo vaak bij wetenschap en techniek, was de eerste stap op weg naar een oplossing het goed specificeren van het probleem. Hiervoor combineerde Andreadis systematisch literatuuronderzoek met interviews bij commerciële en wetenschappelijke datacentra. ‘Er was niet veel over dit onderwerp te vinden,’ zegt hij. ‘En tot mijn nog grotere verbazing bleek uit de interviews ook nog eens dat men geen gebruik maakt van wat er gepubliceerd is. Men vond dat de gepubliceerde modellen niet realistisch waren of alleen bruikbaar bij een heel specifiek scenario.’ Kortom, er was weinig vaste grond om op te staan, voor zowel de capaciteitsplanners als Andreadis. ‘Dat vond ik moeilijk omdat ik daarmee volledig op mijn eigen ideeën en de gesprekken met mijn begeleiders was aangewezen. Maar het gaf me ook veel meer vrijheid in mijn onderzoek omdat ik geen rekening hoefde te houden met wat anderen al gedaan hadden.’
Er is nog maar weinig bekend over capaciteitsplanning bij datacentra.
Simuleren wat (in het) echt niet kan
‘Tijdens mijn interviews vond het idee van wat-als scenario’s veel weerklank bij de capaciteitsplanners,’ zegt Andreadis. ‘Ze hadden behoefte aan een beter begrip van mogelijke toekomstige uitkomsten, rekening houdend met verschillende aspecten zoals het moment van implementatie of wijzigingen in de wensen van hun klanten. Deze wat-als-methodologie is het hart van Capelin geworden. Het helpt de planners bij het formuleren en beantwoorden van vragen.’ De eerste stap in het gebruik van Capelin is het schetsen van de toekomstige inrichting van het datacentrum – door bijvoorbeeld veel goedkope servers toe te voegen of juist een paar hele krachtige servers. Dan volgt de keuze van mogelijke toekomstscenario’s – bijvoorbeeld een toename van tien procent in de aangevraagde rekenkracht ten opzichte van de huidige situatie, of dat het datacentrum door een grootschalige fout voor de helft platgaat. Capelin simuleert dan hoe het datacentrum onder al deze scenario’s presteert. Zo nodig kan de capaciteitsplanner op basis hiervan de inrichting verder aanpassen en de simulaties herhalen. ‘Zulke tests kan je natuurlijk niet met een echt datacentrum doen,’ zegt Andreadis. ‘Simulaties zijn een ideaal middel om mogelijke gevolgen inzichtelijk te maken voordat je een beslissing neemt over de toekomstige capaciteit.’
Succes en mislukking zijn bij capaciteitsplanning voor cloud datacentra niet bepaald uitgewerkte definities.
Succes en mislukking
Een belangrijke horde was dat Capelin een goede definitie van succes en mislukking nodig had om te kunnen rapporteren over de prestaties van de beoogde inrichting van het datacentrum. ‘Op het gebied van capaciteitsplanning voor cloud datacentra zijn deze niet bepaald uitgewerkt,’ zegt Andreadis. ‘Dat had ik al verwacht, maar tijdens de interviews kwam het pas echt tot uitdrukking.’ Het is moeilijk om een mislukking aan de geplande inrichting toe te schrijven omdat er zo veel factoren een rol spelen bij capaciteitsplanning – zoals de timing van een upgrade en het beschikbare personeel. Sommige mislukkingen worden niet eens opgemerkt, zoals servers die een klein beetje minder hard draaien dan normaal. Andere zijn juist heel erg zichtbaar, bijvoorbeeld als online bankieren een paar uur lang niet werkt. Het is ook nog eens heel moeilijk om als capaciteitsplanner iets aantoonbaar goed te doen. Na de upgrade is het datacentrum misschien energiezuiniger, maar als gevolg van een extra hoge investering. Of het datacentrum presteert beter maar is ook vatbaarder voor storingen. Andreadis: ‘Dankzij onze simulator is het mogelijk om een enkele capaciteitsbeslissing werkelijk op waarde te schatten. We kunnen nu energieverbruik, investering en prestaties tegen elkaar afwegen.’
Steeds maar meer servers aanschaffen is niet alleen niet-duurzaam, het neigt naar onverantwoordelijk gedrag.
Beter dan redelijk
Na het bouwen en nauwgezet valideren van Capelin voerde Andreadis een aantal experimenten uit, gebaseerd op geanonimiseerde data van echte cloud datacentra. Keuzes die in de dagelijkse praktijk redelijk leken, bleken lang niet optimaal. Capaciteitsplanning op basis van Capelin zou bijvoorbeeld het energieverbruik met een factor twee kunnen reduceren terwijl ook de service flink verbetert. Een extra meerwaarde is dat het proces van capaciteitsplanning met Capelin veel soepeler verloopt. ‘Capaciteitsplanning draait niet alleen om de hardware,’ zegt Andreadis. ‘Het is een ingewikkeld proces waarbij bijvoorbeeld ook personeelsaspecten en de timing van de uitbreiding een rol spelen, en andere zakelijke factoren die moeilijk in een model te vatten zijn.’ Het komt er typisch op neer dat een groep werknemers, met elk een spilfunctie binnen het datacentrum, over een periode van maanden meerdere malen bij elkaar komt voor overleg. ‘Met onze tool hoeven ze niet meer tot de volgende vergadering te wachten tot de op spreadsheets gebaseerde schattingen klaar zijn,’ zegt Andreadis. ‘Capelin komt binnen enkele minuten met kwantitatieve antwoorden, zelfs in het geval van realistische, complexe situaties. Het kan tijdens de vergadering live gebruikt worden en daarmee de benodigde tijd en mankracht om tot een beslissing te komen flink verminderen. Bovendien neemt het vertrouwen in die beslissing toe.’ Dit is de reden dat veel organisaties, van industrie tot wetenschappelijke instituten, al hun interesse hebben uitgesproken om Capelin onderdeel te maken van hun planningsproces zodra de software beschikbaar komt.
Een passie voor gezondheidszorg
Naast het afronden van zijn masteropleiding heeft Andreadis een deel van zijn zomer besteed als vrijwilliger voor het Rode Kruis – voor het testen van ziekenhuisbezoekers op COVID-19 – en aan het verlenen van eerste hulp als strandwacht bij Den Haag. Ook droeg hij als programmeur bij aan We\Visit, het online platform ontwikkeld aan de TU Delft dat IC-patiënten via beeldbellen in contact brengt met hun naasten. Hij was nog niet echt bezig met zijn verdere toekomst toen zijn blik op een vacature viel voor een promotieplek bij het Leids Universitair Medisch Centrum in samenwerking met het Centrum Wiskunde & Informatica in Amsterdam. ‘Vanaf november zal ik zogenoemde evolutionaire computeralgoritmes ontwikkelen om tumorgroei te modelleren op basis van meerdere, in de tijd uitgespreide, MRI-scans. Het is voor mij de perfecte combinatie van een wetenschappelijke uitdaging met mijn passie voor gezondheidszorg.’ Zijn collega’s en begeleiders in de @Large Research groep, die zo belangrijk waren voor zijn masteronderzoek, zullen hem missen. ‘Hij heeft een zeldzaam talent voor zowel wetenschap als leiderschap. Ik heb hele hoge verwachtingen van hem,’ zegt zijn afstudeerbegeleider Iosup. ‘Het doet pijn om iemand met zijn kwaliteiten te zien vertrekken, maar gelukkig zien we hem, buiten coronatijd, nog bij onze teamevenementen en feestjes.’
Tekst: Merel Engelsman | Fotografie: Georgios Andreadis