High-Performance I/O Programming Models for Exascale Computing

Tid: Fr 2019-11-29 kl 10.00

Plats: B1, Brinellvägen 23, Bergs, våningsplan 1, KTH Campus, Stockholm (English)

Respondent: Sergio Rivas-Gomez , Beräkningsvetenskap och beräkningsteknik (CST)

Opponent: Martin Schulz, Technical University of Munich, 85748 Garching b. Munchen (Germany)

Handledare: Stefano Markidis, Beräkningsvetenskap och beräkningsteknik (CST); Erwin Laure, Beräkningsvetenskap och beräkningsteknik (CST)

Abstract

Framgången för superdatorer på exaskala kommer till stor del bero på nya genombrott som tillmötesgår ökande krav på högpresterande I/O inom högprestandaberäkningar. Forskare utnyttjar idag tillgänglig datorkraft hos superdatorer på petaskala för att köra större simuleringar med högre fidelitet. Samtidigt har dataintensiva tillämpningar blivit vanliga. Dessa skapar ytterligare påfrestningar på I/O subsystemet, framförallt genom det större antalet I/O transaktioner. 

Följdaktligen uppstår flera kritiska utmaningar som är av största vikt vid beräkningar på exaskala. Medan samtidigheten hos nästa generationens superdatorer förväntas öka med uppemot tre storleksordningar så beräknas bandvidden och accesslatensen hos I/O subsystemet förbli relativt oförändrad. Lagring står därför på gränsen till att bli en allvarlig flaskhals. Kommande superdatorer förväntas innehålla nya icke-flyktiga minnesteknologier för att kompensera för dessa begränsningar, men existerande programmeringsmodeller och gränssnitt (t.ex. MPI-IO) kommer eventuellt inte att ge några tydliga tekniska fördelar när de tillämpas på distribuerad intra-nod lagring, särskilt inte för byte-addresserbara persistenta minnen. Även om ökande heterogenitet hos beräkningsnoder kommer kunna ge fördelar med avseende på prestanda och termisk dissipation så kommer denna teknologiska transformation att medföra en ökning av programmeringskomplexitet, vilket kommer att försvåra för vetenskapliga tillämpningar att dra nytta av utvecklingen.

I denna avhandling utforskas hur programmeringsmodeller och gränssnitt behöver vidareutvecklas för att kringgå de ovannämnda begränsningarna. MPI lagringsfönster kommer presenteras, vilket är ett nytt koncept som går ut på att använda den ensidiga MPI kommunikationsmodellen tillsammans med MPI fönster som ett enhetligt gränssnitt till programminne och lagring. Därefter demonstreras hur ensidig MPI kommunikation kan vara till gagn för dataanalyssystem genom en frikopplad strategi, samtidigt som den integrerar kontinuerlig feltolerans och exekvering utanför kärnan. Vidare introduceras persistenta coarrays för att möjliggöra transparant resiliens i Coarray Fortran, som stödjer “failed images” funktionen som nyligen införts i standarden. Slutligen föreslås ett globalt minnesabstraktionslager, som med inspiration av minnes-kartlagda I/O mekanismen hos operativsystemet exponerar olika lagringsteknologier med hjälp av konventionella minnesoperationer.

Resultaten från dessa bidrag förväntas ha betydande påverkan för högprestandaberäkningar inom flera vetenskapliga tillämpningsområden, både för existerande och nästa generationens superdatorer.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-263196

Tillhör: Skolan för elektroteknik och datavetenskap (EECS)
Senast ändrad: 2019-11-05