KRYLOV CONVERGENCE ACCELERATION AND DOMAIN DECOMPOSITION METHODS FOR NONMATCHING GRIDS



Vergelijkbare documenten
Cover Page. The handle holds various files of this Leiden University dissertation

Improving parallelism for the. NEMO ocean model. Hind Shouli. NEMO ocean model

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 8 februari 2010

i(i + 1) = xy + y = x + 1, y(1) = 2.

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE

Citation for published version (APA): Oderkerk, A. E. (1999). De preliminaire fase van het rechtsvergelijkend onderzoek Nijmegen: Ars Aequi Libri

Add the standing fingers to get the tens and multiply the closed fingers to get the units.

The downside up? A study of factors associated with a successful course of treatment for adolescents in secure residential care

DAGELIJKS WERKBOEK DEEL #1

Ius Commune Training Programme Amsterdam Masterclass 16 June 2016

Downloaded from UvA-DARE, the institutional repository of the University of Amsterdam (UvA)

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE

Communication about Animal Welfare in Danish Agricultural Education

THE WORK HET WERK HARALD BERKHOUT

Non Diffuse Point Based Global Illumination

Iterative methoden voor lineaire vergelijkingen. Scientific Computing. sleij101/ Program

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Examination 2DL04 Friday 16 november 2007, hours.

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE

Aanvullingen bij Hoofdstuk 8

(1) De hoofdfunctie van ons gezelschap is het aanbieden van onderwijs. (2) Ons gezelschap is er om kunsteducatie te verbeteren

Ius Commune Training Programme Amsterdam Masterclass 15 June 2018

Examen Lineaire Algebra en Meetkunde Tweede zit (13:30-17:30)

Chapter 4 Understanding Families. In this chapter, you will learn

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op , uur.

Risico s van Technologisch Succes in digitale transformatie S T R A T E G I C A D V I S O R

extra sommen bij Numerieke lineaire algebra

UvA-DARE (Digital Academic Repository) : Peeters-Podgaevskaja, A.V. Link to publication

Effluent biomarkers in peritoneal dialysis: A captivating symphony from the peritoneal membrane Lopes Barreto, Deirisa

Citation for published version (APA): Oderkerk, A. E. (1999). De preliminaire fase van het rechtsvergelijkend onderzoek Nijmegen: Ars Aequi Libri

UvA-DARE (Digital Academic Repository)

Oefenopgaven wi3097: Numerieke methoden voor differentiaalvergelijkingen

Summary 124

L.Net s88sd16-n aansluitingen en programmering.

Borstkanker: Stichting tegen Kanker (Dutch Edition)

Eindtermen Lineaire Algebra voor E vor VKO (2DE01)

Antwoorden op de theoretische vragen in de examen voorbereiding

Thesisonderwerpen binnen de onderzoeksgroep klassieke analyse (Walter Van Assche)

Introductie in flowcharts

Ius Commune Training Programme Amsterdam Masterclass 22 June 2017

UvA-DARE (Digital Academic Repository) Keeping youth in play Spruit, A. Link to publication

Teksten van de liederen die gospelkoor Inspiration tijdens deze Openluchtdienst zingt.

Snel oplossen is een experiment waard

Vergaderen in het Engels

Het Effect van Verschil in Sociale Invloed van Ouders en Vrienden op het Alcoholgebruik van Adolescenten.

Europa: Uitdagingen? Prof. Hylke Vandenbussche Departement Economie- International Trade 26 April 2018 Leuven

Meetkunde en Lineaire Algebra

Understanding the role of health literacy in self-management and health behaviors among older adults Geboers, Bas

voltooid tegenwoordige tijd

De grondbeginselen der Nederlandsche spelling / Regeling der spelling voor het woordenboek der Nederlandsche taal (Dutch Edition)

Lineaire vergelijkingen II: Pivotering

Bouwen op een gemeenschappelijk verleden aan een succesvolle toekomst Welling, Derk Theodoor

Dynamic and Stochastic Planning Problems with Online Decision Making A Novel Class of Models. Maria Lucia Arnoldina Gerarda Cremers

ONBETWIST ONderwijs verbeteren met WISkunde Toetsen Voorbeeldtoetsen Lineaire Algebra Deliverable 3.10 Henk van der Kooij ONBETWIST Deliverable 3.

ANGSTSTOORNISSEN EN HYPOCHONDRIE: DIAGNOSTIEK EN BEHANDELING (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

SAMPLE 11 = + 11 = + + Exploring Combinations of Ten + + = = + + = + = = + = = 11. Step Up. Step Ahead

Uitwerking Tentamen Calculus B (2WBB1) van 4 november 2013

UvA-DARE (Digital Academic Repository) Inquiry-based leading and learning Uiterwijk-Luijk, E. Link to publication

Group work to study a new subject.

L.Net s88sd16-n aansluitingen en programmering.

Ethno-territorial conflict and coexistence in the Caucasus, Central Asia and Fereydan

Blokmatrices. , I 21 = ( 0 0 ) en I 22 = 1.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Lineaire Algebra voor ST (2DS06) op , uur.

Tentamen lineaire algebra voor BWI dinsdag 17 februari 2009, uur.

bij Kinderen met een Ernstige Vorm van Dyslexie of Children with a Severe Form of Dyslexia Ans van Velthoven

Relationele Databases 2002/2003

Classification of triangles

FOR DUTCH STUDENTS! ENGLISH VERSION NEXT PAGE. Toets Inleiding Kansrekening 1 22 februari 2013

Davide's Crown Caps Forum

Preschool Kindergarten

Lichamelijke factoren als voorspeller voor psychisch. en lichamelijk herstel bij anorexia nervosa. Physical factors as predictors of psychological and

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Relationele Databases 2002/2003

z x 1 x 2 x 3 x 4 s 1 s 2 s 3 rij rij rij rij

1 Eigenwaarden en eigenvectoren

Definities, stellingen en methoden uit David Poole s Linear Algebra A Modern Introduction - Second Edtion benodigd voor het tentamen Matrix Algebra 2

Algoritmen abstract bezien

AXIOMATIEK VAN GETALLEN, vergezichten vanuit mijn ivoren toren

University of Groningen. Linear conic programming: genericity and stability Jargalsaikhan, Bolor

Travel Survey Questionnaires

Technische Universiteit Delft. ANTWOORDEN van Tentamen Gewone differentiaalvergelijkingen, TW2030 Vrijdag 30 januari 2015,

University of Groningen. Vrije en reguliere scholen vergeleken Steenbergen, Hilligje

Appendix A: List of variables with corresponding questionnaire items (in English) used in chapter 2

Tentamen lineaire algebra voor BWI maandag 15 december 2008, uur.

Bekijk nog een keer het stelsel van twee vergelijkingen met twee onbekenden x en y: { De tweede vergelijking van de eerste aftrekken geeft:

University of Groningen. Electron Holography of Nanoparticles Keimpema, Koenraad

WISB134 Modellen & Simulatie. Lecture 4 - Scalaire recursies

MyDHL+ Van Non-Corporate naar Corporate

Dutch survival kit. Vragen hoe het gaat en reactie Asking how it s going and reaction. Met elkaar kennismaken Getting to know each other

Voorbeeld. Preview. Dit document is een voorbeeld van NEN / This document is a preview by NEN

HANDBOEK HARTFALEN (DUTCH EDITION) FROM BOHN STAFLEU VAN LOGHUM

Cognitive self-therapy A contribution to long-term treatment of depression and anxiety

Wetenschappelijk Rekenen

Never trust a bunny. D. J. Bernstein University of Illinois at Chicago. Tanja Lange Technische Universiteit Eindhoven

Aanvullingen van de Wiskunde

AE1103 Statics. 25 January h h. Answer sheets. Last name and initials:

Practicum NLA : Iteratieve methodes

B1 Woordkennis: Spelling

Melatonin treatment and light therapy for chronic sleep onset insomnia in children van Maanen, A.

UvA-DARE (Digital Academic Repository) VR as innovation in dental education de Boer, I.R. Link to publication

LONDEN MET 21 GEVARIEERDE STADSWANDELINGEN 480 PAGINAS WAARDEVOLE INFORMATIE RUIM 300 FOTOS KAARTEN EN PLATTEGRONDEN

Transcriptie:

KATHOLIEKE UNIVERSITEIT LEUVEN FACULTEIT TOEGEPASTE WETENSCHAPPEN DEPARTEMENT COMPUTERWETENSCHAPPEN AFDELING NUMERIEKE ANALYSE EN TOEGEPASTE WISKUNDE Celestijnenlaan 200A B-3001 Heverlee KRYLOV CONVERGENCE ACCELERATION AND DOMAIN DECOMPOSITION METHODS FOR NONMATCHING GRIDS Promotoren: Prof. Dr. ir. D. Roose Prof. Dr. X.-C. Cai Proefschrift voorgedragen tot het behalen van het doctoraat in de toegepaste wetenschappen door Serge GOOSSENS June 2000

KATHOLIEKE UNIVERSITEIT LEUVEN FACULTEIT TOEGEPASTE WETENSCHAPPEN DEPARTEMENT COMPUTERWETENSCHAPPEN AFDELING NUMERIEKE ANALYSE EN TOEGEPASTE WISKUNDE Celestijnenlaan 200A B-3001 Heverlee KRYLOV CONVERGENCE ACCELERATION AND DOMAIN DECOMPOSITION METHODS FOR NONMATCHING GRIDS Jury: Prof. Dr. ir. R. Govaerts, voorzitter Prof. Dr. ir. D. Roose, promotor Prof. Dr. X.-C. Cai, promotor (University of Colorado at Boulder, U.S.A.) Prof. Dr. ir. S. Vandewalle Prof. Dr. ir. E. Toorman Prof. Dr. ir. R. Piessens Prof. Dr. ir. C. Vuik (Technische Universiteit Delft, Nederland) Proefschrift voorgedragen tot het behalen van het doctoraat in de toegepaste wetenschappen door Serge GOOSSENS U.D.C. 681.3 G15 June 2000

c Katholieke Universiteit Leuven Faculteit Toegepaste Wetenschappen Arenbergkasteel, B-3001 Heverlee, Belgium Alle rechten voorbehouden. Niets uit deze uitgave mag worden vermenigvuldigd en/of openbaar gemaakt worden door middel van druk, fotocopie, microfilm, elektronisch of op welke andere wijze ook zonder voorafgaande schriftelijke toestemming van de uitgever. All rights reserved. No part of the publication may be reproduced in any form by print, photoprint, microfilm or any other means without written permission from the publisher. D/2000/7515/30 ISBN 90-5682-260-8 Rev. 1

Krylov Convergence Acceleration and Domain Decomposition Methods for Nonmatching Grids Serge Goossens Departement Computerwetenschappen, K.U.Leuven Celestijnenlaan 200A, B-3001 Heverlee, België Abstract The numerical solution of partial differential equations is an important research topic in the field of scientific computing and numerical simulation. After discretisation, very large systems of linear equations have to be solved. In domain decomposition methods, the domain is split into a number of subdomains and the resulting subproblems are coupled via artificial boundary conditions. Krylov subspace methods are iterative methods to solve systems of linear algebraic equations. They are easy to implement but require a good preconditioner. In this thesis we develop efficient numerical solvers for partial differential equations, based on the combination of Krylov subspace methods, such as Flexible GMRES, with domain decomposition preconditioning and to extend the applicability of the developed technique to (overlapping) nonmatching grids. The first part of the thesis deals with improving the convergence of the iterative solver. The domain decomposition method can be optimised by determining an optimal coupling between the subdomains. This is done by imposing boundary conditions for the subdomain problems. Ritz and Harmonic Ritz values and the corresponding vectors are studied to understand the convergence behaviour of GMRES and to extract important information about the eigenvalue spectrum of the preconditioned matrix. With the Ritz vectors corresponding to outlying eigenvalues we can speed up the solution process. This has been successfully applied in a solver for the Shallow Water Equations. We also constructed an optimised nested Krylov method. This is an attractive way to extract a near-optimal approximation

iv from a high dimensional Krylov subspace while keeping memory and computational requirements reasonably low. The second part of the thesis is devoted to the extension of the adopted domain decomposition method to nonmatching grids and focuses on discretisation techniques and error analysis. In the case of (overlapping) nonmatching grids information transfer from one grid to the other grid is not trivial since there is no global discretisation from which this information transfer can be derived. We focus on interpolation formulae and modified discretisation stencils to construct a consistent and second order accurate global discretisation. We also consider the mortar projection as interpolation technique and a coupling technique based on a finite difference discretisation is proposed as an alternative to interpolation.

Krylov Convergence Acceleration and Domain Decomposition Methods for Nonmatching Grids Serge Goossens Departement Computerwetenschappen, K.U.Leuven Celestijnenlaan 200A, B-3001 Heverlee, België Samenvatting Het numeriek oplossen van partiële differentiaalvergelijkingen is een belangrijk onderzoeksonderwerp binnen de vakgebieden wetenschappelijk rekenen en numerieke simulatie. Na discretisatie moeten heel grote stelsels lineaire vergelijkingen opgelost worden. In domeindecompositiemethoden wordt het domein gesplitst in een aantal deeldomeinen en worden de resulterende deelproblemen gekoppeld aan de hand van artificiële randvoorwaarden. Krylov deelruimte methoden zijn iteratieve methoden om stelsels lineaire vergelijkingen op te lossen. Ze kunnen gemakkelijk geïmplementeerd worden, maar vereisen een goede preconditioneringstechniek. In deze thesis ontwikkelen we efficiënte numerieke oplossingstechnieken voor partiële differentiaalvergelijkingen, gebaseerd op de combinatie van Krylov deelruimte methoden, zoals Flexibele GMRES, en domeindecompositiepreconditionering. We breiden de toepasbaarheid van de ontwikkelde technieken ook uit voor (overlappende) niet-aansluitende roosters. Het eerste deel van de thesis behandelt het verbeteren van de convergentie van de iteratieve oplossingsmethode. De domeindecompositiemethode kan verbeterd worden door een optimale koppeling tussen de deeldomeinen op te leggen. Dit gebeurt aan de hand van de randvoorwaarden voor de deelproblemen. De Ritz en harmonische Ritz waarden en de overeenkomstige vectoren worden bestudeerd om meer inzicht te krijgen in het convergentiegedrag van GMRES en om belangrijke informatie over het eigenwaardenspectrum van de gepreconditioneerde matrix te bekomen.

vi Aan de hand van de Ritz vectoren horende bij een klein aantal geïsoleerde eigenwaarden, kunnen we de oplossingsmethode versnellen. Dit hebben we met succes toegepast in een simulatieprogramma voor de Ondiep Water Vergelijkingen. We hebben ook een verbeterde geneste Krylov methode geconstrueerd. Dit is een aantrekkelijke manier om bijna-optimale benaderingen uit een hoogdimensionale Krylov deelruimte te berekenen terwijl de reken- en geheugenkost toch nog redelijk laag blijft. In het tweede deel van de thesis bestuderen we de uitbreiding van de ontwikkelde domeindecompositiemethode naar niet-aansluitende roosters en concentreren we ons vooral op discretisatietechnieken en foutenanalyse. In het geval van overlappende niet-aansluitende roosters is informatieoverdracht van het ene rooster naar het andere rooster niet triviaal omdat er geen globale discretisatie is waarvan deze informatieoverdracht zou kunnen afgeleid worden. We bestuderen interpolatieformules en gewijzigde discretisatieschema s om een consistente en globaal tweede orde nauwkeurige discretisatie te bekomen. We beschouwen ook de mortelprojectie als interpolatietechniek en als een alternatief voor interpolatie, stellen we een koppelingstechniek voor gebaseerd op een eindige-differentiediscretisatie.

Preface We re supposed to research our subject, write it up and present it to the class with a visual aid. 1 This thesis is the result of nearly five years of research, but it is clear that these five years resulted in a lot more than this thesis alone. First of all I would like to thank my thesis advisor, Prof. D. Roose, for the freedom I enjoyed while doing the research for this thesis. One of the most remarkable things I learned from him is how to handle deadlines. His good words and his signature have proved to be very useful on several applications. I enjoyed the collaboration with K. H. Tan (April 1st June 21st, 1996) at the Waterloopkunding Laboratorium Delft Hydraulics (Delft, The Netherlands) and would like to thank Prof. G. Stelling for making this visit possible and E. de Goede for his help with the software. I would also like to thank R. W. Freund for bringing quasi kernel polynomials to my attention and I am grateful to H. A. Van der Vorst for his valuable suggestions, which resulted in several improvements in Chapter 4. I spent some time (July 16th August 27th, 1997, August 24th September 23th, 1998 and July 26th August 20th, 1999) at the Department of Computer Science of the University of Colorado at Boulder (U.S.A.). I am very grateful to Prof. X.-C. Cai, not only for inviting me to Boulder and for the many discussions we had on nonmatching grids methods, but also for accepting to be my second thesis advisor. Prof. D. Keyes invited me to the Department of Computer Science of the Old Dominion University (U.S.A.) and to the Institute for Computer Applications in Science and Engineering (ICASE) at NASA Langley Research Center (U.S.A.). I still remember his enthusiastic reaction after my presentation at the Ninth International Conference on Domain Decomposition in Norway. 1 Bill Watterson, Something under the bed is drooling (A Calvin and Hobbes Collection). vii

viii PREFACE I would like to thank Prof. R. Govaerts, Prof. R. Piessens, Prof. E. Toorman, Prof. S. Vandewalle and Prof. C. Vuik for reading this thesis and accepting to be members of the jury. The contribution of my family and friends is of course not visible in this thesis, but their support has been indispensable. Last but not least, I want to mention that living in the Kaboutermansstraat in Leuven has been very enjoyable the past few years. Serge Goossens June 2000

Acknowledgement Engineers and scientists can never earn as much as business executives and sales people. 2 This thesis presents research results of the Belgian Programme on Interuniversity Poles of Attraction, initiated by the Belgian State, Prime Minister s Office for Science, Technology and Culture (IUAP P4/2). The scientific responsibility rests with its authors. The research presented in this thesis is also supported by the Research Council K.U.Leuven (OT/94/16). The financial support by the Flemish Institute for the Promotion of Scientific and Technological Research in Industry (Vlaams Instituut voor de bevordering van het Wetenschappelijk Technologisch onderzoek in de industrie (I.W.T.)) in the form of specialisation scholarship is gratefully acknowledged. Part of the work for this thesis was carried out during a research visit (April 1st June 21st, 1996) to Waterloopkunding Laboratorium Delft Hydraulics (Delft, The Netherlands). The financial support for this visit by the E.C. MAST II Concerted Action Application of High Performance Computing Techniques for the Modeling of Marine Ecosystems (MMARIE) is gratefully acknowledged. Part of the work for this thesis was carried out during three research visits (July 16th August 27th, 1997, August 24th September 23th, 1998 and July 26th August 20th, 1999) to the Department of Computer Science of the University of Colorado at Boulder (U.S.A.). The financial support for these visits by the Fund for Scientific Research - Flanders (Fonds voor Wetenschappelijk Onderzoek - Vlaanderen (F.W.O.)) is gratefully acknowledged. 2 Dilbert s Salary statement. This theorem can be supported by simple mathematics, based on the following two postulates: knowledge is power (1) and time is money (2). As every engineer knows: Power = Work / Time. Now since Knowledge = Power (postulate 1) and Time = Money (postulate 2), we know that: Knowledge = Work / Money. Solving for Money, we get: Money = Work / Knowledge. Thus, as Knowledge approaches zero, Money approaches infinity, provided that even a very small amount of work is done. Conclusion: The less you know, the more (money) you make. ix

x ACKNOWLEDGEMENT The travel support by Vlaamse Leergangen Leuven is also gratefully acknowledged.

Nederlandse Samenvatting Krylov convergentieversnelling en domeindecompositiemethoden voor niet-aansluitende roosters Wat ik ook zeg of doe, de Euro blijft dalen. Misschien zeg ik beter helemaal niets meer. 3 Inhoudsopgave 1 Inleiding xii 2 Krylov-deelruimtemethoden xiv 3 Domeindecompositiemethoden xv 4 Ritz en Harmonische Ritz waarden uit Krylov-deelruimten xvi 4.1 Inleiding............................. xvii 4.2 Ritz Waarden en FOM Residu Veelterm............. xvii 4.3 Harmonische Ritz Waarden en GMRES Residu Veelterm... xviii 5 Geneste Krylov-deelruimtemethoden xviii 3 Wim Duisenberg, Voorzitter van de Europese Centrale Bank (ECB). xi

xii NEDERLANDSE SAMENVATTING 6 Krylov-deelruimtemethode voor de Ondiep-watervergelijkingen xx 7 Veralgemeende Additieve Schwarz Methode voor de Ondiep-watervergelijkingen xxi 7.1 Veralgemeende Additieve Schwarz Methode.......... xxi 7.2 Eigenwaardenspectrum en Convergentiegeschiedenis..... xxiii 8 Domeindecompositiemethoden voor niet-aansluitende roosters xxiv 8.1 Inleiding............................. xxiv 8.2 Samengesteld-rooster Differentiemethode........... xxiv 9 Mortel-projectie in Samengesteld-rooster Differentiemethode xxxii 10 Koppeling door Eindige Differentie Discretisatie xxxiii 11 Conclusies en suggesties voor toekomstig onderzoek xxxiv 11.1 Conclusies............................ xxxiv 11.2 Suggesties voor toekomstig onderzoek............. xxxv 1 Inleiding In deze thesis ontwikkelen we efficiënte numerieke oplossingsmethoden voor partiële differentiaalvergelijkingen, waarvoor we Krylov-deelruimtemethoden met domeindecompositiepreconditionering gebruiken. Hierbij is het de bedoeling een groot, ijl lineair stelsel Ax b op te lossen, waarin de matrix A de discretisatie van een partiële differentiaalvergelijking voorstelt. Deze vergelijking is gesteld op een domein dat gepartitioneerd is in verschillende deeldomeinen. Bij de domeindecompositiemethoden, die wij bestuderen, worden problemen op (overlappende) deelgebieden opgelost en wordt de koppeling tussen de deeldomeinen gerealiseerd aan de hand van randvoorwaarden op de randen van de deeldomeinen. Dit leidt tot een iteratief schema, de zgn. Schwarz iteratie. Deze techniek biedt voordelen in verband met modeleerflexibiliteit en maakt parallelle verwerking mogelijk. We gebruiken de domeindecompositiemethode als preconditioneringstechniek voor een Krylov-deelruimte iteratieve methode om de convergentie te versnellen. De stelsels lineaire vergelijkingen (bekomen na discretisatie en linearisatie) worden opgelost met een Krylov-deelruimte iteratieve methode, gebaseerd op de welbekende GMRES-methode. Om snelle convergentie te bekomen is het essentieel om deze iteratieve methode toe te passen op een gepreconditioneerd probleem. De preconditionering is gebaseerd op een additieve Schwarz domeindecompositiemethode. In vergelijking met globale preconditioneringstechnieken (zoals ILU e.d.) hebben domeindecompositiemethoden een aantal belangrijke

xiii voordelen: ze zijn gemakkelijk en efficiënt te parallelliseren; ze maken een aanzienlijke vereenvoudiging van problemen met een complexe geometrie mogelijk en ten slotte vertonen ze (samen met de aanverwante multi-rooster-methoden) superieur convergentiegedrag, d.w.z. dat de hoeveelheid rekenwerk om de oplossing te vinden, lineair evenredig is met het aantal vrijheidsgraden. Omwille van deze goede scaleerbaarheid vormen domeindecompositiemethoden (zeker wanneer ze gecombineerd worden met Krylov-deelruimtemethoden) de sleutel tot grootschalige numerieke simulaties. 1. Het eerste deel van de thesis behandelt het verbeteren van de convergentie van de iteratieve oplossingstechniek. (a) De domeindecompositiemethode kan ge-optimiseerd worden door een optimale koppeling tussen de deeldomeinen te bepalen. Dit gebeurt door randvoorwaarden op te leggen voor de deelproblemen. (b) Ritz en Harmonische Ritz waarden en de overeenkomstige vectoren worden bestudeerd om het convergentiegedrag van GMRES beter te begrijpen. (c) We stellen een verbeterde geneste Krylov-methode voor. Dit is een aantrekkelijke manier om bijna-optimale benaderingen uit een hoogdimensionale Krylov-deelruimte te berekenen terwijl de reken- en geheugenkost toch nog redelijk laag blijft. 2. In het tweede deel van de thesis bestuderen we de uitbreiding van de ontwikkelde domeindecompositiemethode naar niet-aansluitende roosters en concentreren we ons vooral op discretisatietechnieken en foutenanalyse. (a) In het geval van overlappende niet-aansluitende roosters is informatieoverdracht van het ene rooster naar het andere rooster niet triviaal omdat er geen globale discretisatie is waarvan deze informatieoverdracht zou kunnen afgeleid worden. We bestuderen interpolatieformules en gewijzigde discretisatieschema s om een consistente en globaal tweede orde nauwkeurige discretisatie te bekomen. (b) We beschouwen ook de mortel-projectie als interpolatietechniek. (c) Als een alternatief voor interpolatie, stellen we een koppelingstechniek voor gebaseerd op een eindige-differentie-discretisatie. De ontwikkelde methoden worden gebruikt voor het oplossen van de ondiepwatervergelijkingen. Deze vergelijkingen zijn afgeleid van de algemene Navier Stokes vergelijkingen en beschrijven de stroming van water in ondiepe gebieden, zoals rivieren, estuaria en zeeën zoals de Noordzee. Dit gebeurde in samenwerking met het Waterloopkundig Laboratorium Delft Hydraulics (Delft, Nederland).

xiv NEDERLANDSE SAMENVATTING 2 Krylov-deelruimtemethoden Discretisatie (en eventueel linearisatie) van partiële differentiaalvergelijkingen leidt tot grote, ijle lineaire stelsels, d.w.z. de matrix bevat zeer veel nulelementen. Iteratieve methoden om grote, ijle lineaire stelsels op te lossen worden steeds meer gebruikt. Vroeger werden directe methoden steeds verkozen boven iteratieve in realistische toepassingen en in commerciële software omwille van hun robuustheid en voorspelbaar gedrag (geen convergentieproblemen, nauwkeurigheid volledig bepaald door de machineprecisie en het conditiegetal). Ondertussen beschikken we over een aantal zeer efficiënte iteratieve methoden om lineaire stelsels op te lossen en is er een duidelijke verschuiving naar het gebruik van iteratieve technieken in toepassingsdomeinen, zoals numerieke stromingsmechanica, structuurmechanica, De ijlheid van de matrices is de belangrijkste motivatie om iteratieve methoden te gebruiken, omdat deze in staat zijn gebruik te maken van deze ijle structuur, terwijl directe methoden, zoals Gauss-eliminatie, veel last ondervinden van het zgn. invullen van nul-posities tijdens de factorisatie A LU. Discretisatie van 2D problemen leidt vaak tot een pentadiagonale matrix waarvan de bandbreedte evenredig is met 2n, waarbij n het aantal roosterpunten is per lijn. Ofschoon de matrix A slechts 5 diagonalen met niet-nul elementen bevat, zullen de onder- en bovendriehoeksmatrices L en U van de factorisatie A LU, toch elk n diagonalen met niet-nul elementen bevatten, waardoor het geheugengebruik vaak onaanvaardbaar stijgt. Iteratieve methoden hebben geen last van dit invuleffect, vermits deze methoden enkel de matrix A gebruiken in matrix-vector producten van de vorm Ax. Naast de klassieke iteratieve methoden, zoals de Gauss Seidel iteratie, is er op dit ogenblik heel wat belangstelling voor Krylov-deelruimte iteratieve methoden. In deze methoden wordt iteratief een basis berekend voor de Krylov-deelruimte en wordt een benaderende oplossing van het stelsel gezocht in deze ruimte, volgens een bepaald benaderingscriterium. De reeds lang gekende methode van de toegevoegde gradiënten is een Krylov-deelruimtemethode. Deze methode is erg efficiënt in geheugengebruik, maar kan slechts gebruikt worden voor symmetrische positief-definiete problemen. De veralgemeende minimale residu methode (GMRES) is een optimale Krylov-deelruimtemethode voor niet-symmetrische, niet-positief-definiete problemen, die echter veel geheugen vergt. Het grote voordeel van een Krylovdeelruimtemethode is dat ze door toepassingsmensen als zwarte doos gebruikt kan worden. Men kan kiezen uit een waaier methoden, waarbij de keuze gebaseerd wordt op een aantal eenvoudige criteria, zoals geheugengebruik en eigenschappen van de matrix, bv. symmetrisch positief-definiet zijn. Essentieel voor een snelle convergentie is wel het gebruik van een goede preconditionering. Preconditionering betekent dat men, in plaats van het stelsel Ax b, het stelsel AM 1 y b oplost, waarbij M een benadering van A voorstelt. De benadering x M 1 y wordt achteraf berekend door toepassing van de

xv preconditionering op de oplossing y van het gepreconditioneerde stelsel. Er wordt dan ook heel wat onderzoek gedaan naar goede preconditioneringstechnieken. Gekende voorbeelden zijn diagonaal- en ILU-preconditionering. Recent gaat de aandacht naar preconditionering gebaseerd op domeindecompositie. De combinatie van preconditionering en Krylov-deelruimtemethoden kan efficiënte en eenvoudige algoritmen leveren voor algemeen gebruik. Op dit ogenblik zijn deze Krylov-deelruimtemethoden competitief met de (klassieke) directe methoden. Dit is een geweldige vooruitgang vergeleken met vroegere iteratieve methoden, die geconstrueerd werden met bepaalde toepassingen in het achterhoofd en dus allerlei probleemafhankelijke parameters e.d. bevatten. Het belang en het succes van iteratieve methoden wordt duidelijk geïllustreerd door hun gebruik in softwarepakketten voor problemen uit de elasticiteitsleer en structuurmechanica. Tot voor kort waren deze softwarepakketten allen gebaseerd op directe methoden, vnl. frontale methoden, wat neerkomt op het toepassen van Gauss-eliminatie volgens een orde gedefinieerd door (golf)fronten die over de structuur lopen tijdens het eliminatieproces. Heden ten dage bevatten deze softwarepakketten ook iteratieve methoden, vooral Krylov-deelruimtemethoden. Vooral voor drie-dimensionale problemen zijn iteratieve technieken noodzakelijk. De huidige verwachting is dat we binnenkort regelmatig lineaire stelsels met 5 10 9 onbekenden zullen moeten oplossen. De benodigde rekentijd voor de meest economische directe methode, die momenteel bekend is, wordt geschat op 520 040 jaar, op voorwaarde dat de berekeningen kunnen uitgevoerd worden met een rekensnelheid van 1 Teraflop. Anderzijds bedraagt de benodigde rekentijd voor een algoritme gebaseerd op gepreconditioneerde toegevoegde gradiënten 575 seconden, indien dezelfde rekensnelheid kan gebruikt worden. In de praktijk zal de rekensnelheid voor de iteratieve methode zal wel iets lager zijn dan voor de directe. Bovendien zijn de geheugenvereisten van directe methoden veel te hoog voor dergelijke problemen. 3 Domeindecompositiemethoden Divide et impera is de filosofie achter het numeriek knip- en plakwerk dat met de term domeindecompositie aangeduid wordt. In 1870 publiceerde Schwarz een artikel dat ondertussen beschouwd wordt als het zaadje dat de domeindecompositieboom deed groeien. Schwarz was geboeid door de vraag of harmonische functies ook bestonden op gebieden met een niet-eenvoudige geometrie. Uitgaande van de kennis van het bestaan van harmonische functies op rechthoeken en cirkels, bewees hij dat harmonische functies ook bestaan op een gebied dat bestaat uit een rechthoek en een cirkel, die elkaar deels overlappen. Het bewijs dat hij hiervoor leverde gaf aanleiding tot een algoritme dat ondertussen gekend is als de alternerende Schwarz methode. Hierbij wordt het domein, waarop de partiële differentiaalvergelijking moet opgelost worden, opgesplitst in een aantal overlappende

xvi NEDERLANDSE SAMENVATTING deeldomeinen. Dit wordt geïllustreerd in figuur 3.1 voor twee deeldomeinen Ω 1 en Ω 2. Deze opsplitsing geeft aanleiding tot artificiële randen voor de deeldomeinen (Γ 1 voor Ω 1 en Γ 2 voor Ω 2 ). Om de differentiaalvergelijking op te lossen op een deeldomein, moet een artificiële randvoorwaarde op de artificiële rand gegeven worden. Startend met een schatting voor de oplossing op Γ 1 kan de differentiaalvergelijking opgelost worden op Ω 1, wat een schatting voor de oplossing levert op Γ 2. Deze schatting kan gebruikt worden als artificiële randvoorwaarde om de differentiaalvergelijking op te lossen op Ω 2. Dit leidt tot een iteratieve methode, die onder bepaalde voorwaarden convergeert naar de oplossing van het globale probleem. Indien de roosters in beide deeldomeinen op elkaar aansluiten (doorlopende roosterlijnen) kan de oorspronkelijke methode aangepast en geoptimaliseerd worden. Dit leidt tot de multiplicatieve Schwarz methode. Helaas is deze methode (in originele vorm) niet geschikt voor uitvoering op een parallelle machine. Een kleine wijziging aan dit algoritme maakt het mogelijk dat alle deeldomeinen tegelijkertijd behandeld worden, met het aantal deeldomeinen gelijk aan het aantal processoren. Deze parallelle variant wordt additieve Schwarz methode genoemd omdat de oplossing van het probleem over het hele domein ontstaat door de som te maken van (de uitbreidingen van) de oplossingen van alle deelproblemen. Op dit ogenblik zijn domeindecompositiemethoden ontwikkeld tot praktisch bruikbare algoritmen die frequent gebruikt worden in technisch wetenschappelijk rekenen. Domeindecompositiemethoden worden ook met succes gebruikt als goede preconditioneringstechnieken voor Krylov-deelruimtemethoden. 4 Ritz en Harmonische Ritz waarden uit Krylovdeelruimten Dit onderzoek werd verricht om schattingen van de eigenwaarden te bekomen tijdens het oplossen van het stelsel met de Krylov-deelruimte iteratieve methode. Op deze manier krijgen we een idee van het eigenwaardenspectrum van de gepreconditioneerde operator AM 1 voor grotere problemen. Voor grotere problemen kunnen we niet alle eigenwaarden van AM 1 berekenen omdat dit veel meer werk vraagt dan het oplossen van het stelsel. Voor een aantal kleine modelproblemen hebben we dit wel gedaan. We weten echter dat de meeste eigenwaarden van AM 1 gelijk zijn aan 1, omdat elke kolom die A en M gemeenschappelijk hebben, aanleiding geeft tot een eigenwaarde 1 voor AM 1. De overblijvende eigenwaarden, die niet in deze cluster zitten, zijn zgn. outliers en hiervoor kunnen goede benaderingen bekomen worden aan de hand van de Ritz en Harmonische Ritz waarden.

m xvii 4.1 Inleiding Het Arnoldi proces berekent een orthonormale basis voork m A r 0µen dus vormen de basisvectoren V v orthogonale matrix. Tijdens het orthogonalisatieproces worden de getallen m h i j berekend zodat de Hessenberg matrices H m h i jµ¾êm m en H m¾ê m 1µ m 1 λµ voldoen aan de fundamentele relatie AV m V m H m h m 1 mv m 1e H m V H m 1 (1) Zowel FOM als GMRES zoeken een benaderende oplossing ink m A r 0µ. Deze benadering kan geschreven worden als x ϕ m 1 Aµr 0, met ϕ m γ m 1λ m 1 γ 1 λ γ 0¾Èm 1 een reële veelterm van graad m 1µ. Het residu dat hiermee correspondeert is r b Ax I Aϕ m 1 Aµµr 0 ϕ m Aµr 0¾K 1 0µ m 1 A r (2) FOM kiest de benadering zodat het residu orthogonaal staat t.o.v.k m A r 0µ: Vm r H 0 AV m y mµ 0 H m y m βe m 2 (3) met β r 0 2. 1 GMRES minimaliseert de norm van het residu rgmres 2: r GMRES 2 V m 1 r H 0 AV m y mµ 2 βe 1 H m y 1 (4) De vector y m wordt berekend door het overgedetermineerde stelsel H m y m βe 1 op te lossen, bv. aan de hand van de normaalvergelijkingen: H m H H m y m H m H βe H m h 2 m 1 m f me H m y m βe (5) met f H m H m e m. 4.2 Ritz Waarden en FOM Residu Veelterm. 0µ ϑ mµ De klassieke Galerkin aanpak om benaderende eigenwaarden mµ 0 te berekenen is als volgt. Een benaderende eigenvector x V m y m wordt ink m A r 0µgezocht zodat het residu van de eigenwaardenvergelijking orthogonaal staat t.o.v.k m A r m Ax µxµ K m A r 0µ V m AV H m y m µv m y (6) De benaderende eigenwaarden worden gevonden als de eigenwaarden van H Vm H AV m. De Ritz waarden i zijn per definitie de eigenwaarden van deze matrix H m ; het zijn dus de gekende Arnoldi eigenwaardenschattingen. De FOMresiduveelterm ϕ FOM m λµis een veelvoud van de karakteristieke veelterm van H m. Dit impliceert dat de Ritz waarden de nulpunten van de FOM-residuveelterm zijn en dat ze deze methode volledig karakteriseren. 1 v 2 v m ¾Ên m een

xviii NEDERLANDSE SAMENVATTING 4.3 Harmonische Ritz Waarden en GMRES Residu Veelterm De Harmonische Ritz waarden ϑ mµ i zijn per definitie de omgekeerden van de (gewone) Ritz waarden van A 1 berekend uit AK m A r 0µ. De motivatie voor deze definitie is het feit dat de omgekeerden van de Harmonische Ritz waarden in het field of values van A 1 zitten, terwijl de Ritz waarden in dat van A zitten. De Harmonische Ritz waarden zijn benaderende eigenwaarden volgens het minimale residu criterium. Een benaderende eigenvector x V m y m wordt gezocht in K m A r 0µ. Het residu van de eigenwaardenvergelijking moet orthogonaal zijn m A r m mµ 0 0µ AV mµh AV m y m µv m y m (7) Met (2.16) vinden we de equivalente eigenwaardenproblemen H m H H m y m µhm H y H m h 2 m 1 m f me H m y m µy (8) We kunnen de norm van de rang-1 aanpassing in (4.15) afschatten (9) t.o.v. AK m A r 0µ Ax µxµ AK h 2 m 1 m f me H m 2 h 2 m 1 m σ min H mµ De Harmonische Ritz waarden zijn gelijk aan de Ritz waarden indien een invariante deelruimte gevonden is, omdat dan h m 1 m 0. Het zijn dan ook eigenwaarden van A. Vergelijking (4.17) toont aan dat de verschillen tussen de Harmonische Ritz waarden en de Ritz waarden alleen maar groot kunnen zijn als h m 1 m groot is en σ min H mµklein is. Dit is het geval wanneer GMRES stagnateert. Net zoals voor Ritz waarden en de FOM-residuveelterm, hebben we bewezen dat de Harmonische Ritz waarden de nulpunten van de GMRES-residuveelterm zijn, door aan te tonen dat deze laatste een veelvoud is van een karakteristieke veelterm van een matrix die als eigenwaarden deze Harmonische Ritz waarden heeft. 5 Geneste Krylov-deelruimtemethoden Om het stelsel Ax b op te lossen gebruiken we een Krylov-deelruimtemethode (meestal GMRES of FGMRES) met (7.1) als preconditioneringstechniek. Zoals hoger vermeld gebruiken we ook een Krylov-deelruimtemethode om de deelproblemen op te lossen, wat inhoudt dat we de inverse M i vervangen door p k M iµ. We bestuderen deze aanpak wanneer slechts 1 deeldomein gebruikt wordt, m.a.w. 1 de preconditionering wordt bekomen door het probleem benaderend op te lossen met een Krylov-deelruimtemethode. We spreken dan van geneste Krylovdeelruimtemethoden.

xix De stelling van Faber en Manteuffel leert ons dat we voor de meeste niet- Hermitische problemen geen korte recursiebetrekking kunnen vinden die de optimale benaderingen uit opeenvolgende Krylov-deelruimten genereert. Dit impliceert dat ofwel korte recursiebetrekkingen, zoals in BiCG, CGS, QMR, TFQMR, Bi-CGstab en BiCGstab(l), gebruikt worden ofwel wordt de optimaliteit behouden ten koste van hoge geheugenvereisten. In de praktijk worden herstarte of afgebroken varianten van optimale methoden, zoals GMRES, gebruikt. Onlangs werden twee geneste Krylov-deelruimte iteratieve methoden, FGMRES/GMRES en GMRESR, voorgesteld. Zowel FGMRES als GCR maken het mogelijk dat de preconditionering verschillend is in elke stap van de iteratie. GMRES is een veranderlijke preconditionering, omdat de geconstrueerde veelterm in elke stap anders kan zijn. GMRESR, voorgesteld door Van der Vorst en Vuik, is gebaseerd op de GCR (Generalized Conjugate Residual) methode beschreven door Eisenstat et al. We vermelden ook de Generalized Conjugate Gradient methode van Axelsson en Vassilevski die nauw verwant is met de GMRESR methode Van der Vorst en Vuik. Er zijn twee verschillende manieren om een geneste iteratie gebaseerd op FGMRES of GCR te bekomen. De eerste is gebaseerd op het residu van de benaderende oplossing in elke stap van de uitwendige iteratie en de tweede is gebaseerd op de laatste vector gegenereerd in het Arnoldi proces. Deze vector is eigenlijk ook een residuvector, namelijk de genormaliseerde residuvector van de geassocieerde Galerkin-projectiemethode. Vermits het residu gedefinieerd is als r j b Ax j, met x j de benaderende oplossing, is het duidelijk dat indien de oplossing van het stelsel Az r j (10) gevonden kan worden, de oplossing van het oorspronkelijke stelsel verkregen kan worden als x x j z. Deze residu-gebaseerde aanpak is terug te vinden in GMRESR, waar GCR gebruikt wordt in de uitwendige iteratie en GMRES in de inwendige. Het is eenvoudig aan te tonen dat als de preconditionering exact is in een stap, dit wil zeggen als de inwendige iteratie het stelsel Az v j (11) exact oplost, een minimale residu methode (zoals FGMRES) de exacte oplossing van het originele probleem vindt. De zoekrichtingen in deze methoden zijn verschillend, maar het convergentiegedrag is vergelijkbaar. Het doel is quasi-optimale benaderingen te berekenen en slechts een beperkt aantal vectoren te moeten opslaan. Deze methoden kunnen verbeterd worden door op te merken dat het rechterlid van de inwendige iteratie orthogonaal is ten opzichte van een deelruimte, gegeneerd in de uitwendige iteratie. Het is dus wenselijk in de inwendige iteratie te

xx NEDERLANDSE SAMENVATTING orthogonaliseren ten opzichte van deze deelruimte, wat de convergentie versnelt. Dit leidt tot onze FGMRES/EGMRES methode en tot GCRO. Voor een zelfde aantal matrix-vectorvermenigvuldigingen leiden deze methoden altijd tot een betere oplossing dan de originele methode zonder de extra inwendige orthogonalisaties. Deze geneste schema s kunnen stilvallen ( breakdown ) zonder dat de oplossing gevonden is. Ook de verbeterde schema s kunnen op deze manier stilvallen. Dit is duidelijk te zien in GCRO waar een singuliere matrix gebruikt wordt om een Krylov-deelruimte te construeren in de inwendige iteratie. Nu is dit fenomeen ( breakdown ) wel zeldzaam in de praktijk, vermits het zich pas kan voordoen nadat het aantal matrix-vectorvermenigvuldigingen groter is geworden dan de dimensie van de Krylov-deelruimte, met andere woorden nadat de inwendige iteratie de ganse Krylov-deelruimte doorlopen heeft. De klassieke aanpak van dit probleem ( breakdown ) is gebruik te maken van de LSQR zoekrichting, die altijd tot een afname van de norm van het residu leidt. Dit is in essentie slechts een stap van een algoritme gebaseerd op de normaalvergelijkingen. Het is genoegzaam bekend dat de normaalvergelijkingen slecht geconditioneerd kunnen zijn en dat de methoden die hierop gebaseerd zijn traag convergeren. Bovendien wordt het gebruik van de transpose van de matrix liever vermeden. Wij hebben een oplossing voor het breakdown probleem geconstrueerd die de transpose van de matrix niet vereist door een combinatie van FGMRES en GMRESR te gebruiken. In onze aanpak zorgen we ervoor dat het inwendig Arnoldi proces altijd verder gaat met de laatst berekende vector en dus zeker een component bevat uit de één-dimensionale ruimtek m 1 A r 0µÒK m A r 0µ, m.a.w. volgens A m b, waarbij m het totaal aantal matrix-vectorvermenigvuldigingen is. Op deze manier kunnen we de hele Krylov-deelruimte doorlopen en vermijden we het breakdown probleem dat in GCRO kan optreden. Door in de inwendige iteratie te projecteren op het residu, lossen we impliciet (5.1) op, zodat we het probleem vermijden dat zich voordoet wanneer er stagnatie optreedt en het residu geen component volgens v j heeft omdat in dit geval (5.2) oplossen natuurlijk niets helpt. 6 Krylov-deelruimtemethode voor de Ondiep-watervergelijkingen In de DELFT3D-FLOW software wordt tijdsintegratie uitgevoerd met een Alternating Operator Implicit (AOI) methode. Bij deze aanpak leidt de ordening van expliciete en impliciete stappen in elke tijdstap tot een stelsel vergelijkingen voor de waterstand. Tot voor kort werd dit stelsel opgelost met een Alternating Direction Implicit (ADI) iteratie, die niet (goed) meer convergeert voor grote tijdstappen en kleine roosterafstanden. We hebben een robuuste en efficiënte oplossingstechniek geïmplementeerd door een Krylov-deelruimte methode te gebruiken met de oorspronkelijke ADI

xxi methode als preconditioneringstechniek. Deze oplossingstechniek wordt ook gebruikt als de oplossingstechniek voor de deeldomeinen in een domeindecompositiemethode, die ook versneld wordt met behulp van een Krylov-deelruimte methode. In dit geval kunnen bepaalde vectoren van de deelruimte, geconstrueerd tijdens het oplossingsproces, gebruikt worden voor de oplossing van de volgende lineaire stelsels. Dit verhoogt uiteraard de efficiëntie van de methode. De gebruikte domeindecompositiemethode is een additieve preconditioneringstechniek en is dus bijzonder goed geschikt om aangewend te worden op een parallelle computer. 7 Veralgemeende Additieve Schwarz Methode voor de Ondiep-watervergelijkingen We beschrijven de domeindecompositiepreconditionering die we gebruiken bij de oplossing van het lineair stelsel Ax b. 7.1 Veralgemeende Additieve Schwarz Methode De gebruikte domeindecompositiepreconditionering is gebaseerd op een Veralgemeende Additieve Schwarz Methode (Generalised Additive Schwarz Method, GASM). We noteren de lineaire restrictie-operator die de componenten behorend tot deeldomein i selecteert, als R i : Ω Ω i. De matrix M i R i AR T i is de deelmatrix van de matrix A die betrekking heeft op deeldomein i. Het resultaat van het toepassen van de GASM kan geschreven worden als een som van de oplossingen van de onafhankelijke deelproblemen die tegelijkertijd kunnen opgelost worden, nl. (12) i 1 p M R T 1 i M i R i 1 We geven de structuur van de GASM voor het geval van twee deeldomeinen, gescheiden door de scheidingslijn Γ zoals getoond wordt in figuur 7.1. De uitbreiding naar meerdere deeldomeinen ligt voor de hand. De deeldomeinen worden uitgebreid tot een kleine overlapping bekomen wordt. Deze overlapping wordt zodanig gekozen dat de restrictie-operatoren kunnen gedefinieerd worden zonder de discretisatiemolecule te verdelen over de deeldomeinoperatoren M i (d.w.z. de overlapping en de restricties worden gedefinieerd zodat de differentiemolecule alleen maar punten gebruikt die in dit deeldomein aanwezig zijn). Dit is van belang bij parallelle verwerking, waarbij ieder deeldomein in het geheugen van een andere processor bewaard wordt. Figuur 7.2 illustreert het uitbreidingsproces. De punten in deeldomein Ω 1 zijn alleen verbonden met punten in Ω 1 of in Ω l door de discretisatiemolecule. Gelijkaardige uitspraken kunnen we doen voor punten in Ω l, Ω r en Ω 2. Dit leidt tot

xxii NEDERLANDSE SAMENVATTING een blokstructuur voor het stelsel lineaire vergelijkingen. Nadat de nodige overlapping verkregen is door uitbreiding, worden de (kleine) deeldomeinen Ω l en Ω r gedupliceerd in respectievelijk Ω l en Ω r. We verkrijgen dan een uitgebreid stelsel lineaire vergelijkingen, waarin we nog steeds de relatie tussen de overlappende onbekenden moeten specifiëren. De eenvoudigste manier is gewoon te stellen dat de waarden in de gedupliceerde deeldomeinen Ω l en Ω r kopieën moeten zijn van de originele deeldomeinen Ω l en Ω r ½. Dit is de zgn. Dirichlet-Dirichlet (DD) koppeling, omdat dit neerkomt op het opleggen van Dirichlet randvoorwaarden voor de deelproblemen. Het uitgebreide stelsel lineaire vergelijkingen met deze DDkoppeling kan als volgt geschreven worden: (13) ¼ A 11 A 1l 0 0 0 0 A l1 A ll A lr 0 0 0 0 0 I 0 I 0 0 I 0 I 0 0 0 0 0 A rl A rr A r2 0 0 0 0 A 2r A 22 ½ ¼ ζ 1 ζ l ζ r ζ l ζ r ζ 2 ½ ¼ f 1 f l 0 0 f r f 2 Snelle convergentie wordt bekomen door een goede splitsing van de uitgebreide Schwarz matrix te kiezen, in plaats van de overlapping groter te maken. De spectraalradius van de gepreconditioneerde operator AM 1, en dus de convergentie-eigenschappen van een Krylov-deelruimtemethode gepreconditioneerd met de GASM (7.1), kunnen verbeterd worden door het stelsel lineaire vergelijkingen te vermenigvuldigen met een goed gekozen, niet-singuliere matrix P. Dit kan geïnterpreteerd worden als het opleggen van meer algemene randvoorwaarden aan de scheidingslijn Γ. De deelmatrices C lr, C ll, C rr en C rl stellen de discretisatie van de koppelingsvergelijkingen (transmissievoorwaarden) voor en kunnen zodanig gekozen worden dat groepering ( clustering ) van de eigenwaarden van de gepreconditioneerde operator AM 1 bekomen wordt. Deze deelmatrices kunnen vrij gekozen worden onder de voorwaarde dat ½ (15) C C lr C ll C rr C rl (14) niet-singulier is. Deze voorwaarde impliceert dat de matrix P in (7.4) die (7.3) in (7.6) transformeert niet-singulier is. Op deze manier ontstaan de zgn. Lokaal Geoptimiseerde Blok Jacobi (LOBJ) preconditioneringmatrices, die gebaseerd zijn op het uitgebreide stelsel lineaire vergelijkingen Aζ f : ¼ A 11 A 1l 0 0 0 0 A l1 A ll A lr 0 0 0 0 C ll C lr C ll C lr 0 0 C rl C rr C rl C rr 0 0 0 0 A rl A rr A r2 0 0 0 0 A 2r A 22 ½ ¼ ζ 1 ζ l ζ r ζ l ζ r ζ 2 ½ ¼ f 1 f l 0 0 f r f 2

xxiii De Veralgemeende Additieve Schwarz Methode verschilt van de klassieke Additieve Schwarz Preconditioneringstechniek doordat de transmissievoorwaarden over de scheidingslijnen, d.w.z. de randvoorwaarden voor de deeldomeinproblemen, gekozen kunnen worden om spectrale eigenschappen van de gepreconditioneerde operator te verbeteren. We hebben ook aandacht besteed aan het benaderend oplossen van de deelproblemen in (7.1). Dit betekent dat het kleine stelsel met matrix M i dat in deeldomein Ω i opgelost moet worden, niet exact opgelost wordt, maar benaderend door een iteratieve methode te gebruiken en deze te stoppen wanneer een bepaalde tolerantie bereikt is of wanneer een voorafbepaald aantal iteratiestappen uitgevoerd is. 1 1 In (7.1) wordt de inverse M i vervangen door p k M iµ, een veelterm in M i die M i iµ benadert. De motivatie hiervoor is dat het niet nodig is de deelproblemen exact op te lossen als de randvoorwaarden op de artificiële randen nog niet juist zijn. Op deze manier kan veel rekentijd uitgespaard worden zonder dat de kwaliteit van de preconditionering M 1 afneemt. Er dient wel op gelet te worden dat p k M 1 een redelijke benadering van M i is, anders zal het aantal globale iteraties stijgen omdat we lokaal in de deeldomeinen te weinig werk doen. 7.2 Eigenwaardenspectrum en Convergentiegeschiedenis Informatie over het eigenwaardenspectrum maakt het mogelijk gepaste vectoren te selecteren die opgenomen kunnen worden in de benaderingsruimte, gebruikt in FGMRES (Flexible GMRES). Dit versnelt de iteratieve methode nog meer. Onlangs kreeg deze door ons ontwikkelde techniek navolging in het gebied van de niet-lineaire elasticiteitsberekeningen. We gebruiken de GASM als preconditioneringstechniek in een Krylov-deelruimtemethode en we onderzoeken de verbanden tussen de randvoorwaarden die opgelegd worden op de artificiële randen van de deeldomeinen en de eigenwaardenspectra van de gepreconditioneerde operator AM 1. Voor grotere problemen gebeurt dit aan de hand van de Ritz en Harmonische Ritz waarden. Voor kleine problemen kunnen we alle eigenwaarden van AM 1 berekenen. Met deze informatie is het mogelijk de convergentieversnelling te voorspellen. Bovendien kan de Krylov-deelruimtemethode nog versneld worden wanneer benaderingen van de eigenvectoren, overeenkomend met extreme eigenwaarden van AM 1 expliciet in de zoekruimte gebracht worden. Na het oplossen van het stelsel met GMRES berekenen we de Ritz waarden. Zo krijgen we informatie over de extreme eigenwaarden die aanwezig zijn in het spectrum van AM 1. Een typisch Ritz spectrum dat bekomen wordt wanneer we de veralgemeende additieve Schwarz preconditioneringsmatrix gebruiken, is afgebeeld in figuur 7.4. Kenmerkend voor dit spectrum is dat een groot aantal eigenwaarden in een groepje rond 1 liggen en dat een klein aantal geïsoleerde eigenwaarden duidelijk verwijderd zijn van deze groep. De eigenvectoren die overeenkomen met de buitenste eigenwaarden van dit spectrum zijn de componenten die

xxiv NEDERLANDSE SAMENVATTING verwijderd moeten worden uit het initieel residu, omdat die de snelle convergentie belemmeren. Ter vergelijking tonen we in figuur 7.3 het Ritz spectrum van de domeindecompositiemethode voor hetzelfde probleem wanneer Dirichlet-Dirichlet koppeling gebruikt wordt. Dit spectrum vertoont geen duidelijke scheiding tussen een aantal aan de rand gelegen eigenwaarden en een groep eigenwaarden rond 1. Erger nog, de eigenwaarden liggen verspreid over het open interval 0 2µen veel ervan liggen dicht tegen 0 of dicht tegen 2. Dit eigenwaardenspectrum verklaart de trage convergentie van de domeindecompositiemethode met Dirichlet-Dirichlet koppeling wanneer deze als oplossingstechniek gebruikt wordt. De spectraalradius van de matrix I AM 1µis bijna 1 en deze spectraalradius is een bovengrens voor de convergentiefactor. De convergentiegeschiedenis van FGMRES wordt getoond in de figuren 7.5 en 7.6. In deze berekeningen gebruiken we telkens 6 Ritz vectoren, berekend uit de zoekruimte die gebruikt werd voor de oplossing van het eerste stelsel. Deze 6 Ritz vectoren resulteren niet in een reductie van de norm van het residu, maar zorgen er wel voor dat de convergentie sneller is in de latere iteraties. 8 Domeindecompositiemethoden voor niet-aansluitende roosters 8.1 Inleiding We hebben een eindige-differentiemethode ontwikkeld met gewijzigde discretisatie aan de scheidingslijn die het gebruik van een lager dimensionale interpolatieoperator op de scheidingslijn mogelijk maakt. Het voordeel hiervan is dat de koppeling tussen de verschillende roosters minder rekenwerk vergt. De resultaten die hiermee behaald werden, tonen aan dat het mogelijk is een consistent en globaal tweede orde schema te bekomen op overlappende, niet-aansluitende roosters door gebruik te maken van een lokale koppeling met een lager dimensionale interpolatie die slechts 4 roosterpunten langs de scheidingslijn gebruikt. Dit is een verbetering ten opzichte van de klassieke theorie die een hoger dimensionale interpolatie vereist en dus uiteraard meer roosterpunten in de koppelingsvergelijkingen gebruikt. 8.2 Samengesteld-rooster Differentiemethode We geven een korte beschrijving van een samengesteld-rooster differentiemethode (Composite Mesh Difference Method, CMDM) voor het oplossen van de tweede orde elliptische partiële differentiaalvergelijkinglu f in Ω met een Dirichlet randvoorwaarde u g op Ω. Gegeven een domein Ω bestaande uit p nietoverlappende deeldomeinen Ω i zo dat Ω p Ω i 1 i, construeren we een rooster met roosterafstand h i in elk van de uitgebreide deeldomeinen Ω¼i van Ω i. Als gevolg

xxv van de uitbreidingen van de deeldomeinen overlappen deze roosters. We noteren Γ i Ω¼i Ω. i 2 Ω¼i Veronderstelling 8.1 De afbrekingsfout α i xµ L hi Lµu xµis orde r i : α i xµ C αi h r i i u r (16) De constante C αi is onafhankelijk van de roosterafstand h i is de Sobolev norm voor de ruimte W Ω¼iµ. k en u k Ω¼i Veronderstelling 8.2 De interpolatie-operatori i gebruikt alleen waarden van roosterpunten in j i Ω j en gebruikt geen waarden van i roosterpunten in Ω¼i. Veronderstelling 8.3 De interpolatiefout β i xµ u I i uµ xµis orde s i : β i xµ C βi h s i i u s i Ω Γ c (17) We hebben de interpolatie-operatori i alleen nodig in een gebied Ω Γ c i rond Γ c i. De interpolatieconstante σ i I i is de norm van de interpolatiematrix. De grootste interpolatieconstante is σ max i σ i. Voor lineaire interpolatie is σ i 1, terwijl voor kwadratische of cubische interpolatie geldt dat σ i 5 4 in 1D en σ i 25 16 in 2D. De globale discretisatie u h u h1 u h2 u hpµop het samengestelde rooster wordt bekomen door het koppelen van de locale discretisaties door te eisen dat de oplossing op één rooster overeenkomt met de interpolatie van de oplossingen op de naburige roosters. Het resulterende stelsel vergelijkingen bestaat uit p deelproblemen van de vorm L hi uhi fhi in Ω¼i, u hi g hi op Γ i, u hi z hi I i u h op Ω¼iÒΓ i. (18) uhi Ω¼i Ki fhi Ω¼i max ghi Γi zhi Ω¼iÒΓi De deelproblemen (8.6) moeten voldoen aan de volgende veronderstellingen. Veronderstelling 8.4 De lokale eindige differentie discretisaties (8.6) zijn stabiel in de maximum norm, m.a.w. er bestaat een constante K i onafhankelijk van h i zo dat (19) uhi Ωi ρi zhi Ω¼iÒΓi (20) Veronderstelling 8.5 De discretisaties (8.6) voldoen aan een sterk discreet maximum principe, d.w.z. de oplossing u hi van (8.6) met f hi 0 en g hi 0 beperkt tot Ω i voldoet aan

xxvi NEDERLANDSE SAMENVATTING De contractiefactor 0 ρ i 1 σµ 1 is een maat voor de reductie van de fout. Veronderstelling 8.6 Het product van de interpolatieconstante en de contractiefactor is kleiner dan 1 τ max i ρ i (21) Globale Foutenanalyse Onder deze voorwaarden kan de stabiliteit van het samengestelde schema bewezen worden en verkrijgen we de volgende foutengrens. Stelling 8.1 De fout van de discrete oplossing voldoet aan p hi 1 σ τ p (22) i 1 e 1 Schwarz Alternerende Methode Het resulterende stelsel kan opgelost worden door een iteratie waarbij de p deelproblemen (8.6) gelijktijdig en onafhankelijk van elkaar opgelost worden. De convergentiefactor van deze iteratie is begrensd door de contractiefactor τ. Stelling 8.2 De rij u nµ d u nµ d u 0µ hµ h convergeert naar de exacte discrete oplossing u h en n h u (23) De afstand wordt gedefinieerd als d w h v hµ max i w v hi Ω¼i. h u hµ τ i K i α i p i 1 i 1 β hi Dit is een parallelle variant van de Schwarz alternerende methode. We gebruiken dit natuurlijk als een preconditioneringstechniek in een Krylov-deelruimtemethode. Consistente Interpolatie De volgende definitie van consistente interpolatie bevat een belangrijke voorwaarde voor de combinaties van discretisatie- en interpolatieformules. Definitie 8.1 Stel dati i de interpolatie-operator van Ω Γ c i naar Γ c i is, en datl de differentiaaloperator is die benaderd wordt door een eindige differentie-operator D i L hi I iµ, die afhankelijk is van de gewone eindige iµ differentie-operatorl hi en vani i. We zeggen dat het discretisatie en interpolatie paar consistent op Ω¼h i is, als L D i L hi I iµµu xµ O h (24) voor alle x¾ω¼h i. Vergelijking (8.22) stelt dat de afbrekingsfout van het gecombineerde discretisatie en interpolatie paar, naar 0 moet gaan als de roosterafstand h i naar 0 gaat.