From fe51cafa2109d7a8522732bf2c13280abfb90091 Mon Sep 17 00:00:00 2001
From: Oliver Sander <oliver.sander@tu-dresden.de>
Date: Mon, 12 Jul 2021 16:06:21 +0200
Subject: [PATCH] Erste Skizze: Nichtlineare Schwarz-Verfahren

---
 skript-mehrgitter-sander.bib |  10 +
 skript-mehrgitter-sander.tex | 421 ++++++++++++++++++++++++++++++++++-
 2 files changed, 427 insertions(+), 4 deletions(-)

diff --git a/skript-mehrgitter-sander.bib b/skript-mehrgitter-sander.bib
index a7e6403..372b475 100644
--- a/skript-mehrgitter-sander.bib
+++ b/skript-mehrgitter-sander.bib
@@ -183,3 +183,13 @@ year = {2013}
   journal={Mathematics of computation},
   year={1999}
 }
+
+@Article{carstensen:1997,
+ author = {Carsten Carstensen},
+ title = {Domain Decomposition for a Non-smooth Convex Minimization Problem and its Application to Plasticity},
+ journal = {Numer. Linear Algebra Appl.},
+ year = {1997},
+ volume = {4},
+ number = {3},
+ pages = {177--190}
+}
diff --git a/skript-mehrgitter-sander.tex b/skript-mehrgitter-sander.tex
index ab7f7e4..d3d6dac 100644
--- a/skript-mehrgitter-sander.tex
+++ b/skript-mehrgitter-sander.tex
@@ -9663,25 +9663,438 @@ Nédélec-Element benötigt.
 Damit haben wir gezeigt, dass die Zerlegung über die Ecken bzw. Kanten eines Gitters die Bedingungen für die Konvergenz von Mehrgittermethoden erfüllen.
 
 
+\chapter{Nichtlineare Gleichungen}
 
+Mehrgitterverfahren funktionieren auch für manche nichtlinearen Probleme, aber die Theorie
+dahinter ist viel weniger gut verstanden.
 
+\medskip
+Es gibt prinzipiell zwei unterschiedliche Ansätze:
+\begin{enumerate}
+ \item Löse das Problem durch ein Newton(-artiges) Verfahren, d.h.\ approximiere es
+  durch eine Folge von linearen Problemen.  Löse diese linearen Probleme mit einem
+  Mehrgitterverfahren.
 
+ \item Wende das Mehrgitterverfahren direkt auf das nichtlineare Problem an.
+\end{enumerate}
 
+Ansatz 1)\todo{fest verdrahtet!} funktioniert häufig nicht schlecht, aber Ansatz~2
+ist konzeptionell interessanter.  Wir beschäftigen uns hier deshalb nur mit Ansatz~2.
 
-\chapter{Mehrgitter für DG-Verfahren}
 
+\section{Nichtlineare Teilraumkorrekturverfahren}
 
-\chapter{Algebraische Mehrgitterverfahren}
+Die grundlegende Idee der Mehrgitterverfahren ändert sich für nichtlineare Probleme nicht:
+\begin{itemize}
+ \item Ein einfaches nichtlineares Verfahren entfernt die hochfrequenten Anteile
+  des Fehlers.
+ \item Die niederfrequenten Anteile können auf einem gröberen Gitter behandelt werden.
+\end{itemize}
 
+Wie sehen nichtlineare Glätter aus?
 
-\chapter{Nichtlineare Gleichungen}
+\medskip
+
+Bisher haben wir Probleme der folgenden Art betrachtet: Finde ein $x \in X$
+so dass
+\begin{equation*}
+ a(x,y) = (f,y)
+ \qquad
+ \forall y \in X.
+\end{equation*}
+Dabei war $a(\cdot,\cdot) : X \times X \to \R$ linear in beiden Argumenten.
+
+\medskip
+
+Im Folgenden betrachten wir wieder Probleme der Bauart
+\begin{equation}
+\label{eq:generic_nonlinear_problem}
+ a(x,y) = (f,y)
+ \qquad
+ \forall y \in X,
+\end{equation}
+aber $a(\cdot,\cdot)$ darf jetzt nichtlinear \emph{im ersten Argument} sein.
+
+\begin{example}
+ Die $p$-Laplace-Gleichung ist
+ \begin{equation*}
+  - \div (\abs{\nabla u}^{p-2} \nabla u) = 0.
+ \end{equation*}
+ Testen mit einer Funktion $\varphi$ ergibt
+ \begin{equation*}
+  \int_\Omega \abs{\nabla u}^{p-2} \langle \nabla u, \nabla \varphi \rangle = \text{Randterme}.
+ \end{equation*}
+ Die ist ein Problem der Art~\eqref{eq:generic_nonlinear_problem}, und die Form $a(u,\varphi)$ ist linear in $\varphi$.
+\end{example}
+
+Wir konstruieren jetzt Schwarz-Verfahren für das nichtlineare Problem~\eqref{eq:generic_nonlinear_problem}.
+Sei dafür wieder $\{X_i\}_{i=1}^n$ eine Zerlegung von $X$ in Teilräume, nicht
+notwendigerweise direkt.
+
+\medskip
+
+Schwarz-Verfahren für lineare Gleichungen bestanden daraus, dass wir die Defektgleichung
+\todo{Prüfen!}
+\begin{equation}
+\label{eq:schwache_nichtlineare_defektgleichung}
+ a(c,w) = (f,w) - a(u^k,w)
+ \qquad
+ \forall w \in \X_i
+\end{equation}
+in einem Teilraum $X_i$ gelöst haben, und das Ergebnis $c \in X_i$ als Korrektur benutzt haben:
+\begin{equation*}
+ u^{k+1} = u^k + c.
+\end{equation*}
+Verschiedene Reihenfolgen und Kombinationen von Teilräumen ergaben die verschiedenen
+Schwarz-Verfahren.
+
+\bigskip
+
+Im linearen Fall konnte man die Defektgleichung~\eqref{eq:schwache_nichtlineare_defektgleichung}
+als $a(\cdot,\cdot)$-orthogonale Projektion des Fehlers $u^* - u^k$ auf den Teilraum $X_i$
+interpretieren.  Das geht jetzt nicht mehr.
+
+\medskip
+
+Ansonsten kann man aber die Schwarz-Verfahren auch für nichtlineare Probleme durchführen.
+\begin{itemize}
+ \item Die Teilprobleme~\eqref{eq:schwache_nichtlineare_defektgleichung} löst man dann
+  z.B.\ mit einem Newton-Löser.
+
+ \item Wobei natürlich im allgemeinen Fall völlig unklar ist ob es überhaupt eine
+  Lösung gibt.  Oder vielleicht gleich mehrere.
+\end{itemize}
+
+Wir  würden jetzt gerne wissen unter welchen Bedingungen solche Schwarz-Verfahren
+konvergieren, und ob sie immer noch Glättungseigenschaften haben.
+
+\medskip
+
+Rigorose Ergebnisse gibt es allerdings nur in wenigen Spezialfällen.
+Das Folgende stammt aus einem Artikel von \citet{carstensen:1997}.
+
+\medskip
+
+In gewissem Sinne handelt es sich um die einfachsten nichtlinearen Probleme.
+
+\todo[inline]{Erklären dass manche Probleme Minimierungsprobleme sind.}
+
+Sei $\phi : X \to \R$ ein Fréchet-differenzierbares Funktional mit
+uniform-elliptischer und Lipschitz-stetiger Fréchet-Ableitung $D\phi$.
+
+\medskip
+
+Das bedeutet dass es zwei Konstanten $0 < \alpha, L < \infty$ gibt so dass
+für alle $u,v \in X$
+\begin{align*}
+ \alpha \norm{u-v}_X^2 + D\phi(u)(v-u) & \le \phi(v) - \phi(u) \\
+ \norm{D\phi(u)(\cdot) - D\phi(v)(\cdot)}_{X^*} & \le L \norm{u-v}_X.
+\end{align*}
+
+\begin{exercise}
+ Zeigen Sie: Aus der ersten Bedingung folgt dass $\phi$ \emph{stark konvex} ist,
+ dass also
+ \begin{equation*}
+  (1-t)\phi(v_1) + t\phi(v_2)
+  \ge
+  \phi((1-t)v_1 + tv_2) + t(1-t)\frac{\alpha}{2} \norm{v_1 -v_2}^2
+ \end{equation*}
+ für alle $v_1, v_2 \in X$ und alle $t \in [0,1]$.
+ \todo[inline]{Bin nicht sicher ob $\alpha$ oder $\frac{\alpha}{2}$ richtig ist.}
+\end{exercise}
+
+Gesucht ist jetzt der eindeutige Minimierer von $\phi$ über $X$.
+
+\bigskip
+
+Das eben beschriebene Szenario beinhaltet schon ein paar interessante Probleme,
+aber wir betrachten dennoch einen etwas allgemeineren Fall.
+
+\medskip
+
+Sei jetzt $J : X \to \R \cup \{ \infty \}$ von der Form
+\begin{equation*}
+ J = \phi + \psi
+\end{equation*}
+mit $\phi$ wie oben.
+
+\medskip
+
+Ja, wir lassen tatsächlich Funktionwerte $\infty$ zu!  In der konvexen Analysis
+ist das gang und gäbe.
+
+\medskip
+
+Das Funktional $\psi : X \to \R \cup \{ \infty \}$ soll konvex und unterhalbstetig
+sein.  Weiterhin soll es separierbar bzgl.\ den Teilräumen $X_i$ sein.
+Damit meinen wir dass für alle $(x_1,\dots,x_N) \in X_1 \times \dots X_N$
+\begin{equation*}
+ \psi \Big( \sum_{j=1}^N x_j\Big) = \sum_{j=1}^N \psi(x_j).
+\end{equation*}
+Außerdem brauchen wir dass für alle $x_j \in X_j$ und $y_j \in \sum_{k=1,k\neq j}^N X_k$
+\begin{equation*}
+ \psi(x_j + P_j y_j) = \psi(x_j).
+\end{equation*}
+\todo[inline]{Definieren $P_j$!}
+\todo[inline]{Diese Bedingung besser erklären!}
+
+\bigskip
+
+Wir betrachten das folgende multiplikative Schwarz-Verfahren.
+
+\begin{itemize}
+ \item Sei $u_j \in X$ die aktuelle Iterierte.
+
+ \item Für alle $j=1,\dots, N$
+  \begin{equation*}
+   u_{n + \frac{j}{N}} = \argmin_{v \in u_{n+\frac{j-1}{N}} + X_j} J(v).
+  \end{equation*}
+\end{itemize}
+
+\begin{exercise}
+ Zeige: Wenn $J$ quadratisch ist, also
+ \begin{equation*}
+  J(v) = \frac{1}{2} a(v,v) - (f,v)
+ \end{equation*}
+ mit einer symmetrischen, elliptischen Bilinearform $a(\cdot,\cdot)$,
+ dann erhält man genau das multiplikative Schwarz-Verfahren aus Kapitel~\ref{}.
+\end{exercise}
+
+Da $J$ strikt konvex und koerzitiv ist hat jedes der lokalen Minimierungsprobleme
+eine eindeutige Lösung.  Der Algorithmus ist also durchführbar.
+
+\begin{exercise}
+ Zeigen Sie dass $J$ koerzitiv ist.
+\end{exercise}
+
+
+\begin{theorem}
+ Sei $u$ der Minimierer von $J$ in $X$, uns sei $(u_\nu)$ die durch das Schwarz-Verfahren
+ erzeugte Folge mit Startwert $u_0$.  Setze
+ \begin{align*}
+  q & \colonequals \frac{\gamma}{1+\gamma} \\
+  \gamma & \colonequals N C_X^2 L^2 \frac{1}{2\alpha^2} \\
+  C_0    & \colonequals 2(1+\gamma)\alpha^{-1} (J(u_0) - J(u)).
+ \end{align*}
+ Dann gilt
+ \begin{equation*}
+  \norm{u - u_\nu}_X^2 \le C_0 q^\nu.
+ \end{equation*}
+\end{theorem}
+
+Einen Beweis für den glatten Fall $\psi = 0$ findet sich bei
+\citet[Theorem~I.3]{lions}.
+
+\begin{proof}
+ \begin{itemize}
+  \item Sei $\nu = n + \frac{j}{N} \ge 1$.
+
+  \item Nach Konstruktion ist $u_\nu$ der Minimierer von $J$ in $X_j$.
+
+  \item Deshalb hat $J(\cdot + u_\nu)|_{X_j}$ sein Minimum in $0$.
+
+  \item Sei $\partial J$ das Subdifferential von $J$.
+  \todo[inline]{Das müssen wir definieren...}
+
+  \item Es ist $0 \in \partial J(u_\nu)|_{X_j}$, und deshalb\todo{Warum?}
+  \begin{equation*}
+   D\phi(u_\nu)(\eta) \le \psi(u_\nu - \eta) - \psi(u_\nu)
+   \qquad
+   \forall \eta \in X_j.
+  \end{equation*}
+
+  \item Zusammen mit der Elliptizität von $D\phi$ erhalten wir
+  \begin{align*}
+   \alpha \norm{u_\nu - u_{\nu - \frac{1}{N}}}^2
+   & \le
+   \phi(u_{\nu - \frac{1}{N}}) - \phi(u_\nu) + D\phi(u_\nu)(u_\nu - u_{\nu - \frac{1}{N}}) \\
+   & \le
+   \phi(u_{\nu - \frac{1}{N}}) - \phi(u_\nu) + \psi(u_{\nu - \frac{1}{N}}) - \psi(u_\nu) \\
+   & =
+   J(u_{\nu - \frac{1}{N}}) - J(u_\nu).
+  \end{align*}
+
+ \end{itemize}
+
+Jetzt nutzen wir die Zerlegung in Teilräume, und zerlegen den Fehler
+\begin{equation*}
+ u_\nu - u = \sum_{k = j - N+1}^j P_k(u_\nu - u).
+\end{equation*}
+Dabei sind die Indizes mod $N$ zu verstehen.
+
+\medskip
+
+Sei $k \in \{ j - N+1, \dots, j\}$.
+
+Wir rechnen
+\begin{align*}
+ D\phi(u_{n+\frac{k}{N}})(\sum_{m = j-N+1}^k P_m(u_\nu - u))
+ & =
+ D\phi(u_{n+\frac{k}{N}})(\sum_{m = j-N+1}^{k-1} P_m(u_\nu - u))
+    + D\phi(u_{n+\frac{k}{N}})(P_k(u_\nu - u)) \\
+    & \text{(wegen Linearität von $D\phi$ im zweiten Argument)} \\
+ & \le
+ D\phi(u_{n+\frac{k}{N}})(\sum_{m = j-N+1}^{k-1} P_m(u_\nu - u))
+    + \psi(u_{n + \frac{k}{N}} - P_k(u_\nu - u)) \\
+    & \qquad - \psi(u_{n + \frac{k}{N}}).
+\end{align*}
+
+Indem wir diese Abschätzung nacheinander für $k=j, j-1, \dots, j-N+1$
+anwenden bekommen wir
+\begin{multline*}
+ D\phi(u_\nu)(u_\nu - u)
+ \le
+ \sum_{k=j-N+1}^j \Big( \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n+\frac{k}{N}})\Big) \\
+ +
+ \sum_{k=j-N+1}^j \Big(D\phi(u_{n+\frac{k}{N}})(\cdot) - D\phi(u_{n+\frac{k-1}{N}})(\cdot)\Big)
+ \Big(\sum_{m=j-N+1}^{k-1} P_m(u_\nu - u)\Big)
+\end{multline*}
+Das schätzen wir weiter ab, und erhalten
+\begin{align*}
+ D\phi(u_\nu)(u_\nu - u)
+ & \le
+ \sum_{k=j-N+1}^j \Big( \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n+\frac{k}{N}})\Big) \\
+ & +
+ \Bigg|\sum_{k=j-N+1}^j \Big(D\phi(u_{n+\frac{k}{N}})(\cdot) - D\phi(u_{n+\frac{k-1}{N}})(\cdot)\Big)
+ \Big(\sum_{m=j-N+1}^{k-1} P_m(u_\nu - u)\Big) \Bigg| \\
+ & \le
+ \sum_{k=j-N+1}^j \Big( \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n+\frac{k}{N}})\Big) \\
+  & +
+ L\sum_{k=j-N+1}^j \norm{u_{n+\frac{k}{N}} - u_{n+\frac{k-1}{N}}}_{X^*}
+ \qquad (\text{Lipschitz-Stetigkeit von $D\phi$}) \\
+ & \cdot C_X \norm{u_\nu - u}
+ \qquad (\text{Stabilität der Zerlegung $\{X_i\}$})
+\end{align*}
+
+\paragraph{Nächster Teilschritt} \mbox{}
+
+Als nächstes schätzen wir den nichtglatten Term
+\begin{equation*}
+ \sum_{k=j-N+1}^j \Big( \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n+\frac{k}{N}})\Big)
+\end{equation*}
+ab.  Dazu nutzen wir die Separabilität von $\psi$.
+
+\medskip
+
+Nach Konstruktion des Algorithmus ist
+\begin{equation*}
+ u_nu - u_{n+\frac{k}{N}}
+ \in
+ \sum_{m=k+1}^j X_m
+ \qquad
+ \forall k \in \{ j-N+1, \dots, j\}.
+\end{equation*}
+
+Wegen der Separierbarkeit~\eqref{} erhält man
+\begin{equation*}
+ \psi(P_k(u_{n+\frac{k}{N}} - u_\nu) + P_k u) = \psi(P_k u)
+\end{equation*}
+und
+\begin{equation*}
+ \psi(P_k(u_{n+\frac{k}{N}})) = \psi(P_k u_\nu).
+\end{equation*}
+
+Jetzt schauen wir uns einen Summanden von~\eqref{} an:
+\begin{align*}
+ \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n + \frac{k}{N}})
+ & =
+ \psi(\sum_{m=j-N+1}^j P_m (u_{n+\frac{k}{N}} - P_k(u_\nu - u))) - \psi(\sum_{m=j-N+1}^j P_m u_{n + \frac{k}{N}}) \\
+ & =
+ \sum_{m=j-N+1}^j\psi( P_m (u_{n+\frac{k}{N}} - P_k(u_\nu - u))) - \sum_{m=j-N+1}^j \psi(P_m u_{n + \frac{k}{N}}) \\
+ & \qquad (\text{Separierbarkeit})
+\end{align*}
+Wegen [2.8] erhält man
+\begin{equation*}
+ = \psi( P_k u_{n+\frac{k}{N}} - P_k P_k(u_\nu - u)) - \psi(P_k u_{n + \frac{k}{N}})
+\end{equation*}
+
+Wegen [3.7] erhält man
+\begin{equation*}
+ \psi(u_{n+\frac{k}{N}} - P_k(u_\nu - u)) - \psi(u_{n + \frac{k}{N}})
+ =
+ \psi(\P_k u) - \psi(P_k u_\nu).
+\end{equation*}
+
+\paragraph{Nächster Teilschritt} \mbox{}
+
+Das bauen wir in [3.5] ein.  [3.5] sagt
+\begin{multline*}
+ D\phi(u_\nu)(u_\nu - u)
+ \le
+ C_X L \norm{u - u_\nu}_X \cdot \sum_{k=j-N+1}^j \norm{u_{n+\frac{k}{N}} - u_{n+\frac{k-1}{N}}}_X \\
+ +
+ \sum_{k=j-N+1}^j (\psi(u_{n+\frac{k}{N}} - P_k(u_\nu -u)) - \psi(u_{n+\frac{k}{N}})).
+\end{multline*}
+Mit der Abschätzung für $\psi$ ergibt das
+\begin{multline*}
+ D\phi(u_\nu)(u_\nu - u)
+ \le
+ C_X L \norm{u - u_\nu}_X \cdot \sum_{k=j-N+1}^j \norm{u_{n+\frac{k}{N}} - u_{n+\frac{k-1}{N}}}_X \\
+ +
+ \underbrace{\sum_{k=j-N+1}^j (\psi(P_ku) - \psi(P_k u_\nu))}_{=\psi(u) - \psi(u_\nu), \text{wegen ???}}.
+\end{multline*}
+Wegen~\eqref{} wiederum ist
+\begin{equation*}
+ \norm{u_{n + \frac{k}{N}} - u_{n + \frac{k-1}{N}}}^2
+ \le
+ \frac{1}{\alpha} \Big( f(u_{n + \frac{k-1}{N}}) - f(u_{n + \frac{k}{N}})\Big),
+\end{equation*}
+und deshalb
+\begin{equation*}
+ D\phi(u_\nu)(u_\nu - u)
+ \le
+ C_X L \frac{1}{\sqrt{\alpha}}
+ \sum_{k=j-N+1}^j \Big( f(u_{n + \frac{k-1}{N}}) - f(u_{n + \frac{k}{N}}) \Big)^\frac{1}{2}.
+\end{equation*}
+Schreibe zur Abkürzung
+\begin{equation*}
+ \delta_\mu \colonequals f(u_\mu) - f(u)
+ \qquad \text{und} \qquad
+ \epsilon_\mu \colonequals \norm{u-u_\mu}_X.
+\end{equation*}
+
+Dann erhält man
+\begin{align*}
+ \alpha \epsilon_\nu^2 + \delta_\nu
+ & \le
+ C_X L \alpha^{-1/2} \epsilon_\nu \cdot
+   \sum_{\mu = \nu -1 + \frac{1}{N}} (\delta_{\mu - \frac{1}{N}} - \delta_\mu)^{1/2} \\
+ %
+ & \le
+ \gamma (\delta_{\nu-1} - \delta_\nu) + \frac{1}{2} \alpha \epsilon_\nu^2.
+\end{align*}
+Daraus wiederum folgt
+\begin{equation*}
+ \frac{\alpha}{2(1+\gamma)} \cdot \epsilon^2_\nu + \delta_\nu
+ \le
+ q \cdot \delta_{\nu-1}.
+\end{equation*}
+Daraus folgt zum einen
+\begin{equation*}
+ \delta_\nu \le \delta_0 \cdot q^{[\nu]}
+\end{equation*}
+\todo[inline]{Carstensen sagt nicht was er mit den eckigen Klammern meint...}
+und zu zum anderen die Behauptung
+\begin{equation*}
+ \norm{u - u_\nu}_X^2 \le C_0 \cdot q^{[\nu]}.
+ \qedhere
+\end{equation*}
+
+\end{proof}
 
-\section{Nichtlineare Teilraumkorrekturverfahren}
 
 \section{Das Full Approximation Scheme (FAS)}
 
 \section{Abgeschnittenes Newton-Mehrgitter (TNNMG)}
 
+
+
+\chapter{Mehrgitter für DG-Verfahren}
+
+
+\chapter{Algebraische Mehrgitterverfahren}
+
+
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 \printbibliography
 
-- 
GitLab