Solving the systems of operator equations by iterative methods

Abstract

Let \(X,Y\) be two Banach spaces and \(Z=X\times Y\). We consider the system of nonlinear equations \[x=\varphi \left( x,y\right),\\ y=\psi \left(x,y\right),\] where \(\varphi:Z\rightarrow X\), \(\psi:Z\rightarrow Y\). Assuming that \(\varphi\) and \(\psi \ \) satisfy Lipschitz conditions we study the convergence of the Gauss-Seidel type method \[x_{n}=\varphi \left(x_{n-1},y_{n-1}\right), \\ y_{n}=\psi \left( x_{n},y_{n-1}\right) .\] The obtained result is applied to the solving of a linear system, for which the matrix is splitted in four submatrices. We illustrate the obtained results for some numerical examples.

Authors

Ion Păvăloiu
(Tiberiu Popoviciu Institute of Numerical Analysis)

Title

Original title (in French)

La résolution des systèmes d’équations opérationnelles à l’aide des méthodes itératives

English translation of the title

Solving the systems of operator equations by iterative methods

Keywords

Gauss-Seidel method, system of equations in Banach spaces, linear systems

Cite this paper as:

I. Păvăloiu, La résolution des systèmes d’équations opérationnelles à l’aide des méthodes itératives, Mathematica, 11(34) (1969), pp. 137-141 (in French).

PDF

Scanned paper (in French).

PDF-Latex version of the paper. (English translation)

About this paper

Journal

Mathematica

Publisher Name

Academia R.S. Romania

DOI

Not available yet.

Print ISBN

Not available yet.

Online ISBN

Not available yet.

Google Scholar Profile

Paper (preprint) in HTML form

La résolution des systèmes d’équations opérationnelles à l’aide des méthodes itératives

 
 
 
 
 
La résolution des systèmes d’équations opérationnelles à l’aide des méthodes itératives

par
Ion Păvăloiu
à Cluj

1. Soient X et Y deux espaces de type Banach et Z=X×Y le produit cartésien de ces espaces.

Dans l’espace Z on considérera l’équation suivante:

(1) x =φ(x,y)
y =ψ(x,y).

Dans la présente note on interprétera l’équation antérieure comme un système de deux équations à deux inconnues où φ et ψ sont des opérateurs définis sur Z et à valeurs respectivement X et Y. De cette manière on mettra en évidence un critérium de convergence du procédé de Gauss-Seidel appliqué à la résolution de ce systéme. Ensuite on montrera que ce criterium est plus général que ceux qui sont connus.

Enfin on appliquera les résultats obtenus à l’élaboration d’une nouvelle méthode de résolution des systèmes des équations lineaires.

Une partie des résultats de cette note ont été obtenus par nous dans un cas particulier (X=Y=) dans le travail [2].

2. On suppose que les opérateurs φ et ψ satisfont les conditions suivantes:

a) Les opérateurs φ et ψ transforment le domaine DZ en lui même.

b) Il existe des constantes α,β, a et b telles que

ψ(x2,y2)ψ(x1,y1) ax2x1+by2y1
φ(x2,y2)φ(x1,y1) αx2x1+βy2y1

pour tout (xi,yi)D,i=1,2.

Théorème 1.

Si les opérateurs φ et ψ satisfont les conditions a) et b), où les constantes α,β, a et b satisfont aux inégalités:

(2) α+b+aβ <2,
(1α)(1b) >aβ,

alors on a les propriétés suivantes:

a’) Le systéme (1) a une seule solution (x¯,y¯)D¯

b’) Le procédé itératif

(3) xn =φ(xn1,yn1),
yn =ψ(xn,yn1),n=1,2,,(x0,y0)D

est convergent et on a:

x¯ =limnxn,y¯=limnyn.
Démonstration.

On montrera d’abord qu’on a la propriété b’). Pour cela on observera que les sommes partielles des deux séries suivantes

(4) x0+i=1(xixi1)
y0+i=1(yiyi1)

coïncident avec les termes des suite (3). En notant

fn1 =xnxn1,
gn1 =ynyn1,n=1,2,,

et tenant compte des conditions b) on obtient les inégalités suivantes

fn αfn1+βgn1
gn afn+bgn1,n=1,2,.

En employant maintenant le lemme 2 [2] il en résulte que si les conditions (2) ont lieu alors il existe un constante C indépendente de n telleque l’on ait

fn Ch1n1k1n1,
gn Ch1nk1n1

et que les séries i=0fi,i=0gi sont convergentes, où 0h1k1<1,(h1,k1) etant une solution positive du système algébrique suivant:

α+βh =kh
ak+b =kh.

Il en résulte la convergence absolue des séries (4) et donc la convergence du procédé (3). Si x¯ et y¯ sont les limites des suites (3) alors en tenant compte de b) il en résulte que (x¯,y¯)est une solution pour le système (1).

Pour l’unicité on supposera que le système (1) a deux solutions (x¯,y¯)D¯ et (x¯1,y¯1)D¯ alors on a

x¯x¯1 αx¯x¯1+βy¯y¯1
y¯y¯1 ax¯x¯1+by¯y¯1

d’où on déduit

x¯x¯1 βa(1b)(1α)x¯x¯1
y¯y¯1 βa(1b)(1α)y¯y¯1

ce qui contredit le fait que (1b)(1α)>aβ.

Remarque.

Si α,β,a et b satisfont les conditions α+β<1,a+b<1 ou α+a<1,β+b<1 alors les conditions (2) sont vérifiées.

L’évaluation des erreurs est donnée par les inégalités suivantes:

x¯xn Ch1n1k1n11h1k1
y¯yn Ch1nk1n11h1k1,n=1,2,.\alignqed

3. On appliquera les résultats exposés antérieurement à la résolution des systémes d’équations linéaires de la forme

(5) X=AX+b

Xn est l’inconnue, A=(ai,j);i,j=1,n¯ est la matrice du système et bn est le terme libre.

Pour la résolution du système (5) on décomposera la matrice A en les matrices M1,M2,M3,M4 des types suivants. M1 est une matrice du type (s,s),M2 est du type (s,ns),M4 est du type (ns,s) et M4est du type (ns,ns), 1s<n, c’est-à-dire que A a la forme suivante

A=(M1M2M3M4)𝑠s.

On notera aussi

X=(uv)et b=(b1b2)

u,b1s et v,b2ns. Ainsi le systéme (5) peut être écrit sous la forme:

(6) u =M1u+M2v+b1
v =M3u+M4v+b2

u et v sont les vecteurs des inconnues, (u,v)s×ns.

Pour la résolution du système (6)  on appliquera le procédé itératif suivant:

(7) ui =M1ui1+M2vi1+b1
vi =M3ui+M4vi1+b2,i=1,2,,(u0,v0)s×ns.

Ce procédé itératif résulte comme une application du procédé (3) exposé dans la première partie de cette note.

En appliquant la théorème 1 on obtiendra le

Théorème 2.

Si les matrices M1,M2,M3 et M4satisfont aux inégalités suivantes:

(8) M1+M4+M2M3 <2
(1M1)(1M4) >M3M2

alors le système (6) a une seule solution (u¯,v¯)s×ns et le procédé (7) converge vers cette solution.

On a ainsi obtenu une nouvelle méthode itérative de résolution des systèmes d’équations. Cette méthode converge dans des conditions beacoup plus générales que la méthode de l’itération simple ou la méthode de Gauss-Seidel. On ilustrera ce fait par l’example numérique suivant.

4. Soit donné le système:

(9) x1 =0.02x1+0.045x2+8x3+0.4
x2 =0.05x1+0.042x2+3x30.6
x3 =0.003x1+0.013x2+0.45x30.8.

On notera

u =(x1x2),v=(x3),
M1 =(0.02 0.0450.05 0.042),M2=(83)
M3 =(0.003, 0.013),M4=(0.45),
b1 =( 0.40.6),b2=(0.8).

Si on considère pour ces matrices la norme uniforme on a

M1 =0.092,
M2 =8,
M3 =0.016et
M4 =0.45.

On vérifiera si avec ces valeurs les conditions (8) sont remplies,

(10) 0.092+0.45+8×0.016 =0.67<2
(10.092)(10.45) =0.4994>0.016×8=0.128

Il en résulte que les conditions (8) sont vérifiées. Du théorème 2 et de (10) il résulte que le procédé itératif suivant

x1(i) =0.02x1(i1)+0.045x2(i1)+8x3(i1)+0,4
x2(i) =0.05x1(i1)+0.042x2(i1)+3x3(i1)0,6
x3(i) =0.003x1(i)+0.013x2(i)+0,45x3(i1)0.8,i=1,2,

x10,x20,x30 arbitraires, converge vers la solution du systême (5).

En exécutant les calculs on vérifie toutes les conclusions théoriques antérieures et après 40 itérations environ on obtient la solution approchée suivante

x1 13.6542065,
x2 6.6168795,
x3 1.6854203.

Bibliographie


Reçu le 12.VII.1969.

[1] I. Pavaloiu, Observatii asupra rezolvarii sistemelor de ecuatii cu ajutorul procedeelor iterative, Studii si Cercetari Matematice, 19 (1967) no. 9, 1289–1298 (in Romanian) [English translation of the title: Remarks on solving the systems of equations by iterative methods].

1969

Related Posts

No results found.