Solving equations by interpolation

Abstract

Let \(X,Y\) be normed spaces, \(G:X\rightarrow Y\) a nonlinear operator, and the nonlinar equation \(G\left( x\right) =0\). We define the divided differences of \(G\) and we give some examples of nonlinear operators on Banach spaces for which we construct the divided differences of different orders. We construct the Lagrange interpolation polynomial in the Newton form for \(G\). The solution of equation is a approximated by using the inverse interpolation Lagrange polynomial.

Authors

Ion Păvăloiu
(Tiberiu Popoviciu Institute of Numerical Analysis)

Title

Original title (in French)

La résolution des equations par intérpolation

English translation of the title

Solving equations by interpolation

Keywords

divided difference in normed spaces, Lagrange inverse interpolation; multistep iterative method of Newton type

PDF

Cite this paper as:

I. Păvăloiu, La résolution des equations par intérpolation, Mathématica, 23(46) (1981) no. 1, pp. 61-72 (in French).

About this paper

Journal

Mathematica

Publisher Name
DOI

Not available yet.

Print ISSN

Not available yet.

Online ISSN

Not available yet.

References

[1] A.M. Ostrowski, Resenie uravnenii i sistem uravnenii, Izd. inostr. lit. Moskva (1963).

[2] I. Pavaloiu, Interpolation dans les espaces lineaires normes et applications, Mathematica, Cluj, nr.12 (35), 2, (1970), pp. 309–324.

[3] I. Pavaloiu, Introducere in teoria aproximarii solutiilor ecuatiilor, Editura Dacia, 1976.

[4] T. Popoviciu, Introduction a la theorie des differences divisees, Bulletin mathematique de la societe Roumaine de Sciences, 42, 1, (1940) pp. 65–78.

[5] A.S. Sergeev, O metode hord, Sibirski mat. Jurnal, XI, (2), (1961), pp. 282–289.

[6] J.F. Traub, Iterative Methods for the Solution of Equations, Prentice Hall, Series in Automatic Computation, 1964.

[7] S. Ul’m, Ob obobscennyh razdelennîh raznostiah, II, Izv. Nauk Estonskoi SSR, 16, 2, (1967), 146–155.

Paper (preprint) in HTML form

La résolution des équations par interpolation

 
 
La résolution des équations par interpolation

par
Ion Păvăloiu

1. La notation de diffèrence divisée.

Soient X et Y deux espaces lineaires normés et G:XY une application. Nous considérons n+1 éléments distincts de l’espace X

(1) x1,x2,,xn+1.

Nous désignons par L(X,Y) l’ensemble des applicatons linéaires et continues définies sur X et à valeurs en Y et nous déffinisons par récurrence les ensembles suivants:

Li(X,Y)=L(X,Li1(X,Y)),i=2,3,

L1(X,Y)=L(X,Y).

Autrement dit les ensembles Li(X,Y) sont les espaces des applications i-linéaires et continues définies sur X et à valeurs en Y.

Définition 1.

L’application [.,.;G]:X2L(X,Y) s’appelle difference divisée d’ordre un de l’approximation G sur les points xi,xj du système (1) si

  • 1)
    [xi,xj;G](xjxi)=G(xj)G(xi)
  • 2)

    s’il existe la dérivée au sens de Fréchet de l’application G sur le point xi, alors [xi,xi;G]=G(xi).

Nous avons défini ci-dessus la différence divisée d’ordre un de l’application G sur deux éléments arbitraires du système (1).

En considérant maintenant des points consècutifs du système (1) nous pouvons considérer les différences divisées suivantes:

[x1,x2;G],[x2,x3;G],,[xn,xn+1;G].

A l’aide des différences divisées définies ci-dessus nous définissons la notion de différence divisée d’ordre n (n>1) de l’application G.

Nous supposons que nous avons défini l’application [,,,;G]:Xi+1Li(X,Y) à l’aide de laquelle nous pouvons définir les différences divisées d’ordre i de l’application G sur i+1 éléments quelconques du système (1).

Soient [xk+1,xk+2,,xk+i+1;G] et [xk,xk+1,,xk+i;G] deux différences divisées d’ordre i sur les points xk+1,xk+2,,xk+i+1 respectivement xk,xk+1,,xk+1 du système (1).

Définition 2.

L’application [,,,;G]:Xi+2Li+1(X,Y) s’appelle différence divisée d’ordre i+1 de l’application G sur les points xk,xk+1,,xk+i+1, si

  • 1)
    [xk,,xk+i+1;G](xk+i+1xk)=
    =[xk+1,,xk+i+1;G][xk,,xk+i;G]
  • 2)

    s’il existe la dérivée au sens de Fréchet d’ordre i+1 de l’application G sur le point xi, alors:

    [xs,xs,,xs;G]=1(i+1)!G(i+1)(xs).

Pour pouvoir utiliser ces différences divisées à la construction des polynomes d’interpolation il est néccessaire d’introduire la notion de différence divisée symétrique par rapport aux points considérés.

Définition 3.

La différence divisée [x1,x2,,xk;G]x1,x2,,xk sont des points du système (1) est dite symétrique par raport à les points, si on a:

(2) [x1,x2,,xk;G]=[xi1,xi2,,xik;G]

pour chaque permutation (i1,i2,,ik) des nombres (1,2,3,,k).

Si X=Y= alors, l’égalité (2) est toujours vérifiée. Alors les différences divisées des fonctions réelles d’une variable réelle sont symétrique par rapport aux points considérés.

Si nous supposons maintenant par example X=2 et Y=, f:2 et si nous désignons par (u,v), (u′′,v′′) deux points de 2, nous avons

(3) [x,x′′;f]=[f(u,v)f(u′′,v)uu′′,f(u′′,v)f(u′′,v′′)vv′′]

x=(u,v)et x′′=(u′′,v′′).

On montre que la différence divisée (3) vérifie les conditions (1) et (2) de la définition 1, mais qu’elle n’est pas symétrique par rapport aux points x et x′′.

Mais nous povons construire une différence divisée sur ces points qui est symétrique. Par example si nous considérons la différence divisée définie par:

[x,x′′;f]= 12[f(u,v)f](u′′,v)uu′′+f(u′′,v)f(u′′,v′′)v′′v,
f(u′′,v)f(u′′,v′′)vv′′+f(u,v′′)f(u,v)v′′v]

alors on a évidement

[x,x′′;f]=[x′′,x;f]

Soit maintenant X=Y=C[0,1] où par C[0,1] nous désignons l’ensemble des fonctions définies et contenues sur l’intervalle [0,1]. Considérons maintenant l’application F:C[0,1]×C[0,1] donnée par l’égalité suivante:

F(x)(s)=01K(s,t,x(t))𝑑t

K:[0,1]×[0,1]× est une fonction continue sur tout son domaine de définition.

Soit maintenant n+1-fonctions

(4) x1,x2,,xn+1

de l’espace C[0,1] qui ont la propriété que xj(t)xi(t) pour ij et pour chaque t[0,1].

La différence divisée de l’application F sur les fonctions xi,xj du systéme (4) peut se définir à l’aide de l’égalité suivante:

[x1,x2;F]h(s)=01K(s,t,x2(t))K(s,t,x1(t))x2(t)x1(t)h(t)𝑑t

hC[0,1].

On montre immédiatement que l’application linéaire définie ci-dessus possède les propriétés (1) et (2) de la définition 1.

Si nous désignons par [xi,xi+1,,xi+s;K] la différence divisée d’ordre s de la fonction K, alors la différence divisée d’ordre s de l’application F se définit par l’égalité suivante:

[xi,xi+1,,xi+s;F]h1h2h3=
=01[xi,xi+1,,xi+s;K]h1(t)h2(t)hs(t)𝑑t

h1,h2,,hsC[0,1].

2. Interpolation

Dans tout ce qui suit nous supposerons que les différences divisées sont symétriques par rapport aux points considérées.

Nous désignons maintenant, par Ln:XY une application définie par l’égalité:

(5) Ln(x)= G(x1)+[x1,x2;G](xx1)+
+[x1,x2,,xn+1;G](xxn)(xx1)

Allors nous avons le théorème suivant:

Théorème 1.

L’application Ln définie par (5) possède les propriétés suivantes

  • 1)

    Ln(xi)=G(xi),i=1,2,,n+1

  • 2)

    G(x)Ln(x)=[x,x1,,xn+1;G](xxn+1)(xx1) pour xX, xxi, i=1,2,,n+1.

Démonstration..

Nous démontrons l’égalité 2) par induction. Pour n=0 l’égalité 2) est évidente parce que G(x)G(x1)=[x,x1;G](xx1) qui n’est autre que l’égalité 1) de la définition 1. Nous supposons que l’égalité 2) est vraie par n=k et nous montrerons qu’elle est vraie aussi pour n=k+1.

En effet si l’égalité suivante a lieu

(6) G(x)= G(x1)+[x1,x2;G](xx1)+
+[x1,x2,,xk+1;G](xxk)(xx1)
+[x,x1,,xk+1;G](xxk+1)(xx1),

alors, en tenant compte de l’égalité

[x,x1,,xk+1;G]=[x,x1,,xk+2;G](xxk+2)+[x1,x2,..,xk+2;G]

qui résulte de la définition de la différence divisée d’ordre k+2. Il résulte l’égalité suivante:

G(x)= G(x1)+[x1,x2;G](xx1)+
+[x1,x2,,xk+2;G](xxk+1)(xx1)
+[x,x1,,xk+2;G](xxk+2)(xx1)

ce qui montre que l’égalité 2) a lieu pour n=k+1.

Il reste à démontrer les égalités 1). De la définition de l’application Ln il résulte:

(7) Ln(xi)= G(x1)+[x1,x2;G](xix1)+
+[x1,x2,,xi;G](xixi1)(xix1).

Si nous considérons maintenant le dernier terme à droite de l’égalité (7) et tenons compte de l’égalité:

[x1,x2,,xi;G](xixi1)=
=[xi1,x1,,xi2,xi;G](xixi1)
=[x1,x2,,xi2,xi;G][xi1,x1,,xi2;G]
=[x1,x2,,xi1,xi;G][x1,x2,,xi2,xi1;G)]

nous obtenons

Ln(xi)= G(x1)+[x1,x2;G](xix1)+
+[x1,x2,,xi2,xi;G](xixi2)(xix1).

En procédant de la mème manière après un nombre fini des pas nous parvenons à l’égalitè suivante:

Ln(xi)=G(x1)+[x1,x2;G](xix1)=G(x1)+G(xi)G(x1)=G(xi).

L’application Ln est dite pôlynome d’interpolation de Lagrange de l’application G sur les noeuds xi,i=1,2,,n+1 du système (1) ∎

3. La résolution des équations par interpolation

On considère l’èquation

(8) G(x)=θ

θ est l’élément nul de l’éspace Y et G:XY est un opérateur non linéaire.

Pour la résolution de l’équation (8) nous pouvons procéder de la manière suivante.

En supposant que les points du système (1) sont dans un voisinage de la soltuion x¯ de l’équation (8), de l’égalité 2) (théorème 1) il rèsulte l’égalité suivante:

G(x¯)=Ln(x¯)+[x¯,x1,,xn+1;G](x¯xn+1)(x¯x1)=θ

d’où il résulte

Ln(x¯)[x¯,x1,,xn+1;G]xx1xxn+1.

Si nous supposons maintenant que nous avons les inégalités x¯xiε, i=1,n+1¯ε est un nombre réel et positif, alors on a:

Ln(x¯)[x¯,x1,,xn+1;G]εn+1

d’où il résulte que pour trouver une approximation de la solution x¯ il suffi de résoudre l’équation suivante:

(9) Ln(x)=θ.

La méthode exposée si-dessus présente quelques inconvénients, notamment:

Tout d’abord, la résolution d’une équation sous la forme (9) même dans le cas n=1 est un problème de mathématiques difficile et la dificulté du problème croit considérablement si n>1. Même dans le cas X=Y=, c’est-à-dire, quand Ln est un polynome algébrique à coefficients réels, le problème peut être très difficile à cause du fait qu’une équation algebrique de dégré n a n racines, et alors il est nécessaire de choisir la racine de l’équation (9) qui approche la racine x¯ de l’équation (8).

En second lieu, il est bien connue que la position des racines d’une équation algébrique dans le plan et la nature de ces racines peuvent se modifier considérablement quand les coefficients de l’équation sont affectés par des erreurs non essentielles.

Dans ce qui suit nous exposerons une autre méthode avec laquelle une parte des difficultés exposéss ci-dessus, s’élimine.

Nous supposons que les opérateurs linéaires

[xi,xj;G]L(X,Y),ij;j=1,2,,n+1

sont inversables.

Il en résulte que G(xi)G(xi), ij. Soit maintenant D un ensemble quelconque d’éléments de l’espace X. Nous désignons par G¯=G|D la restriction de l’application G à l’ensemble D.

Nous supposons que l’application G¯ est un homéomorphisme des ensembles D et G(D). Où par G(D) nous avons désigné l’image de l’ensemble D par G.

Nous avons le théorème suivant:

Théorème 2.

Si l’opérateur linéaire [xi,xj;G], ou xi,xjD est inversable, alors a lieu l’égalité:

[yi,yj,G¯1]=[xi,xj;G]1

yi=G(xi)et yj=G(xj).
Démonstration..

De la définition de différence divisée d’ordre 1 il résulte que

G(xj)=G(xi)=[xi,xj;G](xjxj)

[xi,xj;G]1(yjyi)=xjxi

C’est à dire

G¯1(yj)G¯1(yi)=[xi,xj;G]1(yjyi)

d’où il résulte l’égalité de l’énoncé du théorème.

Soient maintenant x1, x2,,xn+1, n+1 - éléments de l’ensemble D.

Nous désignons par y1,y2,,yn+1 les valeurs de l’application G sur ces points, c’est-à-dire yi=G(xi), i=1,2,,n+1. Nous considérons l’application Ln:YX donnée par

(10) Ln(y)= x1+[y1,y2;G¯1](yy1)+
+[y1,,yn+1;G¯1](yyn)(yyn+1)(yy1)

qui vérifie les égalités

(11) G¯1(y)=Ln(y)+[y,y1,,yn+1;G¯1](yyn+1)(yy1)

et

(12) G¯1(yi)=Ln(yi)=xi,i=1,2,,n+1.

Si nous supposons maintenant que la solution x¯ de l’équation (8) apartient à l’ensemble D, alors évidemment x¯=G¯1(θ) et de (11) nous déduisons:

(13) x¯=G¯1(θ)=Ln(θ)+(1)n+1[θ,y1,,yn+1;G¯1]yn+1y1.

Si nous designons par

(14) x¯=Ln(θ)

nous en déduisons:

(15) x¯x¯[θ,y1,,yn+1;G¯1]yn+1y1.

De l’égalité (15) il résulte que si les éléments x1,x2,,xn+1 sont choisis de telle manière que y1=G(xi)<ε,i=1,2,,n+1ε est un nombre réel suffisamment petit, alors x¯ est une bonne approximation pour x¯.

Pour plus de clarté nous designons par Ln(y1,y2,,yn+1;G¯1|y) l’opérateur Ln(y) donné par la relation (10). Soient maintenant x1, x2,,xn+1,n+1-éléments initiaux donnés et soit (xn)n=1 la suite généree par la rélation de récurrence:

(16) xi+n+1=Ln(yi,yi+1,,yi+n;G¯1|θ),i=1,2,\eqqed

Nous présenterons maintenant quelques cas particulieres du procédé itératif (16).

A. Soient x1 et x2 deux éléments arbitraires de l’espace X. Si nous considérons les premiers deux termes du polynome d’interpolation inverse (10) tenons compte du théorème 2, nous avons

(17) xk+1=xk1[xk1,xk;G]1G(xk1),k=2,3,

qui n’est autre chose que l’extension de la méthode de la corde.

B. Au cas où nous considérons trois éléments initiaux x1,x2,x3X et nous nous bornons aux trois premiers termes de la relation (10) on a:

(18) xk= xk3[xk3,xk2;G]1G(xk3)
[xk3,xk2;G]1[xk3,xk1,xk1;G][xk3,xk1;G]1
G(xk3)[xk1,xk2;G]1G(xk2),k=4,5,

Cette méthode est une extension à l’espace linéaire X d’une méthode analogue à la méthode de Tchebycheff, bien connue. De (15) et de (16) nous déduisons

(19) x¯xi+n+1 [θ,yi,,yn+1;G¯1]yiyn+1,

i=1,2,

A propos de la méthode (16) il se pose les deux questions suivants:

1. Quelles sont les conditions pour la convergence de la méthode (16).

2. Dans le cas de la convergence de la méthode (16), quelle est la vitesse de convergence.

En ce qui concerne la vitese de convergence d’une méthode itérative de type (16), A. M. Ostrowski [1] a montré que l’ordre de convergence de cette méthode n’excède pas 2, pour chaque nombre de points d’interpolation donnée.

Dans ce qui suit nous montrerons que si a chaque pas d’iteration on choisit convenablement les points d’interpolation, alors l’ordre de convergence croit considérablement.

Ainsi qu’il est bien connue pour la résolution d’une équation de la forme (8) par une méthode itérative il est nécessaire de mettre en évidence une application Q:XX qui a la propriété que chaque solution de l’équation (8) est un point fixe pour l’application Q.

Un opérateur Q qui possède la propriété ci-dessus est dit opérateur itératif attaché à l’équation (8).

Pour les opérateurs attachés à l’équation (8) on peut définir la notion d’ordre.

Définition 4.

Soit DX une ensemble d’éléments de l’espace X et ρ>0 un nombre réel.

Nous disons que l’opérateur itératif Q a l’ordre k (k>0nombre réel) sur l’ensemble D, par rapport à l’équation (8) si pour chaque xD on a

(20) G(Q(x))ρG(x)k.

Soient maintenant Q1,Q2,..,Qn;n-opérateurs itératif attachés à l’équation (8), respectivement d’ordre k1,k2,,kn.

Nous considérons un élément arbitraire x0X et désignons par xs0;s=1,n¯ les expresions suivantes:

(21) x10=Q1(x0),xs0=Qs(xs10),s=2,3,,n

Si les éléments initiaux dans la méthode itérative (16) sont:

(22) x0,x10,,xn0

alors si nous écrivons y00=G(x0),yi0=G(xi0),i=1,2,,n, on a:

(23) x1=Ln(y00,y10,,yn0;G¯1|θ).

Nous supposons maintenant que nous avons construit les premiers i+1 éléments de la suite (xn)n=0 alors l’élément xn+1 s’obtient de la manière suivante:

Nous écrievons:

(24) x1i=Q1(xi),xji=Qj(xj1i),j=2,3,,n

et

y0i=G(xi),yji=G(xji),j=1,2,,n

Alors l’élément xi+1 a la forme suivante:

(25) xi+1=Ln(y0i,y1i,,yni;G¯1|θ)

De (15) et de (25) on a:

(26) x¯xi+1[θ,y0i,,yni;G¯1]y0iyni.

Mais du fait que nous avons supposé que les opérateurs itératifs Qj,j=1,2,,n ont respectivement les ordres kj, avec les constantes ρj;j=1,2,,n il résulte les relations suivantes:

(27) y0i=G(xi)

et

(28) ysi G(xsi)=G(Qs(xs1i))ρsG(Qs1(xs2i))ks
ρsρs1ksG(Qs2(xs3))ksks1
ρsρs1ksρs1ksks1ρ1ksks1k2G(xi)k1k2ks

pour s=1,2,,n.

Si nous écrivons maintenant

(29) Cs=ρsρs1ksρs2ksks1ρ1ksks1k2;s=2,3,,n,
(30) K=s=2nCs

et

(31) m=1+k1+k1k2++k1k2kn

et si nous supposons que les différences divisées [θ,y0i,y1i,,yni;G¯1] sont fortement bornées par la même constante M>0, alors on déduit de (26);

(32) x¯xi+1MKG(xi)m,i=0,1,

Si nous supposons maintenant que les differences divisées d’ordre 1 de l’aplication G sont fortement bornées par la même constante B>0, on a:

(33) G(xi)Bx¯xii=0,1,

En tenant compte des inégalités (33) et (32) on obtient:

(34) x¯xi+1MKBmx¯xi,i=0,1,

En multipliant les inégalités (34) par (MKBm)1m1 et en écrivant

δk=(MKBm)1m1x¯xk,k=0,1,,

on obtient de (34)

(35) δi+1δim,i=0,1,

Nous admettrons maintenant que nous pouvons choisir les constantes M, K, B et le point initial x0 de telle manière que δ0<1.

Des inégalités (35) on déduit:

δi+1δ0mi,i=0,1,

d’où en tenant compte de la condition δ0<1 l’on déduit

limiδi+1=0

C’est-à-dire

limiixi+1=x¯.

Nous consiérons maintenant qulques cas particuliers de la méthode itérative (25).

1. Si nous considérons un seul opérateur itératif Q d’ordre k=1 alors la méthode itérative (25) revient à la méthode bien connue de Aitken-Steffensen. Dans ce cas nous avons: m=2.

2. Si Q1=Q2==Qn,k1=k2==kn=k,k1 alors Cs=ρkn+11k1 et m=kn+11k1.

3. Si Q1=Q2==Qn   et k1=k2==kn=1, alors Cs=ρs et m=n.

Remarque.

L’ordre de convergence donné par l’égalité (31) de la méthode (25) est le plus grand possible par rapport aux opérateurs itératifs Q1, Q2,,Qn donnés, si l’ordre dans lequel ils sont appliqués pour obténir les éléments (24), est donnée par l’ordre décroissant des nombres k1, k2,,kn. C’est-à-dire, l’ordre de convergence m est maximal si k1k2kn et minimal si k1k2km.

Bibliographie


Reçu, 8.IV.1980

1981

Related Posts