1930 b -Popoviciu- Mathematica - Remarque sur les polynomes de meilleure approximation
REMARQUE SUR LES POLYNOMES DE MEILLEURE APPROXIMATION
parTiberiu PopoviciuElève à l'Ecole Normale supérieure, Paris.
Reçue le 21 février 1930.
Nous considérons la classe (b) des fonctions définies et continues dans l'intervalle fini et fermé (a,b);(a < b)(a, b) ;(a<b). Des propriétés de - ces fonctions rappelons-nous qu'elles peuvent s'annuler on un nombre fini ou infini de points, mais l'ensemble de ces points forme toujours un nombre fini d'intervalles pouvant d'ailleurs se réduire à un point.
Soit maintenant un système de n+1n+1 fonctions de la classe (b)
(1)
f_(1),f_(2),dots,f_(n)f_{1}, f_{2}, \ldots, f_{n}
linéairement indépendantes, c'est-à-dire qu'une égalité telle que
Remarquons que le système (1) peut n'être pas linéairement indépendant dans un intervalle (alpha,beta)(\alpha, \beta) intérieur à (a,b)(a, b) [tel que |a-alpha|+|beta-b|!=0]|a-\alpha|+|\beta-b| \neq 0].
Toute expression linéaire et homogène telle que (2) sera appelée un polynome du système (1). A tout polynome P nous pouvons faire correspodre un point MM de coordonnées c_(0),c_(1),dots,c_(n)c_{0}, c_{1}, \ldots, c_{n} dans l'espace ordinaire à n+1n+1 dimensions. Nous appelons le point M, l'image du polynome P correspondant.
Le fait que les fonctions (1) sont linéairement indépendantes peut s'exprimer de la façon suivante:
Il yy a conoespondance biunivoque entre les polynomes PP et leurs images MM.
Pour les points où PP s'annule nous faisons les conventions suivantes: ^(1){ }^{\mathbf{1}} ) 1^(0)1^{0}, Nous appelons zéro simple un point intérieur à l'intervalle ( a,ba, b ), où P s'annule en changeant de signe, ou bien un point extrémité ( aa ou b) où P s'annule.
20. Nous appellons zéro double et nous le comptons pour deux zéros simples, un point intérieur où PP s'annule sans changer de signe.
Un système (1) est un système de Tchebyscheff ou système (T). si un polynome quelconque PP ne peut avoir plus de nn zéros. Il résulte que pour qu'un système ne soit pas un système (T) il faut et il suffit. qu'il y ait au moins un polynome ayant au moins n+1n+1 zéros.
Par exemple le système
1,x,x^(2),dots,x^(n)1, x, x^{2}, \ldots, x^{n}
est un système (T) dans tout intervalle fini. Au contraire le système
1,sin x,cos x,dots,sin nx,cos nx1, \sin x, \cos x, \ldots, \sin n x, \cos n x
n'est pas un système (T) dans tout intervalle ( 0,2pi0,2 \pi ), mais il en est un dans un intervalle de longueur plus petite que 2pi2 \pi.
2. Nous allons démontrer la propriété auxiliajre suivante:
Si (1) n'est pas un système (T) on peut trouver n+1n+1 points distincts x_(1),x_(2),dots,x_(n+1)x_{1}, x_{2}, \ldots, x_{n+1} complétement intérieurs à ( a,ba, b ) tels que le déterminant:
soit nul.
En effet, il existe un polynome ayant au moins n+1n+1 zéros. Si un tel polynome s'annule en au moins n+1n+1 points distincts dont aucun ne coïncide avec une extrémité, la propriété est évidente.
Les points où P s'annule peuvent se ranger en 3 catégories. 1^(0)1^{0}. Ou bien P s'annule en changeant de signe; soient
(4) quadx_(1),x_(2),dots,x_(m)\quad x_{1}, x_{2}, \ldots, x_{m}
ces points. 2^(0)2^{0}. Ou bien P s'annule en ne changeant pas de signe; soient
(5)
(1) S. Bernstein "Leçons sur les propriétés extrémales ... etc." p. 1.; J. W. Young „General theory of approximation by fonctions involving a given nombre of arbitrary parameters" Transactions of the Amer. Math. Soc. 8 (1907), p. 331.
ces points. Enfin: 3^(0)3^{0}. Les extrémités où P s'annule
qui contient au moins autant de colonnes que de lignes.
Si dans le tableau (7) tous les déterminants formés par k+ik+i colonnes quelconques sont nuls, la propriété cherchée en résulte. Mais. supposons qu'il y ait un déterminant non nul, par exemple :
A chaque point x^(');x^{\prime} ; et x^('');x^{\prime \prime} ; attachons un nombre non nul a^(');a^{\prime} ; resp. a^('')a^{\prime \prime}; tel que son signe soit celui du polynome P au voisinage de x^(')_(j)x^{\prime}{ }_{j} resp. x^('')x^{\prime \prime}, [le voisinage d'une extrémité est compté uniquement vers l'intérieurde l'intervalle]. On peut alors déterminer un système de nombres non. tous nuls
tel que
Si epsi=0\varepsilon=0 nous avons P_(1)-=P\mathrm{P}_{1} \equiv \mathrm{P}. Si epsi\varepsilon est petit mais non nul, P_(1)\mathrm{P}_{1} est voisin de P. On est sûr que si on prend e suffisamment petit, à chaque zéro x_(j)x_{j} de P correspondra un zéro x_(j)x_{j} de P_(1)\mathrm{P}_{1} voisin de x_(j)x_{j}. On voit aussi à cause du choix des nombres a_(j)^('),a_(j)^('')a_{j}^{\prime}, a_{j}^{\prime \prime} qu'à chaque zéro x_(j)^(')x_{j}^{\prime} correspondent au moins deux zéros simples pour P_(1)\mathrm{P}_{1} et à un zéro x^('')_(j)x^{\prime \prime}{ }_{j} correspond au moins un zéro à l'intérieur de ( a,ba, b ).
Finalement donc, epsi\varepsilon étant suffisamment petit, le polynome P_(I)P_{\mathbf{I}} s'annule au moins m+2k+im+2 k+i fois; la propriété en résulte immédiatement.
Dans le cas k=nk=n il suffit d'introduire au plus un point x_(i)^('')x_{i}{ }^{\prime \prime}.
3. Soit f(x)f(x) une fonction de la classe (b) et considérons l'expression :
M étant l'image du polynome P. Alors, la fonction I(M) est continue par rapport aux coefficients c_(0),c_(1),dots,c_(n)c_{0}, c_{1}, \ldots, c_{n} pour tout a <= x <= ba \leq x \leq b.
L'expression I (M) admet une limite inférieure et nous savons quo cette limite est atteinte par au moins un polynome PP, donc par au moins un système de valeurs finies gamma_(0),gamma_(1),dots,gamma_(n)\gamma_{0}, \gamma_{1}, \ldots, \gamma_{n} des quantités c_(0),c_(1),dotsc_(n)c_{0}, c_{1}, \ldots c_{n} :
M_(1)\mathrm{M}_{1} est alors un point minimisant of le polynome correspondant est un polynome minimisant. En général il est difficile de décider si le polynome minimisant est unique ou non, mais:
S'il y a deux polynomes minimisants distincts, il yy en a une in,finité.
Soient en effet M_(1),M_(2)M_{1}, M_{2} deux points minimisants distincts et considérons le point
Il résulte que tout point du segment M_(1)M_(2)\mathrm{M}_{1} \mathrm{M}_{2} est minimisant. D'autre. part, tout point minimisant est à distance finie, car pour un point à: coordonnées non bornées I(M)I(M) devient infini et en même temps:
Nous pouvons donc énoncer la propriété:
Les points minimisants forment un domaine convexe fermé et borné.
4. Nous nous proposons de démontrer la propriété suivante:
La condition nécessaire et suffisante pour qu'il y ait un seul poly-nome minimisant, quel que soit la fonction ff de la classe (b), est que le système (1) soit un système ( TT ).
On sait que cette condition est suffisante ( 1 ). Nous allons montrer que si le système n'est pas un système de Tchebyscheff, on peut trouver une fonction ff admettant une infinité de polynomes minimisants.
s'annulant en au moins n+1n+1 points distincts à l'intérieur de l'intervalle ( a,ba, b ). Si x_(1),x_(2),dots,x_(n+1)x_{1}, x_{2}, \ldots, x_{n+1} sont n+1n+1 points vérifiant cette condition le déterminant (3) est nul car nous supposons bien entendu que P≡∣≡0\mathrm{P} \equiv \mid \equiv 0.
On peut trouver alors n+1n+1 nombres a_(1),a_(2),dots,a_(n+1)a_{1}, a_{2}, \ldots, a_{n+1} tels que le système
qui est fonction continue de bar(c)_(0), bar(c)_(1),dots, bar(c)_(n)\bar{c}_{0}, \bar{c}_{1}, \ldots, \bar{c}_{n}, admet un minimum positif non nul. Soit mm la valeur de ce minimum; il est atteint pour une infinité de systèmes de valeurs bar(c)_(0), bar(c)_(1),dots, bar(c)_(n)\bar{c}_{0}, \bar{c}_{1}, \ldots, \bar{c}_{n}, car si
bar(c_(i))=c^(**)i quad i=0,1,dots,n\overline{c_{i}}=c^{*} i \quad i=0,1, \ldots, n
(1) S. Bernstein loc. cit. p. 3; J. W. Joung loc. cit.
( ^(2){ }^{2} ) Max ( lambda_(1),lambda_(2),dots,lambda_(n)\lambda_{1}, \lambda_{2}, \ldots, \lambda_{n} ) signifie la väleur de la plus grande quantité lambda_(i)\lambda_{i}.
est un système minimisant, les systèmes
c_(l)=c_(l)^(**)+lambdac_(l)quad i=0,1,2,dots,nc_{l}=c_{l}^{*}+\lambda c_{l} \quad i=0,1,2, \ldots, n
seront aussi minimisants, lambda\lambda étant quelconque.
Maintenant si ff est une fonction continue prenant les valeurs a_(l)a_{l} aux points x_(i)(i=1,2,dots,n+1)x_{i}(i=1,2, \ldots, n+1), on aura pour toat polynome QQ
Max|f-Q| >= m quad[dans(a,b)]\operatorname{Max}|f-Q| \geq m \quad[\operatorname{dans}(a, b)]
[on peut d'ailleurs avoir P^(**)-=0\mathrm{P}^{*} \equiv 0 ].
(9)
Pour fixer les idées, supposons que le polynome P pris initiallement, s'annule en un nombre fini de points; ce sont d'abord les points x_(1),x_(2),dots,x_(n+1)x_{1}, x_{2}, \ldots, x_{n+1}, et puis certains autres points x_(1)^('),x_(2)^('),dots,x_(r)^(')x_{1}^{\prime}, x_{2}^{\prime}, \ldots, x_{r}^{\prime} (qui peuvent ne pas exister du tout).
Les points x_(i),x_(i)^(')x_{i}, x_{i}^{\prime} partagent l'intervalle ( a,ba, b ) en un certain nombre de sous-intervalles ( n+r,n+r+1n+r, n+r+1 ou n+r+2n+r+2 ) tels que dans chacun d'eux le polynome PP garde un signe constant.
Nous déterminons ff dans chaque sous-intervalle tel qu'il soit continu et tel que (9) et (10) soient vérifiés. Pour cela nous allons examiner les diverses sortes de sous-intervalles qui peuvent se présenter. 1^(0)1^{0}. Intervalle ( a,x^(')_(1)a, x^{\prime}{ }_{1} ). Dans un tel intervalle on prendra
On emploie la même construction pour un intervalle (x_(r)^('),b)\left(x_{r}^{\prime}, b\right). 2^(0)2^{0}. Intervalle (a,x_(1))\left(a, x_{1}\right) [ou {:(x_(n+1),b)]\left.\left(x_{n+1}, b\right)\right]. On a
|P^(**)(x_(1))-a_(1)| <= m\left|\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right| \leq m
On prendra dans ( a,x_(1)a, x_{1} )
{:[f=P^(**)(x_(1))-a_(1)-(m)/((A))P," si ",P[P^(**)(x_(1))-a_(1)] > 0],[f=P^(**)(x_(1))-a_(1)," si ",P[P^(**)(x_(1))-a_(1)] < 0]:}\begin{array}{lll}
f=\mathrm{P}^{*}\left(x_{1}\right)-a_{1}-\frac{m}{\mathrm{~A}} \mathrm{P} & \text { si } & \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]>0 \\
f=\mathrm{P}^{*}\left(x_{1}\right)-a_{1} & \text { si } & \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]<0
\end{array}
on voit alors que
(11) Max|f+lambdaP| <= m\operatorname{Max}|f+\lambda \mathrm{P}| \leq m
{:[f=(x-x_(1)^('))(P^(**)(x_(1))-a_(1))/(x_(1)-x_(1)^('))-(m)/((A))Pquad" si "quadP[P^(**)(x_(1))-a_(1)] > 0],[f=(x-x_(1)^('))(P^(**)(x_(1))-a_(1))/(x_(1)-x_(1)^('))","quad" si "quadP[P^(**)(x_(1))-a_(1)] < 0]:}\begin{aligned}
& f=\left(x-x_{1}^{\prime}\right) \frac{\mathrm{P}^{*}\left(x_{1}\right)-a_{1}}{x_{1}-x_{1}^{\prime}}-\frac{m}{\mathrm{~A}} \mathrm{P} \quad \text { si } \quad \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]>0 \\
& f=\left(x-x_{1}^{\prime}\right) \frac{\mathrm{P}^{*}\left(x_{1}\right)-a_{1}}{x_{1}-x_{1}^{\prime}}, \quad \text { si } \quad \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]<0
\end{aligned}
et on a encore (11) sous les conditions (12). 4^(0)4^{0}. Intervalle (x_(1)^('),x_(2)^('))\left(x_{1}^{\prime}, x_{2}^{\prime}\right). Il suffit de prendre
f=-(m)/((A))Pf=-\frac{m}{\mathrm{~A}} \mathrm{P}
et (11) sera satisfait avec (12). 5^(0)5^{0}. Intervalle ( x_(1),x_(2)x_{1}, x_{2} ). Posons
{:[f=g-(m)/((A))P," si "P[P^(**)(x_(1))-a_(1)] > 0","P[P^(**)(x_(2))-a_(2)] > 0],[," ou bien si "[P^(**)(x_(1))-a_(1)][P^(**)(x_(2))-a_(2)] < 0],[f=g," si "P[P^(**)(x_(1))-a_(1)] > 0","P[P^(**)(x_(2))-a_(2)] < 0.]:}\begin{array}{ll}
f=g-\frac{m}{\mathrm{~A}} \mathrm{P} & \text { si } \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]>0, \mathrm{P}\left[\mathrm{P}^{*}\left(x_{2}\right)-a_{2}\right]>0 \\
& \text { ou bien si }\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]\left[\mathrm{P}^{*}\left(x_{2}\right)-a_{2}\right]<0 \\
f=g & \text { si } \mathrm{P}\left[\mathrm{P}^{*}\left(x_{1}\right)-a_{1}\right]>0, \mathrm{P}\left[\mathrm{P}^{*}\left(x_{2}\right)-a_{2}\right]<0 .
\end{array}
On peut déterminer encore un lambda_(1) > 0\lambda_{1}>0 tel que si
0 > lambda > -lambda_(1)0>\lambda>-\lambda_{1}
on ait encore
Max|f-lambdaP| <= m\operatorname{Max}|f-\lambda \mathrm{P}| \leq m
dans l'intervalle ( x_(1),x_(2)x_{1}, x_{2} ).
Cette propriété résulte de la remarque suivante:
Soit g(x)g(x) une fonction continue dans (0,1)(0,1) (nous prenons l'internalle (0,1)(0,1) pour simplifier l'exposé) positive (négative) dans cet intervalle et:
g(0)=g(1)=1g(0)=g(1)=1
Soient, pour fixer les idées, a^(') > 0,b^(') < 0a^{\prime}>0, b^{\prime}<0. On peut alors déterminer un lambda_(1) > 0\lambda_{1}>0 tel que pour 0 < lambda < lambda_(1)0<\lambda<\lambda_{1} on ait
a^(')+x(b^(')-a^('))+lambda g < aa^{\prime}+x\left(b^{\prime}-a^{\prime}\right)+\lambda g<a
dans (0,1)(0,1). La démonstration est immédiate.
La fonction ff ainsi construite répond à la question, car lambda\lambda étant compris entre
0,-lambda_(1)0,-\lambda_{1}
où lambda_(1)\lambda_{1} est un nombre positif, on a
|f-lambdaP| <= m|f-\lambda \mathrm{P}| \leq m
dans (a,b)(a, b) et au moins dans un point x_(i)x_{i} on a l'égalité
|f-lambdaP|=m|f-\lambda \mathrm{P}|=m
D'autre part, n'importe quel autre polynome donne
|f-Q| >= m|f-Q| \geq m
Si PP s'annulait dans tout un intervalle ( alpha,beta\alpha, \beta ) par exemple, on pourrait encore faire la construction très facilement. Les points x_(1),x_(2)x_{1}, x_{2}, dots.x_(n+1)\ldots . x_{n+1} peuvent être pris à l'intérieur de ( alpha,beta\alpha, \beta ). Alors en dehors de (alpha,beta)(\alpha, \beta) nous faisons la même construction que toute à l'heure. Dans ( alpha,beta\alpha, \beta ) nous gardons encore les conditions (9); et dans chaque intervallex_(i),x_(i+1)x_{i}, x_{i+1} nous prenons la fonction ff lineare; et constante dans ( alpha,x_(1)\alpha, x_{1} ) et ( x_(n+1),betax_{n+1}, \beta ), La fonction ainsi obtenue répond encore à la question.