Sur quelques théorèmes de Stieltjes et de M. I. Schur
1.
Désignons par le déterminant de Van Der Monde des nombres (ou points) . Le carré de ce déterminant est le discriminant des nombres , ou le discriminant du polynome de degré ayant comme zéros les points .
Dans une note Stieljes a énoncé le théorème suivant 2 ) :
Théorème 1. Lorsque et que les restent compris dans l’intervalle ( 0,1 ), l’expression
devient maximum quand les sont les zéros du polynome de Jacobi
La valeur de ce maximum est
Stieltjes a donné la démonstration dans un autre travail 3 ), sur lequel nous reviendrons plus loin. Le calcul de n’est pas indiqué par Stieltjes mais il peut se faire en suivant la méthode, développée sur certains cas particuliers, de M. I. Schur 4 ).
1.
J’ai entrepris ce travail à la suite des discussions que j’ai eu avec M. le Prof. Th. Angheluta à l’Institut Mathématique de l’Université de Cluj.
2 ) Th. J. Stieltjes „Sur les polynomes de Jacobi", C. R. Acad. Sc., Paris, t. 100 (1885), p. 620.
3 ) Th. J. Stieltjes "Sur certains polynomes qui vérifient une équation différentielle linéaire du second ordre et sur la théorie des fonctions de lamÉ". Acta Math., t. 6 (1885), p. 321.
4) I. Schur „Uber die Verteilung der Warzeln gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten". Maih. Zeitschrift, t. 1 (1918), p. 377.
2.
La démonstration du théorème I peut se faire facilement. Remarquons d’abord que a un maximum pour qui est nécessairement atteint et notamment pour des valeurs toutes distinctes et ne coïncidant pas avec 0 et 1 .
On peut voir facilement que ce maximum ne peut être atteint que pour un seul système de points . Supposons, en effet, que
et
(1)
Si nous posons
nous avons
l’égalité, dans l’une de ces formules, ne pouvant avoir lieu que si , resp. .
Il en résulte que
(2)
l’égalité n’étant possible que si les suites (1) coincident. C’est en contradiction avec nos hypothèses et l’unicité signalée en résulte.
On en déduit, en particulier, que si les points pour lesquels le maximum est atteint sont simétriquement distribués par rapport au milieu de l’intervalle . Cela résulte du fait que si , on a
3. Stieltjes a démontré que la détermination du maximum se fait à l’aide du calcul différentiel. Posons
Le maximum est donné par le système
qui admet, comme il va en résulter plus loin, une seule solution sous l’hypothèse que les sont distincts entre eux. Cette unicité est d’ailleurs démontrable directement à l’aide de l’inégalité (2).
Un calcul simple nous donne
désignant une sommation où la valeur est exclue.
Le maximum sera donc donné par le système
On voit immédiatement que le polynome , qui est de degré , doit vérifier l’équation différentielle
étant une constante. On trouve et on voit que s’exprime à l’aide de la série hypergéométrique de Gauss, . On trouve effectivement que ce polynome, à un facteur constant près, est égal à donc il est un polynome de Jacobi de degré .
4. Pour calculer la valeur du maximum nous allons faire d’abord quelques considérations un peu plus générales.
Soit
une suite de polynomes définis par les relations de récurrence
(3)
où nous supposons que les et les sont différents de zéro.
Désignons par les zéros du polynome et par
(i)
le résultant des polynomes (ce résultant étant défini de cette manière).
De (3) nous déduisons que le coefficient de dans est égal à . Faisant ensuite succesivement , nous en déduisons
Mais
donc
Si on remarque maintenant que , on obtient
(4)
En particulier, les polynomes sont liés par des relations de la forme (3). Dans ce cas
(5) et on trouve
(6)
5. Passons maintenant au calcul de . Si sont les zéros du polynome , nous avons
Les relations
nous donnent
Nous avons maintenant
(8)
Mais les polymones et la dérivée du premier vérifient encore la relation suivante
étant deux constantes sans importance pour nous.
Si nous faisons succesivement nous obtenons
(9)
Enfin, compte tenant de (5), (6), (7), (8), (9) nous obtenons
qui est précisément la formule demandée.
6. Une transformation linéaire simple permet d’énoncer le théorème suivant :
Théorème II. Lorsque et que les restent compris dans l’intervalle , l’expression
devient maximum quand les sont les zéros du polynome
La valeur de ce maximum est
En particulier si on obtient un autre théorème de Stieltjes 5 ) :
Théorème III. Lorsque les restent dans l’intervalle , l’expression
devient maximum quand les sont les zéros du polynome de legendre de degré n. La valeur de ce maximum est
7.
Stieltjes a encore énoncé le théorème suivant 6 ) :
Théorème IV. Lorsque les sont dans l’intervalle l’expression
devient maximum quand les sont les zéros du polynome qui provient du développement
La valeur de ce maximum, qu’on peut désigner par , est
00footnotetext: 5) Th. J. Stieltjes „Sur quelques théorèmes d’algèbre", C. R. Acad. Sc., Paris, t. 100 (1885) p. 439.
6 ) Loc cit. 5 ).
Ce théorème correspond au cas où . Il a été démontré par M. I. Schur 7 ). Les résultats précédents ne sont pas applicables sans précautions, mais on peut voir àisément que cette propriété résulte du théorème II. On voit, en effet, que ce maximum ne peut être atteint que si les sont tous distinct et si l’un coincide avec 0 et un autre avec 1. On déduit donc le théorème IV du théorème II en faisant , et en prenant au lieu .
Remarquons que
On peut aussi, de la même manière, traiter les cas où ou seulement. Par exemple le cas résulte du théorème II en faisant et en prenant au lieu de . On définit ainsi les nombres .
On trouve effectivement 8 )
8.
Sur les nombres nous pouvons faire quelques remarques. Délimitons d’abord le nombre à l’aide de .
Nous avons
(10)
Remarquons que
Si sont les zéros du polynome , nous avons
7 ) Loc cit. 4 ).
Nous avons
donc
Mais
donc
Tenant compte de la formule
nous en déduisons
(11)
et cette formule est évidemment valable pour .
Compte tenant de la formule de Stirling, on voit que la racine du coefficient de dans (11) tend vers 1 pour . D’autre part M. M. Fekete 9 ) a déjà remarqué que
ce nombre étant le diamètre transfini du segment . Les formules (10), (11) nous montrent donc que :
Théorème V. étant deux nombres non-négatifs, l’expression
9 ) M. Fekete „Über die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten" Math. Zeitschrift,t. 17 (1923), p. 228.
tend, pour , vers le diamètre transfini du segment ).
On établit facilement que est une fonction décroissante de et de . On vérifie immédiatement que la fonction
est convexe par rapport à et lorsque .
La fonction est une somme de fonctions convexes et nous pouvons donc énoncer la propriété suivante :
Théorème VI. La fonction est décroissante et son logarithme est une fonction convexe par rapport aux deux variables a et .
On peut facilement voir que la propriété est valable pour .
On trouve facilement les propriétés correspondantes quand, au lieu de l’intervalle ( 0,1 ), on prend un intervalle fini quelconque ( ).
9. Prenons dans le théorème II ; nous en déduisons que pour l’expression
devient maximum quand les sont les zéros du polynome (écrit sous une forme convenable)
Si nous faisons maintenant , nous obtenons le
Théorème VII. Lorque et que les restent non-négatifs, l’expression
(12)
10 ) M. Fekete a établi l’existence de la limite que la suite
est décroissante. étant donnés, la suite plus générale
est aussi décroissante si on prend le nombre suffisament grand.
devient maximum quand les sont les zéros du polynome de Laguerre généralisé
La valeur de ce maximum est
Le passage à la limite est justifié par le fait - qu’on démontre comme au No. 2-que l’expression (12) admet un maximum atteint pour un seul système de points .
Si le problème correspondant est résolue par le polynome de Laguerre proprement dit.
Le cas peut aussi se rattacher au cas . En effet si pour que (12) soit maximum il faut qu’un des points coincide avec 0 . Faisant donc et prenant au lieu de on déduit le
Théorème VIII. Lorsque les restent non-négatifs, l’expression
devient maximum quand les sont les zéros du polynome
La valeur de ce maximum est
est le polynome de Laquerre
de degré .
10. Faisons quelques remarques sur les nombres .
Si sont les zéros de , nous avons
Si sont les zéros de
Mais, un calcul simple nous donne
donc
(13) .
11 ) L’égalité n’est d’ailleurs possible que si .
Or, l’ordre de grandeur du produit . est
ce qui signifie que
On en déduit que
Remarquons encore que n’est pas une fonctions monotone mais son logarithme est convexe. Compte tenant aussi de (13) et de nous avons le
Thèorème IX. Le logarithme de la fonction est convexe pour . a étant donné on a
11.
Prenons maintenant dans le théorème II. Nous déduisons que pour l’expression
devient maximum quand les sont les zéros du polynome (écrit sous une forme convenable)
Faisant nous obtenons un troisième théorème énoncé par Stieltjes 12 ).
12 ) Loc. cit. 5 ).
Théorème X. L’expression
devient maximum quand les sont les zéros du polynome d’Hermite
La valeur de ce maximum est
Le passage à la limite, on le démontre facilement, est parfaitement justifié.
Nous avons
12.
Remarquons qu’on a
On voit que la somme des zéros du polynome . est égale à . Le théorème VII nous montre alors que si sont non-négatifs et
(14)
l’expression
atteint son maximum, égal à , quand les sont les zéros du polynome . On a pu supprimer le facteur puisque la fonction croît lorque croît à partir de la valeur zéro. On voit d’ailleurs qu’il faut prendre l’égalité dans (14) pour avoir le maximum.
La substitution permet d’énoncer le théorème suivant :
Théorème XI. Lorsque , les sont non-négatifs et
l’expression
devient maximum quand les sont les zéros du polynome de Laguerre généralisé . La valeur de ce maximum est
On a, en particulier, le
Théorème XII. Lorsque les sont non-négatifs et
le discriminant
devient maximum quand les sont les zéros du polynome . La valeur de ce maximum est
De la même manière, en remarquant que
on voit que la somme des carrés des zéros du polynome est égale à . On obtient alors, comme plus haut, le
Théorème XIII. Lorsque les nombres réels vérifient l’inégalité
le discriminant
devient maximum quand les sont les zéros du polynome d’Hermite . La valeur de ce maximum est
Les théorèmes XII, XIII sont dus à M. I. Schur qui les a démontré par une autre voie 13 ).
13. Exactement comme plus haut on démontre que :
Théorème XIV. La fonction est décroissante et son logarithme est convexe pour . Nous avons la limite
pour toute valeur donnée de .
00footnotetext: 13 ) Loc. cit. 4 ).
Nous avons aussi
II.
Généralisation du problème de Stieltjes
14.
Considérons maintenant l’expression
dont nous chercherons à étudier le maximum quand les restent dans un intervalle fini. Nous pouvons toujours nous rapporter à l’intervalle , mais il va sans dire qu’on passe aux problèmes analogues pour un intervalle quelconque par des transformations simples.
Bien entendu, pour avoir des propriétés intéressantes nous allons nous borner au cas ou la fonction a une certaine forme particuliere. Précisons avant tout les hypotheses que nous faisons sur la fonction .
Nous dirons que la fonction , réelle, définie et uniforme dans l’intervalle fermé ( 0,1 ) vérifie les conditions ( C ) ou bien que c’est une fonction (C), si :
. elle est positive dans l’intervalle ouvert .
. elle est continue aux points 0 et 1 .
.
. elle est exponentiellement concave dans l’intervalle .
Nous dirons aussi que vérifie les conditions ( ) ou bien que c’est une fonctions ( ) si, en dehors des propriétés , elle vérifie aussi la propriété suivante :
a une dérivée en tout point de l’intervalle ouvert .
La propriété est entendue au sens restrictif (et non pas au sens de Jensen), donc
(15)
quels que soient les points de l’intervalle .
En particulier nous avons
(16)
pour deux points de . La fonction est concave dans tout intervalle complètement intérieur à .
Des propriétés bien connues résulte qu’une fonction (C) est bornée superieurement dans et est continue non seulement à l’intérieur mais, par suite de la propriété , partout dans .
Le problème que nous nous proposons d’examiner est le suivant :
La fonction vérifiant les conditions ( C ), déterminer et étudier le maximum de l’expression lor sque les restent dans l’intervalle .
On pourrait étudier ce problème aussi quand la fonction ne vérifie pas les conditions (C), mais nos hypothèses paraissent être les plus intéressantes. Soit par exemple la fonction égale à 1 pour et . Cette fonction vérifie les propriétés . On a dans ce cas
mais il est clair que ce maximum n’est pas atteint.
Passons maintenant à l’étude de notre problème.
15. L’expression est une fonction simétrique et est continue dans le domaine . Elle s’annule sur la frontière de ce domaine, donc
Théorème XV. Si est une fonction (C) l’expression admet dans un maximum atteint pour au moins un système de points distincts et situés à l’intérieur de l’intervalle .
Supposons que le maximum soit atteint pour deux systèmes différents de points
(17)
En prenant alors les points
et tenant compte de (16) on déduit, exactement comme au No. 2, que
l’égalité n’étant possible que si les deux suites (17) coincident. C’est en contradiction avec nos hypothèses. Nous avons donc le
Théorème XVI. Si est une fonction ( C ) l’expression admet dans un maximum atteint pour un seul système de points distincts et situés à l’intérieur de intervalle
Nous désignerons par les points pour lesquels ce maximum est atteint. Nous appelons see système le système maximisant de . Le polynome
sera appelé le polynome maximisant de .
Enfin nous désignerons par
qui est èvidemment un nombre positif.
16. Nous allons démontrer maintenant que la correspondance entre une fonction et son système maximisant ou son polynome maximisant est continue.
Nous avons besoin de la propriété suivante :
Lemme I. Nous pouvons faire correspondre à tout nombre positif un autre nombre positif tel que si
on ait aussi
Cette propriété est une conséquence de l’unicité. Supposons, en effet, que la propriété ne soit pas vraie. Par un raisonnement classique on voit qu’il existerait alors un nombre positif et une suite de systèmes de points
telles qu’on ait
et que l’une au moins des inégalités
soit vérifiée pour tout . On en déduit l’existence d’un système
tel que
ce qui est en contradiction avec le théorème XVI.
Considérons maintenant deux fonctions (C), .
Soient et les sys-
tèmes maximisants correspondants. Soit A la borne supérieure de la fonction et B la borne supérieure de ,
00footnotetext: 14) Nous savons d’ailleurs que partout nous avons le signe <.
Nous avons
donc
où .
Nous en déduisons
d’où
Nous avons, en particulier,
Ici est le nombre défini au précédent.
Nous avons aussi
On en déduit que
Or, C tend vers zéro avec B. Tenant alors compte du lemme I, il en résulte le
Théorème XVII. Nous pouvons faire correspondre à tout nombre positif a un autre nombre positif tel que, pour la fonction (C) et pour tout autre fonction (C) qui vérifie l’inégalité
on ait aussi
pour les systèmes maximisants correspondants.
C’est la propriété que nous avions en vue.
Nous en déduisons, en particulier, le
Théorème XVIII. Si une suite de fonctions (C)
converge uniformément vers une fonction (C), , le système maximisant correspondant à tend, pour
, vers le système maximisant correspondant à ).
Cette propriété sera fondamentale pour nous dans la suite.
17. Supposons maintenant que soit une fonction . Pour déterminer alors le maximum nous pouvons appliquer le calcul différentiel. Le maximum est donc déterminé par le système
(18)
(où)
II est facile de voir que, par suite des hypothèses faites et surtout à cause de la propriété (concavité), nous avons le
Lemme II. Si est une fonction ( ) le système (18) admet une solution et une seule telle que les soient dans l’intervalle .
Compte tenant du théorème XV, nous avons le
Théorème XIX. Si est une fonction , nous avons
18.
Avant d’aller plus loin, nous devons montrer comment les démonstrations des propriétés énoncées pour les fonctions (C) et qui vont suivre se déduisent des démonstrations des propriétés correspondantes pour les fonctions ( ).
Démontrons avant tout le
Lemme III. Si
est une suite de points situés à l’intérieur de l’intervalle et si
est une suite de nombres non-croissants, il existe une fonction ’ dont la dérivée logarithmique prend les valeurs aux points correspondants .
Soit la fonction continue définie dans l’intervalle ( ) telle que
une fonction linéaire dans .
15) Que la limite soit une fonction (C) n’est pas essentiel, mais nous appliquerons ce théorème sous cette forme dans la suite.
La fonction
est concave dans l’intervalle ( ).
Nous allons maintenant prolonger convenablement cette fonction dans l’intervalle . Prenons la fonction définie de la manière suivante :
Enfin la fonction définie de la manière suivante
est une fonction ( ) et vérifie les conditions du lemme III.
Le prolongement de la fonction se fait en somme par raccordement à l’aide d’arcs d’hyperboles convenablement choisies. Si est non-négatif la fonction est croissante dans l’intervalle et si est non-positif est décroissante dans l’intervalle ( ). Cette remarque nous sera utile pour la propriété suivante.
Le lemme III a une conséquence importante :
Si sont les polynomes maximisants correspondants à une fonction ( C ) et à k valeurs de n , ces polynomes sont aussi les polynomes maximisants correspondants à une fonction ( ) et aux mêmes valeurs de n.
La démonstration ne présente aucune difficulté et résulte immédiatement du lemme II et du théorème XIX.
Dans la suite nous appliquerons cette propriété pour les polynomes .
Nous avons encore le
Lemme IV. Toute fonction (C) est la limite d’une suite de fonctions ( ) convergeant uniformément dans l’intervalle ( 0,1 ).
Il existe d’abord un nombre positif tel que dans l’intervalle la fonction soit non-decroissante et dans l’intervalle ( ) non-croissante. (On prend bien entendu ). Soit maintenant un nombre positif arbitraire. Il existe un nombre positif tel que
pour , et pour .
Dans l’intervalle fermé ( ) la fonction est continue et concave. Il existe un nombre A tel que dans cet intervalle . Considérons maintenant la suite de polynomes 16 )
(19)
qui vérifient les propriétés suivantes :
, dans
. est concave dans ( )
4.
. La suite (19) converge uniformément vers dans tout l’intervalle ( ).
Nous prolongeons le polynome exactement comme nous l’avons fait avec et nous désignons par la fonction ainsi définie dans tout l’intervalle ouvert ( 0,1 ). Définissons enfin la fonction par
Les fonctions vérifient les conditions ( ).
Pour nous avons , donc est respectivement croissante et décroissante dans les intervalles , ( ), donc à fortiori
D’autre part, nous pouvons determiner un nombre tel que pour on ait
10 ) Les polynomes sont les polynomes de M. S. Bernstein. Pour la démonstration des propriétés du texte voir : Tiberiu Popoviciu „Sur l’approximation des fonctions convexes d’ordre supérieur" Mathematica t. X (1935), p. 49.
Nous en déduisons
Finalement donc
pour
ce qui démontre le lemme IV.
19. Nous dirons que deux suites
(20)
de et de points respectivement, se séparent au sens strict si l’on a
Nous dirons aussi que les deux suites (20) se séparent au sens large si l’on a
et si les suites ont au moins un point commun.
On peut aussi dire que les zéros des polynomes
se séparent respectivement au sens strict et au sens large.
Le polynome peut toujours s’écrire sous la forme
qui n’est autre que la formule d’interpolation de Lagrange. Les constantes sont complètement déterminées.
Nous avons le
Lemme V. La condition nécessaire et suffisante pour que les zéros des polynomes et se séparent au sens strict est que les coefficients si soient tous positifs. La condition nécessaire et suffisante pour que les zéros de ces polynomes se séparent au sens large est que les si soient tous non-négatifs l’un au moins étant nul.
Ces propriétés sont bien connues la démonstration étant immédiate. Revenons maintenant aux polynomes maximisants correspondants à une fonction ( ). Nous avons le
Théorème XX. Les zéros des polynomes maximisants , correspondants à une fonction ( ) ne peuvent pas se séparer au sens large.
La démonstration est facile. Supposons le contraire. Nous pouvons alors écrire
où . Pour fixer les idées, supposons que . On a alors . Dérivant deux fois de suite nous avons
d’où
Tenant compte de et du théorème XIX nous en déduisons
Mais, , il en résulte donc que
C’est en contradiction avec l’hypothèse et le théorème XX est donc démontré.
20. Nous nous proposons de démontrer maintenant la propriété que nous avions en vue et qui s’exprime par le
Théorème XXI. Les zéros de deux polynomes maximisants consécutifs correspondants à une fonction se séparent au sens strict.
Montrons d’abord qu’il suffit de démontrer la propriété pour les fonctions . En effet, si la propriété est vraie pour les fonctions , le théorème XVIII et le lemme IV nous montrent que pour une fonction (C) les zéros se séparent ou bien au sens strict ou bien se séparent au sens large. Mais, en vertu de la conséquence du lemme III, c’est bien le premier cas qui arrive.
Il reste à démontrer la propriété dans le cas où est une fonction ( ). Considérons pour cela la fonction
est une fonction . Lorque croit de 0 à 1 , la fonction ou se déforme d’une façon continue et tend uniformément vers ou .
Les théorèmes XVIII et XX nous montrent alors qu’il suffit de démontrer la propriété pour la fonction . Or, dans ce cas
et il est bien connu que les zéros de ces polynomes de Jacobi se séparent au sens strict. Le théorème est donc complétement démontré.
21. Nous nous proposons de dire maintenant quelques mots sur le maximum .
Soit A le maximum (ou bien la borne supérieure) de . Nous avons
(0,1)
Le théorème de M. M. Fekete nous montre donc que
(21)
Soit un nombre positif arbitraire. Dans l’intervalle la fonction a un minimum positif . Soient les points pour lesquels
est atteint. Nous avons
d’où
Mais
et il en résulte que
(22)
quel que petit que soit . Les relations (21) et (22) nous montrent donc que :
Théorème XXII. Si est une fonction (C) l’expression
a, pour , une limite qui est égale au diamètre transfini du segment 0–1.
22. Nous allons maintenant considerer un cas particulier.
Soit
où et sont nombres positifs. C’est une fonction ( ). Le polynome maximisant est alors solution de l’équation différentielle linéaire homogène d’ordre 2
(23)
où est un polynome de degré convenablement choisi. Nos résultats permettent donc de dire qu’une équation de la forme (23) admet une solution polynome de degré et une seule tel que ce polynome ait tous ses zéros réels et compris dans l’un des intervalles ( ). Soit la solution de degré qui a ses zéros dans l’intervalle ( ) et la solution de degré qui a ses zéros dans le même intervalle. Nous pouvons alors dire que les zéros des polynomes et se séparent au sens strict.
C’est Stieltjes qui a étudié pour la première fois les solutions polynomiales de l’équation (23) 17 ). Il a montré, compte tenant du fait que l’équation a au plus
solutions polynomes de degré , que cette équation a exactement solutions de cette forme qui ont tous leurs zéros réels et compris dans l’intervalle ( ). Les zéros de ces polynomes sont distribués de toutes les manières possibles dans les intervalles ( ), à chaque distribution correspondant une seule solution. D’ailleurs à toute solution correspond un problème de maximum. Ces problèmes de maxima, qui constituent une généralisation du problème étudié dans ce travail, ainsi que d’autres problèmes sur la distribution des zéros des solutions polynomiales d’une équation de la forme (23) seront examinés par nous dans un autre travail qui paraîtra prochenement 18 ).
00footnotetext: 17 ) Loc. cit. 3 )
18) Nous avons énoncé des résultats plus généraux dans notre note : „Sur un problème de maximum de Stielties". C. R. Acad. Sc., Paris, t. 202 (1936) p. 1645.