Algorithme de Remez - Remez algorithm

L' algorithme de Remez ou algorithme d' échange de Remez , publié par Evgeny Yakovlevich Remez en 1934, est un algorithme itératif utilisé pour trouver des approximations simples de fonctions, en particulier des approximations par des fonctions dans un espace de Chebyshev qui sont les meilleures au sens de la norme uniforme L .

Un exemple typique d'un espace Chebyshev est le sous - espace de polynômes de Chebyshev d'ordre n dans la place de réelles fonctions continues sur un intervalle , C [ a , b ]. Le polynôme de meilleure approximation dans un sous-espace donné est défini comme celui qui minimise la différence absolue maximale entre le polynôme et la fonction. Dans ce cas, la forme de la solution est précisée par le théorème d'équioscillation .

Procédure

L'algorithme de Remez commence par la fonction à approximer et un ensemble de points d'échantillonnage dans l'intervalle d'approximation, généralement les extrema du polynôme de Chebyshev mappés linéairement sur l'intervalle. Les étapes sont :

  • Résoudre le système linéaire d'équations
(où ),
pour les inconnues et E .
  • Utilisez les comme coefficients pour former un polynôme .
  • Trouver l'ensemble des points d'erreur maximale locale .
  • Si les erreurs à chaque fois sont de même amplitude et de signe alternatif, alors est le polynôme d'approximation minimax. Sinon, remplacez par et répétez les étapes ci-dessus.

Le résultat est appelé le polynôme de meilleure approximation ou l' algorithme d'approximation minimax .

Une revue des détails techniques dans la mise en œuvre de l'algorithme de Remez est donnée par W. Fraser.

Sur le choix de l'initialisation

Les nœuds de Chebyshev sont un choix courant pour l'approximation initiale en raison de leur rôle dans la théorie de l'interpolation polynomiale. Pour l'initialisation du problème d'optimisation pour la fonction f par l'interpolant de Lagrange L n ( f ), on peut montrer que cette première approximation est bornée par

avec la norme ou constante de Lebesgue de l'opérateur d'interpolation de Lagrange L n des nœuds ( t 1 , ..., t n  + 1 ) étant

T étant les zéros des polynômes de Chebyshev, et les fonctions de Lebesgue étant

Theodore A. Kilgore, Carl de Boor et Allan Pinkus ont prouvé qu'il existe un t i unique pour chaque L n , bien qu'il ne soit pas connu explicitement pour les polynômes (ordinaires). De même, , et l'optimalité d'un choix de nœuds peuvent être exprimés comme

Pour les nœuds de Chebyshev, qui fournit un choix sous-optimal, mais analytiquement explicite, le comportement asymptotique est connu sous le nom

( γ étant la constante d'Euler–Mascheroni ) avec

pour

et borne supérieure

Lev Brutman a obtenu la borne pour , et étant les zéros des polynômes étendus de Chebyshev :

Rüdiger Günttner a obtenu à partir d'une estimation plus précise de

Discussion détaillée

Cette section fournit plus d'informations sur les étapes décrites ci-dessus. Dans cette section, l'indice i va de 0 à n +1.

Étape 1 : Étant donné , résolvez le système linéaire de n +2 équations

(où ),
pour les inconnues et E .

Il devrait être clair que dans cette équation n'a de sens que si les nœuds sont ordonnés , soit strictement croissants, soit strictement décroissants. Alors ce système linéaire a une solution unique. (Comme cela est bien connu, tous les systèmes linéaires n'ont pas de solution.) De plus, la solution peut être obtenue avec uniquement des opérations arithmétiques alors qu'un solveur standard de la bibliothèque prendrait des opérations. Voici la preuve simple :

Calculer l' interpolant standard du n -ième degré aux n +1 premiers nœuds et également l' interpolant standard du n -ième degré aux ordonnées

Pour cela, utilisez à chaque fois la formule d'interpolation de Newton avec les différences divisées d'ordre et d' opérations arithmétiques.

Le polynôme a son i- ième zéro entre et , et donc aucun autre zéro entre et : et ont le même signe .

La combinaison linéaire est aussi un polynôme de degré n et

C'est la même que l'équation ci-dessus pour et pour tout choix de E . La même équation pour i = n +1 est

et nécessite un raisonnement particulier : résolu pour la variable E , c'est la définition de E :

Comme mentionné ci-dessus, les deux termes du dénominateur ont le même signe : E et sont donc toujours bien définis.

L'erreur aux nœuds ordonnés n +2 donnés est à son tour positive et négative car

Le théorème de La Vallée Poussin énonce que sous cette condition aucun polynôme de degré n n'existe avec une erreur inférieure à E . En effet, si un tel polynôme existait, appelez-le , alors la différence serait toujours positive/négative aux n +2 nœuds et aurait donc au moins n +1 zéros ce qui est impossible pour un polynôme de degré n . Ainsi, ce E est une borne inférieure de l'erreur minimale qui peut être atteinte avec des polynômes de degré n .

L'étape 2 modifie la notation de à .

L'étape 3 améliore les nœuds d'entrée et leurs erreurs comme suit.

Dans chaque région P, le nœud actuel est remplacé par le maximiseur local et dans chaque région N est remplacé par le minimiseur local. (Attendez-vous à A , près de , et à B .) Aucune précision élevée n'est requise ici, la recherche de ligne standard avec quelques ajustements quadratiques devrait suffire. (Voir )

Laissez . Chaque amplitude est supérieure ou égale à E . Le théorème de La Vallée Poussin et sa démonstration s'appliquent également à avec comme nouvelle borne inférieure pour la meilleure erreur possible avec des polynômes de degré n .

De plus, cela s'avère utile en tant que limite supérieure évidente pour la meilleure erreur possible.

Étape 4 : Avec et comme borne inférieure et supérieure pour la meilleure erreur d'approximation possible, on a un critère d'arrêt fiable : répéter les étapes jusqu'à ce qu'elle soit suffisamment petite ou ne diminue plus. Ces bornes indiquent la progression.

Variantes

Parfois, plusieurs points d'échantillonnage sont remplacés en même temps par les emplacements des différences absolues maximales proches.

Parfois, tous les points d'échantillonnage sont remplacés en une seule itération avec les emplacements de tous, signe alternatif, différences maximales.

Parfois, l' erreur relative est utilisée pour mesurer la différence entre l'approximation et la fonction, surtout si l'approximation sera utilisée pour calculer la fonction sur un ordinateur qui utilise l' arithmétique à virgule flottante .

Parfois, des contraintes de point zéro erreur sont incluses dans un algorithme d'échange Remez modifié.

Voir également

Les références

Liens externes