s
19 708 Pages

un problème inverse Il est un contexte d'enquête générique dans lequel ils sont des informations demandées sur une quantité physique, ou plus généralement sur un système, à partir de mesures ou d'informations du type indirect.

Par exemple, à partir des mesures de champ gravitationnel dans une certaine zone de la surface de la terre, nous pouvons demander: « grâce aux mesures que nous avons obtenus, que pouvons-nous dire au sujet de la distribution de densité de masse dans ce domaine ». La résolution de ce problème (à savoir, la distribution de densité qui mieux est d'accord avec les mesures) est utile, car elle permet d'obtenir des informations sur une quantité physique ne sont pas directement observables. Les problèmes inverses se posent dans de nombreuses branches science et mathématiques, y compris la vision par ordinateur, l 'apprentissage machine, la statistiques, l 'inférence statistique, la géophysique, la l'imagerie diagnostique (Tel que Tomodensitométrie et l 'EEG/ERP), Le La télédétection, la tomographie acoustique océanographique, la contrôle non destructif, l 'astronomie, la physique et dans de nombreux autres domaines.

histoire

Le domaine des problèmes inverses a été découvert et introduit par le physicien soviétique-arménien Viktor Ambartsumian.[1][2]

Alors qu'il était encore étudiant, il a étudié en profondeur la théorie de Ambartsumian Structure atomique, la formation de niveaux d'énergie, le 'équation de Schrödinger et ses propriétés, et quand maîtrisaient la théorie de valeurs propres tout équations différentielles, Il a noté la similitude apparente entre les niveaux discrets d'énergie et les valeurs propres des équations différentielles. Il demanda alors: étant donné une famille de valeurs propres, vous pouvez trouver la forme des équations avec ces mêmes valeurs propres? Essentiellement Ambartsumian examinait l'inverse de Problème de Sturm-Liouville, ayant à voir avec la détermination des équations d'un corde vibrante. Cet article publié en 1929 dans la revue de physique allemande Zeitschrift für Physik et il est resté Oubliée pendant une longue période de temps. Décrivant cette situation après plusieurs décennies, Ambartsumian a dit: « Si un astronome publie un article avec un contenu mathématique dans un journal de la physique, la chose la plus susceptible de se produire est que vous l'oubliez. »

Cependant, vers la fin de Guerre mondiale, L'article, écrit par une vingtaine d'années Ambartsumian, a été trouvé par les mathématiciens suédois et a formé le point de départ pour toute une zone de recherche sur les problèmes inverses, devenant ainsi le fondement de toute une discipline.

formulation conceptuelle

La résolution d'un problème « inverse » peut être formulée comme un changement conceptuel à partir des données que nous avons la solution faite à partir des paramètres d'un modèle du système:

Données → Paramètres du modèle

Le problème inverse est considéré comme le « » inverse « le problème direct. Celle-ci concerne les paramètres du modèle avec les données observées:

Les paramètres du modèle → données

La transformation des données aux paramètres du modèle (ou vice-versa) est le résultat de l'interaction d'un système physique (par exemple, un outil) avec l'objet dont nous voulons déduire les propriétés. En d'autres termes, la transformation est la physique qui relie la grandeur physique (par exemple les paramètres du modèle) pour les données observées.

Le tableau suivant montre plusieurs exemples du système physique, la physique sous-jacente, la grandeur physique à laquelle nous sommes concernés et le type de données observées.

système physique équations décrivant Quantité physique les données observées
gravitation champ de la Terre Loi de la gravité de Newton densité Champ de gravitation
le champ magnétique de la Terre (à la surface) Les équations de Maxwell susceptibilité magnétique champ magnétique
ondes sismiques (tremblements de terre) équation d'onde la vitesse des vagues (densité) vitesse des particules

L 'algèbre linéaire Il est un outil utile pour comprendre la construction physique et les mathématiques de problèmes inverses, grâce à la présence de la transformation ou le « mapping » des données aux paramètres du modèle.

Formulation générale Problème

L'objectif du problème inverse est de trouver le meilleur modèle, , de telle sorte que (au moins approximativement)

est un opérateur décrivant la relation explicite entre les données observées, , et les paramètres du modèle. Dans divers contextes, l'opérateur il est appelé opérateur directe, observation de l'opérateur, ou fonction d'observation. Dans un contexte plus général, G représente les équations qui régissent la connexion à partir des paramètres du modèle aux données observées (la physique sous-jacente).

problème inverse linéaire

Dans un problème inverse linéaire discret décrivant une système linéaire, et Ils sont des vecteurs, et le problème peut être écrit comme

est un matrice, souvent appelé la matrice d'observation.

Exemples

le champ gravitationnel de la Terre

Seuls quelques systèmes physiques sont en effet linéaire par rapport aux paramètres du modèle. Dans le cadre d'un tel système géophysique est celui du champ gravitationnel de la Terre. le champ gravitationnel de la Terre est déterminée par la distribution sous-jacente de la densité de surface de la Terre. Depuis la lithographie Terre change considérablement fait, nous sommes en mesure d'observer les différences de minutes dans le champ gravitationnel de la surface de la Terre. De notre compréhension de la gravité (Loi de Gravitation de Newton), Nous savons que l'expression mathématique de la gravité est:

Il est une mesure de l'accélération gravitationnelle locale, est la constante de gravitation, Elle est la (densité) de la masse locale à proximité de la surface et est la distance à partir de la masse au point d'observation.

Discrétisation l'équation ci-dessus, nous pouvons relier les données discrètes des observations sur les paramètres de la surface de la Terre (densité) discrètes de la surface de base sur lesquelles nous enquêtons. Par exemple, considérons le cas où nous effectuons 5 mesures sur la surface de la terre. Dans ce cas, notre vecteur de données, d, est une taille de vecteur colonne (en taille) (5x1). Nous avons aussi une distribution de cinq masses sous la surface (condition irréaliste mais utile pour démontrer le concept). Ainsi, nous pouvons construire un système linéaire reliant les cinq masses inconnues aux cinq données de point comme suit:

Maintenant, nous pouvons voir que le système a cinq équations, , avec cinq inconnues, . Pour le résoudre en obtenant les paramètres du modèle qui correspondent à nos données, nous pouvons inverser la matrice l'obtention de paramètre direct de nos valeurs modèle. Par exemple:

Cependant, toutes les matrices carrées sont inversible ( Il est le plus souvent réversible). En effet, nous avons aucune garantie que vous avez suffisamment d'informations pour déterminer seulement la solution d'une équation donnée à moins qu'ils aient des mesures indépendantes (à savoir les mesures d'ajouter chaque information unique sur le système). Il est important de noter que, pour de nombreux systèmes physiques ont pas assez d'informations « convaincante » à une solution unique et ce en raison du fait que le système d'équations ne sont pas « suffisamment » fixé. En termes algébriques, la matrice Il est déficient en rang (ie admet des valeurs propres null), il est donc pas inversible. De plus, si l'on ajoute d'autres observations (par exemple plus d'équations), puis la matrice ne reste plus de type carré. Même dans ce cas, nous avons aucune garantie d'obtenir une matrice complète de rang pour les observations. Tant de problèmes inverses sont considérés sous certains, ce qui signifie donc que nous avons des solutions uniques au problème inverse. Si nous avons un système de rang plein, notre solution peut être unique. sur certains systèmes (plus d'équations que d'inconnues) des difficultés supplémentaires.

Puisque nous ne pouvons pas inverser directement la matrice, nous utiliserons les méthodes d'optimisation pour résoudre le problème inverse. Pour ce faire, nous définissons une cible ou plutôt une fonction objective. L'objectif est fonctionnel qui estime la proximité de ces données à partir du modèle aux données observées. Si nous avions les données parfaites (non affectées par le bruit) et une bonne compréhension du phénomène physique, le modèle reproduit parfaitement les données observées. Habituellement, la forme standard de la fonction objective, , il est:

qui représente la norme qui définit la distance entre les données observées et les données reproduites par notre modèle. la règle Il est utilisé pour estimer la distance entre les données observées et celles reproduites par le modèle, mais d'autres types de normes peuvent être utilisées. La fonction objective est utilisée dans le but de réduire au minimum la distance entre les données mentionnées ci-dessus (sur la base du modèle) et les données observées.

Pour minimiser la fonction objective (et donc de résoudre le problème inverse) on calcule le gradient d'une manière tout à fait analogue à celui de la minimisation d'une fonction d'une variable. Le gradient de la fonction objectif est:

ce qui simplifie à

que, avec une étape supplémentaire devient

L'équation de cette manière est placée sous forme dite normale et fournit une solution formelle au problème inverse. La solution est équivalente à celle de l'ordinaire moindres carrés:

Habituellement, les données présentent les variations inhérentes découlant de la nature aléatoire du bruit ou pire, le type cohérent. Cependant, des erreurs dans les données d'observation introduit des erreurs dans les paramètres du modèle obtenus en résolvant le problème inverse. Pour éviter ces erreurs peuvent être nécessaires pour limiter les solutions possibles afin de mettre l'accent sur certaines caractéristiques de notre modèle. Ce type de restriction est connue sous le nom de régularisation.

mathématiques

Un exemple clé du problème linéaire inverse est fourni par "équation intégrale de Fredholm du premier type.

pour les fonctions suffisamment régulière (lisse) L'opérateur est défini ci-dessus compact sur espaces de Banach comme « raisonnable » espaces Lp. Bien que la carte est injection son inverse en général, il ne sera pas continue (cependant, grâce au théorème de l'opérateur inverse limité, si la carte est bijective, alors la fonction inverse est limitée par exemple, continue). Ainsi les erreurs dans les données petites Ils sont fortement amplifiés dans la solution . En ce sens, le problème inverse à savoir infère par des mesures il est mal conditionné.

Afin d'obtenir une solution numérique, l'intégrale doit être approchée par équarrissage, et les données doivent être échantillonnés dans une forme décente. Le système résultant d'équations linéaires seront mal conditionné

Un autre exemple est l'inversion radon transformer. Dans ce cas, une fonction, par exemple, de deux variables, est déduit une série d'intégrales toutes les directions possibles le long du plan. Ceci est exactement le problème résolu dans la reconstruction des images dans le cadre de tomodensitométrie à Rayons X. Bien que d'un point de vue théorique de nombreux problèmes inverses linéaires sont bien compris, les problèmes impliquant la transformation de Radon et ses généralisations sont encore de nombreux défis théoriques qui ont des problèmes encore assez de données non résolues. Ces problèmes comprennent des données incomplètes pour la transformation radiographie en trois dimensions et des problèmes concernant la généralisation de la transformation radiographie aux champs tensoriels.

Un dernier exemple est reliée à 'Hypothèse de Riemann Il a été donné par Wu et Sprung. L'idée est que, dans le (old) Théorie de Semiclassical Comment l'inverse du potentiel à l'intérieur de l'hamiltonien est proportionnelle à la semi-dérivée des valeurs propres (énergies) de la fonction de densité numérique n (x).

problème inverse non linéaire

Une famille intrinsèquement plus difficile des problèmes inverses est celle des problèmes inverses non linéaires.

Les problèmes inverses non linéaires ont une relation plus complexe entre les données et le modèle, représentée par l'équation:

Dans ce cas, est pas un opérateur linéaire et ne peut pas être séparé de manière à représenter une application linéaire de paramètres de modèle de Transforms dans les données. En cherchant une solution, la première priorité est de comprendre la structure du problème et donner une réponse théorique à trois questions Hadamard (de sorte que le problème est résolu à partir d'un point de vue théorique). Seulement dans une phase d'étude suivant la régularisation et l'interprétation de la dépendance à l'égard de la solution (ou des solutions, en fonction des conditions d'unicité) par les paramètres et les données / mesures (probabilistes ou autres) peut être fait.

Bien que le problème linéaire inverse a été complètement résolu par le point de vue théorique vers la fin du XIXe siècle, seule une classe de problèmes inverses non linéaires a été résolu avant 1970, celle du (problème) et le spectre inverse dispersion inverse (une dimension), grâce au travail fondateur de l'école des mathématiques russe (Krein, Gelfand, Levitan, Marchenko). Une grande discussion des résultats a été donné par Chadan et Sabatier dans leur livre « Problèmes inverses de Quantum Theory Scattering » (deux éditions en anglais et un en russe).

Dans ce type de données du problème sont les propriétés du spectre d'un opérateur linéaire qui décrit la diffusion. la spectre Il est constitué par valeurs propres et de fonctions propres, formant ensemble le « spectre discret », et sa généralisation appelée « spectre continu ». Le point notable du point de vue physique et que les expériences de diffusion fournissent des informations uniquement sur le spectre continu, et que la connaissance de l'état complet du spectre est à la fois nécessaire et suffisante pour obtenir l'opérateur de diffusion. Nous paramètres donc invisibles, ce qui est beaucoup plus intéressant que dans le cas du problème inverse linéaire où est fourni les mêmes informations de la connaissance de l'espace nul. De plus, il y a des zones physiques où le mouvement est associé comme conséquence une préservation du spectre de l'opérateur. Ce phénomène est régi dans son évolution par des équations différentielles non linéaires spéciales aux dérivées partielles, par exemple l'équation de Korteweg-de Vries. Si l'espace d'un opérateur est constitué par une seule valeur propre, puis le mouvement correspondant est celui d'une seule impulsion qui se propage à une vitesse constante et sans déformation, une onde solitaire appelé "soliton».

Un signal parfait, sa généralisation pour l'équation de Korteweg-de Vries ou d'autres équations intégro-différentielles non linéaires dérivées partielles sont d'un grand intérêt, avec de nombreuses applications possibles. Cette zone a été étudiée comme une branche de la physique mathématique à partir de 1970. problèmes inverses sont également Nonlinear actuellement étudié dans de nombreux domaines de la science appliquée (diffusion acoustique, mécanique, électromagnétique - notamment des enquêtes radar, des relevés sismiques et presque tous les modes de détection des images.

considérations mathématiques

Les problèmes inverses sont typiquement mal conditionnés, par opposition à des problèmes typiques bien conditionnés dans des situations de modélisation physique où ils sont connus les paramètres du modèle ou les propriétés du matériau. Sur les trois conditions pour un problème bien conditionné proposées par Jacques Hadamard (Existence, unicité, la stabilité de la solution ou des solutions) la condition de stabilité est le plus souvent violé. Dans le cadre de 'analyse fonctionnelle, le problème inverse est représenté par une carte de espaces métriques. En dépit des problèmes inverses sont souvent formulés dans des espaces de dimension infinie, la limitation du nombre de mesures et l'examen pratique ne dérivent un nombre fini de paramètres inconnus, peut conduire à une reformulation du problème sous forme discrète. Dans ce cas, le problème sera généralement mal conditionné. Dans ces cas, la régularisation peut être utilisé pour introduire des hypothèses moins rigoureuses empêchant supra certaines solutions (overfitting). De nombreux exemples de problèmes inverses régularisés peuvent être interprétés comme des cas particuliers inférence bayésienne.

Revues académiques

Il y a quatre grandes revues universitaires traitant des problèmes inverses en général.

En outre, il existe de nombreux magazines sur l'imagerie dans les instruments de médecine, etc., de contrôle non destructif. qui traite principalement des problèmes inverses dans leurs domaines d'intérêt.

notes

bibliographie

  • Chadan, Khosrow Sabatier, Pierre Célestin (1977). Les problèmes inverses dans Quantum Theory Scattering. Springer-Verlag. ISBN 0-387-08092-9
  • Aster, Richard [et al.] (2004). Estimation des paramètres et problèmes inverses, Elsevier. ISBN 978-0-12-065604-2; ISBN 0-12-065604-3
  • (FR) WH Press, SA Teukolsky, WT Vetterling et BP Flannery, Section 19.4. Les problèmes inverses et l'utilisation d'une information Priori, en Recettes numériques: L'art de calcul scientifique, 3e éd., New York, Cambridge University Press, 2007 ISBN 978-0-521-88068-8.

Articles connexes

  • sondages météo
  • L'assimilation des données
  • Géophysique mathématique
  • régularisation Tikhonov
  • Méthode de Backus-Gilbert

liens externes

Les associations sur les problèmes inverses