Introduction

L'utilisation de modèles de probabilité spatiale est particulièrement motivée dans l'industrie minière, où les prospecteurs prélevés des échantillons géologiques pour détecter la présence de minéraux précieux. Ces données présentent souvent une forte corrélation spatiale, mais la construction d'un modèle géophysique complet est parfois impossible en raison de la difficulté à observer les conditions souterraines.

Contexte Technique

Pour résoudre ce problème, nous utilisons un modèle de probabilité qui utilise les données voisines pour prédire une variable d'intérêt à un nouvel emplacement. Nous allons utiliser un exemple de données de concentration d'uranium et de vanadium provenant du lac Walker. Les données sont distribuées avec le package R gstat. Nous allons modifier le modèle de processus gaussien pour tenir compte du fait que la localisation réelle des points de données n'est pas connue avec précision et est observée avec un bruit de mesure important.

Notre modèle utilise la notation suivante : $ ilde{mathbf{s}}_i$ pour la coordonnée enregistrée et $mathbf{s}_i$ pour la coordonnée latente où la mesure a réellement eu lieu. Nous utilisons $mathbf{s}_i = ilde{mathbf{s}}_i + Delta_i$, avec $Delta_i sim operatorname{Normal}(mathbf{0}, sigma_s^2 I_2)$, et évaluons le processus gaussien à $mathbf{s}_i$ plutôt qu'à $ ilde{mathbf{s}}_i$.

Analyse et Implications

Ce modèle est plus difficile à calculer que le modèle de processus gaussien à localisation fixe, car la matrice de covariance change lorsque les coordonnées latentes changent. Nous utilisons pm.gp.Marginal pour intégrer les valeurs latentes du processus gaussien aux observations. Nous allons construire des jeux de données avec des niveaux de bruit croissants et examiner comment les estimations des paramètres du modèle changent.

Nous utilisons la bibliothèque PyMC pour implémenter le modèle et effectuer les simulations. Nous générons des coordonnées bruyantes en ajoutant du bruit aux coordonnées originales, puis nous construisons le modèle en utilisant l'objet pm.Data pour contenir les coordonnées bruyantes.

Perspective

Ce modèle de probabilité spatiale avec des coordonnées inconnues peut être appliqué à d'autres domaines tels que la neuroscience, la robotique et la géostatistique. Il est important de noter que la précision des estimations des paramètres dépend de la quantité de données disponibles et du niveau de bruit dans les données. Il est également important de surveiller les diagnostics de convergence et les divergences pour s'assurer que le modèle est bien spécifié et que les estimations sont fiables.