Distance de Bhattacharyya

Distance de Bhattacharyya

En statistiques, la distance de Bhattacharyya est une mesure de la similarité de deux distributions de probabilités discrètes. Elle est reliée au coefficient de Bhattacharyya , qui est une mesure statistique du recouvrement de deux ensembles d'échantillons. Cette mesure est régulièrement utilisée dans des problèmes de classification, en particulier dans le domaine de la vision par ordinateur.

Le nom de la distance et du coefficient proviennent du statisticien indien A. Bhattacharya (en), qui travaillait dans les années 1930 à l'Institut indien de statistiques[1]. Le coefficient peut être utilisé pour déterminer la proximité relative des deux ensembles considérés. Il est utilisé pour mesurer la séparabilité de classes en classification automatique.

Sommaire

Définition

Pour deux distributions de probabilité discrète p et q définies sur le même espace de probabilité, la distance de Bhattacharyya est calculée par :

D_B(p,q) = -\ln \left( BC(p,q) \right)

où :

BC(p,q) = \sum_{x\in X} \sqrt{p(x) q(x)}

est le coefficient de Bhattacharyya.

Pour des distributions de probabilité continues, le coefficient est défini par :

BC(p,q) = \int \sqrt{p(x) q(x)}\, dx

Dans les deux cas, 0 \le BC \le 1 et 0 \le D_B \le \infty. La distance de Bhattacharyya n'obéit par à l'inégalité triangulaire, au contraire de la distance de Hellinger, définie à partir de la distance de Bhattacharyya par \sqrt{1-BC}.

Pour des distributions gaussiennes multivariées pi = N(mi,Pi),

D_B={1\over 8}(m_1-m_2)^T P^{-1}(m_1-m_2)+{1\over 2}\ln \,\left({\det P \over \sqrt{\det P_1 \, \det P_2} }\right),

mi et Pi sont les moyennes et les covariances des distributions, et P={P_1+P_2 \over 2}.

Cette écriture montre que dans le cas gaussien, le premier terme de la distance de Bhattacharyya est relié à la distance de Mahalanobis[2].

Coefficient de Bhattacharyya

Note et références

  1. (en) A. Bhattacharyya, « On a measure of divergence between two statistical populations defined by their probability distributions », dans Bulletin of the Calcutta Mathematical Society (en), vol. 35, 1943, p. 99–109 , MR 0010358
  2. Sergios Theodoridis, Konstantinos Koutroumbas, Pattern recognition, Academic Press Inc, 2006 (ISBN 978-0123695314) , p. 228

Voir aussi

Articles connexes

Bibliographie

  • (en) F. Nielsen et S. Boltz, « The Burbea-Rao and Bhattacharyya centroids », dans ArXiv:1004.5049v1, 2010 [texte intégral] 
  • (en) Thomas Kailath (en), « The Divergence and Bhattacharyya Distance Measures in Signal Selection », dans IEEE Transactions on Communication Technology, vol. 15, no 1, 1967, p. 52–60 [lien DOI] 
  • (en) A. Djouadi, O. Snorrason et F. Garber, « The quality of Training-Sample estimates of the Bhattacharyya coefficient », dans IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 12, no 1, 1990, p. 92-97 [lien DOI] 
  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Distance de Bhattacharyya de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Bhattacharyya distance — In statistics, the Bhattacharyya distance measures the similarity of two discrete probability distributions. It is normally used to measure the separability of classes in classification. For discrete probability distributions p and q over the… …   Wikipedia

  • Mahalanobis distance — In statistics, Mahalanobis distance is a distance measure introduced by P. C. Mahalanobis in 1936.[1] It is based on correlations between variables by which different patterns can be identified and analyzed. It gauges similarity of an unknown… …   Wikipedia

  • Hellinger distance — In probability theory, a branch of mathematics, given two probability measures P and Q that are absolutely continuous in respect to a third probability measure lambda;, the square of the Hellinger distance between P and Q is defined as the… …   Wikipedia

  • Statistical distance — See: * total variation distance * Signal to noise ratio distance * Bhattacharyya distance * Mahalanobis distance * …   Wikipedia

  • String metric — String metrics (also known as similarity metrics) are a class of textual based metrics resulting in a similarity or dissimilarity (distance) score between two pairs of text strings for approximate matching or comparison and in fuzzy string… …   Wikipedia

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • Histogramme (imagerie numérique) —  Pour l’article homonyme, voir Histogramme.  Une image de tournesol …   Wikipédia en Français

  • Shaktism — ( Sanskrit: IAST|Śāktaṃ, sa. शाक्तं; lit., doctrine of power or doctrine of the Goddess ) is a denomination of Hinduism that focuses worship upon Shakti or Devi – the Hindu Divine Mother – as the absolute, ultimate Godhead. It is, along with… …   Wikipedia

  • Miscegenation — Race Classification Race (classification of humans) Genetics …   Wikipedia

  • List of statistics topics — Please add any Wikipedia articles related to statistics that are not already on this list.The Related changes link in the margin of this page (below search) leads to a list of the most recent changes to the articles listed below. To see the most… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”