Taux d'erreur de mots

Taux d'erreur de mots
Page d'aide sur l'homonymie Pour les articles homonymes, voir WER.

Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance de la parole.

Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Plus le taux est faible (minimum 0.0) plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions.

Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par:

 WER = \frac{S+D+I}{N}

où :

  • N est le nombre de mots de référence,
  • S est le nombre de substitutions (mots incorrectement reconnus),
  • D est le nombre de suppressions (mots omis),
  • I est le nombre d'insertions (mots ajoutés),
  • H est le nombre de mots correctement reconnus.

Le taux de reconnaissance de mots, ou word accuracy (WAcc) en anglais, est défini ainsi :

 WAcc = 1 - WER = \frac{N-S-D-I}{N} = \frac{H-I}{N}

Ce taux de reconnaissance peut être négatif.

Références


Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Taux d'erreur de mots de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • Taux de reconnaissance de mots — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… …   Wikipédia en Français

  • ERREUR — La définition classique de la vérité et de l’erreur est celle d’Aristote: «Dire de ce qui est qu’il est, ou de ce qui n’est pas qu’il n’est pas, c’est dire vrai; dire de ce qui n’est pas qu’il est ou de ce qui est qu’il n’est pas, c’est dire faux …   Encyclopédie Universelle

  • Taux de capture — Poké ball Une Wiki Ball, Poké Ball spéciale de Wikipédia Une Poké Ball (モンスターボール Monsutābōru, Monster Ball dans les versions japonaises originales) est un appareil sphérique dans les jeux vidéo et les séries télévisées Pokémon utilisé par les… …   Wikipédia en Français

  • WRR — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… …   Wikipédia en Français

  • Word error rate — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… …   Wikipédia en Français

  • Word recognition rate — Taux d erreur de mots Pour les articles homonymes, voir WER. Le taux d erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d un système de reconnaissance vocale. Le WER est dérivé… …   Wikipédia en Français

  • Reconnaissance vocale — Pour les articles homonymes, voir ASR. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d analyser la parole captée au moyen d un microphone pour la… …   Wikipédia en Français

  • Automatic Speech Recognition — Reconnaissance vocale Pour les articles homonymes, voir ASR. La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d analyser un mot ou une phrase captée …   Wikipédia en Français

  • Reconnaissance de la parole — Reconnaissance vocale Pour les articles homonymes, voir ASR. La reconnaissance vocale ou reconnaissance automatique de la parole (Automatic Speech Recognition ASR) est une technologie informatique qui permet d analyser un mot ou une phrase captée …   Wikipédia en Français

  • Traduction vocale quasi-instantanée — La traduction dite en temps réel, en réalité « quasi en temps réel », réalisée par un logiciel spécialisé est un processus non encore opérationnel, nécessitant de maîtriser simultanément 3 grandes étapes devant être réalisées pour… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”