WRR

WRR

Taux d'erreur de mots

Page d'aide sur l'homonymie Pour les articles homonymes, voir WER.

Le taux d'erreur de mots, ou word error rate (WER) en anglais, est une unité de mesure classique pour mesurer les performances d'un système de reconnaissance vocale.

Le WER est dérivé de la distance de Levenshtein, en travaillant au niveau des mots au lieu des caractères. Il indique le taux de mots incorrectement reconnus par rapport à un texte de référence. Au plus le taux est faible (minimum 0.0) au plus la reconnaissance est bonne. Le taux maximum n'est pas borné et peut dépasser 1.0 en cas de très mauvaise reconnaissance s'il y a beaucoup d'insertions.

Après avoir aligné de manière optimale la référence avec le texte reconnu grâce à un algorithme de programmation dynamique, le taux d'erreur de mots est donné par:

 WER = \frac{S+D+I}{N}


Néanmoins, il est fréquent de rapporter plutôt le taux de reconnaissance de mots, ou word recognition rate (WRR) en anglais, et souvent en pourcentage. Il indique le taux de mots corrects par rapport à un texte de référence. Au plus le taux est élevé, au plus la reconnaissance est de bonne qualité (maximum 100%). Le taux minimum n'est pas borné et peut être négatif.

 WRR = 1 - WER = \frac{N-S-D-I}{N} = \frac{H-I}{N}

Où :

  • N est le nombre de mots de référence,
  • S est le nombre de substitutions (mots incorrectement reconnus),
  • D est le nombre de suppressions (mots omis),
  • I est le nombre d'insertions (mots ajoutés),
  • H est le nombre de mots correctement reconnus.

Références

Ce document provient de « Taux d%27erreur de mots ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article WRR de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • WRR — may refer to:* Water Resources Research, a scientific periodical published by the American Geophysical Union * The Waynesburg and Washington Railroad * Weighted round robin, a scheduling algorithm * WRR (FM), a classical radio station in Dallas,… …   Wikipedia

  • WRR (FM) — Infobox Radio station name = WRR city = Dallas, Texas area = Dallas/Fort Worth Metroplex branding = Classical 101 WRR slogan = airdate = 1920 on AM 1310 1948 on FM 101.1 frequency = 101.1 MHz HD Radio format = Classical music erp = 98,000 watts… …   Wikipedia

  • WRR — weapons response range (as well as wpns release rg) …   Military dictionary

  • WRR — Weighted Round Robin (Computing » General) Weighted Round Robin (Computing » Networking) * Water Resources Research (Academic & Science » Universities) * World Rivers Review (Community » Media) * World Radiometric Reference (Governmental » NASA)… …   Abbreviations dictionary

  • wrr — ISO 639 3 Code of Language ISO 639 2/B Code : ISO 639 2/T Code : ISO 639 1 Code : Scope : Individual Language Type : Living Language Name : Wardaman …   Names of Languages ISO 639-3

  • WRR — abbr. Work Requirements Review …   Dictionary of abbreviations

  • Bible code — A Bible code (also Torah code) is the notion that there are information patterns encrypted or coded form in the text of the Bible, or, more specifically, in the Torah, the first five books of the Hebrew Bible. The existence of such codes has been …   Wikipedia

  • Weighted round robin — (WRR) is a best effort connection scheduling discipline. Each packet flow or connection has its own packet queue in a network interface card. It is the simplest emulation of generalized processor sharing (GPS) discipline. While GPS serves… …   Wikipedia

  • DWRR-FM — This article is about a radio station in Philippines. For the computer scheduling algorithm, see DWRR. ABS CBN DWRR FM (Tambayan 101.9) City of license Quezon City Broadcast area Metro Manila …   Wikipedia

  • KTCK — City of license Dallas, Texas Broadcast area Dallas/Fort Worth Metroplex Branding Sports Radio 1310: The Ticket …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”