Semantique

Semantique

Sémantique

LinguistiqueDialog ballons icon.svg
Disciplines :
Théories :

La sémantique est une branche de la linguistique qui étudie les signifiés.

Le mot sémantique est dérivé du grec σημαντικός (semantikos), «signifié» lui même formé à partir de σημαίνω (semaino), "signifier, indiquer" ou σήμα (SEMA), "signe, marque." Il a été repris à la fin du XIXe siècle par le linguiste français Michel Bréal, auteur du premier traité de sémantique.

En particulier, la sémantique possède plusieurs objets d'étude :

Le terme de sémantique est utilisé en opposition à celui de syntaxe dans l'étude des langages de programmation en informatique, pour laquelle elle a été développée de manière formelle (voir sémantique des langages de programmation). Il y a entre la sémantique et la syntaxe le même rapport qu'entre le fond et la forme.

Sommaire

Différence entre l'analyse sémantique et l'analyse lexicale

L'analyse lexicale va s'occuper du mot et elle s'en occupera par rapport à une phrase. On ne peut pas faire d'analyse lexicale du mot "petites" s'il n'est pas inclus dans une phrase, en relation avec d'autres mots compléments ou chefs de groupe.

À savoir : un sème est la plus petite unité de sens.

La sémantique peut s'intéresser à un mot pour le mot. On analysera ainsi le mot "petites" :

PETIT (Adj. => qui n'est pas grand) + E (marque de féminin) + S (marque de pluriel) [PETIT - la base ou le radical du mot (signe lexical), E + S - sont des signes grammaticaux]

Pour le mot "petites" nous avons donc 3 sèmes.

À partir de ce même mot, d'autres analyses sont possibles sans forcément mettre en lumière un énoncé entier. (cf introduction)

Applications à la fouille de données

Les méthodes de fouille de données (en anglais data mining) permettent de dégager du sens d'un ensemble de données d'allure a priori disparates (voir aussi intelligence artificielle) et donc créent de la sémantique. La sémantique dégagée prend généralement trois formes (traduction par des signifiants formels) issues de l'intelligence artificielle :

  • Le tableau
  • Le graphe (réseau maillé d'objets, de concepts, etc.)
  • L'arbre (cas particulier de graphe nécessitant une théorie et une exploitation spécifiques)

Ce sont des signifiants, au sens où ils représentent les connaissances. De telles structures sont ensuite annotées dans les données de départ, chaque donnée portant alors la marque de son appartenance à une branche de l'arbre, une case du tableau, etc. L'analyse reprend alors à un niveau de compréhension plus complexe.

L'audit de découverte des connaissances

Toutefois, la machine ne manipulant que des signifiants, il est impératif que la démarche de forage de données fasse intervenir un expert humain du domaine. Celui-ci va restituer la sémantique extraite et lui donner du sens, de la valeur. Trois critères sont exhibés à cette fin :

  • Est-ce connu ?
  • Est-ce explicable ?
  • Est-ce utile ?

L'idéal est d'avoir un triplet NON/OUI/OUI.

Un tel projet est appelé "audit de découverte des connaissances ", en anglais KDD, Knowledge Discovery in Databases.

Finalement, la sémantique extraite tient le rôle d'une cartographie de l'information, elle permet de situer les informations les unes par rapport aux autres. Ce rôle "cartographique " permet de stocker l'information, de la ranger et plus tard de la retrouver. Tout modèle, jeu de catégories, topique freudienne est alors de facto une cartographie de l'information, c'est-à-dire un contexte formalisé.

Ce sont en fait des données sur les données, des métadonnées. Des architectures informatiques spécifiques permettent de gérer ces métadonnées, on parle de client ou de serveur de métadonnées. Un système connu est le Dublin Core Metadata Initiative (DCMI).
(voir Dublin Core)

Le Web sémantique est un projet du même type que DCMI, visant à créer, gérer et exploiter des métadonnées systématiques pour chaque page web. Ainsi le contenu de chaque page web étant explicité vers des signifiants, la machine serait capable de raisonner sur la pertinence du contenu et non plus sur des statistiques lexicales. Cela peut avoir des conséquences remarquables sur les technologies de recherche d'informations, ainsi que l'allure et le fonctionnement des moteurs de recherche.

Cas particulier de la fouille textuelle

La fouille textuelle (text mining, en anglais), consiste à transformer un objet "texte" en un objet "tableau", "arbre" ou "graphe" à l'aide de traitements sémantiques ou syntaxiques puis à appliquer des techniques de data mining sur cet objet formalisé. Les attendus sont généralement :

  • Le résumé automatique
  • L'indexation automatique
  • La génération d'index de livre (vedettes et sous-vedettes)
  • L'extraction et la cartographie de concepts
  • La classification automatique
  • Le rapprochement entre textes

L'approche sémantique a une littérature plus féconde que l'approche syntaxique : même si cette dernière a des résultats supérieurs, les ressources de calcul demandées font souvent pencher la balance en faveur de l'analyse sémantique.

L'analyse sémantique transforme un ensemble de textes en une matrice lexicale :

  • En ligne, chaque texte
  • En colonne, chaque mot-clé apparaissant au moins une fois dans l'un des textes
  • Dans les cases, un ratio numérique mesurant à la fois la fréquence d'apparition d'un mot-clé dans un texte et la fréquence d'apparition du mot-clé dans le corpus.

Cas particulier des ontologies

Article détaillé : Ontologie (informatique).

Le terme "ontologie" a une signification philosophique, mais en gestion des connaissances, il représente la forme probablement la plus évoluée de représentation sémantique des connaissances.
Il s'agit d'une sorte de "superthésaurus" destiné à indexer toutes les productions documentaires, stockées, entrantes ou sortantes dans un groupe social donné, typiquement une entreprise. Ainsi, un courrier électronique, un ouvrage de référence, un document de travail partageant les mêmes thèmes seront automatiquement mis en lien, donc mis en contexte, dégageant ainsi des connaissances sémantiques.

La structuration d'une ontologie est pratiquement un métier en soi, à l'instar de la conception et de la maintenance des thésaurus de bibliothèques. La construction est toujours collective et par agglomération de domaines de compétence.

L'articulation de base d'une ontologie est la suivante :

  • C'est un arbre sémantique
  • Chaque mot-clé est affublé de lexicons : synonymes, homonymes, hyperonymes, traduction dans d'autres langues, etc. Ce microréseau autour d'un mot-clé est appelé concept ou classe
  • Chaque concept est à considérer comme une catégorie de thésaurus, donc avec des catégories plus larges ou plus étroites. Ce lien d'appartenance est interprété comme un lien logique.
  • Chaque concept peut avoir des instances, soit des éléments appartenant à cette catégorie.

Exemple : OISEAU > AIGLE {aigle royal}. La machine peut alors inférer que l'aigle royal est un oiseau.

  • Les liens entre concepts peuvent être beaucoup plus complexes que la simple subordination, sortant ainsi du cadre du thésaurus. Si les concepts sont assimilables à des groupes nominaux, les liens sont assimilables à des groupes verbaux : on regroupe ces liens en catégories de liens. La structure du réseau est parfois appelée topic map en anglais.

En pratique, on pourrait ainsi traduire automatiquement un manuel d'histoire en ontologie, en considérant cinq types de concepts (date,lieu, évènement, personne physique, personne morale) et une trentaine de catégories de liens verbaux.

  • En plus des lexicons, les instances peuvent pointer vers des ressources ou URI. Généralement, ce sont les documents que l'on cherche à indexer.

Pour la machine, raisonner sur les connaissances ainsi représentées revient à se "balader" dans le réseau de concepts, à la manière d'un réseau routier. Il existe des algorithmes spécifiques, par exemple les chercheurs de chemins (Pathfinder), qui cherchent le plus court chemin d'un concept à l'autre en respectant un critère d'économie : "plus petit nombre de concepts", "plus grand nombre de langues", "plus grand nombre de synonymes", etc. Les résultats peuvent être spectaculaires, surtout si l'on garde présent à l'esprit que le point de départ et le point d'arrivée ne sont pas les concepts, mais bien les URI indexés (documents de l'entreprise).

Sémantique et psycholinguistique : le cas de WordNet

à compléter
L'université de Princeton
synonymie et "synsets"
hyperonymie, définition, observation de l'apprentissage de la langue chez les enfants

Voir aussi

Bibliographie

  • John Langshaw Austin, Quand dire, c'est faire (Seuil, 1991, ISBN 2020125692)
  • Marc Baratin et Claude Moussy, Conceptions latines du sens et de la signification, Centre Alfred Ernout, 1999.
  • Rudolf Carnap, Le dépassement de la métaphysique par l’analyse logique du langage (1931), in Antonia Soulez, Manifeste du Cercle de Vienne et autres écrits, PUF, 1985, ISBN 2130388523)
  • Noam Chomsky, Questions de sémantique (Seuil, 1975, ISBN 2020027488)
  • Paul Grice, "Meaning," The Philosophical Review 66: 377-88. (1957)
  • John Lyons, Eléments de sémantique (Larousse, 1978, ISBN 2030703443)
  • Bernard Normier, L'apport des technologies linguistiques au traitement et à la valorisation de l'information textuelle, Éditions ADBS, 2007 (ISBN 9782843650925) ;
  • François Rastier, Sémantique interprétative (Presses Universitaires de France, 1987, 2e éd. revue et augmentée 1996)
  • Gérard Sabah, L'intelligence artificielle et le langage, Hermès, 1988, 1989, (ISBN 2-86601-134-1) (ISBN 2-86601-187-2)
  • Alfred Tarski in Gilles-Gaston Granger'et al., Logique, sémantique, métamathématique, 1923-1944 (Armand Colin, 1974)
  • Irène Tamba, La sémantique (PUF, Que sais-je ?, 2005, ISBN 2130548563)
  • (en) Anna Wierzbicka, Semantics : Primes and Universals, Oxford University Press, 19996 (ISBN 0-19-870003-2)

Articles connexes

Wiktprintable without text.svg

Voir « sémantique » sur le Wiktionnaire.

Liens externes

Notes et références


  • Portail de la linguistique Portail de la linguistique
Ce document provient de « S%C3%A9mantique ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Semantique de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • SÉMANTIQUE — «La sémantique, ou comment s’en débarrasser»: jusqu’à une époque récente, l’étude du sens était volontiers considérée comme constituant pour la linguistique une sorte de rejeton indésirable, au nom sans doute de ce réalisme naïf «qui porte à… …   Encyclopédie Universelle

  • Sémantique — La sémantique est une branche de la linguistique qui étudie les signifiés. Le mot sémantique est dérivé du grec σημαντικός (semantikos), « signifié » lui même formé à partir de σημαίνω (semaino), « signifier, indiquer » ou… …   Wikipédia en Français

  • Semantique generale — Sémantique générale La sémantique générale, système de pensée présenté par son auteur comme « non aristotélicien », a été fondée par Alfred Korzybski après qu il ait pris conscience, au cours de la première guerre mondiale, que les… …   Wikipédia en Français

  • Sémantique Générale — La sémantique générale, système de pensée présenté par son auteur comme « non aristotélicien », a été fondée par Alfred Korzybski après qu il ait pris conscience, au cours de la première guerre mondiale, que les mécanismes de pensée qui …   Wikipédia en Français

  • Semantique de Kripke — Sémantique de Kripke La sémantique de Kripke a été proposée par Saul Aaron Kripke et est la sémantique traditionnellement associée à la logique intuitionniste et aux logiques modales. Elle est fondée sur un univers de mondes possibles, c est à… …   Wikipédia en Français

  • Semantique des langages de programmation — Sémantique des langages de programmation En informatique théorique, la sémantique formelle (des langages de programmation) est l’étude de la signification des programmes informatiques vus en tant qu’objets mathématiques. Sommaire 1 Lien avec la… …   Wikipédia en Français

  • Sémantique de kripke — La sémantique de Kripke a été proposée par Saul Aaron Kripke et est la sémantique traditionnellement associée à la logique intuitionniste et aux logiques modales. Elle est fondée sur un univers de mondes possibles, c est à dire que le modèle qui… …   Wikipédia en Français

  • Semantique axiomatique — Sémantique axiomatique La sémantique axiomatique est une approche basée sur la logique mathématique qui sert à prouver qu un programme informatique est correct. Sommaire 1 L idée 2 Le langage : la logique de Hoare 3 Preuves …   Wikipédia en Français

  • Semantique denotationnelle — Sémantique dénotationnelle En informatique, la sémantique dénotationnelle est une des approches permettant de formaliser la signification d un programme en utilisant les mathématiques. Parmi les autres approches, on trouve la sémantique… …   Wikipédia en Français

  • Semantique operationnelle — Sémantique opérationnelle En informatique, la sémantique opérationnelle est l une des approches qui servent à donner une signification aux programmes informatiques d une manière rigoureuse, mathématiquement parlant (voir Sémantique des langages… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”