Cross Industry Standard Process for Data Mining

Cross Industry Standard Process for Data Mining

CRISP-DM signifie Cross Industry Standard Process for Data Mining[1]. Il s'agit d'un Modèle de Processus de data mining qui décrit une approche communément utilisée par les experts en data mining pour résoudre les problèmes qui se posent à eux. Des sondages effectués en 2002, 2004, et 2007 montrent qu'il s'agit de la méthode principale utilisée par les data miners. [2] [3] [4].Cette méthode a été créée par un consortium formé des compagnies NCR, SPSS, et Daimler-Benz. Le processus définit une hiérarchie consistant de phases majeures, de taches générales, de taches spécialisées, et d'instances de processus[5].

Sommaire

Phases Principales

Phases du processus CRISP_DM..

CRISP-DM découpe le processus de data mining en six phases principales[6]:

Histoire

La méthode CRISP-DM fut conçue en 1996. En 1997 elle se développe en tant que projet de l'Union Européenne financé par le programme ESPRIT. Le projet était conduit par quatre compagnies: ISL, NCR Corporation, Daimler-Benz and OHRA. Ce cœur du consortium apporte differentes experiences au project: ISL, plus tard acquis and intégré dans SPSS Inc. produit ses progiciels d'analyse predictive du même nom, intégré de nos jours au groupe IBM. Le géant informatique NCR Corporation créa la division Teradata spécialisée dans les entrepots de données et son propre progiciel de data mining. Daimler-Benz avait une importante équipe de data miners. OHRA, une compagnie d'assurance, venait juste de commencer à explorer le potentiel d'utilisation du data mining.

La première version de la méthode fut publiée sous le numéro de version CRISP-DM 1.0 en 1999.

CRISP-DM 2.0

En Juillet 2006 le consortium annonce qu'il va commencer à travailler sur une seconde version de CRISP-DM. Le 26 Septembre 2006, le CRISP-DM SIG se réunit pour discuter des améliorations pour CRISP-DM 2.0 et de la feuille de route qui en découle. Pourtant, ces efforts vont être retardés. Le SIG ne s'est pas réunis, n'a pas modifié le site web CRISP, ou communiqué quoique ce soit aux membres depuis le début de l'année 2007. Depuis le 22 juin 2011, le site web redirige vers une page du site d'IBM dédié à SPSS.

Avantages

  • Méthode neutre par rapport aux métiers
  • Méthode neutre par rapport aux outils
  • Méthode liée étroitement à KDD Process Model
  • Point d'ancrage du processus de data mining

Notes

Liens externes

Références

  1. Shearer C. The CRISP-DM model: the new blueprint for data mining. J Data Warehousing 2000;5:13—22.
  2. Gregory Piatetsky-Shapiro (2002) KDnuggets Methodology Poll
  3. Gregory Piatetsky-Shapiro (2004) KDnuggets Methodology Poll
  4. Gregory Piatetsky-Shapiro (2007) KDnuggets Methodology Poll
  5. Robert Nisbet, John Elder, Gary Miner Handbook of Statistical Analysis & Data Mining Applications (Academic Press) page 35
  6. Gavin Harper, « Methods for mining HTS data », dans Drug Discov. Today, vol. 11, no 15-16, août 2006, p. 694–699 [texte intégral, lien PMID, lien DOI] 



Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Cross Industry Standard Process for Data Mining de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Cross Industry Standard Process for Data Mining — CRISP DM stands for Cross Industry Standard Process for Data Mining[1]. It is a data mining process model that describes commonly used approaches that expert data miners use to tackle problems. Polls conducted in 2002, 2004, and 2007 show that it …   Wikipedia

  • Data mining — Not to be confused with analytics, information extraction, or data analysis. Data mining (the analysis step of the knowledge discovery in databases process,[1] or KDD), a relatively young and interdisciplinary field of computer science[2][3] is… …   Wikipedia

  • Exploration de données — Articles principaux Exploration de données Fouille de données spatiales Fouille du web Fouille de flots de données Fouille de textes …   Wikipédia en Français

  • Projet:Mathématiques/Liste des articles de mathématiques — Cette page n est plus mise à jour depuis l arrêt de DumZiBoT. Pour demander sa remise en service, faire une requête sur WP:RBOT Cette page recense les articles relatifs aux mathématiques, qui sont liés aux portails de mathématiques, géométrie ou… …   Wikipédia en Français

  • CRISP-DM — Der Cross Industry Standard Process for Data Mining gibt den Lebenszyklus in einem Knowledge Discovery in Databases Prozess vor. Dieser Prozess wurde aus einem Förderprojekt der Europäischen Union von namhaften Teilnehmern, u.a. der Daimler AG… …   Deutsch Wikipedia

  • JANUS clinical trial data repository — is a clinical trial data repository (or data warehouse) standard as sanctioned by the Food and Drug Administration (FDA). It was named for the Roman god Janus (mythology), who had two faces, one that could see in the past and one that could see… …   Wikipedia

  • Business and Industry Review — ▪ 1999 Introduction Overview        Annual Average Rates of Growth of Manufacturing Output, 1980 97, Table Pattern of Output, 1994 97, Table Index Numbers of Production, Employment, and Productivity in Manufacturing Industries, Table (For Annual… …   Universalium

  • Pharmaceutical industry in the People's Republic of China — The pharmaceutical industry is one of the leading industries in People s Republic of China, covering synthetic chemicals and drugs, prepared Chinese medicines, medical devices, apparatus and instruments, hygiene materials, packing materials, and… …   Wikipedia

  • coal mining — Coal was very important in the economic development of Britain. It was used as fuel in the factories built during the Industrial Revolution and continued to be important until the 1980s. The main coalfields are in north east England, the north… …   Universalium

  • Code for Sustainable Homes — The Code for Sustainable Homes is an environmental impact rating system for housing in England and Wales, setting new standards for energy efficiency (above those in current building regulations)[1] and sustainability which are not mandatory… …   Wikipedia

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”