Inevidence logo

Installez le plugin Flash pour voir l'animation : Cliquez ici pour le télécharger

Open Text Mining
PDF Imprimer Envoyer
Écrit par Philippe Bonny
Mardi, 28 Septembre 2010 17:00
article

La croissance du monde de l'Open Source n'épargne pas le secteur du Text Mining. Ce qui, il y a encore quelques années, était précieusement conservé au sein des éditeurs du domaine, comme trésor de guerre, est aujourd'hui llibrement accessible sur la toile. Ces outils open source comprennent en effet des librairies riches en fonctionnalités d'analyse automatique de texte telles que : Tokeniser, Analyseur Morpho-Syntaxiques, Extracteurs d'entités nommés, PartOfSpeech Tagger, Gestionnaires de Grammaires etc. Et ce dans un grand nombre de langues allant de l'Hindi ... au Basque !

Quelques exemples d'outils les plus utilisés :

GATE, http://gate.ac.uk/ (Le plus complet)

Logo-gate

NLTK, http://www.nltk.org/Home (basé sur le langage Python)

 

RAPID MINER, http://rapid-i.com/content/view/181/196/, (Plutôt Data Mining mais avec des fonctionnalités de base Text Mining)

Rapid_analytics_190