318 pages - January 2016
ISBN papier : 9781784051075
ISBN ebook : 9781784061074

Cet ouvrage est un guide complet pour l’analyse de données textuelles. Il s’appuie sur un ensemble de bibliothèques géré par le langage R, logiciel libre de traitement des données et d’analyse statistiques.

Paperback
64,00
Ebook
9,90
 
Clear

– Paperback:
Free delivery for any order placed directly through the ISTE Group website istegroup.com
Delivery time: approximately one week
Deliveries only within metropolitan France, Belgium, Switzerland and Luxembourg
Printed in color
An ebook version is provided free with every hardcopy ordered through our website
It will be sent after the order is completed
Offer not applicable to bookshops

– Ebook:
Prices reserved for private individuals
Licenses for institutions: contact us
Our ebooks are in PDF format (readable on any device)

Cet ouvrage est un guide complet pour l’analyse de données textuelles. Il s’appuie sur un ensemble de bibliothèques géré par le langage R, logiciel libre de traitement des données et d’analyse statistiques.

Didactique, Analyse de données textuelles sous R présente les étapes préalables d’opérations de base comme le chargement des données, le découpage en tokens ou la conversion en matrice terme-document. Il détaille également les tâches plus complexes comme l’association des segments de discours à des locuteurs d’un entretien, l’extraction et la visualisation des thèmes, la classification des mots, l’indexation et la recherche des documents ou l’extraction des relations entre entités nommées. Cet ensemble d’opérations doit pouvoir s’intégrer dans un écosystème de plateformes d’analyse comme un système de recommandation, d’aide à la traduction ou d’analyse des médias sociaux.

1. R, généralités et installation
2. Charger des données : entrées/sorties sous R
3. Ressources statiques : dictionnaires et collections
4. Ressources dynamiques : récupération de données
5. Analyse des distributions de mots
6. Analyse de questions ouvertes
7. Analyse généraliste : matrice et associations
8. Analyse généraliste : termes et analyse des correspondances
9. Analyse de la lisibilité
10. Détection d’entités nommées
11. Extraction de relations entre entités
12. Modèles de partitionnement de données
13. Analyse d’opinion
14. Recherche de documents
15. Modèles pour la catégorisation
16. Visualisation sémantique

Nicolas Turenne

Docteur en informatique, Nicolas Turenne est chercheur à l’INRA au sein du Laboratoire Interdisciplinaire Sciences Innovation Sociétés à l’université de Paris-Est. Il est spécialiste en extraction et gestion de connaissances à partir de textes en utilisant des modèles stochastiques et relationnels.


Chapitre 1 Table des matières