288 pages - July 2022
ISBN papier : 9781789480306
ISBN ebook : 9781789490305

Code ERC :

LS2_12 Bioinformatics
LS2_13 Computational biology
LS2_14 Biostatistics
LS2_15 Systems biology

 
Clear

– Paperback:
Free delivery for any order placed directly through the ISTE Group website istegroup.com
Delivery time: approximately two weeks
Deliveries only within metropolitan France, Belgium, Switzerland and Luxembourg
Printed in color
An ebook version is provided free with every hardcopy ordered through our website
It will be sent after the order is completed
Offer not applicable to bookshops

– Ebook:
Prices reserved for private individuals
Licenses for institutions: contact us
Our ebooks are in PDF format (readable on any device)

Sorry, this entry is only available in French.

1. Entrepôts de données cliniques
2. Méthodes du Web sémantique pour l’intégration de données en sciences de la vie
3. Workflows d’intégration de données bioinformatiques
4. Sélection de variables dans le modèle linéaire général : application à des approches multiomiques pour étudier la qualité des graines
5. Compression structurée de l’information génétique et étude d’association pangénomique par modèles additifs
6. Des noyaux pour les omiques
7. Modèles multivariés pour l’intégration de données et la sélection de biomarqueurs dans les données omiques

Christine Froidevaux

Christine Froidevaux est professeure d’informatique émérite à l’Université Paris-Saclay et effectue des recherches en intégration des données pour les systèmes biologiques.

Marie-Laure Martin Magniette

Marie-Laure Martin-Magniette est directrice de recherche à l’INRAE et développe des méthodologies statistiques pour l’analyse et l’intégration des données omiques.

Guillem Rigaill

Guillem Rigaill est directeur de recherche à l’INRAE et développe des méthodologies statistiques pour les analyses (multi)omiques.

Chapitre 1

Entrepôts de données cliniques (pages : 9-31)

La prise en charge des patients dans les hôpitaux, les cabinets de ville et toutes les structures de soins produit une grande quantité d’informations. Ces données, générées pour le soin, peuvent être réutilisées pour la recherche et l’amélioration des soins dans des entrepôts de données cliniques. Ce chapitre explore les différentes architectures, la construction des entrepôts et leur utilisation pour la recherche.


Chapitre 2

Méthodes du Web sémantique pour l’intégration de données en sciences de la vie (pages : 33-61)

Les données en sciences de la vie sont massives, hétérogènes, compliquées et complexes. L'enjeu est d'en automatiser le traitement afin de le rendre systématique, ce qui nécessite à la fois intégration (data engineering) et méthodes d'analyse (data science). Ce chapitre montre comment le Web Sémantique offre une solution générique adoptée à large échelle par la communauté bioinformatique.


Chapitre 3

Workflows d’intégration de données bioinformatiques (pages : 63-97)

Les traitements de données sont au cœur de nombreux domaines de la Bioinformatique. Ils consistent en l’enchaînement d’un grand nombre d’outils bioinformatiques et manipulent des données massives et diverses. Ce chapitre décrit les difficultés d’implémentation et d’exécution de ces traitements, introduit les systèmes de gestion de workflows comme élément de solution et souligne les problèmes de recherche encore ouverts.


Chapitre 4

Sélection de variables dans le modèle linéaire général : application à des approches multiomiques pour étudier la qualité des graines (pages : 101-128)

Nous proposons dans ce chapitre une nouvelle méthode de sélection de variables dans le modèle linéaire général tenant compte de la dépendance pouvant exister entre les colonnes de la matrice d’observations afin de l’appliquer à des données “-omiques” qui sont caractérisées par la présence d’une forte structure de dépendance. L’implémentation de la méthode est disponible dans le package R MultiVarSel.


Chapitre 5

Compression structurée de l’information génétique et étude d’association pangénomique par modèles additifs (pages : 129-163)

Ce chapitre présente un modèle de compression de données adapté aux études d’associations pangénomiques (GWAS pour Genome-Wide association Study). La méthode présentée exploite la structure de déséquilibre de liaison du génome pour améliorer la puissance statistique des tests utilisés dans les études d’associations pangénomiques. Une étude de cas concret sur la spondylarthrite ankylosante illustre l’approche.


Chapitre 6

Des noyaux pour les omiques (pages : 165-210)

En biologie des systèmes, de nombreuses méthodes ont été développées pour intégrer les données -omiques et, parmi elles, les noyaux sont une approche couramment utilisée. Dans ce chapitre, nous présentons le cadre général des approches à noyau et leur utilité pour l'analyse de divers types de données biologiques avec un focus particulier sur les approches exploratoires.


Chapitre 7

Modèles multivariés pour l’intégration de données et la sélection de biomarqueurs dans les données omiques (pages : 211-269)

Les méthodes multivariées linéaires présentées permettent : l’exploration d’un seul jeu de données (ACP), la discrimination (PLS-DA), l’intégration de plusieurs jeux de données (PLS, multi-block PLS). Les aspects mathématiques de chaque méthode sont présentés, ensuite leur mise en œuvre sur des exemples fictifs et réels permet d’en illustrer l’intérêt pour répondre à des questions biologiques.