Challenge 3

De Challenge4Cancer
Aller à : navigation, rechercher
Challenge-3-900px.png
Challenge 3 : Meta-épidemiologie : “Comprendre le cancer à partir de la littérature scientifique médicale”


Description
La médecine contemporaine est dite “Evidence Based Medicine”, soit une médecine fondée sur les preuves. En effet, la médecine puise, évalue, discute le bien-fondé et la fiabilité de ces preuves dans la littérature médicale. Articles scientifiques, études cliniques, publications de toute sorte représentent l’extrême amont de ce qui fondera la démarche diagnostique et fixera en pratique l’attitude thérapeutique.

Le cancer est l’un des champs de recherche les plus actifs et fait l’objet d’une littérature particulièrement abondante, dont le contenu en méta-données représentent une source féconde de connaissance médicale.

Le challenge “Comprendre le cancer à partir de littérature scientifique médicale” consiste à proposer une solution data-analytique originale permettant de déduire des contenus de la littérature médicale mis à disposition des éclairages nouveaux associant cancers et tissus de méta-données qui leurs sont attachés.

Par exemple, vous pourrez travailler à l’appariement entre l’état de la recherche tels que PubMed peut en tracer la dynamique et la réalité épidémiologique de l’incidence des cancers. Vous pourrez aussi travailler à un graphe de co-occurence de tags ou autres éléments sémantiques liant cancers et facteurs corrélés cachés qu’il s’agirait de révéler.

Ressources pour ce Challenge
Jeux de données
Un jeu de données principal

Nous mettons à votre disposition les jeux de données suivants :

  • les jeux de données de mortalité du cancer
    • Monde (World Health Organisation)
      • sur la période 1950-2012
      • par pays
      • par localisation de cancers
      • par tranche d’âge,
      • par sexe
    • OCDE sur la période 1960-2012
      • par pays
      • pour l’ensemble des cancers
      • par sexe
    • France
  • les jeux de données d’incidence du cancer
    • Monde (World Health Organisation) par pays
      • sur la période 1953-2007
      • par localisation de cancers
      • par tranche d’âge,
      • par sexe
    • en France
      • sur la période 2009-2012
      • par région
      • par localisation de cancers

Vous trouverez ici le lien de téléchargement de ces données


Des jeux de données spécifiques
Nous mettons à disposition les jeux de données suivants :
  • les essais cliniques réalisés dans le monde et rassemblés sur la plate-forme de l’OMS ICTRP
  • les essais cliniques rassemblés dans ClinicalTrials.gov
  • les essais cliniques rassemblés dans Clinical Study Data Request
  • les méta-données de tous les articles taggés Cancer du portail Pubmed
  • la base complète d’articles de Pubmed en Open Access
Vous trouverez les ontologies ouvertes suivantes :
  • un portail d’ontologie biomédicale ontologie, dont vous trouverez ici la documentation de l’API
  • un algorithme de “sémantisation” de contenu médical metamap
  • ontologie du projet SIMILE : Semantic Interoperability of Metadata and Information in unLike Environments


Environnement de data analyse
L'environnement de data analyse est générique pour tous les challenges. Vous pouvez le découvrir ici.


InscriptionC4CWiki.png