Challenge 1

De Challenge4Cancer
Aller à : navigation, rechercher
Challenge1.png
Challenge 1 : Comprendre la répartition du cancer dans le temps et dans l’espace


Description
L’évolution dans le temps des cancers et leur répartition géographique sont des informations épidémiologiques majeures. A l’échelle mondiale, la progression des cancers est disparate. Par exemple, dans les pays développés, la mortalité globale des cancers tend à diminuer mais certains cancers progressent, notamment les cancers de la peau, du foie ou du poumon chez la femme. Au plan de la répartition spatiale des cancers, l’on constate de grandes disparités, marquées par des inégalités entre pays développés et pays en voie de développement, et à l’échelle même des pays développés, entre zones urbaines et zones rurales. Le challenge “Connaître la répartition du cancer dans le temps et dans l’espace” consiste à proposer une solution data-analytique originale permettant de mieux appréhender la répartition spatiale et temporelle de la maladie cancéreuse dans la zone géographique de votre choix (monde, continent, sous-continent, pays, France) et dans la fenêtre temporelle de votre choix.


Exemple de projet
Bâtir un modèle prédictif d’une ou des maladies cancéreuses permettant d’anticiper leur évolution dans le temps et de mieux en comprendre la répartition dans l’espace. Un exemple simple consisterait à prédire la mortalité de cancers à partir de l’évolution du nombre de personnes atteintes.

Les grandes entités spatiales sont : le monde, l’Europe, l’OCDE, les continents, les sous-continents, les groupes de pays, les pays, la France (avec un granularité nationale, départementale). Les time series disponibles sont variables d’un pays à l’autre, la période la plus large couvrant 1950 à 2012.

Vous pourrez vous appuyer sur les datasets d’incidence et de mortalité des cancers et les croiser avec tout autre facteur susceptible d’y être associé, qu’il s’agisse de facteurs démographiques, socio-économiques, comportementaux ou environnementaux.

Nous avons mis à disposition un moteur de recherche de données, référençant plus de 21000 jeux de données couvrant la majorité des facteurs épidémiologiques évoqués ou pressentis comme facteurs de risques du cancer : vous trouverez ici la typologie de ces jeux de données.


Ressources pour ce Challenge
Jeux de données
Un jeu de données principal

  • Les jeux de données de mortalité du cancer
    • Monde (World Health Organisation)
      • sur la période 1950-2012
      • par pays
      • par localisation de cancers
      • par tranche d’âge,
      • par sexe
    • OCDE sur la période 1960-2012
      • par pays
      • pour l’ensemble des cancers
      • par sexe
    • France sur les périodes 1985-1989, 2005-2009
      • par département
      • par localisation de cancer
      • par sexe
  • Les jeux de données d’incidence du cancer
    • Monde (World Health Organisation) par pays
      • sur la période 1953-2007
      • par localisation de cancers
      • par tranche d’âge,
      • par sexe
    • en France
      • sur la période 2009-2012
      • par région
      • par localisation de cancers

Vous trouverez ici le lien de téléchargement de ces données


Environnement de data analyse
L'environnement de data analyse est générique pour tous les challenges. Vous pouvez le découvrir ici.


InscriptionC4CWiki.png