Les Ressources mises à disposition

De Challenge4Cancer
Aller à : navigation, rechercher
C4C Ressources.png


+21 000 jeux de données


Accessibilité
Découvrez les données, via la technologie ouverte CKAN, accessibles par un moteur d’exploration sur :


Typologie des données

Démographie :
  • Âge
  • Population homme/femme
  • Taux suicide
  • Indice de mortalité
  • Indice de fécondité
  • Nombre d’enfant par femme
  • Âge du premier enfant
  • Mortalité infantile
  • Mortalité maternelle



Environnement & Agriculture :
  • Emission CO2
  • Emission GES, ammoniac, soufre, pesticide & fertilisants
  • Emissions de non-methane volatile organic compounds par secteur
  • Pourcentage de terres agricoles
  • Biomasse en forêt
  • Données de consommation d’enrj & prix & taxes
  • Pollution par transport
  • Traitement des déchets
Travail  :
  • Emploi & conditions de travail
  • Indicateur Qualité de vie : espérance de vie en bonne santé
  • Revenus, Chômage, Temps de travail
  • Conditions de vie : logement, précarité
  • Scolarisation & Formation
  • Population active
  • Taux de chômage




Economique :
  • Croissance
  • PIB par habitant
  • Revenu par habitant
  • Corruption perçu
  • Score démocratique
  • Croissance économique 2005 - 2015







Comportement :
  • Consommation alcool
  • Consommation tabac
  • Utilisation charbon
  • Consommation téléphonique
  • Mort accident de la route












Santé :
  • Tuberculose,
  • HIV (prévalence)
  • Espérance de vie à la naissance, à 65 ans, espérance de vie en bonne santé…
  • Maladies professionnelles
  • Maladie cardiovasculaires (mortalité)
  • Mortalité des maladies chroniques
  • Immunisation vaccin (DTP, Polio)
  • Malnutrition + obésité (prévalence)
  • Contraception
  • Maladies congénitales
  • Tension A. , cholestérol
  • Diarrhée enfant
  • Statut vaccinal
  • Mortalité par accidents
  • Mortalité par cancer
  • Pneumopathie
  • Hépatite Chronique
  • Maladies du système nerveux
  • Alcoolisme
  • Dépendance aux drogues
  • Diabète
  • Nombre de machines mammographiques
  • Santé & Admin : Indicateurs de dép. de santé sur 20 ans/ pays : dépenses publiques, des ménages, assurances privés, totales de santé, soins, de prévention, consommation de soins
  • Démographie médicale/spécialité, des professionnels de santé (Nombre d’hôpitaux, de pharmacies, de laboratoires, nombre de lits)
Cancer :
  • Cancer statistiques régionales
  • Dépistage du cancer (colon, utérus, …)
  • Décès dû au cancer / Mortalité par cancer
  • Cancer du sein, du poumon
  • Cancer & génomique
  • Mortalité/Incidence du cancer par âge, sexe, régions, race depuis les registres 1999 - 2012
  • Ontologie du cancer
  • Incidence du mélanome







Environnement de data analyse


Un cluster Big Data, mis à disposition par Teralab

Logo Teralab.png

Si vous souhaitez avoir accès aux outils, merci de bien vouloir remplir le formulaire en cliquant sur le lien ci-dessous :

Bouton Acces Outils.png


Si vous rencontrez des soucis, envoyer nous un email à data@epidemium.cc.

  • www.teralab-datascience.fr

Pour accéder au service, veuillez contacter l’équipe d’Epidemium à data@epidemium.cc

Rôle Nombre VCPU RAM

Edge node

1

4

8

Service node

1

4

16

Name node

2

2

4

Data node

4

4

16

Backup node

1

2

1


Des outils de data analyse

Logiciels embarqués dans le Cluster :

  • Cloudera CDH 5.8
  • Python 2.7 (toutes les machines)
  • R version 2.15.1 (Edge node uniquement)
  • Cassandra : un outil de gestion de base de données pour Big Data
  • Pip : un outil de gestion d'environnement virtuel pour python
  • Installation de R pour Dataiku / DataStudio
LogoHyperCubeLandingPage.png

Hypercube HyperCube est un outil de data-analyse qui traduit des Big Data en résultats opérationnels, en faisant usage de technologies de pointe de type “moteur de règles”. Pour accéder au service, veuillez contacter l’équipe d’Epidemium à data@epidemium.cc.









LogoDataiku.png

Dataiku Dataiku est un studio de data-analyse, de dataviz, qui met à disposition une gamme large et simple d’outils “click-and-go” de data-analyse pour forger votre intuition et construire vos hypothèses autour de datasets. Pour accéder au service, vous pouvez commencer en utilisant la version gratuite pour tester vos hypothèses. Pour accéder au service complet, veuillez contacter l’équipe d’Epidemium à data@epidemium.cc.

Avant de vous lancer, voici quelques informations pratiques :


Une Communauté


Inscrivez-vous ou connectez-vous avec votre compte sur http://epidemium.cc et :
  • Explorez les profils des participants pour les inviter à vous rejoindre dans votre équipe projet.
  • Explorez les projets et proposez vos compétences.
Venez poser vos questions à la communauté sur la plateforme Q&A d'Epidemium et répondez à celles des autres membres !


Facebook.png

Twitter.png

Meetup2.png

Un Ecosystème


Vous avez besoin d’une expertise et vous n’avez pas trouvé de profils susceptibles de vous accompagner dans votre projet au sein de la communauté ?

Contactez nous afin que nous puissions trouver le ou les experts les plus pertinents sur :

  • methodologie@epidemium.cc si c’est pour une question scientifique
  • ethique@epidemium.cc si c'est pour une question éthique.

Pour toutes autres questions, pour proposer des idées, nous faire vos retours, etc. vous pouvez aussi contacter l’équipe Epidemium sur contact@epidemium.cc.