Introduction à l'épidémiologie

De Challenge4Cancer
Aller à : navigation, rechercher
  • Un peu d’Histoire [1]

Etablir un lien statistique entre l’exposition à un facteur de risque et la survenue d’une maladie n’est pas simple à établir. Par exemple, le rapport entre tabagisme et survenue du cancer du poumon fut longtemps pressenti mais il a fallu attendre les années 50 et les travaux de Doll & Hill afin d’établir un lien d’association significatif. En effet, on pouvait incriminer de nombreux facteurs : la pollution aérienne industrielle ou automobile, les fumées de chauffage domestique, les bitumineux pour le revêtement des routes, des infections telles la grippe.

la première étude cas-témoin

Doll & Hill ont été pionniers réalisant les premières études "cas-témoins”, établissant la recherche médicale sur des bases méthodologiques plus rigoureuses : tous les facteurs d’expositions ont été scrupuleusement recueillis : âge, sexe, catégorie sociale, habitat rurale ou urbain, exposition aux pollutions industrielles, et ce, afin d’établir une comparaison fiable entre les expositions des patients atteints de cancers “les cas” et les patients exempts de la pathologie cancéreuse “les témoins”.

une étude de cohorte 

Malgré leur découverte, en 1953, un comité d’experts établissait pour le compte du Ministère de la Santé britannique que “l’association entre le fait de fumer et le cancer du poumon n’est pas nécessairement causal”. Doll & Hill innovèrent de nouveau et menèrent une étude prospective d’ampleur, dite de cohorte, comparant les incidences de cancers broncho-pulmonaires chez les fumeurs et les non-fumeurs : il fut établi que non seulement l’association est statistiquement significative mais en plus que l’association croît avec l’importance de l’exposition au tabac.

  • Quelques notions simples de statistiques : la prévalence, l'incidence

la prévalence

La prévalence d’une maladie dans une population est la proportion de sujets atteints dans la population.  Si M est le nombre de la malade à un instant t et S le nombre total de sujet, la prévalence d’une maladie M, alors

$ {\displaystyle P=\frac{M}{S}} $

La prévalence est un instantanée de l’état d'atteinte d’une population par une maladie. En aucun cas, elle ne rend compte de l’évolution temporelle de la maladie. Pour cela on a besoin d’un autre outil qu’est l’incidence.

le taux d’incidence

Si l’on observe l’évolution du nombre de malades dans une période définie :  ΔT, le taux d’incidence est la proportion de nouveaux sujets atteints dans la population.

Pour définir le taux d’incidence, il nous faut tenir compte de la durée d’exposition à la maladie, on pondère alors le nombre de sujets dans la population relativement à la période définie. On utilise une unité qui est le nombre de “personnes-années"  : si l’on cherche à calculer le taux d’incidence sur une période de deux ans pour une population de 100 sujets. On dira qu’il s’agit d’une population de 200 personnes années.

Soit  ΔM, le nombre de nouveaux cas apparus dans l’intervalle  ΔT et soit P le nombre total de personnes-années, alors le taux d’incidence est

$ {\displaystyle P = \frac{\Delta M}{P}} $

Rmq : attention, certes la prévalence est d’autant plus importante que l’incidence l’est, mais en aucun cas la prévalence renvoie à la dynamique dans le temps de l’évolution d’une maladie, seul l’incidence en rend compte.

risque relatif et Odd-Ratio

Soit une population exposée à un facture de risque supposé E et développant éventuellement une maladie M : nous noterons E+ la population exposée et E- la population non exposée, nous noterons M+ la population malade de M  et M- la population non malade de M.

On appelle risque relatif et on note RR le risque d’avoir la maladie M étant donnée l’exposition E, le rapport entre le risque $ R_{1} $ d’avoir la maladie chez les sujets E+ et le risque $ R_{0} $ d’avoir la maladie chez les sujets E-.

L’Odd-Ratio est le “rapport de côte”, c’est le rapport entre la côte de la maladie dans la population exposée E+ et  la côte de la maladie dans la population non-exposée E-

E+ E-
M+ a b
M- c d

l'Odd-Ratio est alors $ {\displaystyle \frac{a}{b}*\frac{d}{c}} $

Rmq : pour une maladie rare, l’Odd-Ratio et le risque relatif RR sont très proches et peuvent être confondus

risque attribuable

Si l’on note pour une maladie M, une exposition E et une période d’observation  $ \Delta T $,  $ \Delta M $ le nombre de nouveaux cas et  $ \Delta M' $ le nombre de nouveaux cas dus à l’exposition, alors le risque attribuable est $ {\displaystyle RA = \frac{\Delta M'}{\Delta M}} $

Dans le cadre de l’étude d’un cancer fictif, et étant donnée l’exposition à deux facteurs de risques, la consommation de tabac et l’exposition excessive aux UV, supposons que les risques relatifs soient respectivement de 2 et 4, supposons par ailleurs que dans la population on compte 30% de tabagiques et 5% de surexposés aux UV, alors le risque attribuable est respectivement de 46% et de 17%. Il faut donc savoir pondérer les risques relatifs par l’importance de l’exposition !

On comprend donc que le risque relatif donne une idée du risque individuel alors que le risque attribuable tient compte du nombre de personnes exposées dans la population.

La standardisation et comparaison de populations

Selon le vieil adage, "comparaison n'est pas raison". Dans le cadre qui nous intéresse, l'on peut être amené à comparer des populations. Après calcul de caractéristiques simples telles l'incidence, la prévalence, il est parfois tentant d'opérer une comparaison terme à terme de ces caractéristiques. Mais, de nombreux facteurs peuvent concourir aux résultats obtenus et empêcher toute comparaison justifiée.

En effet, rapporter l'une à l'autre la prévalence du cancer de deux groupes, dont nous allons supposer qu'elles sont très différentes, peut amener à conclure qu'un groupe semble plus atteint que l'autre. Car, l'âge, le sexe, la structure socio-professionnelle peuvent induire de nettes différences qui inviteraient à conclure à tort à des différences statistiquement significatives. Forçons le trait, supposons que l'on étudie la prévalence du cancer de la prostate dans deux populations, il faudra s'assurer que par l'âge et le sexe, le populations sont bien appariées !

Standardisation directe

Rappelons que le taux d'incidence, telle que nous le définissions plus haut, appelé aussi taux d'incidence brut, est le rapport entre ΔM, le nombre de nouveaux cas apparus dans l’intervalle ΔT et le nombre total de personnes-années.

Pour tenir compte des différentes caractéristiques de sous-populations dont on peut estimer qu'elles peuvent impacter la structure de l'incidence, l'on peut calculer un taux d'incidence spécifique;

Indexons par $ 0,1,...,N $ des sous-populations de la population étudiée. Pour chaque sous-population $ i $, on note $ P_{i} $le nombre de personnes-années et $ M_{i } $le nombre de nouveaux cas observés dans cette sous-population. Alors, le taux d'incidence spécifique relativement à la sous-population $ i $est $ {\displaystyle TI_{i} = \frac{M_{i}}{P_{i}}} $

On peut alors déduire que le taux d'incidence brut est la moyenne pondérée des taux d'incidence spécifiques

$ {\displaystyle TI = \Sigma_{i=0,...N}\alpha_{i}TI_{i} = \alpha_{0}TI_{0}+\alpha_{1}TI_{1}+...+\alpha_{N}TI_{N}} $

$ \alpha_{i} = \frac{P_{i}}{P_{0}+P_{1}+...+P_{N}} $représente le poids relatif de la sous-population $ i $ par rapport à l'ensemble de la population observée

Donc, pour comparer deux populations, il convient de les décomposer en sous-populations et d'en étudier alors les caractéristiques spécifiques. C'est ce que l'on appelle la Standardisation Directe.

Afin de comparer les taux d’incidence de deux populations, il faut prendre soin de la standardisation telle que présentée plus haut.

Une façon de caractériser les différences entre les taux d’incidence de deux populations, on est amené à calculer le rapport des taux standardisés d’incidences, soit ce qu’il convient d’appeler le Comparative Morbidity Figure (CMF).

Par exemple, dans la comparaison de l’incidence du cancer du poumon en Haute-Vienne et en Lozère, on standardise les taux d’incidence sur l’âge, sur le sexe (si l‘information est disponible) selon les calculs présentés plus haut, puis on calcule le rapport des taux standardisés.

Standardisation indirecte

On cherche encore à comparer les taux d’incidence d'une population observée à une population de référence dont on suppose disposer des taux d’incidence standardisés.

Une autre approche consiste à évaluer ce que serait le nombre de cas dans la population observée étant donné le taux d’incidence de la population de référence. On rapporte alors le nombre observé de cas au nombre attendu de cas et on obtient alors le Standardized Mortality Ratio : SMR

Comme plus haut, on indexe par $ 0,1,...,N $ les sous-populations. On note $ TI_{ref} $le taux d'incidence standardisé de la population de référence et $ TI_{i,ref} $le taux de la sous-population $ i $.

Pour chaque sous-population $ i $, on note $ P_{i,obs} $le nombre de personnes-années et $ M_{i,att} $le nombre de cas attendus si d'aventure la population observée ne présentait pas de différence caractéristique avec la population de référence, soit $ M_{i,att} = P_{i,obs} * TI_{i,ref} $

Le SMR est alors obtenu part $ {\displaystyle SMR = \frac{M_{obs}}{M_{att}} } $
  1. Épidémiologie: principes et méthodes quantitatives, Par Jean Bouyer