nullLa modélisation en épidémiologie.La modélisation en épidémiologie.Alain-jacques Valleron
UMR-S 707
Epidémiologie, Systèmes d’Information et Modélisation
Université Pierre et Marie Curie (Paris) et INSERM
Assistance Publique – Hôpitaux de Paris
http://www.u707.jussieu.fr/valleron
Détection et analyse d’épidémiesDétection et analyse d’épidémiesDécouverteSurveillanceProtocolisation
de la prise en chargeStratégies de
controleCaractérisation de
l’épidémieHistoire naturelle
de la maladieEvaluation et
prévision de l’épidémieNouveaux traitementsIdentification
Diagnostic
- Mode de contaminationhttp://www.tjgangsiguan.com 通风管 pvc钢丝管 消防水带 http://www.u51688.com http://www.qiwhy.comHistoire naturelle d’une maladie infectieuseHistoire naturelle d’une maladie infectieuseObservables
Symptômes
Décès
Guérison
tempsinfectionsymptômesbiologiquecliniquedécès /
guérisoninfectieux (contaminant)latenceincubation[description, déclaration, délai][certitude diagnostique, asymtomatique]infectieusesurvieexpositiondiagnosticNon observable
Infection
Infectiosité
Etude des maladies transmissibles
Le modèle Susceptible-Infectieux-Immun (SIR)Etude des maladies transmissibles
Le modèle Susceptible-Infectieux-Immun (SIR)nulll(t)nBLe paramètre de reproduction
de base R0 d’une épidémieLe paramètre de reproduction
de base R0 d’une épidémieR0 est le paramètre clé en épidémiologie.
Definition: Nombre de cas secondaires provenant d’un cas index infectieux dans une population infinie
R0 = p c D :
p : probabilité de transmission IS
c : nombre de contacts/ unité de temps
D : durée moyenne de la période infectieuse.R0R0Rougeole Ro = 15 to 20
Grippe Ro = 1.8 to 2.5
Variole Ro = 3
SARS Ro = 2
Hepatite B
groupes à haut risque Ro = 4 to 8.8
population générale Ro = 1.1
Ro for SARS in Singapore
(Lloyd-Smith, 2005) Théorème du seuil Théorème du seuilProportion d’individus à immuniser à la naissance pour contrôler l’épidémie
Variole (R0 = 3) p=67 %
Rougeole (R0 = 15-20) p = 93-95%
nullD. Butler, Nature, News, 2 March 2006 SurveillanceSurveillance
surveillance: an ongoing systematic collection, analysis and interpretation of data and the dissemination of the information to those who need to know.
1592, Londres: 1ère collecte systématique des certificats de décès
1603, London : 1er bulletin hebdomadaire de mortalité
1838, Paris : La ‘Médecine numérique’ de P.C. Louis
La statistique médicale de J. Gavarret
1839, London: 1ère surveillance épidémiologique par W. Farr
2006 : l’âge de l’information … Solution???
nullIn Nature,16 March 2006 In Nature,16 March 2006 Surveillance : l’espace
Krigeage de l’incidenceSurveillance : l’espace
Krigeage de l’incidence
Semi variogramme paramétrique
Interpolation par:
Où les li résolvent
Carrat, 1992, Am J EpidSurveillance: temps
serfling + algorithmes de décisionSurveillance: temps
serfling + algorithmes de décisionnullnullPandémies de grippeLes pandémies de grippe durant le 20ème siècleLes pandémies de grippe durant le 20ème siècleDonnées Epigrippe [Carrat et al, Arch Intern Med, 2002]Données Epigrippe [Carrat et al, Arch Intern Med, 2002]Les données: 334 foyers
Les cas index ont la grippe (test virologique).;
790 contacts (350 avec une grippe clinique).Schéma de l’étude: si un cas est détecté, suivi des symptômes grippaux dans son ménage pendant les 15 prochains jours:Modèle SIR (Susceptible-Infectieux-Immun)
de transmission dans les ménagesModèle SIR (Susceptible-Infectieux-Immun)
de transmission dans les ménagesI) Risque instantané d’infection du sujet s:ls(t) =II) Durée infectieuse du sujet s: Distribution Gamma (moyenne ms, écart type s);
Moyenne: Enfant mE / Adulte mA.Cauchemez S, Carrat F, Viboud C, Valleron AJ, Boëlle PY.
Statistics in Medicine 2004; 23: 3469-87.Données incomplètes-Augmentation de données:
Exemple dans un ménage de taille 3Données incomplètes-Augmentation de données:
Exemple dans un ménage de taille 3Adulte Enfant 1Enfant 2Période de symptômes (observée)Temps15 jours de suiviModèle bayésien à structure hiérarchiqueModèle bayésien à structure hiérarchiqueNotations :
Y : données observées de symptômes ;
υ,ψ : début et fin de la période infectieuse ;
α, β, e, μ, s : paramètres du modèle.
Modèle à structure hiérarchique :
P(Y,υ,ψ, α, β, μ ) = P(Y/υ,ψ) P(υ,ψ/ α, β, e, μ, s ) P(α, β, e, μ, s )Observation :
La période infectieuse commence durant les 3 jours précédents la période de symptômesTransmission :
Risque d’infection du sujet s: αs+ es Σ βi/n
αs : risque d’infection hors-ménage
es : susceptibilité
βi : contribution de l’infectieux i
Durée d’infectivité : Gamma(μs,s).A prioriModèle bayésien à structure hiérarchiqueModèle bayésien à structure hiérarchiqueNotations :
Y : données observées de symptômes ;
υ,ψ : début et fin de la période infectieuse ;
α, β, e, μ, s : paramètres du modèle.
Modèle à structure hiérarchique :
P(Y,υ,ψ, α, β, μ ) = P(Y/υ,ψ) P(υ,ψ/ α, β, e, μ, s ) P(α, β, e, μ, s )Observation :
La période infectieuse commence durant les 3 jours précédents la période de symptômesTransmission :
Risque d’infection du sujet s: αs+ es Σ βi/n
αs : risque d’infection hors du foyer
es : susceptibilité
βi : risque d’infection dû à l’infectieux i
Durée d’infectivité : Gamma(μs,s).A prioriUtilisation de méthodes statistiques “intensives”Utilisation de méthodes statistiques “intensives”MCMC : Monte Carlo Markov Chains
Principe :
Algorithme d’optimisation stochastique
Simulation d’une chaîne de Markov dont la distribution stationnaire est la distribution d’intérêt pour les paramètres
plusieurs techniques de mise à jour :
échantillonneur de Gibbs, Metropolis Hastings
A chaque itération :
Rééchantillonnage d’une valeur de paramètre
Rééchantillonnage d’une date imputée par foyer
Rééchantillonnage d’une durée infectieuse par foyer
Résultats (1): Estimation des paramètres de transmissionRésultats (1): Estimation des paramètres de transmissionRésultats (2): Rôle des enfants dans la transmissionRésultats (2): Rôle des enfants dans la transmissionEstimation temps-réel du nombre de reproduction R d’une épidémieEstimation temps-réel du nombre de reproduction R d’une épidémie
R<1 annonce que l’épidémie est sous controleAnalyse temps-réelAnalyse temps-réelRecueil des données sur le terrain:
Difficulté d’obtenir des données détaillées en temps-réel;
Peu d’a priori sur l’histoire naturelle de la maladie, surtout lorsqu’il s’agit d’une maladie émergente;
Problèmes statistiques:
Les cas secondaires avec de longues périodes d’incubation sont censurés;
Problèmes méthodologiques:
Difficulté à analyser rapidement les données;
L’estimation du nombre de reproduction
par la méthode de Wallinga et Teunis, AJE, 2004L’estimation du nombre de reproduction
par la méthode de Wallinga et Teunis, AJE, 2004Intervalle de génération:
Temps entre le début des symptômes d’un cas et le début des symptômes des personnes qu’il infecte;
Distribution de probabilité connue.
Données: dates de début des symptômes
Exemple: R1, nombre de cas générés par le cas 1
Calculer les probabilités 1->2 et 1->3;
Espérance de R1 = P(1->2) + P(1->3);
Mais le calcul se fait APRES l’épidémie.
Cas 1t1t2t3Cas 2Cas 3TempsLorsque l’épidémie n’est pas finie…
Lorsque l’épidémie n’est pas finie…
t1t2t3T (présent)Temps[Cauchemez et al., Emerging Infectious Diseases, 2006]nullEstimation de R :
Wallinga & Teunis 2004Maladies émergentes
Maladies émergentes
Données collectées durant l’épidémie:
Début des symptômes:
Traçage de cas:t1Temps[Cauchemez et al., AJE, 2006 à paraître]Modèle statistiqueModèle statistiqueTraçageCourbe épidémiqueInférence sur l’intervalle de générationInférence sur le traçage complet jusqu’en TAlgorithme MCMCInférence sur le nombre de reproductionCorrection pour la censure au temps TAlgorithme Monte CarloReal-time distribution of generation intervalReal-time distribution of generation intervalPosterior mean and 95% credible interval of the mean (a) and the standard deviation (b) of the generation interval (GI).Cauchemez et al., 2006 Reproduction number for the last 10 days of follow-upReproduction number for the last 10 days of follow-upPosterior mean and 95% credible interval of the reproduction number for the last 10 days of follow-up.At time t: estimate of R
for time period [t-10, t]
with data available up to time tCauchemez et al., 2006 Result (2): Real-time monitoring of SARS outbreak in Hong-KongResult (2): Real-time monitoring of SARS outbreak in Hong-KongCauchemez et al., 2005,PrévisionsPrévisionsButs
« gestion du risque »
« perception du risque »
Méthodes
Consensus
Empiriques
Intégrant les connaissances
Sur l’agent infectieux
Sur l’histoire naturelle de la maladie
Sur la population (démographie, traansports, comportements)
Prédiction de la diffusion d’une épidémie grippale par la méthode des « analogues »Prédiction de la diffusion d’une épidémie grippale par la méthode des « analogues »Viboud C, Am J Epidemiol 2004Search “similar”
past temporal patterns Prédiction de la diffusion d’une épidémie grippale par la méthode des « analogues »Prédiction de la diffusion d’une épidémie grippale par la méthode des « analogues »Viboud C, Am J Epidemiol 2004Prévision par intégration d’hypothèses épidémiologiques et cliniquesPrévision par intégration d’hypothèses épidémiologiques et cliniquesEnviron 500 000 bovins infectés sont entrés dans la chaîne alimentaire entre 1980 et 1989
(d’après Ferguson et coll., Phil. Trans. Roy. Soc London, 1997)Environ 500 000 bovins infectés sont entrés dans la chaîne alimentaire entre 1980 et 1989
(d’après Ferguson et coll., Phil. Trans. Roy. Soc London, 1997)Premières prévisions publiéesPremières prévisions publiéesCousens, N. et coll., Nature, 1997; 385:197
Données analysées : 13 cas (-> 1995)
Simulations de scénarios avec durée moyenne d’incubation entre 10 et 25 ans, distributions lognormales et Gamma
Entre 75 et 80 000 cas
Ghani, A et coll., Nature, 2000;406:583
Données analysées : 53 cas (-> 1999)
Modélisation de scénarios avec durée moyenne d’incubation entre 10 et > 60 ans
Entre 63 et 136 000 casSusceptibilité (f(a)) et âgeSusceptibilité (f(a)) et âgeObservation :
Les cas sont jeunes
Hypothèse modélisée:
Susceptibilité dépendant de l’age.
0.515AA e-a ag(t) : exposition et dateg(t) : exposition et dateChez les bovins, l’incidence de l’ESB a été reconstruite [par modèle*]
Croissance exponentielle, temps de doublement de 14 mois
1989 : SRM ban
1996 : interdiction totale
198219961989Impact du SRM ban* Anderson 1996, NatureD durée d’incubationD durée d’incubationDistribution usuelles pour l’incubation d’une maladie infectieuse*
Lois asymétriques à droite
Permet une grande variabilité vers les durées longues
Lognormal, gamma, weibull, F, …
2 à 4 paramètres
Sartwell PE, 1950. Am J. Hyg. Formulation du modèleFormulation du modèleValeur possible pour i :
Toute valeur entre 1980 et 1996
Probabilité proportionnelle à f(a-d) g(i)
Mortalité « autre cause »
5 à 10 paramètres
(A)i, a, m, s, b198019891996O,AI, A-DD Formulation statistiqueFormulation statistiqueD’après Brillinger* :
Un processus de Poisson ponctuel (les naissances) filtré par une fonction de mortalité dépendante de l’âge et de la date est un processus de Poisson planaire dans le diagramme de LexistaVraisemblance*Brillinger, 1986, BiometricsNumériquementNumériquementIntégration à 10-4 d’une intégrale bidimensionnelle
La fonction à intégrer comporte 2 intégrations
~ 7 106 points par intégration [30/40 minutes sur un P4]
Optimisation numérique : BFGS, dérivée numérique (10 points)
Cluster de 4 biproc + PVM : ~ 5 jours par optimisation
Intervalles de confiance / prédiction par bootstrapRésultats (2001) :
taille de l’épidémie ~ 200Résultats (2001) :
taille de l’épidémie ~ 200Valleron et al, Science, 2001
Boelle et al., Stat. Mthods in Medical Resaerch, 2004286505 Pic de l’épidémie 2002
Peu de cas après 2010Les alternatives aux « modèles homogènes »TempsIncidence cumuléeLattice)Homogeneous PanmixingScale free (social)SusceptibleInfectiousRecoveredRAZLes alternatives aux « modèles homogènes »Modélisation de réseaux sociaux
Modélisation de réseaux sociaux
Eubank, 2004 Corsica (n=20)Prévision par intégration de données d’observation
épidémiologique, de modélisation de dynamique d’épidémies,
et de données populationnellesnullCorsica (n=20)Population estimates from :
LandScanTM Global Population Database.
Oak Ridge, TN: Oak Ridge National Laboratory.
Available at http://www.ornl.gov/landscan/ Individual-centered modelsIndividual-centered modelsSimulation des 85 millions habitants de Thailande
10 calculateurs en parallèle, > 1 mois de temps calcul.In Ferguson, Dedrek, Cummings, Cauchemez, Fraser et al., Nature, 2005nullFerguson et col., Nature 2006null d’après : Global spread of pandemic influenza: coordinating the use of antiviral stockpiles
V. Colizza, A. Barrat, M. Barthelemy, AJ. Valleron,A. Vespignani , 2006 (en préparation)ConclusionsConclusionsNécessité d’intégrer médecine clinique et biologie dans la modélisation des épidémies
Nouvelles données changeant l’échelle des moyens nécessaires à la recherche.
Besoin de triple compétence : mathématique, statistique, informatique.
Beaucoup de sujets de travail possibles.RemerciementsRemerciementsPY Boelle, F. Carrat, S. Cauchemez, A. Flahault,
S. Ansart, A. Lacombe, C. Pelat
“ Epidemiology, Information systems and modelling”,
Université Pierre et Marie Curie et Inserm (Paris)
Alain Barrat
CNRS, Orsay
V. Colizza, M. Barthelemy, A. Vespignani
School of Informatics and Center for Biocomplexity, Indiana University
Jacques Vidal
UCLA, Los Angeles
Soutiens financiers : 6ème PCRDT Union Européenne (SARSTRANS, INFTRANS)
本文档为【La modélisation en épidémiologie】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。