web analytics

Posts etiquetados con ‘modelos epidemeológicos’

La extinción de los apellidos entre la aristocracia victoriana y el número R

En la segunda mitad del siglo XIX surgió una curiosa preocupación entre la aristocracia victoriana sobre la posible extinción de sus apellidos. Para entender el problema, comencemos recordando que esos apellidos se transmitían desde el padre (no madre) a los hijos, tanto varones como hembras, pero luego eran sólo los hijos varones quienes los volvían a transmitir.

Una representación esquemática de la transmisión de apellidos siguiendo la línea masculina. Sólo los hijos varones transmiten el apellido.

Esta preocupación tuvo eco entre los estadísticos de la época, como muestra el hecho de que sir Francis Galton (Birmingham, 1822 – Haslemere, 1911) propusiera en la revista The Educational Times and Journal of the College of Preceptors, el 1 de marzo de 1873, la siguiente cuestión:

“Question 4001 (Proposed by FRANCIS GALTON) — A large nation, of whom we will only concern ourselves with the adult males, N in number, and who each bear separate surnames, colonise a district. Their law of population is such that, in each generation, a0 per cent. of the adult males have no male children who reach adult life; a1 have one such male child; a2 have two; and so on, up to a5 who have five. Find (1) what proportion of the surnames will have become extinct after r generations; and (2) how many instances there will be of the same surname being held by m persons.

[The Proposer remarks that a general solution of this problem would be of much aid in certain rather important statistical enquiries, and that he finds it a laborious matter to work it out numerically, in even the simplest special cases, and to only a few generations. In reality, the generations would overlap and mix, but it is not necessary to suppose them otherwise than as occurring in successive steps.]”

Sir Francis Galton

El reverendo, y matemático, Henry William Watson (Marylebone, 1827 – Berkswell, 1903) aceptó el desafío y propuso una solución en la misma revista el 1 de agosto de 1873. A raíz del intercambio de ideas entre ellos, publicaron un artículo conjunto titulado “On the probability of the extinction of families” en 1875, en la revista Journal of the Royal Anthropological Institute of Great Britain and Ireland, con la solución a la cuestión de Francis Galton. Aunque los autores no eran conscientes de ello, con ese artículo Francis Galton y Henry William Watson habían redescubierto el trabajo previo del estadístico francés Irénée-Jules Bienaymé (París, 1796 – París, 1878) sobre la extinción de familias cerradas (aristocráticas, por ejemplo), motivo por el cual hoy el proceso es conocido como proceso de Galton-Watson, pero también como de Bienaymé-Galton-Watson.

Henry William Watson

Puede ser interesante construir el proceso en un contexto general para que el lector luego pueda identificar otras aplicaciones que no sean la original de Francis Galton a su problema.

Consideremos una población de individuos que cambia su configuración en instantes discretos de tiempo n = 0, 1, 2, … – denominados generaciones – y que, con independencia de la naturaleza de los individuos – personas, organismos, neutrones, genes – lo hace de la siguiente manera:

  • Cada individuo de la generación n produce un número aleatorio de nuevos individuos, denominados descendientes, en la generación n+1.
  • La secuencia Xa, Xb, … formada por los números de descendientes para cada individuo a, b, … está formada por variables aleatorias mutuamente independientes, que son también independientes de los números de descendientes de individuos en las generaciones previas.
  • Los números Xa, Xb, … también son idénticamente distribuidos con función de masa común F = {Pk: k=0,1, …}, donde Pk = P{ Xa = k }.

Es decir, la ley de probabilidad que determina el tamaño Xa de la descendencia de un individuo – el individuo a – de la generación n es la misma que la correspondiente ley para cualquier otro individuo de esa u otra generación, y su realización – por ejemplo, el individuo a de la generación n genera k descendientes – no depende del número de descendientes generados por el resto de los individuos de la generación n a la que pertenece o de las generaciones previas. Siguiendo esta descripción, el estado Zn del proceso de Galton-Watson en el instante n es el número de individuos en la generación n.

En el problema original de Francis Galton,  Zn representa el número de apellidos iguales al del antecesor inicial presentes en la población en la generación n por herencia a lo largo de la línea masculina. En esta contabilidad sólo se contabilizan los apellidos de los varones, no de las hembras, dado que éstas no transmitirán su apellido en generaciones futuras. El hecho de asumir un único antecesor inicial está vinculado a suponer Z0  = 1.

Comenzando desde Z0 = 1, el estado del proceso en la generación n+1 se obtiene desde la recursión

Zn+1 = X1(n+1) + … + XZn(n+1),

 que expresa el número de descendientes en la generación n+1 desde la contribución (a esa generación n+1) del i-ésimo individuo – es decir, Xi(n+1) – de la generación n. El número de descendientes en la generación n es una variable aleatoria Zn que podría tomar el valor 0, en cuyo caso Zn+1 = 0 y, como consecuencia, Zm = 0 en cualquier generación posterior m = n, n+1, … Es importante destacar que la independencia de las variables aleatorias Xi(n) garantiza que la sucesión {Zn: n=0,1,…} verifica la propiedad Markoviana.

No todas las elecciones de la distribución de descendencia F conducen a un proceso de Galton-Watson interesante. Por ejemplo, si F está concentrada sobre un único punto (es decir, Pk = 1 para un cierto número k), entonces el proceso es determinista y Zn es el producto de k consigo mismo n veces.

El proceso de Galton-Watson determinista, cuando el número de hijos varones es siempre igual a 1.No olvidemos que las hijas no influyen en la herencia del apellido.

Otro proceso poco interesante se tiene cuando F está concentrada sobre los puntos k = 0 y 1, de modo que P0, P1 > 0 y P0 + P1 = 1. En este caso, la población permanece en el estado inicial Z0 = 1 durante un cierto número n’ de generaciones – con probabilidad igual al producto de P1 consigo mismo n’ veces – y luego salta al estado 0 en la siguiente generación n’+1 – con probabilidad P0 –, donde permanece indefinidamente. El estado 0 es, entonces, absorbente y refleja la extinción del proceso en la generación n’+1.

 

Supervivencia de un apellido durante n’ = 3 generaciones (sin incluir la inicial) y extinción en la 4ª generación.

Para evitar estos casos particulares, el análisis del proceso de Galton-Watson está habitualmente asociado a la hipótesis de que la distribución de descendencia no está concentrada sobre un único punto (por ello, Pk < 1 para todo k) y asigna probabilidad estrictamente positiva (Pk > 0), al menos, a algún k > 1. En tal caso, un sencillo cálculo conduce a una expresión para el tamaño medio de la población en la generación n en términos de

E[Zn] = M·…·M,

es decir, el producto del tamaño medio M de la descendencia de un individuo consigo mismo n veces.

El valor de M tiene propiedades interesantes y permite clasificar los procesos de Galton-Watson como supercríticos (M > 1), críticos (M = 1) y subcríticos (M < 1), de manera que la extinción del proceso se observa con seguridad en los casos crítico y subcrítico, mientras que el proceso puede no extinguirse en el caso supercrítico con probabilidad positiva.

Estos últimos comentarios nos llevan a ver una clara similitud entre el tamaño medio M de la descendencia de un individuo en el proceso de Galton-Watson y el factor reproductivo básico R0 de los modelos epidémicos, como puede observar el lector comparando esta entrada con otras entradas recientes sobre las matemáticas del coronavirus, y las matemáticas contra la malaria y el modelo SIR. Esa similitud no es casual, dado que el proceso de Galton-Watson tiene aplicaciones a la trasmisión de enfermedades infecciosas en sus fases iniciales de propagación.

Entre las aplicaciones modernas se encuentra la proliferación de neutrones libres en una reacción de fisión nuclear, desde los trabajos de Leo Szilard a finales de 1930. Pero no hay que olvidar la genética, sin duda la más cercana al trabajo de Francis Galton y Henry William Watson que nos permite explicar por qué un reducido número de individuos, antepasados de Homo sapiens, tienen ahora descendientes sobrevivientes de la línea masculina reflejados en un número bastante pequeño de haplogrupos distintivos de ADN del cromosoma Y humano.

Mario Castro Ponce (Universidad Pontificia Comillas), Manuel de León (Instituto de Ciencias Matemáticas CSIC, Real Academia de Ciencias) y Antonio Gómez Corral (Universidad Complutense de Madrid)

Etiquetas: , , ,
Categorias: Covid-19

Sopa de letras: Más allá del modelo SIR

En entradas anteriores hemos hablado del modelo SIR y de su exitosa trayectoria desde sus orígenes. Por eso, no es de extrañar que un siglo después siga siendo el modelo de referencia en Epidemiología Matemática. No obstante, siguiendo la máxima pragmática, un modelo es tan bueno como su capacidad para ser útil. En este sentido, algunas objeciones al modelo SIR han impulsado el desarrollo de variantes que describiremos en este artículo y aproximaciones alternativas, como las variantes estocásticas o los modelos en “red” (epidemic networks) que reservamos para futuras entradas en este blog.

 


Imagen por microscopio electrónico del SARS-CoV-2 (en naranja). Fuente: National Institute of Allergy and Infectious Diseases

La Biología no actúa de manera instantánea: el modelo SEIR

La primera objeción más frecuente es que el término de la derecha de la ecuación para la evolución de los susceptibles

implica indirectamente que un infectado se vuelve infeccioso instantáneamente. Evidentemente, el virus infecta progresivamente al sujeto, aunque los síntomas sólo se aprecian unos días después de la infección. Como discutimos en El aspecto del enemigo, uno de los desafíos del SARS-CoV-2 es el tiempo en el que un infectado es asintomático, pero puede infectar a otros susceptibles. El modelo SEIR incluye un estado intermedio, E (abreviatura de “Expuestos”), que trata de simular ese periodo de latencia. No siempre los individuos etiquetados en el estado E transmiten la enfermedad; por ejemplo, en el caso de la tuberculosis, se refiere a un estado anterior a la infección activa y durante el cual los bacilos – de la especie Mycobacterium tuberculosis – están en fase latente, de manera que el individuo está infectado pero no puede transmitir la tuberculosis a otros, pero porta bacilos latentes en su organismo que, tarde o temprano, progresarán hacia una infección activa.

Figura 1: Esquema del modelo SEIR. El estado E representa a los sujetos “expuestos” a la infección pero que aún no presentan síntomas.

 

Este modelo introduce mucha flexibilidad al incorporar dos nuevos parámetros, el tiempo de latencia, tL, y la probabilidad de que un sujeto asintomático sea infeccioso, e. Es el más utilizado estos días para hacer predicciones cuantitativas de la epidemia de coronavirus, algunas destacadas en prensa, como aquellas de los grupos de Imperial College, Oxford, o las iniciativas colectivas CEMAT o Healthdata.

Si recuerdan de nuestras entradas anteriores, definimos el ritmo (o factor) reproductivo básico, R0, como el número medio de contagios propagados por cada persona contagiada. Para el modelo SIR este parámetro tomaba el valor

 

Bajo la luz del modelo SEIR, este parámetro toma la forma

Es decir, el modelo SIR subestima R0. Eso son malas noticias, aunque tiene bastante sentido: los sujetos asintomáticos siguen propagando la infección, aunque no sean conscientes de ello, con probabilidad e, y su impacto aumenta con el tiempo medio de latencia, tL.

¿Es el confinamiento o la vacunación la solución a nuestros problemas?

La siguiente pregunta que podemos hacernos concierne la eficacia (a nivel epidemiológico, no a nivel biológico) de vacunar a la población. Esto se puede hacer antes del brote de la epidemia, en cuyo caso, nuestro modelo sería idéntico a un modelo SIR o SEIR, salvo por el hecho de que la población susceptible sería sólo una fracción de la población total; es decir, es necesario incorporar un nuevo estado V para aquellos individuos sobre los que la vacuna induce algún grado de protección. Otra interpretación de este tipo de intervención es el confinamiento que estamos sufriendo estos días. En este escenario, los pacientes diagnosticados son hospitalizados y aislados para evitar que contagien a otros susceptibles. En tal caso, el modelo suele denominarse SITR (Figura 2).

Figura 2: Esquema del modelo SITR. Una fracción de los pacientes infectados es “tratada” (es decir, tratados clínicamente, aislados, vacunados) o confinada de tal manera que se evita que una proporción de infectados infecte a otros pacientes.

El estado T también puede entenderse como un modelo con cuarentena (Q, del inglés quarantine) en el que los pacientes infectados diagnosticados son aislados. Este modelo también es muy versátil porque se pueden contemplar situaciones en las que después del aislamiento y durante un tiempo tA,  una fracción δ sigue siendo infecciosa. En este caso, R0 tomaría el valor

donde γ es inversamente proporcional al tiempo medio que se tarda en detectar a un nuevo infectado y ponerle en aislamiento. De nuevo, el modelo arroja mucha información sobre la importancia de realizar tests a la población (a través del parámetro γ) y de ser cautelosos con las altas hospitalarias hasta garantizar que los pacientes no son infecciosos (a través de tA).

Durante la epidemia del SARS-CoV-1 (el predecesor del Covid-19), algunos grupos utilizaron un modelo generalizado de éste (¡que casi contiene todas las letras del alfabeto!) llamado SEQIJR (Figura 3), que permite distinguir entre estar en cuarentena (Q) y estar aislado (J).

Figura 3: El modelo SEQIJR, un modelo con expuestos (E), pacientes en cuarentena (Q) y aislados (J).

No obstante, como dice el saber popular, a veces menos es más y los modelos complejos (con muchas letras en su nombre) traen consigo una significativa incertidumbre en sus parámetros que puede limitar su utilidad predictiva, por lo que no siempre son “mejores” desde un punto de vista práctico.

¿Qué pasa si no se desarrolla inmunidad perfecta?

Nuestra última sopa de letras trata de responder a una pregunta que está en el aire estos días: ¿qué pasará si después de haber estado infectado, se puede recaer de nuevo?

Para responder a esta pregunta, se ha estudiado una familia de modelos conocidos genéricamente como modelos “endémicos”, todos ellos variantes del modelo SIRS.

Figura 4: Modelo SIRS. Los recuperados pueden perder la inmunidad y volver a ser susceptible perpetuando los ciclos de epidemia/control. La gripe estacional es un ejemplo de infección “endémica”.

 

En este caso, existe un equilibrio “endémico” en el que siempre habrá una fracción de la población infectada que puede dar lugar a ciclos de epidemia que se perpetúan periódicamente. La gripe estacional es un ejemplo de enfermedad endémica que, gracias a la vacunación masiva de sujetos susceptibles de alto riesgo, se mantiene bajo cierto control. Desgraciadamente, la gripe se cobra una factura de miles de fallecidos en España todos los años – y cerca del medio millón en todo el mundo –, por lo que no debemos minimizar el impacto de esta enfermedad tan común y generalizada.

Todos estos modelos comparten un aspecto común: todos predicen un crecimiento exponencial y un aplanamiento de la curva. No obstante, no dejan de ser modelos simplificados y pequeños cambios en la estimación de los parámetros, o una mala calidad de los datos hace muy complicado predecir el resultado final de la epidemia. No obstante, esperamos haber convencido al lector de la utilidad y versatilidad de las matemáticas para entender las epidemias y los mecanismos de intervención más eficaces.  También confiamos en que, cuando las circunstancias lo permitan, el lector pueda impresionar a amigos y parientes con esta fascinante sopa de letras que les hemos traído hoy.

Mario Castro Ponce (Universidad Pontificia Comillas), Manuel de León (Instituto de Ciencias Matemáticas CSIC, Real Academia de Ciencias) y Antonio Gómez Corral (Universidad Complutense de Madrid)

Etiquetas: , , ,
Categorias: Covid-19