La misma Secretaría de Salud llegó a decir que los datos de contagios diarios que proporciona se deben multiplicar por un factor de ocho o más para poder estimar el número total de infectados. Otros investigadores han mencionado factores mucho más elevados. Por eso es difícil tomar decisiones certeras utilizando solamente el número oficial de contagios, que está burdamente subestimado. Vamos volando con turbulencia y en la niebla.
La única manera de saber dónde estamos parados es hacer un análisis lo más exhaustivo posible de los datos que proporciona diariamente la SSA. En ellos, la única magnitud fehaciente es el número de fallecimientos que van siendo registrados continuamente. El número de contagiados lo podemos estimar a posteriori, pero estamos obligados a partir de la cantidad de decesos por el Covid-19 como único dato realmente tangible. No ignoramos que hay un subregistro de decesos debidos al Covid-19 en las actas de defunción, que en la CDMX se está investigando, pero eso lo comentamos más abajo.
El Instituto Robert Koch (IRK) en Alemania utiliza el llamado nowcasting para ir monitoreando la epidemia (a diferencia del forecasting, o predicciones al futuro). Lo que más importa es el aquí y ahora. Solo hay dos cantidades relevantes en los reportes diarios del IRK: el número de contagios registrados el día anterior y la tasa de crecimiento o decrecimiento de los mismos, que se reporta como un factor “R”. Si R es menor que uno, los contagios diarios se van reduciendo día con día. Si R es mayor que uno, van aumentando. En cada región, el semáforo de distanciamiento social pasa al verde, amarillo o rojo de acuerdo a los contagios diarios y al valor promedio de R en días anteriores. Ya que Alemania realiza cientos de miles de pruebas por semana (y tiene capacidad para aplicar hasta un millón), la medición de la evolución del número de contagios diarios es bastante atinada, se registra en las bases de datos de inmediato, y de ahí se puede estimar el valor de R.
Nowcasting se puede traducir entonces como “estimar la situación presente”, es decir, qué valores reales tenemos hasta la fecha, para ayudar en la toma de decisiones. Debido a que en México es casi imposible calcular la tasa reciente de aumento de los contagios, por las razones explicadas arriba, no nos queda más que hacer el análisis puntual a partir del número de decesos, la magnitud observable.
La figura adjunta (“Decesos diarios hasta mayo 17”) muestra, sin embargo, otro problema que se tiene al tratar de calcular la evolución del número de fallecimientos en México. Las barras azules representan la progresión de decesos diarios desde el inicio de la epidemia hasta el corte reportado el 17 de mayo. Como se puede ver, parecería que de abril a mayo fueron cayendo los decesos diarios (superficie azul). Sin embargo, después del 17 de mayo siguieron llegando datos de decesos que se utilizaron para completar las estadísticas. Las barras verdes muestran las correcciones que se hicieron a las cifras de decesos diarios, del 18 de mayo hasta el 11 de junio. Eliminamos unos pocos datos que tenían fecha de deceso anterior a la fecha de síntomas.
Como es evidente, hubo correcciones significativas para los datos de los días reportados el 17 de mayo, hasta casi un mes para atrás. El retraso administrativo en la captura de los decesos es impresionante: hasta el 17 de mayo se habían reportado 5,177 muertes por el Covid-19 (el área azul). Entre el 18 de mayo y el 11 de junio se corrigió el número de decesos y se agregaron 2,774 más (el área verde). Es decir, la cantidad total de fallecimientos al 17 de mayo no era de 5,177, como se anunció originalmente, sino de 7,951 casos, es decir, un 53% más respecto al reporte inicial.
Como vemos, este factor de corrección es muy relevante. Esto significa que cuando la Secretaría de Salud reporta el número de decesos para una fecha cualquiera, en el mes siguiente se seguirán ingresando datos que van a aumentar, a posteriori, el total real.
Le pregunta entonces es: dado que el número total de decesos reportados por la Secretaría de Salud hasta el 11 de junio fue de 15,994, ¿cuál es el número real de fallecimientos, a esa fecha, hace dos días, considerando que hay datos que tardarán semanas en ingresar a la base de datos?
Para calcular el valor estimado de los decesos hasta el 11 de junio hemos hecho un ajuste estadístico a los datos reportados. La figura adjunta (“Decesos diarios hasta junio 11”) muestra, en azul, los fallecimientos reportados por la SSA desde el inicio de la epidemia y hasta el 11 de junio. El total es de 15,994 defunciones en la base de datos. Suponiendo que los ajustes administrativos que se harán a estos datos reportados el 11 de junio van a tener las mismas proporciones (los mismos factores de corrección) que las observadas entre las barras azules y las verdes en los días anteriores al 17 de mayo, podemos estimar cuántos decesos más ingresarán a la base de datos en las semanas posteriores al 11 de junio. Esta estimación se muestra en forma de barras verdes superpuestas a las barras azules. Para disminuir el ruido en el cálculo, hemos agrupado los días en grupos de seis y la altura de cada barra muestra el promedio de casos diarios en ese intervalo. Eso no altera el número de casos totales en la región azul. Como se puede ver en la figura, es de esperar que los días posteriores al 11 de junio ingresen 6,429 casos adicionales a la base de datos, con lo que el total esperado de decesos al 11 de junio sería de alrededor de 22,400 casos (redondeando). El factor de corrección, por ejemplo, para los seis días previos y hasta el 11 de junio es de 2.77, para, dada la superficie azul, poder estimar la superficie verde. Este factor fue calculado tomando los promedios correspondientes (correcciones contra datos originales) de los seis días entre el 12 y el 17 de mayo.
Este cálculo, que es muy simple y sólo supone que la dinámica y proporciones de captura de datos no ha cambiado, nos indica que ya nos estaríamos acercando al máximo de casos mencionados por la SSA para toda la epidemia, número que era inicialmente de 6,000, pasó posteriormente a 30,000 y, recientemente, hasta 35,000 decesos posibles. Es muy probable que alcancemos esta última cantidad de fallecimientos hacia el 1 de julio, considerando el ajuste que aquí comentamos, por los datos que ingresarán tarde al sistema, y nuevos casos hasta el final del mes. El ajuste es además optimista, ya que entre el 17 de mayo y el 11 de junio hay 25 días, pero las correcciones administrativas pueden abarcar hasta las cinco o seis semanas anteriores a una fecha de corte (es decir, los datos del 17 de mayo seguirán aumentando todavía dos o tres semanas más).
Para verificar esta estimación estadística utilizamos un segundo método independiente. En la base de datos de la SSA aparecen también decesos marcados como “pendientes”, es decir, entrarán en la columna de decesos Covid-19 sólo después de que se les clasifique como casos positivos o no. De ahí va saliendo parte de los datos que se convertirán en correcciones, además de los datos de aquellos decesos que se reporten del exterior del sistema. Para los datos del 17 de mayo calculamos entonces una regresión lineal que trata de reproducir el resultado de decesos ya corregidos, por día, tomando como datos de entrada los decesos originalmente reportados hasta el 17 de mayo y los casos pendientes, también hasta el 17 de mayo, por fecha de defunción. Los coeficientes de esta regresión lineal se los aplicamos a los días previos a los datos reportados hasta el 11 de junio y el resultado que obtenemos es de un total estimado de 22,476 fallecimientos hasta el 11 de junio, un número muy cercano a la estimación dada arriba con el primer método. Esto nos sirve para corroborar que la estimación que hemos hecho tiene el rango correcto.
El lector puede corregir por si mismo la cifra de decesos totales proporcionadas por la SSA en cada uno de los próximos días multiplicándola simplemente por 1.4. Este factor de corrección seguirá siendo válido todavía una semana, más o menos.
Con el ajuste arriba comentado, el crecimiento promedio de los decesos diarios habría sido de 2.9% por día, en los últimos 20 días (para un factor R de 1.12). Pensando ahora hacia el futuro, podemos plantear varios escenarios de lo que podría suceder si este crecimiento diario se mantiene o se logra disminuir.
•Si se mantuviera el crecimiento de decesos al 2.9% diario, tendríamos del orden de 21,000 fallecimientos adicionales hasta el 1 de julio.
•Si se mantuviera constante el número de decesos diarios, del 11 de junio hasta finales de mes, tendríamos unos 15000 casos adicionales (con R igual a 1.0).
•Y si ocurriera lo casi imposible y se redujera el número de decesos en un 5% diariamente, se tendrían poco más de 9,000 fallecimientos adicionales del 11 de junio hasta el primero de julio (con R=0.81).
Sin embargo, todos estos escenarios dependen del pasado, es decir, de los contagios que ya ocurrieron hace 20 días (ese intervalo es el tiempo promedio desde el contagio hasta el deceso, cuando éste ocurre). No hay nada que indique que hace 20 días se hubiera frenado significativamente el crecimiento de los contagios diarios. Por eso, los dos escenarios con 21,000 o 15,000 decesos adicionales hasta el 1 de julio son mucho más probables que la alternativa optimista.
Sin embargo, tanto la estimación demasiado optimista (9,000 decesos) como la más pesimista (21,000 decesos), agregadas al total de cerca de 22,400 decesos que hemos calculado como ya ocurridos hasta el 11 de junio, se acercan mucho o rebasan claramente el pronóstico de la SSA para toda la epidemia. Recordemos además que el Taller de Datos de la revista Nexos descubrió, analizando las actas de defunción de la Ciudad de México, que aparentemente sólo el 25% de los decesos por Covid-19 están siendo clasificados así en los registros civiles. Si el factor de subregistro para el país fuera tal que solo 50% de las defunciones por Covid-19 se están capturando como tales en las actas, el lector tiene que multiplicar todos los números mencionados en este artículo por un factor de dos.
Como mostramos aquí, una estimación de la situación actual es parcialmente posible, aprovechando exhaustivamente los datos disponibles. La SSA reporta una subestimación del total de decesos por dos razones distintas: primero, porque los datos se ingresan al sistema hasta seis semanas más tarde. Y segundo, porque hay además un subregistro de las actas de defunción que deberían ser etiquetadas como Covid-19. Es decir, hay un retraso administrativo, que hemos mostrado aquí cómo paliar, y un subregistro de actas de defunción Covid-19 que sólo puede aclarar la SSA revisando cómo fueron clasificadas las actas emitidas desde marzo.
En México parecería que nos falta la voluntad política de hacer un ejercicio de procesamiento de datos informativo y comprensible para la población. No puede ser que la sociedad civil sea más eficiente en esto que las autoridades y que tengamos que andar de detectives para saber cuál es el aquí y ahora que en otros países se da a conocer de manera realista y sin ambages. Parece que la Ciudad de México rompe ya con la línea federal de no aplicarle muchas más pruebas a la población y esperemos que eso redunde en mejor información en la semanas y meses que aún quedan de esta dura experiencia.
Raúl Rojas es académico de la Universidad Libre de Berlín, y Rafael Gamboa, del ITAM.
1 comentario
A la tragedia de la pandemia hay qué abonar la ineptitud y los afanes de un dictador de tercera.