top of page

Regresiones matemáticas y Modelo SIR en R / RStudio

  • Foto del escritor: BenavidesJuanC - ChimboBryamF
    BenavidesJuanC - ChimboBryamF
  • 8 jun 2020
  • 3 Min. de lectura

Modelo Lineal


Carga del CSV de datos referente a numero de días y cantidad de personas contagiadas de COVID en España.

ree

- Calculo de la Regresión lineal


El comando básico es lm (linear models).

El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresor o independiente (x).


El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables.


El resultado lo guardamos en un objeto llamado regresión.

Este objeto es una lista que contiene toda la información relevante sobre el análisis.

Mediante el comando summary obtenemos un resumen de los principales resultados:



ree

Gráfica de los datos reales


ree



ree

Predicción de nuevos casos a 10 días


ree

Se suman las nuevas predicciones a nuestro set de datos


ree

ree



Modelo de predicción Logístico


- Cargamos los datos para este se utilizan un CSV con el día desde donde se presentó el primer infectado


Librerías necesarias

ree

ree

- Usaremos la función drm del paquete drc.

El parámetro fct sirve para indicar el modelo a usar, para el caso del modelo logístico con L.5()


ree


ree

- Calculamos el modelo de regresión logístico


ree

- Generamos la gráfica de nuestros datos



ree

- Realizamos la predicción a dos meses


ree

- Añadimos nuestras nuevas predicciones a los datos y generamos la nueva grafica

ree

ree


Modelo de Predicción Exponencial


- Cargamos los datos de nuestro CSV


Librerías Necesarias

ree


ree


- Al igual que el anterior modelo Usaremos la función drm del paquete drc.

El parámetro fct sirve para indicar el modelo a usar, pero para nuestro modelo exponencial el factor que usaremos será EXD.3()



ree

ree

- Realizamos los cálculos del modelo exponencial con EXD.3()


ree

- Generamos la gráfica del modelo


ree

ree

- Ahora calculamos las predicciones para dos meses


ree

- Añadimos nuestros nuevos datos de la predicción a los datos y se gráfica


ree

ree


Modelo de Predicción Polinomial


- Cargamos nuestros datos


ree

- Usamos la función poly() que puede generar directamente un polinomio, evitando tener que escribir toda la fórmula

ree

- Ahora generamos nuestro modelo polinomial de grado 6 para que se acople a nuestros datos


ree

- Generamos los nuevos datos dentro del intervalo del predictor


ree

- Realizamos la predicción en base al error estándar


ree

- Calculamos los intervalos de los limites


ree

- Generamos la Gráfica


ree

ree


Modelo de Predicción Probabilista (Probabilidad)


ree


ree

Filtramos nuestros datos para obtener solo los de España de los nuevos casos


ree

Calculamos la Media y la Mediana


ree

Cargamos los datos de nuestro otro CSV de los casos confirmados y generamos X y

ree

Ahora generamos nuestro modelo de probabilidad con una predicción a 200 días


ree

Graficamos


ree


ree

Modelo SIR o modelado matemático de epidemias


- Para el modelo SIR, requeriremos la librería (deSolve), además especificaremos la cantidad de población con cual realizaremos la simulación.

Para los valores de beta y gamma, los obtuvimos únicamente de uno de nuestros trabajos en Python ya que no se pudo realizar ese calculo en R


beta = 0.12596558425613963

gamma = 0.001


ree

- Procedemos a crear la función del modelo y calculamos sus intervalos


ree

- Aquí especificamos en times hasta el tiempo en días que se muestra en la gráfica, además de mostrar los primeros 10 datos


ree

- Generamos la gráfica del modelo SIR


ree

ree



Conclusiones


Gracias a los modelos matemáticos se puede se pueden realizar predicciones en cuanto a la enfermedad de alto contagio por la que esta pasando el planetta, los modelos muestran las tasas de crecimiento del avance de esta enfermedad.


Podemos decir que el modelo exponencial da una mejor referencia con respecto a la tasa de contagiados ya que presenta una curva que crece de acuerdo a sus estadísticas. El modelo polinomial consigue añadir curvatura al modelo introduciendo nuevos predictores, es necesario predecir el valor de la variable respuesta en puntos interpolados dentro del rango del predictor. El modelo basado en probabilidad esta mas cerca de la realidad ya que el crecimiento por el valor de la mediana es mas certero, son óptimos hasta cierto punto.


El modelo polinomial se acerca mas a la realidad no tiene mucha diferencia con los resultados y puede hacer una mejor predicción con respecto al modelo de probabilidad, sin embargo este ultimo tiene sus ventajas y es que muestra datos reales pero conforme pasan los días los datos van siendo falibles.


El lenguaje de programación R es un lenguaje potente con un gran objetivo orientado a la estadística y gráfica, que para este caso ha facilitado el entendimiento y uso de regresiones matemáticas, como también para el modelo SIR.


Gracias al modelo matemático SIR se ha comprobado características sobre el brote epidemiológico que está atravesando el planeta con el COVID-19 y a la vez realizar predicciones, lo que intentan los países es intentar aplanar la curva y frenar los contagios. El modelo relaciona las variaciones las tres poblaciones (Susceptible, Infectada y Recuperada).




Referencias


- Tutorial básico de R con Rstudio


MODELO LINEAL


MODELO LOGISTICO Y EXPONENCIAL


MODELO POLINOMIAL Y MODELO PROBABILISTICO


MODELO SIR


MODELO DE SIMULACION



Descarga del Proyecto
















 
 
 

Comentarios


Universidad Politécnica Salesiana 2020

bottom of page