top of page

Regresiones matemáticas y Modelo SIR en R / RStudio

  • Foto del escritor: BenavidesJuanC - ChimboBryamF
    BenavidesJuanC - ChimboBryamF
  • 8 jun 2020
  • 3 Min. de lectura

Modelo Lineal


Carga del CSV de datos referente a numero de días y cantidad de personas contagiadas de COVID en España.


- Calculo de la Regresión lineal


El comando básico es lm (linear models).

El primer argumento de este comando es una fórmula y ~ x en la que se especifica cuál es la variable respuesta o dependiente (y) y cuál es la variable regresor o independiente (x).


El segundo argumento, llamado data especifica cuál es el fichero en el que se encuentran las variables.


El resultado lo guardamos en un objeto llamado regresión.

Este objeto es una lista que contiene toda la información relevante sobre el análisis.

Mediante el comando summary obtenemos un resumen de los principales resultados:




Gráfica de los datos reales






Predicción de nuevos casos a 10 días



Se suman las nuevas predicciones a nuestro set de datos






Modelo de predicción Logístico


- Cargamos los datos para este se utilizan un CSV con el día desde donde se presentó el primer infectado


Librerías necesarias



- Usaremos la función drm del paquete drc.

El parámetro fct sirve para indicar el modelo a usar, para el caso del modelo logístico con L.5()





- Calculamos el modelo de regresión logístico



- Generamos la gráfica de nuestros datos




- Realizamos la predicción a dos meses


- Añadimos nuestras nuevas predicciones a los datos y generamos la nueva grafica




Modelo de Predicción Exponencial


- Cargamos los datos de nuestro CSV


Librerías Necesarias





- Al igual que el anterior modelo Usaremos la función drm del paquete drc.

El parámetro fct sirve para indicar el modelo a usar, pero para nuestro modelo exponencial el factor que usaremos será EXD.3()





- Realizamos los cálculos del modelo exponencial con EXD.3()



- Generamos la gráfica del modelo




- Ahora calculamos las predicciones para dos meses



- Añadimos nuestros nuevos datos de la predicción a los datos y se gráfica





Modelo de Predicción Polinomial


- Cargamos nuestros datos


- Usamos la función poly() que puede generar directamente un polinomio, evitando tener que escribir toda la fórmula


- Ahora generamos nuestro modelo polinomial de grado 6 para que se acople a nuestros datos



- Generamos los nuevos datos dentro del intervalo del predictor



- Realizamos la predicción en base al error estándar


- Calculamos los intervalos de los limites



- Generamos la Gráfica




Modelo de Predicción Probabilista (Probabilidad)





Filtramos nuestros datos para obtener solo los de España de los nuevos casos



Calculamos la Media y la Mediana


Cargamos los datos de nuestro otro CSV de los casos confirmados y generamos X y


Ahora generamos nuestro modelo de probabilidad con una predicción a 200 días



Graficamos





Modelo SIR o modelado matemático de epidemias


- Para el modelo SIR, requeriremos la librería (deSolve), además especificaremos la cantidad de población con cual realizaremos la simulación.

Para los valores de beta y gamma, los obtuvimos únicamente de uno de nuestros trabajos en Python ya que no se pudo realizar ese calculo en R


beta = 0.12596558425613963

gamma = 0.001



- Procedemos a crear la función del modelo y calculamos sus intervalos



- Aquí especificamos en times hasta el tiempo en días que se muestra en la gráfica, además de mostrar los primeros 10 datos



- Generamos la gráfica del modelo SIR






Conclusiones


Gracias a los modelos matemáticos se puede se pueden realizar predicciones en cuanto a la enfermedad de alto contagio por la que esta pasando el planetta, los modelos muestran las tasas de crecimiento del avance de esta enfermedad.


Podemos decir que el modelo exponencial da una mejor referencia con respecto a la tasa de contagiados ya que presenta una curva que crece de acuerdo a sus estadísticas. El modelo polinomial consigue añadir curvatura al modelo introduciendo nuevos predictores, es necesario predecir el valor de la variable respuesta en puntos interpolados dentro del rango del predictor. El modelo basado en probabilidad esta mas cerca de la realidad ya que el crecimiento por el valor de la mediana es mas certero, son óptimos hasta cierto punto.


El modelo polinomial se acerca mas a la realidad no tiene mucha diferencia con los resultados y puede hacer una mejor predicción con respecto al modelo de probabilidad, sin embargo este ultimo tiene sus ventajas y es que muestra datos reales pero conforme pasan los días los datos van siendo falibles.


El lenguaje de programación R es un lenguaje potente con un gran objetivo orientado a la estadística y gráfica, que para este caso ha facilitado el entendimiento y uso de regresiones matemáticas, como también para el modelo SIR.


Gracias al modelo matemático SIR se ha comprobado características sobre el brote epidemiológico que está atravesando el planeta con el COVID-19 y a la vez realizar predicciones, lo que intentan los países es intentar aplanar la curva y frenar los contagios. El modelo relaciona las variaciones las tres poblaciones (Susceptible, Infectada y Recuperada).




Referencias


- Tutorial básico de R con Rstudio


MODELO LINEAL


MODELO LOGISTICO Y EXPONENCIAL


MODELO POLINOMIAL Y MODELO PROBABILISTICO


MODELO SIR


MODELO DE SIMULACION



Descarga del Proyecto
















 
 
 

Comments


Universidad Politécnica Salesiana 2020

bottom of page