WEBVTT
Kind: captions
Language: es-419

00:00:00.659 --> 00:00:03.900
Katie Naum:
Eso nos lleva a nuestro orador final Ajitesh

00:00:03.900 --> 00:00:05.830
Srivastava de la Universidad de California.

00:00:05.830 --> 00:00:08.370
Ajitesh, puedes compartir cuando estés listo.

00:00:08.370 --> 00:00:09.820
Ajitesh Srivastava:

00:00:15.230 --> 00:00:19.160
Espero que puedan ver mi pantalla.

00:00:19.160 --> 00:00:20.160
Bien.

00:00:20.160 --> 00:00:23.160
Mi nombre es Ajitesh Srivastava.

00:00:23.160 --> 00:00:29.830
Soy el coinvestigador de esta subvención:
Recuperar: Predicciones detalladas precisas

00:00:29.830 --> 00:00:35.120
y asignación de recursos para la respuesta
a la epidemia de COVID-19.

00:00:36.120 --> 00:00:41.379
Los objetivos de este proyecto son los siguientes:
pronósticos precisos de COVID-19 en varios

00:00:41.379 --> 00:00:47.110
niveles, incluso para varios países, para
el nivel estatal, el nivel nacional y los

00:00:47.110 --> 00:00:49.969
pronósticos detallados como el nivel del
vecindario.

00:00:49.969 --> 00:00:54.530
Nos gustaría incorporar la identificación
basada en datos de una serie de casos no reportados

00:00:54.530 --> 00:01:00.640
que no se observan realmente, pero que afectan
significativamente a los pronósticos a largo

00:01:00.640 --> 00:01:05.020
plazo, y finalmente, cómo utilizar estos
pronósticos de manera efectiva para la gestión

00:01:05.020 --> 00:01:08.920
de recursos durante la pandemia.

00:01:08.920 --> 00:01:13.640
Esto es lo que hemos logrado hasta ahora.

00:01:13.640 --> 00:01:15.930
Tenemos un pronóstico preciso de COVID-19.

00:01:15.930 --> 00:01:21.050
En pocos segundos, podemos realizar entrenamiento
y predicciones para 3.000 condados en menos

00:01:21.050 --> 00:01:22.340
de 30 segundos.

00:01:22.340 --> 00:01:25.400
Proporcionamos garantías de fiabilidad sobre
los factores no observados.

00:01:25.400 --> 00:01:27.600
Por ejemplo, cuánto subregistro está pasando.

00:01:27.600 --> 00:01:31.660
En algunos casos, podemos identificar ese
número y podemos garantizar matemáticamente

00:01:31.660 --> 00:01:34.090
que ese número está cerca de la verdad.

00:01:34.090 --> 00:01:37.550
Tenemos una interfaz web y un repositorio
de Github disponibles al público y también

00:01:37.550 --> 00:01:41.500
ofrecemos evaluaciones semanales que comparan
nuestro enfoque con los modelos que utiliza

00:01:41.500 --> 00:01:42.500
actualmente el CDC.

00:01:42.500 --> 00:01:47.280
Estamos proporcionando nuestro caso y pronósticos
de muerte al CDC, que incluye el nivel nacional

00:01:47.280 --> 00:01:51.340
de EE.UU. semanal, el nivel estatal y el nivel
del condado.

00:01:51.340 --> 00:01:59.810
Estos se utilizarán para informar al público
y para la selección de los lugares de las

00:01:59.810 --> 00:02:01.130
pruebas de vacunación.

00:02:01.130 --> 00:02:05.520
También estamos proporcionando nuestras previsiones
para desarrollar modelos conjuntos a UMass

00:02:05.520 --> 00:02:10.990
centro de predicción y a KIT, donde estamos
proporcionando previsiones nacionales y estatales

00:02:10.990 --> 00:02:11.990
de Alemania.

00:02:11.990 --> 00:02:17.340
Aquí están las publicaciones: dos de ellas
están preimpresas y una de ellas ha sido

00:02:17.340 --> 00:02:19.690
aceptada en la conferencia de KDD.

00:02:20.690 --> 00:02:25.350
Por lo tanto, la idea central que afirmamos
aquí es que un modelo no es suficiente.

00:02:25.350 --> 00:02:30.240
Simplemente tener un modelo que es complejo
no es suficiente.

00:02:30.240 --> 00:02:35.330
Pronosticar requiere tomar decisiones con
respecto a qué estrategia de aprendizaje

00:02:35.330 --> 00:02:39.880
usas, qué tipo de procesamiento previo de
datos usas, qué eliges como parámetros,

00:02:39.880 --> 00:02:40.980
qué decides tener como hiperparámetros.

00:02:40.980 --> 00:02:41.980
Todas estas decisiones pueden afectar significativamente
sus resultados de pronóstico.

00:02:41.980 --> 00:02:46.150
Con eso en mente, nos gustaría tener un modelo
que capture varias complejidades y, sin embargo,

00:02:46.150 --> 00:02:50.760
preferimos enfoques de aprendizaje simples
para evitar el sobreajuste para que sepamos

00:02:50.760 --> 00:02:57.800
que lo que estamos aprendiendo está realmente
cerca de la verdad, y que y queremos comprobar

00:02:57.800 --> 00:03:04.650
matemáticamente la capacidad de aprendizaje
- ¿Si lo que estamos afirmando que tenemos

00:03:04.650 --> 00:03:07.950
- se ajustaba a los datos del pasado?

00:03:07.950 --> 00:03:09.980
¿O realmente aprendió algo?

00:03:09.980 --> 00:03:16.250
Y nos gustaría tener una ejecución rápida
para permitir el análisis de escenarios.

00:03:16.250 --> 00:03:23.940
Usted puede leer este documento para entender
cómo empezamos desde un modelo complejo y

00:03:23.940 --> 00:03:28.510
simplificarlo en un modelo matemáticamente
equivalente que es fácil de aprender.

00:03:29.510 --> 00:03:36.690
Así que un aspecto central de nuestro trabajo
es abordar la capacidad de aprendizaje.

00:03:36.690 --> 00:03:45.110
A pesar de las simplificaciones, una ecuación
en nuestro modelo todavía no es lineal.

00:03:45.110 --> 00:03:53.900
Así que siempre podemos ajustar sus datos
a cualquier modelo, pero ¿refleja la verdad?

00:03:53.900 --> 00:03:56.750
Porque puede haber múltiples soluciones.

00:03:56.750 --> 00:04:02.170
Por ejemplo, aquí para el factor de subregistro,
se ven cuatro curvas.

00:04:02.170 --> 00:04:09.180
Todos estos cuatro modelos de una manera,
se ajustan a los datos del pasado muy bien,

00:04:09.180 --> 00:04:10.400
pero conducen a resultados significativamente
diferentes.

00:04:10.400 --> 00:04:14.170
Entonces, ¿cómo sabes cuál de estas cuatro
curvas refleja la verdad?

00:04:14.170 --> 00:04:21.860
Por lo tanto, demostramos que este factor
de subregistro se puede aprender confiablemente

00:04:21.860 --> 00:04:28.750
de los datos sólo bajo ciertas condiciones
y los detalles de esto están en el documento.

00:04:29.750 --> 00:04:36.020
Tenemos una visualización en línea donde
se pueden realizar pronósticos de forma interactiva

00:04:36.020 --> 00:04:41.340
y también se puede ver varios escenarios
de dónde vamos y qué pasaría si ponemos

00:04:41.340 --> 00:04:43.110
nuestro mejor esfuerzo vs.

00:04:43.110 --> 00:04:49.530
qué pasaría si ponemos nuestro peor esfuerzo
donde podríamos estar en unas pocas semanas

00:04:49.530 --> 00:04:50.890
a partir de ahora.

00:04:51.890 --> 00:04:54.420
En nuestra página, también proporcionamos
comparaciones de nuestro enfoque con otros

00:04:54.420 --> 00:05:01.590
enfoques de los CDC y hemos estado consistentemente
en los dos primeros, los tres primeros entre

00:05:01.590 --> 00:05:05.430
unos 25 modelos que se están utilizando actualmente.

00:05:06.430 --> 00:05:12.160
Otro trabajo relevante que estamos considerando
es aprender confiablemente los efectos de

00:05:12.160 --> 00:05:13.160
varias pólizas.

00:05:13.160 --> 00:05:15.650
También estamos interesados en realizar,
resolviendo algunos problemas de asignación

00:05:15.650 --> 00:05:17.400
de recursos ahora que tenemos pronósticos
precisos.

00:05:17.400 --> 00:05:22.870
Entonces, ¿cómo asignamos los EPP o cómo
decidimos dónde deberían realizarse las

00:05:22.870 --> 00:05:29.790
pruebas a través del mapa y dónde deberíamos
tener sitios de vacunación?

00:05:29.790 --> 00:05:33.540
Y con eso, terminaré mi charla.

00:05:33.540 --> 00:05:34.170
Gracias.

