Máster en Big Data y Data Science de la UNED

Voces de autoridad definen la alianza entre ciencia de los datos y Astronomía. El Big Data permite explorar el Universo mediante el análisis de los datos generados por los complejos de observación, incluso sirve para atacar problemas de gran complejidad como los relacionados con la energía oscura. La actual coyuntura demanda expertos y especialistas en análisis de grandes volúmenes de datos, la UNED conduce uno de los mejores programas al respecto.

Hay una fuente generadora de Big Data que supera a la mayoría: los datos llegados desde los instrumentos de observación astronómica. En 1997, cuando se dio la noticia sobre la construcción de un gran mapa del Universo conocido, compuesto por cientos de terabytes, surgieron varios debates en encuentros académicos sobre la clase de innovaciones tecnológicas y metodológicas que harían falta para las inevitables actualizaciones que esa gigantesca carta de navegación cósmica necesitaría. Ya en esa época, el mapa (generado por el Sloan Digital Sky Survey - SDSS) superaba la capacidad de análisis de la mayoría de grandes equipos disponibles. Desde la llegada del instrumental utilizado para ese proyecto, muchos expertos coinciden en que la ciencia que representa la punta de lanza del Big Data es la Astronomía. SDSS arribó a los 100 terabytes durante el 2012, en los últimos años llegó a la mitad de un petabyte (unidad de información almacenada, cuyo símbolo es PB, y que equivale a 1015 bytes = 1 000 000 000 000 000 de bytes).

Hacia el 2016, el complejo ALMA (Atacama Large Millimeter/submillimeter Array), uno de los proyectos de investigación astronómica más grandes del mundo, con participación de Europa, varios países asiáticos, América del Norte y la colaboración de Chile, generaba 100 terabytes anuales de datos. El costo de ALMA se calcula en 1.300 millones de dólares. Instrumentales desarrollados posteriormente han superado esas cifras.

El verdadero centro de la cuestión, lo que realmente preocupa a la legión de científicos implicados en proyectos tan grandes, es si están obteniendo todo el conocimiento posible a partir de esos grandes volúmenes de datos. El tamaño de la información acumulada, en ocasiones, solo permite confirmar modelos teóricos anteriores, como el rastro de las ondas generadas en las primeras etapas del Universo (separadas por cientos de millones de años luz): grabaciones determinadas por la posición actual de las galaxias.

Estos y otros limitantes condujeron en su día a la estrategia denominada LSST (Large Synoptic Survey Telescope): un telescopio de 8,4 metros, que comenzará a operar en el 2022 y que podrá observar todo el cielo visible. LSST también está en Chile, al norte del país y a 2.682 metros de altura. El conjunto de espejos y cámaras (de 3.200 megapíxeles) de este gran telescopio va a permitir capturas fotográficas realmente grandes del Universo. Cada imagen será como la proyección de 40 lunas llenas, en seis noches podría rastrear toda la bóveda celeste. Se considera que podría descubrir, por las variaciones de posición y brillo, unos 10 millones de objetos.

LA RESPUESTA A LOS MISTERIOS DEL UNIVERSO, TAMBIÉN SE ESCONDE EN LOS DATOS

Ahora bien, estos logros de la óptica del LSST son increíbles, pero el auténtico desafío está en el análisis de los datos obtenidos. La analítica masiva que complejos como este demandan, obliga a una estrategia profundamente multidisciplinar. En una noche, el telescopio podría producir 15 terabytes de datos, que necesitarán su transmisión por fibra óptica de nueva generación hasta lugares donde emprender la analítica. Durante un mes, solo la observación astronómica del LSST podría igualar en datos al tráfico que todo Internet tiene cada día.

Pero esta marca se verá rota, a su vez, con el proyecto SKA (Square Kilometer Array): el mayor radiotelescopio del mundo, con un kilómetro cuadrado de superficie recolectora. Este complejo generará dos exabytes (dos mil terabytes) cada día. Sus datos recrearán el más completo mapa de hidrógeno del Universo, hasta ahora. Hablamos de lecturas capaces de revelar la ubicación de estrellas, pero también dónde están los átomos que tejen al Universo.

Todas estas iniciativas mayúsculas hacen de la Astronomía una ciencia con mucho que ver con el Big Data. Los grandes proyectos de observación del cielo producen datos que, simplemente, están a la espera de que se les formulen las preguntas correctas. En efecto, muchos científicos consideran que allí estarán codificados muchos de los misterios más importantes sobre el origen del cosmos y la propia Astrofísica.

Así, el campo de la Astronomía ha experimentado una gran revolución durante la última década, gracias a instrumentales y modelos metodológicos cada vez más potentes para estudiar los datos llegados desde el espacio. Sin el avance de las ciencias de la computación, en general, y del Big Data y el Data Science en concreto, sería difícil absorber y procesar los grandes volúmenes de datos que se obtienen mediante observación.

Pero, al hilo de lo anterior, este campo del saber también avanza gracias a la capacidad de poner a prueba las teorías sobre el Universo a través de simulaciones informáticas construidas a partir del análisis de datos. Voces de autoridad en este campo, como Carlos Allende, del Instituto de Astrofísica de Canarias, consideran que el Big Data permite, incluso, el descubrimiento de nuevas estrellas y otros objetos espaciales (cuyo rastro se revela como pauta escondida en los datos, por ejemplo, permitiendo una diferenciación entre fenómenos que se consideraban similares). Pero también grandísimos interrogantes, como los generados alrededor de la energía oscura, pueden ser abordados gracias a esta alianza con la ciencia de los datos: es conocida la expansión del Universo, que se esperaba tuviera un ritmo constante o bien que se frenara y retrocediera hasta colapsar. Sin embargo, en los últimos años se ha sabido que el cosmos se expande de una forma acelerada desde hace, al menos, 5 mil millones de años. Esto hace que aparezcan en cascada importantes preguntas sobre la naturaleza de la energía oscura. Pues bien, equipos científicos de todo el mundo esperan que el Big Data ayude a comprender más sobre esa misteriosa fuerza que expande al Universo en todas direcciones.

En estos momentos, nos encontramos ante una coyuntura muy especial: el Big Data y el Data Science se han convertido en sectores estratégicos en una cantidad cada vez mayor de ámbitos profesionales: científico, empresarial, social, cultural, etc. Para la esfera a la que nos referimos en esta entrada del Blog del Máster en Big Data y Data Science de la UNED, la Astronomía, la diferencia es mayúscula: hoy ninguna Universidad seria del mundo pondría en marcha un programa sobre la ciencia que estudia los cuerpos celestes sin contemplar ciertas competencias y habilidades en Big Data.

En España existe uno de los programas en la materia más completos y exitosos, impartido por la Universidad pública líder en formación Online y aplicación de nuevas tecnologías a la formación superior: la UNED