BIG DATA Y DATA SCIENCE: CONCEPTOS
- BLOG DEL MÁSTER EN BIG DATA Y DATA SCIENCE ONLINE DE LA UNED
- Visto: 3818
Orientar acertadamente un proceso de toma de decisiones, en nuestra época de transformación digital y cambios socioculturales, involucra una recolección, lectura e interpretación correcta de los datos. Aquí aparecen los “conceptos” de Data Science y Big Data, para definir un universo en expansión… el de enormes volúmenes de datos.
Data Science…
Cuando se hizo necesario diferenciar y centrar la figura del "data scientist", como suele ser más o menos habitual en otros campos del saber, la mayor parte de las herramientas que le serían propias ya existían o estaban esbozadas. Se trató de crear un cuadro productivo que integrara procedimientos matemáticos, estadísticos e informáticos de una forma completamente científica, con objeto de analizar inteligentemente el océano de los datos y descubrir en ellos todo lo susceptible de ser entendido, precisamente, como de origen científico: patrones, regularidades, rasgos generales, tendencias temporales, posibles axiomas o leyes, etc.
Se trate de una estructura productiva ya integrada en el mercado o un equipo de investigación, el data scientist puede desarrollar aplicaciones o soluciones especificas a unos objetivos preestablecidos. Su trabajo, a grandes rasgos, es utilizar los recursos tecnológicos para ordenar, crear modelos de pronóstico y optimizar la visualización de los datos (por ejemplo, respecto al factor tiempo).
Tal vez podría conjeturarse que el Data Science actúa como matriz impulsora del Big Data: la asociación de los conceptos y todas sus implicaciones metodológicas, ha logrado que un nivel nuevo de pragmatismo y visión estratégica desemboque en los procesos productivos que acumulan datos; que, al ser ordenados y visualizados, se convierten en información coherente: la nueva forma de riqueza.
La razón por la que hablamos de una ciencia como tal es que, en muchos escenarios actuales, nos enfrentamos a volúmenes de datos que demandan marcos analíticos de enorme y desconocida complejidad. Hasta el punto de necesitar investigar en sistemas con millones de variables. Es decir, esta demanda de la producción excede por completo los modelos tradicionales de análisis en bases de datos.
De ahí que muchos estudios y ejercicios formativos, como este programa modular de la UNED (Experto, Especialista y Máster), apunten a una integración: Big Data y Data Science. McKinsey Global Institute se refiere al primero como “conjuntos de datos cuyo tamaño va más allá de la capacidad de captura, almacenado, gestión y análisis de las herramientas de bases de datos”.
Es decir, en materia formativa sobresalen programas superiores creados en el eje ciencia-técnica: Herramientas para analizar grandes volúmenes, pero también bases de conocimiento que permiten idear soluciones aplicadas.
Big Data…
Lo especial de este concepto es que lleva implícito, entre otros, el de eficiencia. Atacar un universo de análisis con datos heterogéneos, en bases disímiles, con distintas escalas de estructuración, etc. para mostrar resultados en tiempo real, requiere de una eficacia nueva. Desde la aparición del concepto en el 2013, hemos visto comprometidos ámbitos del conocimiento, la sociedad y la economía cada vez más amplios.
Big Data, igualmente, eleva a nuevas expresiones aspectos como variedad, velocidad y volumen (hablamos de terabytes y petabytes), colocando todo el acento en la herramienta de análisis y su desarrollo.
Naturalmente, las definiciones son amplísimas, lo que también es corriente en el establecimiento del eje ciencia-técnica. Tanto interés por este área de estudio es también, de alguna forma, simple: un dato es como un detalle “mínimo” del comportamiento humano y todos sus constructos materiales y psicosociales, una pieza reducida que codifica nuestra manera de crear realidad. Millones de datos juntos, aunque condensan todas las partes de un nicho completo, no significan nada sin la alianza entre los conceptos nombrados (Big Data y Data Science).
Luego, a lo que nos estamos refiriendo aquí, es a procedimientos científicos que revelan muchas de las claves explicativas para esas tendencias que re-significan cada día nuestro modo de vida: la economía, los patrones de consumo, la cultura, el impacto en el ambiente, los modelos de administración, etc.
El hecho de unir Big Data y Data Science en la misma frase expresa la necesidad de que ciencia y herramienta se encuentren para poner al alcance efectivo de más actores sociales todo el potencial de una administración y visualización inteligente de todos esos terabytes y petabytes de datos desordenados.
El potencial de un acceso de tal magnitud a la información es revolucionario, porque podríamos convertir la “simple” ventaja competitiva de tomar buenas decisiones, en la posibilidad de mejorar nuestros escenarios futuros.