Curso: introducción al mundo del Big Data
Big data es un conjunto de datos tan grande que nuestros medios tradicionales de gestión de la información no están a la altura. Esta colección puede tomar muchas formas.
Ejemplos de Big Data
Los tweets almacenados en los servidores de Twitter.
La información que obtiene Google del seguimiento de los viajes en automóvil.
El conjunto completo de los resultados de las elecciones locales y nacionales de un país se remonta a los registros históricos.
Lo que las compañías de seguros de salud saben acerca de quién recibe qué tratamientos se realizan en qué hospitales.
Los tipos de compras y lugares que aparecen en las tarjetas de crédito.
Lo que la gente ve en Netflix , cuándo, dónde y cuánto tiempo
Definición
Posiblemente la próxima tecnología revolucionaria en Tecnologías de la Información
Apareció en la primera década del siglo XXI
Big Data tiene como objetivo resolver problemas antiguos y nuevos de manera más eficiente pero aplicado a extensos volúmenes de datos no usados hasta el momento
Genera valor a un negocio a partir del almacenamiento y procesamiento de cantidades muy grandes de información digital que no puede ser analizada con técnicas tradicionales de computación
Características del Big Data:
N = ALL, Fin del muestreo
Todo el conjunto de datos es válido, no se descartan casos
Se puede eliminar el problema del sesgo
La inexactitud de los datos ya no es un problema
El error de la muestra se minimiza, y por tanto podemos asumir datos menos exactos
Dicho de otra forma, cuando dependemos de una muestra, queremos que los datos sean exactos
Obtenemos el qué, pero no el por qué
Las técnicas de Big Data no explican la causalidad (correlaciones)
Las tres ‘v’ del Big Data
Volumen: Se considera un volumen grande a partir de Petabytes (1.000.000 GB)
Velocidad: Frecuencia a la que se genera los datos / Tiempo de análisis de los datos
Variedad: Datos estructurados, semi-estructurados, no estructurados
¿Otras Vs?: ¿Veracidad? ¿Valor?
Tipos de datos
Estructurados
Bases de datos tradicionales
Encuestas, censos
Semi-estructurados
XML, RDF
Grafos
No estructurados
Texto
Imágenes, audio
Ejemplos de Big Data
Los tweets almacenados en los servidores de Twitter.
La información que obtiene Google del seguimiento de los viajes en automóvil.
El conjunto completo de los resultados de las elecciones locales y nacionales de un país se remonta a los registros históricos.
Lo que las compañías de seguros de salud saben acerca de quién recibe qué tratamientos se realizan en qué hospitales.
Los tipos de compras y lugares que aparecen en las tarjetas de crédito.
Lo que la gente ve en Netflix , cuándo, dónde y cuánto tiempo
Definición
Posiblemente la próxima tecnología revolucionaria en Tecnologías de la Información
Apareció en la primera década del siglo XXI
Big Data tiene como objetivo resolver problemas antiguos y nuevos de manera más eficiente pero aplicado a extensos volúmenes de datos no usados hasta el momento
Genera valor a un negocio a partir del almacenamiento y procesamiento de cantidades muy grandes de información digital que no puede ser analizada con técnicas tradicionales de computación
Características del Big Data:
N = ALL, Fin del muestreo
Todo el conjunto de datos es válido, no se descartan casos
Se puede eliminar el problema del sesgo
La inexactitud de los datos ya no es un problema
El error de la muestra se minimiza, y por tanto podemos asumir datos menos exactos
Dicho de otra forma, cuando dependemos de una muestra, queremos que los datos sean exactos
Obtenemos el qué, pero no el por qué
Las técnicas de Big Data no explican la causalidad (correlaciones)
Las tres ‘v’ del Big Data
Volumen: Se considera un volumen grande a partir de Petabytes (1.000.000 GB)
Velocidad: Frecuencia a la que se genera los datos / Tiempo de análisis de los datos
Variedad: Datos estructurados, semi-estructurados, no estructurados
¿Otras Vs?: ¿Veracidad? ¿Valor?
Tipos de datos
Estructurados
Bases de datos tradicionales
Encuestas, censos
Semi-estructurados
XML, RDF
Grafos
No estructurados
Texto
Imágenes, audio
No hay comentarios.