Curso: introducción al mundo del Big Data

Big data es un conjunto de datos tan grande que nuestros medios tradicionales de gestión de la información no están a la altura. Esta colección puede tomar muchas formas.



Ejemplos de Big Data

Los tweets almacenados en los servidores de Twitter.

La información que obtiene Google del seguimiento de los viajes en automóvil.

El conjunto completo de los resultados de las elecciones locales y nacionales de un país se remonta a los registros históricos.

Lo que las compañías de seguros de salud saben acerca de quién recibe qué tratamientos se realizan en qué hospitales.

Los tipos de compras y lugares que aparecen en las tarjetas de crédito.

Lo que la gente ve en Netflix , cuándo, dónde y cuánto tiempo


Definición 

Posiblemente la próxima tecnología revolucionaria en Tecnologías de la Información

Apareció en la primera década del siglo XXI

Big Data tiene como objetivo resolver problemas antiguos y nuevos de manera más eficiente pero aplicado a extensos volúmenes de datos no usados hasta el momento

Genera valor a un negocio a partir del almacenamiento y procesamiento de cantidades muy grandes de información digital que no puede ser analizada con técnicas tradicionales de computación

Características del Big Data:

N = ALL, Fin del muestreo

Todo el conjunto de datos es válido, no se descartan casos

Se puede eliminar el problema del sesgo

La inexactitud de los datos ya no es un problema

El error de la muestra se minimiza, y por tanto podemos asumir datos menos exactos

Dicho de otra forma, cuando dependemos de una muestra, queremos que los datos sean exactos

Obtenemos el qué, pero no el por qué

Las técnicas de Big Data no explican la causalidad (correlaciones)

Las tres ‘v’ del Big Data 

Volumen: Se considera un volumen grande a partir de Petabytes (1.000.000 GB)

Velocidad: Frecuencia a la que se genera los datos / Tiempo de análisis de los datos

Variedad: Datos estructurados, semi-estructurados, no estructurados

¿Otras Vs?: ¿Veracidad? ¿Valor?

Tipos de datos 
 Estructurados
  Bases de datos tradicionales
  Encuestas, censos

Semi-estructurados
  XML, RDF
  Grafos

 No estructurados
  Texto
  Imágenes, audio

 

https://123short.com/fr3ES

No hay comentarios.

Con tecnología de Blogger.