¿Qué es BIG DATA? Introducción, tipos, características, ejemplo

Tabla de contenido:

Anonim

Antes de pasar a la introducción a Big Data, primero debe saber

¿Qué son los datos?

Las cantidades, caracteres o símbolos en los que las operaciones son realizadas por una computadora, que pueden almacenarse y transmitirse en forma de señales eléctricas y registrarse en soportes de grabación magnéticos, ópticos o mecánicos.

Ahora, aprendamos la introducción de Big Data

¿Qué es Big Data?

Big Data es una colección de datos que es enorme en volumen, pero que crece exponencialmente con el tiempo. Es un dato con un tamaño y complejidad tan grande que ninguna de las herramientas tradicionales de administración de datos puede almacenarlo o procesarlo de manera eficiente. Big data también es un dato pero con un tamaño enorme.

En este tutorial, aprenderá,

  • ¿Qué son los datos?
  • ¿Qué es Big Data?
  • Ejemplos de Big Data
  • Tipos de Big Data
  • Características de Big Data
  • Ventajas del procesamiento de Big Data

Ejemplos de Big Data

A continuación se muestran algunos de los ejemplos de Big Data:

La Bolsa de Valores de Nueva York genera alrededor de un terabyte de nuevos datos comerciales por día.

Redes sociales

La estadística muestra que más de 500 terabytes de datos nuevos se introducen en las bases de datos del sitio de redes sociales Facebook , todos los días. Estos datos se generan principalmente en términos de carga de fotos y videos, intercambio de mensajes, comentarios, etc.

Un solo motor Jet puede generar más de 10 terabytes de datos en 30 minutos de tiempo de vuelo. Con muchos miles de vuelos por día, la generación de datos alcanza hasta muchos Petabytes.

Tipos de Big Data

Los siguientes son los tipos de Big Data:

  1. Estructurado
  2. No estructurado
  3. Semiestructurada

Estructurado

Cualquier dato que se pueda almacenar, acceder y procesar en forma de formato fijo se denomina datos "estructurados". A lo largo del tiempo, el talento en informática ha logrado un mayor éxito en el desarrollo de técnicas para trabajar con este tipo de datos (donde el formato es bien conocido de antemano) y también en obtener valor de ellos. Sin embargo, hoy en día, estamos previendo problemas cuando el tamaño de dichos datos crece en gran medida, los tamaños típicos están en la furia de múltiples zettabytes.

¿Lo sabías? 10 21 bytes equivalentes a 1 zettabyte o mil millones de terabytes forman un zettabyte .

Al observar estas cifras, uno puede entender fácilmente por qué se le da el nombre de Big Data e imaginar los desafíos involucrados en su almacenamiento y procesamiento.

¿Lo sabías? Los datos almacenados en un sistema de gestión de bases de datos relacionales son un ejemplo de datos "estructurados" .

Ejemplos de datos estructurados

Una tabla 'Empleado' en una base de datos es un ejemplo de datos estructurados

ID de empleado Nombre de empleado Género Departamento Salary_In_lacs
2365 Rajesh Kulkarni Masculino Finanzas 650000
3398 Pratibha Joshi Mujer Administración 650000
7465 Shushil Roy Masculino Administración 500000
7500 Shubhojit Das Masculino Finanzas 500000
7699 Priya Sane Mujer Finanzas 550000

No estructurado

Cualquier dato cuya forma o estructura sea desconocida se clasifica como datos no estructurados. Además de que el tamaño es enorme, los datos no estructurados plantean múltiples desafíos en términos de su procesamiento para obtener valor de ellos. Un ejemplo típico de datos no estructurados es una fuente de datos heterogénea que contiene una combinación de archivos de texto simples, imágenes, videos, etc. Hoy en día, las organizaciones tienen una gran cantidad de datos disponibles, pero desafortunadamente, no saben cómo obtener valor de ellos, ya que estos datos están en su forma sin procesar o en formato no estructurado.

Ejemplos de datos no estructurados

El resultado devuelto por "Búsqueda de Google"

Semiestructurada

Los datos semiestructurados pueden contener ambas formas de datos. Podemos ver los datos semiestructurados como una forma estructurada, pero en realidad no están definidos, por ejemplo, con una definición de tabla en DBMS relacional. Un ejemplo de datos semiestructurados es un dato representado en un archivo XML.

Ejemplos de datos semiestructurados

Datos personales almacenados en un archivo XML

Prashant RaoMale35Seema R.Female41Satish ManeMale29Subrato RoyMale26Jeremiah J.Male35

Crecimiento de datos a lo largo de los años

Tenga en cuenta que los datos de la aplicación web, que no están estructurados, consisten en archivos de registro, archivos de historial de transacciones, etc. Los sistemas OLTP están diseñados para trabajar con datos estructurados en los que los datos se almacenan en relaciones (tablas).

Características de Big Data

Los macrodatos pueden describirse por las siguientes características:

  • Volumen
  • Variedad
  • Velocidad
  • Variabilidad

(i) Volumen: el nombre de Big Data en sí está relacionado con un tamaño enorme. El tamaño de los datos juega un papel muy importante en la determinación del valor de los datos. Además, si un dato en particular se puede considerar realmente como un Big Data o no, depende del volumen de datos. Por lo tanto, el 'volumen' es una característica que debe tenerse en cuenta al tratar con Big Data.

(ii) Variedad: el siguiente aspecto de Big Data es su variedad .

La variedad se refiere a fuentes heterogéneas y la naturaleza de los datos, tanto estructurados como no estructurados. Durante los primeros días, las hojas de cálculo y las bases de datos eran las únicas fuentes de datos consideradas por la mayoría de las aplicaciones. Hoy en día, los datos en forma de correos electrónicos, fotos, videos, dispositivos de monitoreo, PDF, audio, etc. también se están considerando en las aplicaciones de análisis. Esta variedad de datos no estructurados plantea ciertos problemas para el almacenamiento, la extracción y el análisis de datos.

(iii) Velocidad: el término "velocidad" se refiere a la velocidad de generación de datos. La rapidez con la que se generan y procesan los datos para satisfacer las demandas determina el potencial real de los datos.

Big Data Velocity se ocupa de la velocidad a la que fluyen los datos desde fuentes como procesos comerciales, registros de aplicaciones, redes y sitios de medios sociales, sensores, dispositivos móviles, etc. El flujo de datos es masivo y continuo.

(iv) Variabilidad: se refiere a la inconsistencia que pueden mostrar los datos en ocasiones, lo que dificulta el proceso de poder manejar y administrar los datos de manera efectiva.

Beneficios del procesamiento de Big Data

La capacidad de procesar Big Data aporta múltiples beneficios, tales como:

    • Las empresas pueden utilizar inteligencia externa al tomar decisiones

El acceso a los datos sociales de los motores de búsqueda y sitios como Facebook, Twitter permite a las organizaciones ajustar sus estrategias comerciales.

    • Servicio al cliente mejorado

Los sistemas tradicionales de retroalimentación de los clientes están siendo reemplazados por nuevos sistemas diseñados con tecnologías de Big Data. En estos nuevos sistemas, se utilizan tecnologías de procesamiento de Big Data y lenguaje natural para leer y evaluar las respuestas de los consumidores.

    • Identificación temprana del riesgo para el producto / servicio, si lo hubiera
    • Mejor eficiencia operativa

Las tecnologías de Big Data se pueden utilizar para crear un área de preparación o una zona de aterrizaje para nuevos datos antes de identificar qué datos se deben mover al almacén de datos. Además, dicha integración de las tecnologías de Big Data y el almacén de datos ayuda a una organización a descargar los datos a los que se accede con poca frecuencia.

Resumen

  • Definición de Big Data: Big Data se define como datos de gran tamaño. Bigdata es un término que se utiliza para describir una colección de datos que tiene un tamaño enorme y, sin embargo, crece exponencialmente con el tiempo.
  • Los ejemplos de análisis de Big Data incluyen bolsas de valores, sitios de redes sociales, motores a reacción, etc.
  • Big Data podría ser 1) estructurado, 2) no estructurado, 3) semiestructurado
  • El volumen, la variedad, la velocidad y la variabilidad son algunas de las características de Big Data
  • Un mejor servicio al cliente, una mejor eficiencia operativa y una mejor toma de decisiones son algunas de las ventajas de Bigdata