BigData 2024, Diciembre

Cambiar tipo de instancia, grupo de seguridad, protección de terminación: AWS EC2

Cambiar tipo de instancia, grupo de seguridad, protección de terminación: AWS EC2

En este tutorial de AWS, aprenderá cómo cambiar el tipo de instancia de AWS EC2, la protección de terminación, los datos de usuario, el comportamiento de apagado, el grupo de seguridad, la verificación de origen / destino y cómo habilitar y deshabilitar la supervisión de ClassicLink y CloudWatch.

¿Qué es AWS Lambda? Función Lambda con ejemplos

¿Qué es AWS Lambda? Función Lambda con ejemplos

Antes de AWS Lambda, entendamos: ¿Qué es Serverless? Sin servidor es un término que generalmente se refiere a aplicaciones sin servidor. Las aplicaciones sin servidor son aquellas que no necesitan ninguna provisión de servidor y

Hadoop MapReduce Join & Contador con ejemplo

Hadoop MapReduce Join & Contador con ejemplo

Un contador en MapReduce es un mecanismo que se utiliza para recopilar información estadística sobre el trabajo de MapReduce. Esta información podría ser útil para el diagnóstico de un problema en el procesamiento de trabajos de MapReduce. Coun

Azure frente a AWS: diferencias clave

Azure frente a AWS: diferencias clave

¿Qué es Azure? Azure es una plataforma en la nube flexible y de código abierto que ayuda en el desarrollo, alojamiento de servicios, administración de servicios y almacenamiento de datos. La herramienta de computación en la nube de Azure aloja aplicaciones web

Guía de certificación de AWS: costo, cursos, salario, detalles del examen

Guía de certificación de AWS: costo, cursos, salario, detalles del examen

¿Qué es la certificación AWS? AWS Certification ayuda a los profesionales a generar credibilidad y confianza al validar su experiencia en la nube con una credencial reconocida por la industria. Ayuda a profes

¿Qué es BIG DATA? Introducción, tipos, características, ejemplo

¿Qué es BIG DATA? Introducción, tipos, características, ejemplo

Para entender el 'Big Data', primero necesitamos saber qué son los 'datos'. El diccionario Oxford define 'datos' como - `` Las cantidades, caracteres o símbolos en los que se perforan las operaciones

20 MEJORES competidores de AWS & Alternativas en 2021

20 MEJORES competidores de AWS & Alternativas en 2021

AWS es la plataforma de computación en la nube de Amazon que ofrece soluciones rápidas, flexibles, confiables y rentables. También ofrece un servicio en forma de bloques de construcción que se pueden utilizar para crear y dep

Las 30 mejores alternativas y competidores de nuevas reliquias en 2021

Las 30 mejores alternativas y competidores de nuevas reliquias en 2021

New Relic's es una herramienta líder para el monitoreo del rendimiento de aplicaciones (APM). Ofrece datos en tiempo real sobre el rendimiento de sus aplicaciones web. Sin embargo, los datos que obtiene no son muy detallados y

Tutorial de Sqoop: ¿Qué es Apache Sqoop? Arquitectura & Ejemplo

Tutorial de Sqoop: ¿Qué es Apache Sqoop? Arquitectura & Ejemplo

Antes de aprender más sobre Flume y Sqoop, estudiemos Problemas con la carga de datos en Hadoop El procesamiento analítico que usa Hadoop requiere la carga de grandes cantidades de datos de diversas fuentes en Hadoop c

Tutorial de HDFS: arquitectura, lectura y amp; Operación de escritura usando la API de Java

Tutorial de HDFS: arquitectura, lectura y amp; Operación de escritura usando la API de Java

Hadoop viene con un sistema de archivos distribuido llamado HDFS (HADOOP Distributed File Systems) Las aplicaciones basadas en HADOOP hacen uso de HDFS. HDFS está diseñado para almacenar archivos de datos muy grandes, ejecutar

Hadoop & Ejemplos de Mapreduce: crear el primer programa en Java

Hadoop & Ejemplos de Mapreduce: crear el primer programa en Java

Enunciado del problema: averigüe la cantidad de productos vendidos en cada país. Entrada: Nuestro conjunto de datos de entrada es un archivo CSV, SalesJan2009.csv Requisitos previos: este tutorial está desarrollado en Linux - Ubunt

Cómo instalar Hadoop con configuración paso a paso en Ubuntu

Cómo instalar Hadoop con configuración paso a paso en Ubuntu

Requisitos previos: debe tener Ubuntu instalado y en ejecución. Debe tener Java instalado. Paso 1) Agregue un usuario del sistema Hadoop usando el siguiente comando sudo addgroup hadoop_ sudo adduser --ingroup hadoop_ h

Top 60 Hadoop & Preguntas de la entrevista de MapReduce y amp; Respuestas

Top 60 Hadoop & Preguntas de la entrevista de MapReduce y amp; Respuestas

1) ¿Qué es Hadoop Map Reduce? Para procesar grandes conjuntos de datos en paralelo en un clúster hadoop, se utiliza el marco Hadoop MapReduce. El análisis de datos utiliza un mapa de dos pasos y reduce el proceso. 2) ¿Cómo había

Cómo descargar & Instalar Cassandra en Windows

Cómo descargar & Instalar Cassandra en Windows

Apache Cassandra es utilizado por organizaciones más pequeñas, mientras que Datastax Enterprise es utilizado por la organización más grande para almacenar una gran cantidad de datos. Apache Cassandra es administrado por Apache. En este tutorial

Arquitectura de Cassandra & Estrategia de factor de replicación

Arquitectura de Cassandra & Estrategia de factor de replicación

Cassandra está diseñada para manejar big data. La característica principal de Cassandra es almacenar datos en múltiples nodos sin un solo punto de falla. La razón de este tipo de arquitectura de Cassandra fue que el

Modelo de datos de Cassandra con un ejemplo simple

Modelo de datos de Cassandra con un ejemplo simple

Aunque el lenguaje de consulta de Cassandra se parece al lenguaje SQL, sus métodos de modelado de datos son totalmente diferentes. En Cassandra, un modelo de datos incorrecto puede degradar el rendimiento, especialmente cuando los usuarios intentan

Las 10 mejores herramientas de análisis de datos para el análisis de macrodatos (2021)

Las 10 mejores herramientas de análisis de datos para el análisis de macrodatos (2021)

El software Big Data Analytics se utiliza ampliamente para proporcionar un análisis significativo de un gran conjunto de datos. Aquí está la lista de las 11 herramientas principales de análisis y visualización de Big Data con funciones clave y enlaces de descarga.

Crear, modificar & Suelta el espacio de teclas en Cassandra con un ejemplo

Crear, modificar & Suelta el espacio de teclas en Cassandra con un ejemplo

Cassandra proporciona un lenguaje de consulta que permite a los desarrolladores comunicarse con Cassandra. La sintaxis del lenguaje de consulta Cassandra (CQL) se parece al lenguaje SQL. En este tutorial, aprenderá: Cass

Tabla de Cassandra: crear, modificar, soltar y amp; Truncar (con ejemplo)

Tabla de Cassandra: crear, modificar, soltar y amp; Truncar (con ejemplo)

La sintaxis del lenguaje de consulta Cassandra (CQL) se parece al lenguaje SQL. Crear tabla Modificar tabla Eliminar tabla Truncar tabla Cassandra Crear tabla La familia de columnas en Cassandra es similar a la tabla RDBMS

Las 15 mejores herramientas de Big Data - Software de código abierto para análisis de datos

Las 15 mejores herramientas de Big Data - Software de código abierto para análisis de datos

El mercado actual está inundado de una variedad de herramientas de Big Data. Aportan rentabilidad y una mejor gestión del tiempo en las tareas de visualización de datos. Aquí está la lista del mejor software de big data comercial y de código abierto con sus características clave y enlaces de descarga.

Colección Cassandra: conjunto, lista, mapa con ejemplo

Colección Cassandra: conjunto, lista, mapa con ejemplo

Las colecciones de Cassandra son una buena forma de manejar tareas. Se pueden almacenar varios elementos en colecciones. Existen limitaciones en las colecciones de Cassandra. La colección Cassandra no puede almacenar datos más de

Lenguaje de consulta Cassandra (CQL): insertar, actualizar, eliminar (ejemplo)

Lenguaje de consulta Cassandra (CQL): insertar, actualizar, eliminar (ejemplo)

En este artículo, aprenderá: Insertar datos Insertar datos Actualizar datos Eliminar datos Leer datos Insertar datos El comando 'Insertar en' escribe datos en columnas Cassandra en forma de fila. Almacenará solo aquellos colu

Configuración del clúster de Cassandra en varios nodos (máquinas)

Configuración del clúster de Cassandra en varios nodos (máquinas)

Las grandes organizaciones como Amazon, Facebook, etc. tienen una gran cantidad de datos para administrar. Por lo tanto, estas organizaciones no pueden almacenar esa enorme cantidad de datos en una sola máquina. Esto cuando usan la base de datos

DataStax DevCenter & Guía de instalación de OpsCenter

DataStax DevCenter & Guía de instalación de OpsCenter

En este tutorial, aprenderá, Instalación de DevCenter Instalación de OpsCenter Instalación de DevCenter DevCenter es la herramienta de consulta frontal donde puede escribir su consulta y ejecutarla. DevCenter i

Seguridad de Cassandra: Crear usuario & Autenticación con JMX

Seguridad de Cassandra: Crear usuario & Autenticación con JMX

En todas las bases de datos NoSQL, la seguridad ha sido un punto débil. Ninguna base de datos NoSQL proporciona una seguridad completa. Después de reconocer este punto débil en Cassandra y debido a las muy altas demandas de los clientes y

Las 23 preguntas principales de la entrevista de Cassandra y amp; Respuestas

Las 23 preguntas principales de la entrevista de Cassandra y amp; Respuestas

1) Explica qué es Cassandra. Cassandra es un sistema de almacenamiento de datos de código abierto desarrollado en Facebook para la búsqueda en la bandeja de entrada y diseñado para almacenar y administrar grandes cantidades de datos en el servidor de productos básicos.

¿Qué es Business Intelligence? Definición & Ejemplo

¿Qué es Business Intelligence? Definición & Ejemplo

¿Qué es Business Intelligence? BI (Business Intelligence) es un conjunto de procesos, arquitecturas y tecnologías que convierten datos sin procesar en información significativa que impulsa acciones comerciales rentables.

Base de datos vs almacén de datos: diferencias clave

Base de datos vs almacén de datos: diferencias clave

¿Qué es la base de datos? Una base de datos es una colección de datos relacionados que representan algunos elementos del mundo real. Está diseñado para ser construido y poblado con datos para una tarea específica. También es una construcción

20+ MEJOR software de gestión de activos de TI (Reseñas de 2021)

20+ MEJOR software de gestión de activos de TI (Reseñas de 2021)

La gestión de activos de TI es una práctica empresarial que ayuda a gestionar los activos de tecnología de la información en toda la empresa dentro de su organización. Conecta las funciones de inventario, financieras, contractuales y de gestión de riesgos para controlar el ciclo de vida de los activos.

ETL vs ELT: debe conocer las diferencias

ETL vs ELT: debe conocer las diferencias

¿Qué es ETL? ETL es una abreviatura de Extraer, Transformar y Cargar. En este proceso, una herramienta ETL extrae los datos de diferentes sistemas fuente RDBMS y luego transforma los datos como si se aplicara un cálculo.