BigData 2025, Enero

Cómo descargar & Instalar Cassandra en Windows

Cómo descargar & Instalar Cassandra en Windows

Apache Cassandra es utilizado por organizaciones más pequeñas, mientras que Datastax Enterprise es utilizado por la organización más grande para almacenar una gran cantidad de datos. Apache Cassandra es administrado por Apache. En este tutorial

Top 60 Hadoop & Preguntas de la entrevista de MapReduce y amp; Respuestas

Top 60 Hadoop & Preguntas de la entrevista de MapReduce y amp; Respuestas

1) ¿Qué es Hadoop Map Reduce? Para procesar grandes conjuntos de datos en paralelo en un clúster hadoop, se utiliza el marco Hadoop MapReduce. El análisis de datos utiliza un mapa de dos pasos y reduce el proceso. 2) ¿Cómo había

Cómo instalar Hadoop con configuración paso a paso en Ubuntu

Cómo instalar Hadoop con configuración paso a paso en Ubuntu

Requisitos previos: debe tener Ubuntu instalado y en ejecución. Debe tener Java instalado. Paso 1) Agregue un usuario del sistema Hadoop usando el siguiente comando sudo addgroup hadoop_ sudo adduser --ingroup hadoop_ h

Hadoop & Ejemplos de Mapreduce: crear el primer programa en Java

Hadoop & Ejemplos de Mapreduce: crear el primer programa en Java

Enunciado del problema: averigüe la cantidad de productos vendidos en cada país. Entrada: Nuestro conjunto de datos de entrada es un archivo CSV, SalesJan2009.csv Requisitos previos: este tutorial está desarrollado en Linux - Ubunt

Tutorial de HDFS: arquitectura, lectura y amp; Operación de escritura usando la API de Java

Tutorial de HDFS: arquitectura, lectura y amp; Operación de escritura usando la API de Java

Hadoop viene con un sistema de archivos distribuido llamado HDFS (HADOOP Distributed File Systems) Las aplicaciones basadas en HADOOP hacen uso de HDFS. HDFS está diseñado para almacenar archivos de datos muy grandes, ejecutar

Tutorial de Sqoop: ¿Qué es Apache Sqoop? Arquitectura & Ejemplo

Tutorial de Sqoop: ¿Qué es Apache Sqoop? Arquitectura & Ejemplo

Antes de aprender más sobre Flume y Sqoop, estudiemos Problemas con la carga de datos en Hadoop El procesamiento analítico que usa Hadoop requiere la carga de grandes cantidades de datos de diversas fuentes en Hadoop c

20 MEJORES competidores de AWS & Alternativas en 2021

20 MEJORES competidores de AWS & Alternativas en 2021

AWS es la plataforma de computación en la nube de Amazon que ofrece soluciones rápidas, flexibles, confiables y rentables. También ofrece un servicio en forma de bloques de construcción que se pueden utilizar para crear y dep

¿Qué es BIG DATA? Introducción, tipos, características, ejemplo

¿Qué es BIG DATA? Introducción, tipos, características, ejemplo

Para entender el 'Big Data', primero necesitamos saber qué son los 'datos'. El diccionario Oxford define 'datos' como - `` Las cantidades, caracteres o símbolos en los que se perforan las operaciones

Guía de certificación de AWS: costo, cursos, salario, detalles del examen

Guía de certificación de AWS: costo, cursos, salario, detalles del examen

¿Qué es la certificación AWS? AWS Certification ayuda a los profesionales a generar credibilidad y confianza al validar su experiencia en la nube con una credencial reconocida por la industria. Ayuda a profes

Azure frente a AWS: diferencias clave

Azure frente a AWS: diferencias clave

¿Qué es Azure? Azure es una plataforma en la nube flexible y de código abierto que ayuda en el desarrollo, alojamiento de servicios, administración de servicios y almacenamiento de datos. La herramienta de computación en la nube de Azure aloja aplicaciones web

¿Qué es AWS Lambda? Función Lambda con ejemplos

¿Qué es AWS Lambda? Función Lambda con ejemplos

Antes de AWS Lambda, entendamos: ¿Qué es Serverless? Sin servidor es un término que generalmente se refiere a aplicaciones sin servidor. Las aplicaciones sin servidor son aquellas que no necesitan ninguna provisión de servidor y

Cambiar tipo de instancia, grupo de seguridad, protección de terminación: AWS EC2

Cambiar tipo de instancia, grupo de seguridad, protección de terminación: AWS EC2

En este tutorial de AWS, aprenderá cómo cambiar el tipo de instancia de AWS EC2, la protección de terminación, los datos de usuario, el comportamiento de apagado, el grupo de seguridad, la verificación de origen / destino y cómo habilitar y deshabilitar la supervisión de ClassicLink y CloudWatch.

Cómo crear una instancia EC2 en AWS: tutorial paso a paso

Cómo crear una instancia EC2 en AWS: tutorial paso a paso

Una instancia EC2 no es más que un servidor virtual en la terminología de Amazon Web Services. Significa Elastic Compute Cloud. Es un servicio web donde un suscriptor de AWS puede solicitar y aprovisionar una computadora

Tutorial de pruebas de Big Data: qué es, estrategia, cómo probar Hadoop

Tutorial de pruebas de Big Data: qué es, estrategia, cómo probar Hadoop

Las pruebas de BigData se definen como pruebas de aplicaciones de Bigdata. En este tutorial, aprenderá a probar aplicaciones Hadoop funcionales y de rendimiento, junto con las herramientas para las mismas.

29 MEJORES herramientas ITSM en 2021

29 MEJORES herramientas ITSM en 2021

La gestión de servicios de TI, que se conoce popularmente (ITSM), tiene como objetivo alinear la prestación de servicios de tecnología de la información con las necesidades de la empresa. El enfoque de las herramientas ITSM es brindar resultados satisfactorios

Transformación del control de transacciones en Informatica: comandos TCL

Transformación del control de transacciones en Informatica: comandos TCL

La transformación del control de transacciones nos permite confirmar o deshacer transacciones durante la ejecución del mapeo. Las operaciones de compromiso y reversión son de gran importancia ya que garantizan la

Las 20 mejores herramientas de integración continua (CI) en 2021

Las 20 mejores herramientas de integración continua (CI) en 2021

Con muchas herramientas de Integración Continua disponibles en el mercado, es una tarea bastante tediosa seleccionar la mejor herramienta para su proyecto. A continuación se muestran las 20 principales herramientas de CI con funciones clave y enlaces de descarga.

Las 30 mejores alternativas y competidores de nuevas reliquias en 2021

Las 30 mejores alternativas y competidores de nuevas reliquias en 2021

New Relic's es una herramienta líder para el monitoreo del rendimiento de aplicaciones (APM). Ofrece datos en tiempo real sobre el rendimiento de sus aplicaciones web. Sin embargo, los datos que obtiene no son muy detallados y

Hadoop MapReduce Join & Contador con ejemplo

Hadoop MapReduce Join & Contador con ejemplo

Un contador en MapReduce es un mecanismo que se utiliza para recopilar información estadística sobre el trabajo de MapReduce. Esta información podría ser útil para el diagnóstico de un problema en el procesamiento de trabajos de MapReduce. Coun

¿Qué es MapReduce en Hadoop? Arquitectura - Ejemplo

¿Qué es MapReduce en Hadoop? Arquitectura - Ejemplo

En este tutorial aprenderá, ¿qué es MapReduce en Hadoop? Cómo funciona, proceso, arquitectura con ejemplo.

Diferencia entre información y datos

Diferencia entre información y datos

¿Qué son los datos? Los datos son un hecho en bruto y desorganizado que debe procesarse para que sean significativos. Los datos pueden ser simples y al mismo tiempo desorganizados, a menos que estén organizados. Generalmente, los datos comprenden

¿Qué es Hadoop? Introducción, Arquitectura, Ecosistema, Componentes

¿Qué es Hadoop? Introducción, Arquitectura, Ecosistema, Componentes

Apache HADOOP es un marco utilizado para desarrollar aplicaciones de procesamiento de datos que se ejecutan en un entorno informático distribuido. Similar a los datos que residen en un sistema de archivos local de computación personal

50 preguntas principales de la entrevista de DevOps y amp; Respuestas

50 preguntas principales de la entrevista de DevOps y amp; Respuestas

1) Explique qué es DevOps. Es un término recientemente emergente en el campo de TI, que no es más que una práctica que enfatiza la colaboración y comunicación tanto de los desarrolladores de software como de la implementación (o

¿Qué es ITSM? Procesos de gestión de servicios de TI, marco y beneficios

¿Qué es ITSM? Procesos de gestión de servicios de TI, marco y beneficios

¿Qué es ITSM? ITSM tiene como objetivo alinear la prestación de servicios de TI con las necesidades de la empresa. La forma completa de ITSM es Gestión de servicios de TI. El enfoque de las herramientas ITSM es brindar un servicio satisfactorio

PDF tutorial de Hadoop: Conceptos básicos de Big Data Analytics para principiantes

PDF tutorial de Hadoop: Conceptos básicos de Big Data Analytics para principiantes

BigData es la última palabra de moda en la industria de TI. Hadoop de Apache es una plataforma líder de Big Data utilizada por los gigantes de TI Yahoo, Facebook & Google. Este libro electrónico paso a paso está diseñado para convertirse en un experto en Hadoop.

Lista de las 24 mejores herramientas de inteligencia empresarial (BI) en 2021

Lista de las 24 mejores herramientas de inteligencia empresarial (BI) en 2021

Las herramientas de Business Intelligence ayudan a las organizaciones a mejorar su toma de decisiones y colaboración social. Proporciona los medios para informes eficientes, análisis exhaustivo de datos, estadísticas y amp; a

¿Qué es OLAP? Cubo, Operaciones y amp; Tipos en almacén de datos

¿Qué es OLAP? Cubo, Operaciones y amp; Tipos en almacén de datos

¿Qué es el procesamiento analítico en línea? OLAP es una categoría de software que permite a los usuarios analizar información de múltiples sistemas de bases de datos al mismo tiempo. Es una tecnología que permite a los analistas

Las 25 preguntas principales de la entrevista de prueba ETL y amp; Respuestas

Las 25 preguntas principales de la entrevista de prueba ETL y amp; Respuestas

1) ¿Qué es ETL? En la arquitectura de almacenamiento de datos, ETL es un componente importante que gestiona los datos de cualquier proceso empresarial. ETL son las siglas de Extract, Transform and Load. Extraer hace el proceso o

Diferencia entre la tabla de hechos y la tabla de dimensiones

Diferencia entre la tabla de hechos y la tabla de dimensiones

Tabla de hechos: una tabla de hechos es una tabla principal en un modelo dimensional. Una tabla de hechos contiene medidas / hechos Clave extranjera para la tabla de dimensiones Tabla de dimensiones: una tabla de dimensiones contiene dimensiones de af