Descargar PDF
1) Explica qué es Cassandra.
Cassandra es un sistema de almacenamiento de datos de código abierto desarrollado en Facebook para la búsqueda en la bandeja de entrada y diseñado para almacenar y administrar grandes cantidades de datos en servidores de productos básicos. Puede servir como ambos
- Sistema de almacenamiento de datos en tiempo real para aplicaciones en línea
- También como base de datos de lectura intensiva para el sistema de inteligencia empresarial
2) ¿Cuál es el uso de Cassandra y por qué usar Cassandra?
Cassandra fue diseñado para manejar cargas de trabajo de big data en múltiples nodos sin ningún punto único de falla. Los diversos factores responsables del uso de Cassandra son
- Es tolerante a fallas y consistente
- Escalabilidades de gigabytes a petabytes
- Es una base de datos orientada a columnas.
- No hay un solo punto de falla
- No se necesita una capa de almacenamiento en caché separada
- Diseño de esquema flexible
- Tiene almacenamiento de datos flexible, fácil distribución de datos y escrituras rápidas.
- Admite propiedades ACID (atomicidad, consistencia, aislamiento y durabilidad)
- Centro de datos múltiples y capacidad para la nube
- Compresión de datos
3) Explique qué es el tipo compuesto en Cassandra.
En Cassandra, el tipo compuesto permite definir una clave o un nombre de columna con una concatenación de datos de diferente tipo. Puede utilizar dos tipos de tipo compuesto
- Clave de fila
- Nombre de columna
4) ¿Cómo almacena Cassandra los datos?
- Todos los datos almacenados como bytes
- Cuando especifica el validador, Cassandra se asegura de que esos bytes estén codificados según el requisito
- Luego, un comparador ordena la columna según el orden específico de la codificación
- Si bien los compuestos son solo matrices de bytes con una codificación específica, para cada componente almacena una longitud de dos bytes seguida del componente codificado por bytes seguido de un bit de terminación.
5) Mencione cuáles son los componentes principales del modelo de datos de Cassandra.
Los componentes principales de Cassandra Data Model son
- Grupo
- Espacio de claves
- Columna
- Columna y familia
6) Explique qué es una familia de columnas en Cassandra.
La familia de columnas en Cassandra se refiere a una colección de filas.
7) Explique qué es un clúster en Cassandra.
Un clúster es un contenedor de espacios de claves. La base de datos de Cassandra está segmentada en varias máquinas que operan juntas. El clúster es el contenedor más externo que organiza los nodos en un formato de anillo y les asigna datos. Estos nodos tienen una réplica que se hace cargo en caso de falla en el manejo de datos.
8) Enumere los otros componentes de Cassandra.
Los otros componentes de Cassandra son
- Nodo
- Centro de datos
- Grupo
- Confirmar registro
- Mem-mesa
- SSTable
- Filtro de floración
9) Explique qué es un espacio de claves en Cassandra.
En Cassandra, un espacio de claves es un espacio de nombres que determina la replicación de datos en los nodos. Un clúster consta de un espacio de claves por nodo.
10) ¿Cuál es la sintaxis para crear un espacio de teclas en Cassandra?
La sintaxis para crear un espacio de claves en Cassandra es
CREAR ESPACIO CLAVE
11) Mencione cuáles son los valores almacenados en la columna Cassandra.
En Cassandra Column, básicamente hay tres valores
- Nombre de columna
- Valor
- Sello de tiempo
12) Mencione cuándo puede usar Alter keyspace.
ALTER KEYSPACE se puede utilizar para cambiar propiedades como el número de réplicas y durable_write de un espacio de claves.
13) Explica qué es Cassandra-Cqlsh.
Cassandra-Cqlsh es un lenguaje de consulta que permite a los usuarios comunicarse con su base de datos. Al utilizar Cassandra cqlsh, puede hacer las siguientes cosas
- Definir un esquema
- Inserte un dato y
- Ejecuta una consulta
14) Mencione lo que determinan los comandos de shell "Capturar" y "Consistencia".
Hay varios comandos de shell Cqlsh en Cassandra. El comando "Capturar", captura la salida de un comando y lo agrega a un archivo, mientras que el comando "Consistencia" muestra el nivel de consistencia actual o establece un nuevo nivel de consistencia.
15) ¿Qué es obligatorio al crear una tabla en Cassandra?
Si bien la creación de una clave principal de tabla es obligatoria, está formada por una o más columnas de una tabla.
16) Mencione lo que debe tenerse en cuenta al agregar una columna.
Al agregar una columna, debe tener cuidado de que el
- El nombre de la columna no entra en conflicto con los nombres de las columnas existentes
- La tabla no está definida con la opción de almacenamiento compacto
17) Mencione qué son las colecciones Cassandra- CQL.
Las colecciones de Cassandra CQL le ayudan a almacenar varios valores en una sola variable. En Cassandra, puede usar colecciones CQL de las siguientes maneras
- Lista : se utiliza cuando es necesario mantener el orden de los datos y un valor se debe almacenar varias veces (contiene la lista de elementos únicos)
- SET : Se utiliza para que el grupo de elementos se almacene y se devuelva en orden clasificado (contiene elementos repetidos)
- MAPA : es un tipo de datos que se utiliza para almacenar un par de elementos clave-valor
18) ¿Explica cómo Cassandra escribe datos?
Cassandra escribe datos en tres componentes
- Escritura de Commitlog
- Escritura memorable
- Escritura SStable
Cassandra primero escribe datos en un registro de confirmación y luego en una estructura de tabla en memoria memtable y finalmente en SStable
19) Explica qué es Memtable en Cassandra.
- Cassandra escribe los datos en una estructura de memoria conocida como Memtable
- Es un caché en memoria con contenido almacenado como clave / columna
- Por clave, los datos de Memtable se ordenan
- Hay un Memtable separado para cada ColumnFamily, y recupera datos de columna de la clave
20) Explique en qué consiste SStable.
SStable consta principalmente de 2 archivos
- Archivo de índice (filtro Bloom y pares de compensación de clave)
- Archivo de datos (datos de columna reales)
21) Explique para qué se usa Bloom Filter en Cassandra.
Un filtro de floración es una estructura de datos eficiente en el espacio que se utiliza para probar si un elemento es miembro de un conjunto. En otras palabras, se utiliza para determinar si una SSTable tiene datos para una fila en particular. En Cassandra se utiliza para guardar IO al realizar una BÚSQUEDA DE CLAVE.
22) Explique cómo Cassandra escribe los datos modificados en el registro de confirmación.
- Cassandra concatenar datos modificados para commitlog
- Commitlog actúa como un registro de recuperación de fallos para los datos
- Hasta que los datos modificados se concatenen para confirmar la operación de escritura del registro, nunca se considerará exitosa
Los datos no se perderán una vez que el registro de confirmación se vacíe en el archivo
23) Explique cómo Cassandra borra los datos.
Las SSTables son inmutables y no pueden eliminar una fila de las SSTables. Cuando es necesario eliminar una fila, Cassandra asigna el valor de la columna con un valor especial llamado Tombstone. Cuando se leen los datos, el valor de Tombstone se considera eliminado.