Aquí están las preguntas de la entrevista de Elastic Search para candidatos nuevos y experimentados.
1) ¿Qué es Elasticsearch?
Elasticsearch es una base de datos NoSQL. Se basa en el motor de búsqueda Lucene y está construido con RESTful APIS. Ofrece una implementación simple, máxima confiabilidad y fácil administración. También proporciona consultas avanzadas para realizar análisis detallados y almacena todos los datos de forma centralizada. Ayuda a ejecutar una búsqueda rápida de los documentos.
2) ¿Cuáles son las características importantes de Elasticsearch?
Estas son características importantes de Elasticsearch:
- Un servidor de búsqueda de código abierto escrito con Java.
- Se utiliza para indexar cualquier tipo de datos heterogéneos.
- Tiene interfaz web REST API con salida JSON
- Búsqueda de texto completo
- Búsqueda casi en tiempo real (NRT)
- Almacén de documentos JSON fragmentado, replicable y con capacidad de búsqueda.
- Almacén distribuido de documentos sin esquemas, basado en REST y JSON
- Soporte multilenguaje y geolocalización
3) ¿Qué es un clúster?
Un clúster es una colección de nodos que juntos contienen datos y proporcionan capacidades de búsqueda e indexación unidas.
4) Explique el índice
Un nodo es una instancia de búsqueda elástica. Se crea cuando comienza una instancia de elasticsearch.
5) ¿Qué es un documento en Elastic Search?
En una búsqueda de Elastic, un documento es una unidad básica de información que se puede indexar. Se expresa en un par JSON (clave: valor). '{"usuario": "nullcon"}'. Cada documento está asociado con un tipo y una identificación única.
6) Definir el término fragmento
Cada índice se puede dividir en varios fragmentos para poder distribuir datos. El fragmento es la parte atómica de un índice, que se puede distribuir en el clúster si desea agregar más nodos.
7) ¿Cuáles son las ventajas importantes de Elastic Search?
Estas son las ventajas importantes de Elasticsearch:
- Almacena datos sin esquema y también crea un esquema para tus datos.
- Manipule sus datos registro por registro con la ayuda de API de múltiples documentos
- Realice el filtrado y la consulta de sus datos para obtener información
- Basado en Apache Lucene y proporciona RESTful API
- Proporciona escalabilidad horizontal, confiabilidad y capacidad multiusuario para el uso de la indexación en tiempo real.
- Te ayuda a escalar vertical y horizontalmente
8) ¿Qué es la pila ELK?
ELK Stack es una colección de tres productos de código abierto: Elasticsearch, Logstash y Kibana. Todos ellos son desarrollados, administrados y mantenidos por la empresa Elastic.
- E significa ElasticSearch : se utiliza para almacenar registros.
- L significa LogStash: se utiliza tanto para el envío como para el procesamiento y almacenamiento de registros.
- K significa Kibana: es una herramienta de visualización (una interfaz web) que se aloja a través de Nginx o Apache.
9) Explicar la arquitectura de pila ELK
ELK Stack está diseñado para permitir a los usuarios acceder a datos de cualquier fuente, en cualquier formato, y buscar, analizar y visualizar esos datos en tiempo real.
- Registros: se identifican los registros del servidor que deben analizarse
- Logstash: recopila registros y datos de eventos. Incluso analiza y transforma datos.
- ElasticSearch: los datos transformados de Logstash se almacenan, buscan e indexan.
- Kibana: Kibana usa Elasticsearch DB para explorar, visualizar y compartir
10) ¿Cuáles son las razones para usar ELK stack?
Aquí están las razones para usar ELK stack:
- ELK funciona mejor cuando los registros de varias aplicaciones de una empresa convergen en una única instancia de ELK
- Proporciona información asombrosa para esta única instancia y también elimina la necesidad de iniciar sesión en un centenar de fuentes de datos de registro diferentes.
- Instalación rápida en las instalaciones
- Escalas fáciles de implementar vertical y horizontalmente
- Elastic ofrece una gran cantidad de clientes de idiomas, que incluye Ruby. Pitón. PHP, Perl, .NET, Java y JavaScript, y más
- Disponibilidad de bibliotecas para diferentes lenguajes de programación y scripting
11) Explicar Tokenizer en ElasticSearch
Un desglose de Tokenizer coloca los valores de un documento en una secuencia. Los índices invertidos se crean y actualizan utilizando estos valores. Después de eso, este flujo de valores se almacena en el documento.
12) ¿Qué es una réplica en ElasticSearch?
Cada fragmento en ElasticSearch tiene 2 copias, que se denominan réplicas. Le ayudan a conseguir alta disponibilidad y tolerancia a fallos.
13) ¿Cuáles son las operaciones principales que puede realizar en un documento?
Aquí, se realizan operaciones importantes en documentos:
- Indexación de un documento
- Obteniendo documentos
- Actualizar documentos
- Eliminar documentos
14) ¿Qué es un clúster en Elasticsearch?
El clúster es una colección de uno o varios nodos que contiene todos sus datos y ofrece capacidades de indexación y búsqueda federadas en todos los nodos.
15) ¿Cómo se puede eliminar un índice en Elastic Search?
Para eliminar un índice en Elasticsearch, debe escribir el comando:
DELETE /index name.
Por ejemplo, BORRAR / sitio web.
16) Explica el método para agregar un mapeo en un índice.
Elasticsearch te permite crear el mapeo según los datos proporcionados por el usuario en el cuerpo de la solicitud. Su función de volumen se puede utilizar para agregar más de un objeto JSON en el índice.
Por ejemplo, POST sitio web / _bulk.
17) ¿Cuáles son las distintas formas de búsqueda en Elasticsearch?
A continuación se muestra la forma de búsqueda en Elasticsearch:
Búsqueda de múltiples índices y múltiples tipos: puede buscar API que se pueden aplicar en todos los índices múltiples utilizando el sistema de soporte de múltiples índices.
En Elastic Search, podemos crear ciertas etiquetas en todos los índices en todos los índices y en todos los tipos.
- Búsqueda de URI: una solicitud de búsqueda se ejecuta mediante un URI proporcionando los parámetros solicitados.
- Búsqueda del cuerpo de la solicitud: una solicitud de búsqueda debe ser ejecutada por un DSL de búsqueda. Incluye la consulta DSL dentro del cuerpo.
18) ¿Cuál es la última versión de Elasticsearch?
Última versión de Elastic Search en enero de 2020, que es la versión más reciente y estable de Elasticsearch.
19) ¿Qué es el mapeo?
El mapeo es un proceso que le ayuda a definir cómo se mapea un documento al motor de búsqueda. Sus características de búsqueda son campos incluidos que están tokenizados y también se pueden buscar.
20) ¿Dónde se almacena Elastic Search?
Puede almacenar Elasticsearch es un documento distribuido, que es una tienda con varios tipos de directorios. También puede recuperar las complejas estructuras de datos que se pueden serializar como documentos JSON.
21) ¿Qué es Apache Lucene?
Apache Lucene es una biblioteca de software de recuperación de información de código abierto. Está escrito originalmente en lenguaje Java.
22) A continuación, se muestran importantes herramientas de gestión de la configuración compatibles con Elasticsearch:
- Puppet - puppet-elasticsearch
- Chef - libro de cocina-elasticsearch
- Ansible - búsqueda ansible-elástica
23) ¿Qué es NRT en Elasticsearch?
NRT es una forma completa de plataforma (búsqueda casi en tiempo real). Es una plataforma de búsqueda casi en tiempo real. Significa que hay una ligera latencia (principalmente un segundo) desde que indexa un documento hasta que se vuelve muy fácil de buscar.
24) ¿Dónde se configuran los ajustes para X-Pack?
Puede configurar los ajustes para X-Pack. Tiene características en los archivos de configuración elasticsearch, logstash y kibana.yml (pila ELK).
25) ¿Qué es la API cat en Elasticsearch?
Estos comandos aceptan un parámetro de cadena de consulta. Esto ayuda a ver toda la información, los encabezados y la información que proporcionan y el comando / _cat, que le permite enumerar todos los comandos disponibles.
26) ¿Cuáles son los distintos comandos disponibles en Elasticsearch cat API?
Los comandos que se usan con la API de gato son:
- Alias de gatos, asignación de gatos, recuento de gatos, datos de campo de gatos
- Salud del gato, índices de gato, maestro de gato, tareas pendientes, complementos de gato, recuperación de gato
- repositorios de gatos, instantáneas de gatos, plantillas de gatos
27) ¿Qué es el nodo Ingest?
El nodo de ingesta se utiliza para preprocesar documentos antes de que ocurra la indexación real del documento. Le ayuda a interceptar solicitudes masivas e indexadas. También aplica transformaciones y luego devuelve los documentos a la API y al índice masivos.
28) ¿Cuáles son las distintas formas de utilizar los comandos X-Pack?
A continuación, se muestran los comandos de X-Pack que lo ayudan a configurar la seguridad:
- Certgen
- emigrar
- syskeygen
- certutil
- saml-metadata
- configuración-contraseñas
- usuarios
29) ¿Qué son las API de documento único en Elasticsearch?
- Obtener API
- API de índice
- Eliminar API
- Actualizar API
30) Explicar la API de exploración en Elasticsearch
La API Graph explore le permite extraer y resumir información sobre los documentos.
31) ¿Cómo se puede crear un índice en Elasticsearch?
Por ejemplo:
PUT / cliente? Bonita
GET / _cat / índices? V
32) ¿Qué son las agregaciones?
El marco de agregaciones le ayuda a proporcionar datos agregados basados en una consulta de búsqueda. Se basa en bloques de construcción simples conocidos como agregaciones. Se puede componer para construir resúmenes complejos de los datos.
33) ¿Elasticsearch tiene un esquema?
Mapeos de ElasticSearch que se pueden utilizar para aplicar un esquema en documentos.
34) ¿Qué es Query DSL en Elasticsearch?
Elasticsearch ofrece Query DSL (Lenguaje específico de dominio) completo basado en JSON para definir consultas.
35) ¿Qué es Elasticsearch Data Node?
Los nodos de datos contienen fragmentos que manejan documentos indexados. Le ayudan a ejecutar operaciones de agregación de búsqueda y CRUD relacionadas con datos, etc. Sin embargo, debe establecer node.data = true para convertir el nodo como nodo de datos.
36) ¿Qué es un documento en ElasticSearch?
El documento es muy similar a una fila en bases de datos relacionales. Cada documento del índice posee una estructura diferente pero tiene el mismo tipo de datos para los campos respectivos.
- MySQL => Bases de datos => Tablas => Columnas / Filas
- ElasticSearch => Índices => Tipos => Documentos con propiedades
37) Explica el tipo en ElasticSearch
El tipo es una partición de índice lógico cuya semántica depende del usuario.
38) ¿Cuál es el lenguaje de consulta de Elasticsearch?
Elasticsearch utiliza el lenguaje de consulta Apache Lucene, que también se conoce como Query DSL.
39) ¿Qué es el mapeo dinámico en Elasticsearch?
El mapeo dinámico ayuda al usuario a indexar documentos sin configuraciones no deseadas para el nombre del campo. En su lugar, se agregará automáticamente a través de Elasticsearch con algunas reglas personalizadas.
40) ¿Qué es Elasticsearch de búsqueda difusa?
La búsqueda aproximada es un proceso en el que se deben identificar las ubicaciones de los documentos de las páginas web. Eso se asemeja al argumento de búsqueda. También funciona cuando el argumento no es relevante para el corresponsal de búsqueda de información en particular.