50 preguntas principales de la entrevista sobre aprendizaje automático y amp; Respuestas

Anonim

Descargar PDF

1) ¿Qué es el aprendizaje automático?

El aprendizaje automático es una rama de la informática que se ocupa de la programación de sistemas para aprender y mejorar automáticamente con la experiencia. Por ejemplo: los robots están programados para que puedan realizar la tarea en función de los datos que recopilan de los sensores. Aprende automáticamente los programas a partir de los datos.

2) ¿Menciona la diferencia entre la minería de datos y el aprendizaje automático?

El aprendizaje automático se relaciona con el estudio, diseño y desarrollo de los algoritmos que brindan a las computadoras la capacidad de aprender sin ser programados explícitamente. Mientras que, la minería de datos se puede definir como el proceso en el que los datos no estructurados intentan extraer conocimiento o patrones interesantes desconocidos. Durante este proceso de máquina, se utilizan algoritmos de aprendizaje.

3) ¿Qué es el 'sobreajuste' en el aprendizaje automático?

En el aprendizaje automático, cuando un modelo estadístico describe un error o ruido aleatorio en lugar de una relación subyacente, se produce un "sobreajuste". Cuando un modelo es excesivamente complejo, normalmente se observa un sobreajuste, debido a que tiene demasiados parámetros con respecto al número de tipos de datos de entrenamiento. El modelo presenta un rendimiento deficiente que se ha sobreajustado.

4) ¿Por qué ocurre el sobreajuste?

Existe la posibilidad de sobreajuste ya que los criterios utilizados para entrenar el modelo no son los mismos que los criterios utilizados para juzgar la eficacia de un modelo.

5) ¿Cómo se puede evitar el sobreajuste?

Al usar una gran cantidad de datos, se puede evitar el sobreajuste, el sobreajuste ocurre relativamente, ya que tiene un pequeño conjunto de datos e intenta aprender de él. Pero si tiene una base de datos pequeña y se ve obligado a venir con un modelo basado en eso. En tal situación, puede utilizar una técnica conocida como validación cruzada . En este método, el conjunto de datos se divide en dos secciones, conjuntos de datos de prueba y de entrenamiento, el conjunto de datos de prueba solo probará el modelo, mientras que, en el conjunto de datos de entrenamiento, los puntos de datos generarán el modelo.

En esta técnica, un modelo generalmente recibe un conjunto de datos de datos conocidos en los que se ejecuta el entrenamiento (conjunto de datos de entrenamiento) y un conjunto de datos desconocidos contra el cual se prueba el modelo. La idea de la validación cruzada es definir un conjunto de datos para "probar" el modelo en la fase de entrenamiento.

6) ¿Qué es el aprendizaje automático inductivo?

El aprendizaje automático inductivo implica el proceso de aprendizaje mediante ejemplos, donde un sistema, a partir de un conjunto de instancias observadas, intenta inducir una regla general.

7) ¿Cuáles son los cinco algoritmos populares de Machine Learning?

  • Árboles de decisión
  • Redes neuronales (propagación inversa)
  • Redes probabilísticas
  • Vecino más cercano
  • Máquinas de vectores de soporte

8) ¿Cuáles son las diferentes técnicas de algoritmos en Machine Learning?

Los diferentes tipos de técnicas en Machine Learning son

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje semi-supervisado
  • Aprendizaje reforzado
  • Transducción
  • Aprendiendo a aprender

9) ¿Cuáles son las tres etapas para construir las hipótesis o el modelo en el aprendizaje automático?

  • Construcción del modelo
  • Prueba de modelo
  • Aplicando el modelo

10) ¿Cuál es el enfoque estándar para el aprendizaje supervisado?

El enfoque estándar para el aprendizaje supervisado es dividir el conjunto de ejemplos en el conjunto de capacitación y la prueba.

11) ¿Qué es 'Conjunto de entrenamiento' y 'Conjunto de prueba'?

En diversas áreas de la ciencia de la información, como el aprendizaje automático, se utiliza un conjunto de datos para descubrir la relación potencialmente predictiva conocida como "Conjunto de entrenamiento". El conjunto de formación es un ejemplo que se le da al alumno, mientras que el conjunto de prueba se utiliza para probar la precisión de las hipótesis generadas por el alumno, y es el conjunto de ejemplos que se le oculta al alumno. El conjunto de entrenamiento es distinto del conjunto de prueba.

12) ¿Enumere varios enfoques para el aprendizaje automático?

Los diferentes enfoques en Machine Learning son

  • Concepto Vs Aprendizaje de clasificación
  • Aprendizaje simbólico versus estadístico
  • Aprendizaje inductivo vs analítico

13) ¿Qué no es el aprendizaje automático?

  • Inteligencia artificial
  • Inferencia basada en reglas

14) Explique cuál es la función del 'Aprendizaje no supervisado'.

  • Encuentra grupos de datos
  • Encuentre representaciones de baja dimensión de los datos
  • Encuentra direcciones interesantes en los datos
  • Interesantes coordenadas y correlaciones.
  • Encuentre observaciones novedosas / limpieza de bases de datos

15) Explique cuál es la función del 'Aprendizaje supervisado'.

  • Clasificaciones
  • Reconocimiento de voz
  • Regresión
  • Predecir series de tiempo
  • Anotar cadenas

16) ¿Qué es el aprendizaje automático independiente de algoritmos?

El aprendizaje automático en el que los fundamentos matemáticos son independientes de cualquier clasificador o algoritmo de aprendizaje en particular, ¿se conoce como aprendizaje automático independiente del algoritmo?

17) ¿Cuál es la diferencia entre el aprendizaje artificial y el aprendizaje automático?

El diseño y desarrollo de algoritmos según los comportamientos basados ​​en datos empíricos se conoce como Machine Learning. Si bien la inteligencia artificial además del aprendizaje automático, también cubre otros aspectos como la representación del conocimiento, el procesamiento del lenguaje natural, la planificación, la robótica, etc.

18) ¿Qué es el clasificador en el aprendizaje automático?

Un clasificador en un aprendizaje automático es un sistema que ingresa un vector de valores de características discretos o continuos y genera un único valor discreto, la clase.

19) ¿Cuáles son las ventajas de Naive Bayes?

En Naïve Bayes, el clasificador convergerá más rápido que los modelos discriminativos como la regresión logística, por lo que necesita menos datos de entrenamiento. La principal ventaja es que no puede aprender las interacciones entre funciones.

20) ¿En qué áreas se utiliza el reconocimiento de patrones?

El reconocimiento de patrones se puede utilizar en

  • Visión por computador
  • Reconocimiento de voz
  • Procesamiento de datos
  • Estadísticas
  • Recuperación informal
  • Bioinformática

21) ¿Qué es la programación genética?

La programación genética es una de las dos técnicas utilizadas en el aprendizaje automático. El modelo se basa en las pruebas y la selección de la mejor opción entre un conjunto de resultados.

22) ¿Qué es la programación lógica inductiva en el aprendizaje automático?

La programación lógica inductiva (ILP) es un subcampo del aprendizaje automático que utiliza la programación lógica que representa conocimientos y ejemplos previos.

23) ¿Qué es la selección de modelos en el aprendizaje automático?

El proceso de selección de modelos entre diferentes modelos matemáticos, que se utilizan para describir el mismo conjunto de datos, se conoce como Selección de modelos. La selección de modelos se aplica a los campos de la estadística, el aprendizaje automático y la minería de datos.

24) ¿Cuáles son los dos métodos utilizados para la calibración en el aprendizaje supervisado?

Los dos métodos utilizados para predecir buenas probabilidades en el aprendizaje supervisado son

  • Calibración Platt
  • Regresión isotónica

Estos métodos están diseñados para la clasificación binaria y no son triviales.

25) ¿Qué método se utiliza con frecuencia para evitar el sobreajuste?

Cuando hay datos suficientes, se utiliza 'Regresión isotónica' para evitar un problema de sobreajuste.

26) ¿Cuál es la diferencia entre heurística para el aprendizaje de reglas y heurística para árboles de decisión?

La diferencia es que las heurísticas para árboles de decisión evalúan la calidad promedio de varios conjuntos desarticulados, mientras que los aprendices de reglas solo evalúan la calidad del conjunto de instancias que se cubre con la regla candidata.

27) ¿Qué es Perceptron en el aprendizaje automático?

En Machine Learning, Perceptron es un algoritmo para la clasificación supervisada de la entrada en una de varias posibles salidas no binarias.

28) ¿Explica los dos componentes del programa de lógica bayesiana?

El programa de lógica bayesiana consta de dos componentes. El primer componente es lógico; consta de un conjunto de cláusulas bayesianas, que captura la estructura cualitativa del dominio. El segundo componente es cuantitativo, codifica la información cuantitativa sobre el dominio.

29) ¿Qué son las redes bayesianas (BN)?

La Red Bayesiana se utiliza para representar el modelo gráfico de la relación de probabilidad entre un conjunto de variables.

30) ¿Por qué el algoritmo de aprendizaje basado en instancias a veces se denomina algoritmo de aprendizaje perezoso?

El algoritmo de aprendizaje basado en instancias también se conoce como algoritmo de aprendizaje perezoso, ya que retrasan el proceso de inducción o generalización hasta que se realiza la clasificación.

31) ¿Cuáles son los dos métodos de clasificación que puede manejar SVM (Support Vector Machine)?

  • Combinando clasificadores binarios
  • Modificar binario para incorporar el aprendizaje multiclase

32) ¿Qué es el aprendizaje en conjunto?

Para resolver un programa computacional en particular, se generan y combinan estratégicamente múltiples modelos como clasificadores o expertos. Este proceso se conoce como aprendizaje conjunto.

33) ¿Por qué se utiliza el aprendizaje en conjunto?

El aprendizaje conjunto se utiliza para mejorar la clasificación, predicción, aproximación de funciones, etc. de un modelo.

34) ¿Cuándo usar el aprendizaje en conjunto?

El aprendizaje por conjuntos se utiliza cuando crea clasificadores de componentes que son más precisos e independientes entre sí.

35) ¿Cuáles son los dos paradigmas de los métodos conjuntos?

Los dos paradigmas de los métodos conjuntos son

  • Métodos de conjunto secuencial
  • Métodos de conjuntos paralelos

36) ¿Cuál es el principio general de un método de conjunto y qué es embolsar y potenciar en el método de conjunto?

El principio general de un método de conjunto es combinar las predicciones de varios modelos construidos con un algoritmo de aprendizaje dado para mejorar la robustez en un solo modelo. El ensacado es un método en conjunto para mejorar los esquemas de clasificación o estimación inestable. Mientras que el método de impulso se utiliza secuencialmente para reducir el sesgo del modelo combinado. Tanto el refuerzo como el embolsado pueden reducir los errores al reducir el plazo de variación.

37) ¿Qué es la descomposición de la varianza-sesgo del error de clasificación en el método de conjunto?

El error esperado de un algoritmo de aprendizaje se puede descomponer en sesgo y varianza. Un término de sesgo mide qué tan cerca el clasificador promedio producido por el algoritmo de aprendizaje coincide con la función objetivo. El término de varianza mide cuánto fluctúa la predicción del algoritmo de aprendizaje para diferentes conjuntos de entrenamiento.

38) ¿Qué es un algoritmo de aprendizaje incremental en conjunto?

El método de aprendizaje incremental es la capacidad de un algoritmo para aprender de nuevos datos que pueden estar disponibles después de que el clasificador ya se haya generado a partir de un conjunto de datos ya disponible.

39) ¿Para qué se utilizan PCA, KPCA e ICA?

PCA (análisis de componentes principales), KPCA (análisis de componentes principales basado en kernel) e ICA (análisis de componentes independientes) son técnicas de extracción de características importantes que se utilizan para la reducción de dimensionalidad.

40) ¿Qué es la reducción de dimensiones en el aprendizaje automático?

En Machine Learning y estadísticas, la reducción de dimensiones es el proceso de reducir el número de variables aleatorias bajo consideración y se puede dividir en selección de características y extracción de características.

41) ¿Qué son las máquinas de vectores de soporte?

Las máquinas de vectores de soporte son algoritmos de aprendizaje supervisado que se utilizan para el análisis de clasificación y regresión.

42) ¿Cuáles son los componentes de las técnicas de evaluación relacional?

Los componentes importantes de las técnicas de evaluación relacional son

  • Adquisición de datos
  • Adquisición de la verdad fundamental
  • Técnica de validación cruzada
  • Tipo de consulta
  • Métrica de puntuación
  • Prueba de significación

43) ¿Cuáles son los diferentes métodos para el aprendizaje secuencial supervisado?

Los diferentes métodos para resolver problemas de aprendizaje secuencial supervisado son

  • Métodos de ventana deslizante
  • Ventanas corredizas recurrentes
  • Modelos ocultos de Markow
  • Modelos Markow de máxima entropía
  • Campos aleatorios condicionales
  • Graficar redes de transformadores

44) ¿Cuáles son las áreas en robótica y procesamiento de información donde surge el problema de predicción secuencial?

Las áreas en robótica y procesamiento de información donde surge el problema de predicción secuencial son

  • Aprendizaje de imitación
  • Predicción estructurada
  • Aprendizaje por refuerzo basado en modelos

45) ¿Qué es el aprendizaje estadístico por lotes?

Las técnicas de aprendizaje estadístico permiten aprender una función o un predictor a partir de un conjunto de datos observados que pueden hacer predicciones sobre datos futuros o no vistos. Estas técnicas brindan garantías sobre el desempeño del predictor aprendido en los datos futuros no vistos basados ​​en un supuesto estadístico sobre el proceso de generación de datos.

46) ¿Qué es PAC Learning?

El aprendizaje PAC (probablemente aproximadamente correcto) es un marco de aprendizaje que se ha introducido para analizar los algoritmos de aprendizaje y su eficiencia estadística.

47) ¿Cuáles son las diferentes categorías en las que puede categorizar el proceso de aprendizaje de secuencias?

  • Predicción de secuencia
  • Generación de secuencia
  • Reconocimiento de secuencia
  • Decisión secuencial

48) ¿Qué es el aprendizaje de secuencias?

El aprendizaje secuencial es un método de enseñanza y aprendizaje de una manera lógica.

49) ¿Cuáles son dos técnicas de aprendizaje automático?

Las dos técnicas de Machine Learning son

  • Programación genética
  • Aprendizaje inductivo
50) ¿Dar una aplicación popular de aprendizaje automático que ve en el día a día?

El motor de recomendación implementado por los principales sitios web de comercio electrónico utiliza Machine Learning.