Fases del compilador con ejemplo

¿Cuáles son las fases del diseño del compilador?

El compilador opera en varias fases, cada fase transforma el programa fuente de una representación a otra. Cada fase toma entradas de su etapa anterior y alimenta su salida a la siguiente fase del compilador.

Hay 6 fases en un compilador. Cada una de esta fase ayuda a convertir el lenguaje de alto nivel en el código de máquina. Las fases de un compilador son:

Análisis léxico
Análisis de sintaxis
Análisis semántico
Generador de código intermedio
Optimizador de código
Generador de códigos

Todas estas fases convierten el código fuente dividiéndolo en tokens, creando árboles de análisis y optimizando el código fuente en diferentes fases.

En este tutorial, aprenderá:

¿Cuáles son las fases del diseño del compilador?
Fase 1: Análisis léxico
Fase 2: Análisis de sintaxis
Fase 3: Análisis semántico
Fase 4: Generación de código intermedio
Fase 5: Optimización de código
Fase 6: Generación de código
Gestión de tablas de símbolos
Rutina de manejo de errores:

Fase 1: Análisis léxico

El análisis léxico es la primera fase en la que el compilador escanea el código fuente. Este proceso puede ser de izquierda a derecha, carácter por carácter, y agrupar estos personajes en fichas.

Aquí, el flujo de caracteres del programa fuente se agrupa en secuencias significativas identificando los tokens. Hace la entrada de los tickets correspondientes en la tabla de símbolos y pasa ese token a la siguiente fase.

Las principales funciones de esta fase son:

Identificar las unidades léxicas en un código fuente.
Clasifique las unidades léxicas en clases como constantes, palabras reservadas e introdúzcalas en diferentes tablas. Ignorará los comentarios en el programa fuente.
Identificar el token que no forma parte del idioma.

Ejemplo :

x = y + 10

Tokens

X	identificador
=	Operador de asignación
Y	identificador
+	Operador de suma
10	Número

Fase 2: Análisis de sintaxis

El análisis de sintaxis se trata de descubrir la estructura en el código. Determina si un texto sigue o no el formato esperado. El objetivo principal de esta fase es asegurarse de que el código fuente escrito por el programador sea correcto o no.

El análisis de sintaxis se basa en las reglas basadas en el lenguaje de programación específico mediante la construcción del árbol de análisis con la ayuda de tokens. También determina la estructura del idioma de origen y la gramática o sintaxis del idioma.

A continuación, se muestra una lista de las tareas realizadas en esta fase:

Obtener tokens del analizador léxico
Comprueba si la expresión es sintácticamente correcta o no
Informar todos los errores de sintaxis
Construya una estructura jerárquica que se conoce como árbol de análisis

Ejemplo

Cualquier identificador / número es una expresión

Si x es un identificador e y + 10 es una expresión, entonces x = y + 10 es una declaración.

Considere el árbol de análisis para el siguiente ejemplo

(a+b)*c

En Parse Tree

Nodo interior: registro con un operador archivado y dos archivos para niños
Hoja: registros con 2 / más campos; uno para el token y otra información sobre el token
Asegúrese de que los componentes del programa encajen de manera significativa
Recopila información de tipos y comprueba la compatibilidad de tipos
Los operandos de verificación están permitidos por el idioma de origen

Fase 3: Análisis semántico

El análisis semántico verifica la consistencia semántica del código. Utiliza el árbol de sintaxis de la fase anterior junto con la tabla de símbolos para verificar que el código fuente dado sea semánticamente coherente. También comprueba si el código transmite un significado apropiado.

Semantic Analyzer comprobará si hay discrepancias de tipos, operandos incompatibles, una función llamada con argumentos incorrectos, una variable no declarada, etc.

Las funciones de la fase de análisis semántico son:

Le ayuda a almacenar la información de tipo recopilada y guardarla en una tabla de símbolos o árbol de sintaxis
Le permite realizar la verificación de tipos
En el caso de falta de coincidencia de tipos, donde no hay reglas de corrección de tipos exactas que satisfagan la operación deseada, se muestra un error semántico.
Recopila información de tipos y comprueba la compatibilidad de tipos
Comprueba si el idioma de origen permite los operandos o no

Ejemplo

float x = 20.2;float y = x*30;

En el código anterior, el analizador semántico encasillará el entero 30 para que flote 30.0 antes de la multiplicación.

Fase 4: Generación de código intermedio

Una vez que finaliza la fase de análisis semántico, el compilador genera código intermedio para la máquina de destino. Representa un programa para alguna máquina abstracta.

El código intermedio se encuentra entre el lenguaje de alto nivel y el nivel de máquina. Este código intermedio debe generarse de tal manera que sea fácil de traducir al código de la máquina de destino.

Funciones de generación de código intermedio:

Debe generarse a partir de la representación semántica del programa fuente.
Contiene los valores calculados durante el proceso de traducción.
Le ayuda a traducir el código intermedio al idioma de destino
Le permite mantener el orden de precedencia del idioma de origen
Contiene el número correcto de operandos de la instrucción.

Ejemplo

Por ejemplo,

total = count + rate * 5

El código intermedio con la ayuda del método de código de dirección es:

t1 := int_to_float(5)t2 := rate * t1t3 := count + t2total := t3

Fase 5: Optimización de código

La siguiente fase de es la optimización del código o el código intermedio. Esta fase elimina la línea de código innecesaria y organiza la secuencia de declaraciones para acelerar la ejecución del programa sin desperdiciar recursos. El objetivo principal de esta fase es mejorar el código intermedio para generar un código que se ejecute más rápido y ocupe menos espacio.

Las principales funciones de esta fase son:

Le ayuda a establecer un equilibrio entre la velocidad de ejecución y la de compilación.
Mejora el tiempo de ejecución del programa de destino.
Genera código optimizado aún en representación intermedia
Eliminar el código inalcanzable y deshacerse de las variables no utilizadas
Eliminar declaraciones que no se modifican del ciclo

Ejemplo:

Considere el siguiente código

a = intofloat(10)b = c * ad = e + bf = d

Puede llegar a ser

b =c * 10.0f = e+b

Fase 6: Generación de código

La generación de código es la última y última fase de un compilador. Obtiene entradas de las fases de optimización del código y, como resultado, produce el código de la página o el código objeto. El objetivo de esta fase es asignar almacenamiento y generar código de máquina reubicable.

También asigna ubicaciones de memoria para la variable. Las instrucciones del código intermedio se convierten en instrucciones de máquina. Esta fase convierte el código optimizado o intermedio en el idioma de destino.

El idioma de destino es el código máquina. Por lo tanto, todas las ubicaciones y registros de la memoria también se seleccionan y asignan durante esta fase. El código generado por esta fase se ejecuta para tomar entradas y generar salidas esperadas.

Ejemplo:

a = b + 60.0

Posiblemente se traduciría a registros.

MOVF a, R1MULF #60.0, R2ADDF R1, R2

Gestión de tablas de símbolos

Una tabla de símbolos contiene un registro para cada identificador con campos para los atributos del identificador. Este componente facilita al compilador buscar el registro del identificador y recuperarlo rápidamente. La tabla de símbolos también le ayuda a gestionar el alcance. La tabla de símbolos y el controlador de errores interactúan con todas las fases y la tabla de símbolos se actualiza en consecuencia.

Rutina de manejo de errores:

En el proceso de diseño del compilador, pueden producirse errores en todas las fases que se indican a continuación:

Analizador léxico: tokens mal escritos
Analizador de sintaxis: faltan paréntesis
Generador de código intermedio: operandos no coincidentes para un operador
Optimizador de código: cuando no se puede acceder a la declaración
Generador de código: declaraciones inalcanzables
Tablas de símbolos: error de varios identificadores declarados

Los errores más comunes son la secuencia de caracteres no válida en el escaneo, las secuencias de token no válidas en el tipo, el error de alcance y el análisis sintáctico en el análisis semántico.

El error se puede encontrar en cualquiera de las fases anteriores. Después de encontrar errores, la fase debe ocuparse de los errores para continuar con el proceso de compilación. Estos errores deben informarse al controlador de errores que maneja el error para realizar el proceso de compilación. Generalmente, los errores se informan en forma de mensaje.

Resumen

El compilador opera en varias fases, cada fase transforma el programa fuente de una representación a otra
Seis fases del diseño del compilador son 1) Análisis léxico 2) Análisis de sintaxis 3) Análisis semántico 4) Generador de código intermedio 5) Optimizador de código 6) Generador de código
El análisis léxico es la primera fase en la que el compilador escanea el código fuente
El análisis de sintaxis se trata de descubrir la estructura en el texto
El análisis semántico verifica la consistencia semántica del código.
Una vez que finaliza la fase de análisis semántico, el compilador genera código intermedio para la máquina de destino
La fase de optimización de código elimina la línea de código innecesaria y organiza la secuencia de declaraciones
La fase de generación de código obtiene entradas de la fase de optimización del código y produce el código de página o el código objeto como resultado
Una tabla de símbolos contiene un registro para cada identificador con campos para los atributos del identificador
La rutina de manejo de errores maneja errores e informes durante muchas fases

Tabla de contenido:

¿Cuáles son las fases del diseño del compilador?

Fase 1: Análisis léxico

Fase 2: Análisis de sintaxis

Ejemplo

Fase 3: Análisis semántico

Ejemplo

Fase 4: Generación de código intermedio

Ejemplo

Fase 5: Optimización de código

Fase 6: Generación de código

Ejemplo:

Gestión de tablas de símbolos

Rutina de manejo de errores:

Resumen

Deshacerse del flash blanco cuando se cargue el iframe - Trucos CSS

Formulario para obtener direcciones (Google Maps) - Trucos CSS

Enlaces para llamadas y mensajes de texto de iPhone - Trucos CSS

Estructura de la página HTML5 - Trucos CSS

Mantenga el flash detrás de otros elementos - Trucos CSS

15 mejores herramientas de web scraping para extracción de datos en 2021

MEJOR examen de certificación de Python en 2021

PDF del tutorial de Python: PDF básico para principiantes (Descargar ahora)

Los 11 mejores libros de programación de Python para principiantes (actualización de 2021)

Principales preguntas y respuestas de la entrevista de Python (Descargar PDF)

Apuntar solo a enlaces externos - Trucos CSS

Alternar texto - Trucos CSS

Acordeón jQuery simple - Trucos CSS

Compruebe si el elemento está dentro de otro elemento específico - Trucos CSS

Evento de triple clic - Trucos CSS