HBase Crear tabla con ejemplo

Tabla de contenido:

Anonim

En HBase, podemos crear operaciones de tabla de dos formas

  • Comando de Shell
  • API de JAVA

Aprenderemos a usar ambos para crear tablas.

  • HBase Crear tabla con API de Java
  • HBase Crear tabla con Shell

HBase crea una tabla con la API de Java

En esta sección, realizaremos algunas de las operaciones utilizando la codificación de Java a través de la API de Java.

A través de la API de Java, podemos crear tablas en HBase y también cargar datos en tablas utilizando la codificación de Java.

  • Establecer una conexión con HBase a través de la API de Java
  • Uso de Eclipse para codificación, depuración y pruebas de Java

Estableciendo conexión a través de la API de Java:

Los siguientes pasos nos guían para desarrollar código Java para conectar HBase a través de la API de Java.

Paso 1) En este paso, vamos a crear un proyecto Java en eclipse para la conexión HBase.

Creación de un nuevo nombre de proyecto "HbaseConnection" en eclipse.

Para la configuración de proyectos relacionados con Java o la creación de programas

Si observamos la captura de pantalla de arriba.

  1. Dé el nombre del proyecto en este cuadro. En nuestro caso, tenemos el nombre del proyecto "HbaseConnection"
  2. Marque esta casilla para guardar la ubicación predeterminada. En este / home / hduser / work / HbaseConnection está la ruta
  3. Marque la casilla para el entorno Java aquí. En este JavaSE-1.7 está la edición de Java
  4. Elija su opción donde desea guardar el archivo. En nuestro caso, hemos seleccionado la segunda opción "Crear una carpeta separada para fuentes y archivos de clase".
  5. Haga clic en el botón finalizar.
  • Al hacer clic en el botón Finalizar, se creará el proyecto "HbaseConnection" en eclipse.
  • Llegará directamente a la página de inicio de eclipse después de hacer clic en el botón Finalizar.

Paso 2) En la página de inicio de eclipse, siga los siguientes pasos

Right click on project -> Select Build Path -> Configure build path

De la captura de pantalla anterior

  1. Haga clic derecho en un proyecto
  2. Seleccionar ruta de construcción
  3. Seleccione configurar ruta de compilación

Después de hacer clic en Configurar ruta de compilación, se abrirá otra ventana como se muestra en la siguiente captura de pantalla

En este paso, agregaremos jarras HBase relevantes en el proyecto java como se muestra en la captura de pantalla.

  • Jarras importantes que se agregarán hbase-0.94.8.jar, hadoop-core-1.1.2.jar
  • Haga clic en el botón finalizar

  1. Ven a las bibliotecas
  2. Opción de prensa - Agregar frascos externos
  3. Seleccione los frascos importantes necesarios
  4. Presione el botón finalizar para agregar estos archivos a 'src' del proyecto java en bibliotecas

Después de agregar estos frascos, se mostrará en la ubicación del proyecto "src". Todos los archivos Jar incluidos en el proyecto ya están listos para su uso con el ecosistema Hadoop.

Paso 3) En este paso, utilizando HBaseConnection.java, la conexión HBase se establecería a través de la codificación Java.

  • En el menú superior de Eclipse, ejecute un programa java como se muestra a continuación

    Ejecutar -> Ejecutar como -> Aplicación Java

  1. Seleccione Ejecutar
  2. Seleccione Ejecutar como aplicación Java
  • Este código establecerá una conexión con HBase a través de la API de Java.
  • Después de ejecutar este código, la tabla 'guru99' se creará en HBase con dos familias de columnas denominadas "educación" y "proyectos". En la actualidad, el esquema vacío solo se crea en HBase.

De la captura de pantalla anterior, estamos realizando las siguientes funciones.

  1. Usando HTableDescriptor podemos crear la tabla "guru99" en HBase
  2. Usando el método addFamily, vamos a agregar "educación" y "proyectos" como nombres de columna a la tabla "guru99".

La siguiente codificación va a

  • Establecer una conexión con HBase y
  • Crear tabla "guru99" con dos columnas

Código colocado en el documento HBaseConnection_Java

// Place this code inside Hbase connectionimport java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apache.hadoop.hbase.HTableDescriptor;Import org.apache.hadoop.hbase.client.HBaseAdmin;public class HBaseConnection{public static void main(String[] args) throws IOException{HBaseConfigurationhc = new HBaseConfiguration(new Configuration());HTableDescriptorht = new HTableDescriptor("guru99");ht.addFamily( new HColumnDescriptor("education"));ht.addFamily( new HColumnDescriptor("projects"));System.out.println( "connecting" );HBaseAdminhba = new HBaseAdmin( hc );System.out.println( "Creating Table" );hba.createTable( ht );System.out.println("Done… ");}}

Este es un código obligatorio que debe colocar en HBaseConnection.java y debe ejecutar un programa java

Después de ejecutar este programa, establecerá una conexión con HBase y, a su vez, creará una tabla con los nombres de las columnas.

  • El nombre de la tabla es "guru99"
  • Los nombres de las columnas son "educación" y "proyectos"

Paso 4) Podemos verificar si la tabla "guru99" se crea con dos columnas en HBase o no usando el modo de shell de HBase con el comando "list".

El comando "list" proporciona información sobre todas las tablas que se crean en HBase.

En esta pantalla, vamos a hacer

  • Comprobación de código en el shell HBase ejecutando el comando "list".
  • Si ejecutamos el comando "list", mostrará la tabla creada en HBase como se muestra a continuación. En nuestro caso, podemos ver que se crea la tabla "guru99"

HBase Crear tabla con Shell

La sintaxis para crear una tabla es

Syntax: create 
, 

Ejemplo:-

hbase(main):001:0> create 'education' ,'guru99'0 rows(s) in 0.312 seconds=>Hbase::Table - education

El ejemplo anterior explica cómo crear una tabla en HBase con el nombre especificado según el diccionario o las especificaciones según la familia de columnas. Además de esto, también podemos pasarle algunos atributos de alcance de tabla.

create 'guru99', {NAME=>'Edu', VERSIONS=>213423443}

Resumen:

HBase es una base de datos NoSQL orientada a columnas para almacenar una gran cantidad de datos sobre el ecosistema Hadoop. El manejo de tablas en HBase es algo muy importante porque todas las funcionalidades importantes, como operaciones de datos, mejoras de datos y modelado de datos, se pueden realizar solo a través de tablas en HBase. Las tablas realizan las siguientes funciones 1) Creación de tablas con nombres de columna y filas 2) Inserción de valores en tablas 3) Recuperación de valores de tablas