Exportación de datos de R: Cómo exportar datos de R a CSV, Excel

Tabla de contenido:

Anonim

Cómo exportar datos de R

En este tutorial, aprenderemos cómo exportar datos desde el entorno R a diferentes formatos.

Para exportar datos al disco duro, necesita la ruta del archivo y una extensión. En primer lugar, la ruta es la ubicación donde se almacenarán los datos. En este tutorial, verá cómo almacenar datos en:

  • El disco duro
  • Google Drive
  • Dropbox

En segundo lugar, R permite a los usuarios exportar los datos a diferentes tipos de archivos. Cubrimos la extensión del archivo esencial:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • ESTADO

En general, no es difícil exportar datos de R.

En este tutorial, aprenderá:

  • Exportar a disco duro
  • Cómo exportar un DataFrame a un archivo CSV en R
  • Cómo exportar datos de R a un archivo de Excel
  • Exportación de datos de R a software diferente
  • Exportación de datos de R a un archivo SAS
  • Cómo exportar datos de R a un archivo STATA
  • Interactuar con los servicios en la nube
  • Google Drive
  • Exportar a Dropbox

Exportar a disco duro

Para empezar, puede guardar los datos directamente en el directorio de trabajo. El siguiente código imprime la ruta de su directorio de trabajo:

directory <-getwd()directory

Producción:

## [1] "/Users/15_Export_to_do" 

De forma predeterminada, el archivo se guardará en la siguiente ruta.

Para Mac OS:

/Users/USERNAME/Downloads/ 

Para ventanas:

C:\Users\USERNAME\Documents\

Por supuesto, puede establecer un camino diferente. Por ejemplo, puede cambiar la ruta a la carpeta de descarga.

Crear marco de datos

En primer lugar, importemos el conjunto de datos de mtcars y obtengamos la media de mpg y disp agrupados por equipo.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Salida ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

La tabla contiene tres filas y tres columnas. Puede crear un archivo CSV con la función write.csv en R.

Cómo exportar un DataFrame a un archivo CSV en R

La sintaxis básica de write.csv en R para exportar el DataFrame a CSV en R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Ejemplo:

write.csv(df, "table_car.csv")

Explicación del código

  • write.csv (df, "table_car.csv"): crea un archivo CSV en el disco duro:
    • df: nombre del marco de datos en el entorno
    • "table_car.csv": nombre el archivo table_car y guárdelo como csv

Nota : Puede usar la función write.csv en R como write.csv2 () para separar las filas con un punto y coma para exportar R a datos csv.

write.csv2(df, "table_car.csv")

Nota : Solo con fines pedagógicos, creamos una función llamada open_folder () para abrir la carpeta del directorio por usted. Solo necesita ejecutar el código a continuación y ver dónde se almacena el archivo csv. Debería ver un nombre de archivo table_car.csv para la exportación de datos R a csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Cómo exportar datos de R a un archivo de Excel

Ahora, aprenderemos cómo exportar datos de R a Excel:

Exportar datos de R a Excel es trivial para los usuarios de Windows y más complicado para los usuarios de Mac OS. Ambos usuarios usarán la biblioteca xlsx para crear un archivo de Excel. La ligera diferencia proviene de la instalación de la biblioteca. De hecho, la biblioteca xlsx usa Java para crear el archivo. Java debe instalarse si no está presente en su máquina para exportar Data R a Excel.

Usuarios de Windows

Si es un usuario de Windows, puede instalar la biblioteca directamente con conda para exportar el marco de datos a Excel R:

conda install -c r r-xlsx

Una vez instalada la biblioteca, puede utilizar la función write.xlsx (). Se crea un nuevo libro de trabajo de Excel en el directorio de trabajo para exportar R a datos de Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Si es usuario de Mac OS, debe seguir estos pasos:

  • Paso 1: instale la última versión de Java
  • Paso 2: instalar la biblioteca rJava
  • Paso 3: Instale la biblioteca xlsx

Paso 1) Puede descargar Java del sitio oficial de Oracle e instalarlo.

Puede volver a Rstudio y comprobar qué versión de Java está instalada.

system("java -version")

En el momento del tutorial, la última versión de Java es 9.0.4.

Paso 2) Necesita instalar rjava en R. Le recomendamos que instale R y Rstudio con Anaconda. Anaconda gestiona las dependencias entre bibliotecas. En este sentido, Anaconda manejará las complejidades de la instalación de rJava.

En primer lugar, debe actualizar conda y luego instalar la biblioteca. Puede copiar y pegar las siguientes dos líneas de código en la terminal.

conda - conda updateconda install -c r r-rjava

A continuación, abra rjava en Rstudio

library(rJava)

Paso 3) Finalmente, es hora de instalar xlsx. Una vez más, puedes usar conda para hacerlo:

conda install -c r r-xlsx

Al igual que los usuarios de Windows, puede guardar datos con la función write.xlsx ()

library(xlsx)

Producción:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Exportación de datos de R a software diferente

Exportar datos a diferentes programas es tan simple como importarlos. La biblioteca "refugio" proporciona una forma conveniente de exportar datos a

  • spss
  • sas
  • Stata

En primer lugar, importe la biblioteca. Si no tiene "haven", puede ir aquí para instalarlo.

library(haven) 

Archivo SPSS

A continuación se muestra el código para exportar los datos al software SPSS:

write_sav(df, "table_car.sav") 

Exportación de datos de R a un archivo SAS

Tan simple como spss, puede exportar a sas

write_sas(df, "table_car.sas7bdat")

Cómo exportar datos de R a un archivo STATA

Finalmente, la biblioteca haven permite escribir archivos .dta.

write_dta(df, "table_car.dta")

R

Si desea guardar un marco de datos o cualquier otro objeto R, puede usar la función save ().

save(df, file ='table_car.RData')

Puede verificar los archivos creados anteriormente en el directorio de trabajo actual

Interactuar con los servicios en la nube

Por último, pero no menos importante, R está equipado con fantásticas bibliotecas para interactuar con los servicios de computación en la nube. La última parte de este tutorial trata sobre la exportación / importación de archivos desde:

  • Google Drive
  • Dropbox

Nota : Esta parte del tutorial asume que tienes una cuenta con Google y Dropbox. De lo contrario, puede crear rápidamente uno para - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Es necesario instalar la biblioteca googledrive para acceder a la función que permite interactuar con Google Drive.

La biblioteca aún no está disponible en Anaconda. Puede instalarlo con el siguiente código en la consola.

install.packages("googledrive") 

y abres la biblioteca.

library(googledrive)

Para los usuarios que no son de Conda, instalar una biblioteca es fácil, puede usar la función install.packages ('NOMBRE DEL PAQUETE) con el nombre del paquete entre paréntesis. No olvide el ''. Tenga en cuenta que se supone que R debe instalar el paquete en libPaths () automáticamente. Vale la pena verlo en acción.

Subir a Google Drive

Para cargar un archivo en Google Drive, debe usar la función drive_upload ().

Cada vez que reinicie Rstudio, se le pedirá que permita el acceso a tidyverse a Google Drive.

La sintaxis básica de drive_upload () es

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Después de iniciar el código, debe confirmar varias preguntas.

drive_upload%<("table_car.csv", name ="table_car")

Producción:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Escribe 1 en la consola para confirmar el acceso

Luego, se le redirige a la API de Google para permitir el acceso. Haz clic en Permitir.

Una vez que se complete la autenticación, puede salir de su navegador.

En la consola de Rstudio, puede ver el resumen del paso realizado. Google cargó con éxito el archivo ubicado localmente en Drive. Google asignó una identificación a cada archivo en la unidad.

Puede ver este archivo en la hoja de cálculo de Google.

drive_browse("table_car")

Producción:

Serás redirigido a la hoja de cálculo de Google.

Importar desde Google Drive

Cargar un archivo desde Google Drive con el ID es conveniente. Si conoce el nombre del archivo, puede obtener su ID de la siguiente manera:

Nota : Dependiendo de su conexión a Internet y del tamaño de su unidad, se demorará.

x <-drive_get("table_car")as_id(x)

Guardaste el ID en la variable x. La función drive_download () permite descargar un archivo de Google Drive.

La sintaxis básica es:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Finalmente puedes descargar el archivo:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explicación del código

  • drive_download (): función para descargar un archivo de Google Drive
  • as_id (x): use el ID para explorar el archivo en Google Drive
  • sobrescribir = VERDADERO: Si el archivo existe, sobrescríbalo, de lo contrario se detiene la ejecución Para ver el nombre del archivo localmente, puede usar:

Producción:

El archivo se almacena en su directorio de trabajo. Recuerde, debe agregar la extensión del archivo para abrirlo en R. Puede crear el nombre completo con la función paste () (es decir, table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Producción:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Finalmente, puede eliminar el archivo de su unidad de Google.

## remove filedrive_find("table_car") %>%drive_rm()

Producción:

Es un proceso lento. Se necesita tiempo para borrar

Exportar a Dropbox

R interactúa con Dropbox a través de la biblioteca rdrop2. La biblioteca tampoco está disponible en Anaconda. Puedes instalarlo a través de la consola.

install.packages('rdrop2')
library(rdrop2)

Debe proporcionar acceso temporal a Dropbox con su credencial. Una vez realizada la identificación, R puede crear, eliminar la carga y la descarga en su Dropbox.

En primer lugar, debe otorgar acceso a su cuenta. Las credenciales se almacenan en caché durante toda la sesión.

drop_auth()

Serás redirigido a Dropbox para confirmar la autenticación.

Obtendrá una página de confirmación. Puedes cerrarlo y volver a R

Puede crear una carpeta con la función drop_create ().

  • drop_create ('my_first_drop'): crea una carpeta en la primera rama de Dropbox
  • drop_create ('First_branch / my_first_drop'): crea una carpeta dentro de la carpeta First_branch existente.
drop_create('my_first_drop')

Producción:

En DropBox

Para cargar el archivo .csv en su Dropbox, use la función drop_upload ().

Sintaxis básica:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Producción:

En DropBox

Puede leer el archivo csv de Dropbox con la función drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Producción:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Cuando haya terminado de usar el archivo y desee eliminarlo. Debe escribir la ruta del archivo en la función drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Producción:

También es posible eliminar una carpeta.

drop_delete('my_first_drop')

Producción:

Resumen

Podemos resumir todas las funciones en la siguiente tabla

Biblioteca

Objetivo

Función

base

Exportar csv

write.csv ()

xlsx

Exportar Excel

write.xlsx ()

refugio

Exportar spss

write_sav ()

refugio

Exportar sas

write_sas ()

refugio

Exportar stata

write_dta ()

base

Exportar R

salvar()

Google Drive

Subir Google Drive

drive_upload ()

Google Drive

Abrir en Google Drive

drive_browse ()

Google Drive

Recuperar ID de archivo

drive_get (as_id ())

Google Drive

Descargar desde Google Drive

download_google ()

Google Drive

Eliminar archivo de Google Drive

drive_rm ()

rdrop2

Autentificación

drop_auth ()

rdrop2

Crea una carpeta

drop_create ()

rdrop2

Subir a Dropbox

drop_upload ()

rdrop2

Leer csv de Dropbox

drop_read_csv

rdrop2

Eliminar archivo de Dropbox

drop_delete ()