Cómo exportar datos de R
En este tutorial, aprenderemos cómo exportar datos desde el entorno R a diferentes formatos.
Para exportar datos al disco duro, necesita la ruta del archivo y una extensión. En primer lugar, la ruta es la ubicación donde se almacenarán los datos. En este tutorial, verá cómo almacenar datos en:
- El disco duro
- Google Drive
- Dropbox
En segundo lugar, R permite a los usuarios exportar los datos a diferentes tipos de archivos. Cubrimos la extensión del archivo esencial:
- csv
- xlsx
- RDS
- SAS
- SPSS
- ESTADO
En general, no es difícil exportar datos de R.
En este tutorial, aprenderá:
- Exportar a disco duro
- Cómo exportar un DataFrame a un archivo CSV en R
- Cómo exportar datos de R a un archivo de Excel
- Exportación de datos de R a software diferente
- Exportación de datos de R a un archivo SAS
- Cómo exportar datos de R a un archivo STATA
- Interactuar con los servicios en la nube
- Google Drive
- Exportar a Dropbox
Exportar a disco duro
Para empezar, puede guardar los datos directamente en el directorio de trabajo. El siguiente código imprime la ruta de su directorio de trabajo:
directory <-getwd()directory
Producción:
## [1] "/Users/15_Export_to_do"
De forma predeterminada, el archivo se guardará en la siguiente ruta.
Para Mac OS:
/Users/USERNAME/Downloads/
Para ventanas:
C:\Users\USERNAME\Documents\
Por supuesto, puede establecer un camino diferente. Por ejemplo, puede cambiar la ruta a la carpeta de descarga.
Crear marco de datos
En primer lugar, importemos el conjunto de datos de mtcars y obtengamos la media de mpg y disp agrupados por equipo.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Salida ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
La tabla contiene tres filas y tres columnas. Puede crear un archivo CSV con la función write.csv en R.
Cómo exportar un DataFrame a un archivo CSV en R
La sintaxis básica de write.csv en R para exportar el DataFrame a CSV en R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Ejemplo:
write.csv(df, "table_car.csv")
Explicación del código
- write.csv (df, "table_car.csv"): crea un archivo CSV en el disco duro:
- df: nombre del marco de datos en el entorno
- "table_car.csv": nombre el archivo table_car y guárdelo como csv
Nota : Puede usar la función write.csv en R como write.csv2 () para separar las filas con un punto y coma para exportar R a datos csv.
write.csv2(df, "table_car.csv")
Nota : Solo con fines pedagógicos, creamos una función llamada open_folder () para abrir la carpeta del directorio por usted. Solo necesita ejecutar el código a continuación y ver dónde se almacena el archivo csv. Debería ver un nombre de archivo table_car.csv para la exportación de datos R a csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Cómo exportar datos de R a un archivo de Excel
Ahora, aprenderemos cómo exportar datos de R a Excel:
Exportar datos de R a Excel es trivial para los usuarios de Windows y más complicado para los usuarios de Mac OS. Ambos usuarios usarán la biblioteca xlsx para crear un archivo de Excel. La ligera diferencia proviene de la instalación de la biblioteca. De hecho, la biblioteca xlsx usa Java para crear el archivo. Java debe instalarse si no está presente en su máquina para exportar Data R a Excel.
Usuarios de Windows
Si es un usuario de Windows, puede instalar la biblioteca directamente con conda para exportar el marco de datos a Excel R:
conda install -c r r-xlsx
Una vez instalada la biblioteca, puede utilizar la función write.xlsx (). Se crea un nuevo libro de trabajo de Excel en el directorio de trabajo para exportar R a datos de Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Si es usuario de Mac OS, debe seguir estos pasos:
- Paso 1: instale la última versión de Java
- Paso 2: instalar la biblioteca rJava
- Paso 3: Instale la biblioteca xlsx
Paso 1) Puede descargar Java del sitio oficial de Oracle e instalarlo.
Puede volver a Rstudio y comprobar qué versión de Java está instalada.
system("java -version")
En el momento del tutorial, la última versión de Java es 9.0.4.
Paso 2) Necesita instalar rjava en R. Le recomendamos que instale R y Rstudio con Anaconda. Anaconda gestiona las dependencias entre bibliotecas. En este sentido, Anaconda manejará las complejidades de la instalación de rJava.
En primer lugar, debe actualizar conda y luego instalar la biblioteca. Puede copiar y pegar las siguientes dos líneas de código en la terminal.
conda - conda updateconda install -c r r-rjava
A continuación, abra rjava en Rstudio
library(rJava)
Paso 3) Finalmente, es hora de instalar xlsx. Una vez más, puedes usar conda para hacerlo:
conda install -c r r-xlsx
Al igual que los usuarios de Windows, puede guardar datos con la función write.xlsx ()
library(xlsx)
Producción:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Exportación de datos de R a software diferente
Exportar datos a diferentes programas es tan simple como importarlos. La biblioteca "refugio" proporciona una forma conveniente de exportar datos a
- spss
- sas
- Stata
En primer lugar, importe la biblioteca. Si no tiene "haven", puede ir aquí para instalarlo.
library(haven)
Archivo SPSS
A continuación se muestra el código para exportar los datos al software SPSS:
write_sav(df, "table_car.sav")
Exportación de datos de R a un archivo SAS
Tan simple como spss, puede exportar a sas
write_sas(df, "table_car.sas7bdat")
Cómo exportar datos de R a un archivo STATA
Finalmente, la biblioteca haven permite escribir archivos .dta.
write_dta(df, "table_car.dta")
R
Si desea guardar un marco de datos o cualquier otro objeto R, puede usar la función save ().
save(df, file ='table_car.RData')
Puede verificar los archivos creados anteriormente en el directorio de trabajo actual
Interactuar con los servicios en la nube
Por último, pero no menos importante, R está equipado con fantásticas bibliotecas para interactuar con los servicios de computación en la nube. La última parte de este tutorial trata sobre la exportación / importación de archivos desde:
- Google Drive
- Dropbox
Nota : Esta parte del tutorial asume que tienes una cuenta con Google y Dropbox. De lo contrario, puede crear rápidamente uno para - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h
Google Drive
Es necesario instalar la biblioteca googledrive para acceder a la función que permite interactuar con Google Drive.
La biblioteca aún no está disponible en Anaconda. Puede instalarlo con el siguiente código en la consola.
install.packages("googledrive")
y abres la biblioteca.
library(googledrive)
Para los usuarios que no son de Conda, instalar una biblioteca es fácil, puede usar la función install.packages ('NOMBRE DEL PAQUETE) con el nombre del paquete entre paréntesis. No olvide el ''. Tenga en cuenta que se supone que R debe instalar el paquete en libPaths () automáticamente. Vale la pena verlo en acción.
Subir a Google Drive
Para cargar un archivo en Google Drive, debe usar la función drive_upload ().
Cada vez que reinicie Rstudio, se le pedirá que permita el acceso a tidyverse a Google Drive.
La sintaxis básica de drive_upload () es
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Después de iniciar el código, debe confirmar varias preguntas.
drive_upload%<("table_car.csv", name ="table_car")
Producción:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Escribe 1 en la consola para confirmar el acceso
Luego, se le redirige a la API de Google para permitir el acceso. Haz clic en Permitir.
Una vez que se complete la autenticación, puede salir de su navegador.
En la consola de Rstudio, puede ver el resumen del paso realizado. Google cargó con éxito el archivo ubicado localmente en Drive. Google asignó una identificación a cada archivo en la unidad.
Puede ver este archivo en la hoja de cálculo de Google.
drive_browse("table_car")
Producción:
Serás redirigido a la hoja de cálculo de Google.
Importar desde Google Drive
Cargar un archivo desde Google Drive con el ID es conveniente. Si conoce el nombre del archivo, puede obtener su ID de la siguiente manera:
Nota : Dependiendo de su conexión a Internet y del tamaño de su unidad, se demorará.
x <-drive_get("table_car")as_id(x)
Guardaste el ID en la variable x. La función drive_download () permite descargar un archivo de Google Drive.
La sintaxis básica es:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Finalmente puedes descargar el archivo:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Explicación del código
- drive_download (): función para descargar un archivo de Google Drive
- as_id (x): use el ID para explorar el archivo en Google Drive
- sobrescribir = VERDADERO: Si el archivo existe, sobrescríbalo, de lo contrario se detiene la ejecución Para ver el nombre del archivo localmente, puede usar:
Producción:
El archivo se almacena en su directorio de trabajo. Recuerde, debe agregar la extensión del archivo para abrirlo en R. Puede crear el nombre completo con la función paste () (es decir, table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Producción:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Finalmente, puede eliminar el archivo de su unidad de Google.
## remove filedrive_find("table_car") %>%drive_rm()
Producción:
Es un proceso lento. Se necesita tiempo para borrar
Exportar a Dropbox
R interactúa con Dropbox a través de la biblioteca rdrop2. La biblioteca tampoco está disponible en Anaconda. Puedes instalarlo a través de la consola.
install.packages('rdrop2')
library(rdrop2)
Debe proporcionar acceso temporal a Dropbox con su credencial. Una vez realizada la identificación, R puede crear, eliminar la carga y la descarga en su Dropbox.
En primer lugar, debe otorgar acceso a su cuenta. Las credenciales se almacenan en caché durante toda la sesión.
drop_auth()
Serás redirigido a Dropbox para confirmar la autenticación.
Obtendrá una página de confirmación. Puedes cerrarlo y volver a R
Puede crear una carpeta con la función drop_create ().
- drop_create ('my_first_drop'): crea una carpeta en la primera rama de Dropbox
- drop_create ('First_branch / my_first_drop'): crea una carpeta dentro de la carpeta First_branch existente.
drop_create('my_first_drop')
Producción:
En DropBox
Para cargar el archivo .csv en su Dropbox, use la función drop_upload ().
Sintaxis básica:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Producción:
En DropBox
Puede leer el archivo csv de Dropbox con la función drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Producción:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Cuando haya terminado de usar el archivo y desee eliminarlo. Debe escribir la ruta del archivo en la función drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Producción:
También es posible eliminar una carpeta.
drop_delete('my_first_drop')
Producción:
Resumen
Podemos resumir todas las funciones en la siguiente tabla
Biblioteca |
Objetivo |
Función |
---|---|---|
base |
Exportar csv |
write.csv () |
xlsx |
Exportar Excel |
write.xlsx () |
refugio |
Exportar spss |
write_sav () |
refugio |
Exportar sas |
write_sas () |
refugio |
Exportar stata |
write_dta () |
base |
Exportar R |
salvar() |
Google Drive |
Subir Google Drive |
drive_upload () |
Google Drive |
Abrir en Google Drive |
drive_browse () |
Google Drive |
Recuperar ID de archivo |
drive_get (as_id ()) |
Google Drive |
Descargar desde Google Drive |
download_google () |
Google Drive |
Eliminar archivo de Google Drive |
drive_rm () |
rdrop2 |
Autentificación |
drop_auth () |
rdrop2 |
Crea una carpeta |
drop_create () |
rdrop2 |
Subir a Dropbox |
drop_upload () |
rdrop2 |
Leer csv de Dropbox |
drop_read_csv |
rdrop2 |
Eliminar archivo de Dropbox |
drop_delete () |