Primeros pasos con el lenguaje R

Instalación de R

Es posible que desee instalar RStudio después de haber instalado R. RStudio es un entorno de desarrollo para R que simplifica muchas tareas de programación.

Solo ventanas:

Visual Studio (a partir de la versión 2015 Update 3) ahora presenta un entorno de desarrollo para R llamado R Tools, que incluye un intérprete en vivo, IntelliSense y un módulo de depuración. Si elige este método, no tendrá que instalar R como se especifica en la siguiente sección.

Para ventanas

  1. Vaya al sitio web CRAN, haga clic en descargar R para Windows y descargue la última versión de R.
  2. Haga clic con el botón derecho en el archivo del instalador y EJECUTAR como administrador.
  3. Seleccione el idioma operativo para la instalación.
  4. Siga las instrucciones de instalación.

Para OSX/macOS

Alternativa 1

(0. Asegúrese de que XQuartz esté instalado)

  1. Vaya al sitio web de CRAN y descargue la última versión de R.
  2. Abra la imagen del disco y ejecute el instalador.
  3. Siga las instrucciones de instalación.

Esto instalará tanto R como R-MacGUI. Colocará la GUI en la carpeta / Aplicaciones / como R.app, donde se puede hacer doble clic o arrastrarla al Doc. Cuando se lanza una nueva versión, el proceso de (re)instalación sobrescribirá R.app, pero se mantendrán las versiones principales anteriores de R. El código R real estará en el directorio /Library/Frameworks/R.Framework/Versions/. También es posible usar R dentro de RStudio y estaría usando el mismo código R con una GUI diferente.

Alternativa 2

  1. Instale homebrew (el administrador de paquetes faltante para macOS) siguiendo las instrucciones en https://brew.sh/
  2. instalar cerveza R

Aquellos que elijan el segundo método deben saber que el mantenedor de la bifurcación de Mac desaconseja este uso y no responderá a las preguntas sobre dificultades en la lista de correo de R-SIG-Mac.

Para Debian, Ubuntu y derivados

Puede obtener la versión de R correspondiente a su distribución a través de apt-get. Sin embargo, esta versión estará con frecuencia muy por detrás de la versión más reciente disponible en CRAN. Puede agregar CRAN a su lista de “fuentes” reconocidas.

sudo apt-get install r-base

Puede obtener una versión más reciente directamente de CRAN agregando CRAN a su lista de fuentes. Siga las [instrucciones] (http://cran.us.r-project.org/bin/linux/ubuntu/README.html) de CRAN para obtener más detalles. Tenga en cuenta en particular la necesidad de ejecutar también esto para que pueda usar install.packages(). Los paquetes de Linux generalmente se distribuyen como archivos fuente y necesitan compilación:

sudo apt-get install r-base-dev

Para Red Hat y Fedora

sudo dnf install R

Para ArchLinux

R está disponible directamente en el repositorio del paquete “Extra”.

sudo pacman -S r

Puede encontrar más información sobre el uso de R en Archlinux en la [página de ArchWiki R] (https://wiki.archlinux.org/index.php/R).

¡Hola Mundo!

"Hello World!"

Además, consulte la discusión detallada de cómo, cuándo, si y por qué imprimir una cadena.

1: https://www.wikiod.com/es/r/leer-y-escribir-cadenas#Impresión y visualización de cadenas

Obteniendo ayuda

Puede usar la función help() o ? para acceder a la documentación y buscar ayuda en R. Para búsquedas aún más generales, puede usar help.search() o ??.

#For help on the help function of R
help()

#For help on the paste function
help(paste)    #OR
help("paste")  #OR
?paste         #OR
?"paste"

Visite https://www.r-project.org/help.html para obtener información adicional

Modo interactivo y scripts R

El modo interactivo

La forma más básica de usar R es el modo interactivo. Escribes comandos e inmediatamente obtienes el resultado de R.

Usando R como calculadora

Inicie R escribiendo R en el símbolo del sistema de su sistema operativo o ejecutando RGui en Windows. A continuación puede ver una captura de pantalla de una sesión interactiva de R en Linux:

Captura de pantalla de una terminal Linux ejecutando R

Este es RGui en Windows, el entorno de trabajo más básico para R en Windows: Captura de pantalla de un terminal RGui en Windows

Después del signo >, se pueden escribir expresiones. Una vez que se escribe una expresión, R muestra el resultado. En la captura de pantalla anterior, R se usa como calculadora: Escriba

1+1

para ver inmediatamente el resultado, 2. El [1] inicial indica que R devuelve un vector. En este caso, el vector contiene solo un número (2).

la primera trama

R se puede utilizar para generar gráficos. El siguiente ejemplo usa el conjunto de datos PlantGrowth, que viene como un conjunto de datos de ejemplo junto con R

Escriba int todas las líneas siguientes en el indicador de R que no comiencen con ##. Las líneas que comienzan con ## están destinadas a documentar el resultado que devolverá R.

data(PlantGrowth)
str(PlantGrowth)
## 'data.frame':    30 obs. of  2 variables:
## $ weight: num  4.17 5.58 5.18 6.11 4.5 4.61 5.17 4.53 5.33 5.14 ...
## $ group : Factor w/ 3 levels "ctrl","trt1",..: 1 1 1 1 1 1 1 1 1 1 ...
anova(lm(weight ~ group, data = PlantGrowth))
## Analysis of Variance Table
## 
## Response: weight
##           Df  Sum Sq Mean Sq F value  Pr(>F)  
## group      2  3.7663  1.8832  4.8461 0.01591 *
## Residuals 27 10.4921  0.3886                  
## ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
boxplot(weight ~ group, data = PlantGrowth, ylab = "Dry weight")

Se crea la siguiente trama:

Diagrama de caja, creado a partir del conjunto de datos de ejemplo PlantGrowth

data(PlantGrowth) carga el conjunto de datos de ejemplo PlantGrowth, que son registros de masas secas de plantas que se sometieron a dos condiciones de tratamiento diferentes o a ningún tratamiento (grupo de control). El conjunto de datos está disponible bajo el nombre PlantGrowth. Tal nombre también se llama Variable.

Para cargar sus propios datos, las siguientes dos páginas de documentación pueden ser útiles:

str(PlantGrowth) muestra información sobre el conjunto de datos que se cargó. El resultado indica que PlantGrowth es un data.frame, que es el nombre de R para una tabla. El data.frame contiene dos columnas y 30 filas. En este caso, cada fila corresponde a una planta. Los detalles de las dos columnas se muestran en las líneas que comienzan con $: La primera columna se llama peso y contiene números (num, el peso seco de la planta respectiva). La segunda columna, grupo, contiene el tratamiento al que fue sometida la planta. Estos son datos categóricos, que se denominan factor en R. Lea más información sobre tramas de datos.

Para comparar las masas secas de los tres grupos diferentes, se realiza un ANOVA de una vía usando anova(lm(... )). peso ~ grupo significa “Comparar los valores de la columna peso, agrupando por los valores de la columna grupo”. Esto se llama Fórmula en R. data = ... especifica el nombre de la tabla donde se pueden encontrar los datos.

El resultado muestra, entre otros, que existe una diferencia significativa (Columna Pr(>F)), p = 0.01591) entre algunos de los tres grupos. Se deben realizar pruebas post-hoc, como la prueba de Tukey, para determinar qué medias de los grupos difieren significativamente.

boxplot(...) crea un diagrama de caja de los datos. de donde provienen los valores a graficar. peso ~ grupo significa: “Represente los valores del peso de la columna frente a los valores del grupo de la columna. ylab = ... especifica la etiqueta del eje y. Más información: Dibujo base

Escriba q() o Ctrl-D para salir de la sesión de R.

guiones R

Para documentar su investigación, es conveniente guardar los comandos que utiliza para el cálculo en un archivo. Para ese efecto, puede crear secuencias de comandos R. Un script R es un archivo de texto simple que contiene comandos R.

Cree un archivo de texto con el nombre plants.R y rellénelo con el siguiente texto, donde algunos comandos son familiares del bloque de código anterior:

data(PlantGrowth)

anova(lm(weight ~ group, data = PlantGrowth))

png("plant_boxplot.png", width = 400, height = 300)
boxplot(weight ~ group, data = PlantGrowth, ylab = "Dry weight")
dev.off()    

Ejecute el script escribiendo en su terminal (¡El terminal de su sistema operativo, no una sesión R interactiva como en la sección anterior!)

R --no-save <plant.R >plant_result.txt

El archivo plant_result.txt contiene los resultados de su cálculo, como si los hubiera escrito en el indicador interactivo de R. De este modo, sus cálculos están documentados.

Los nuevos comandos png y dev.off se utilizan para guardar el diagrama de caja en el disco. Los dos comandos deben incluir el comando de trazado, como se muestra en el ejemplo anterior. png("FILENAME", ancho = ..., alto = ...) abre un nuevo archivo PNG con el nombre de archivo especificado, ancho y alto en píxeles. dev.off() terminará de trazar y guardará el trazado en el disco. No se guarda ningún resultado hasta que se llama dev.off().