R tiene muchas funciones para análisis estadístico y gráfico; estos últimos pueden verse inmediatamente en su ventana y guardarse en varios formatos (jpg, png, bmp, ps, pdf, emf, pictex, xfig; los formatos disponibles dependen del sistema operativo). Los resultados del análisis estadístico se muestran en la pantalla y algunos resultados intermedios (como valores P, coeficientes de regresión, residuos, etc.). Mientras que los programas más clásicos muestran directamente los resultados de un análisis, R almacena estos resultados como un "objeto". ", para que puedas hacer un análisis sin tener que mostrar tu resultado inmediatamente.
C´omo funciona R
En Windows, algunos comandos se pueden ejecutar a través de menús interactivos (por ejemplo, más adelante describiré el operador "asignar" que le permite crear objetos en R, veremos cómo manejar estos objetos en la memoria y, finalmente, veremos cómo utilizar la ayuda en línea, que, a diferencia de la ayuda de otros programas estadísticos, es bastante útil e intuitiva. Los archivos de datos se pueden leer directamente desde un disco local o en un servidor remoto a través de la red.
Creaci´on, listado y remoci´on de objetos en memoria
Otra opción útil en esta función es nivel máximo que especifica el nivel de detalle para mostrar objetos compuestos. De forma predeterminada, ls.str() muestra todos los detalles de los objetos en la memoria, incluidas las columnas de marcos de datos, matrices y listas, que pueden generar mucha información. Para eliminar objetos en la memoria, usamos la función rm(): rm(x) elimina el objeto x, rm(x,y) elimina los objetos x e y, yrm(list=ls()) elimina todos los objetos en la memoria. ; Las mismas opciones mencionadas para la función ls() se pueden usar para eliminar selectivamente algunos objetos: rm(list=ls(pat="ˆm")).
La ayuda en l´ınea
Valor: si corresponde, el tipo de objeto devuelto por la función u operador. Ejemplos: algunos ejemplos que normalmente se pueden ejecutar sin abrir la ayuda usando la función exampleamples(). De forma predeterminada, la función de ayuda solo busca paquetes que están cargados en la memoria.
Manejando Datos con R 9
- Leyendo datos desde un archivo
- Guardando datos
- Generaci´on de datos
- Secuencias regulares
- Secuencias aleatorias
- Manipulaci´on de objetos
- Creaci´on de objetos
- Conversi´on de objetos
- Operadores
- C´omo acceder los valores de un objeto: el sistema de indexaci´on
- Accediendo a los valores de un objeto con nombres
- El editor de datos
- Funciones aritm´eticas simples
- C´alculos con Matrices
La función tiene la forma gl(k, n) donde k es el número de niveles (o clases) y n es el número de iteraciones en cada nivel. Todas estas funciones se pueden usar reemplazando la letra r con las letras d, p o q para obtener la densidad de probabilidad (dfunc(x, ..)), la densidad de probabilidad acumulada (pfunc(x, ..)) y el valor del cuartil (qfunc(p, ..), con 0
Para extraer un vector o factor de un marco de datos, puede utilizar el símbolo $ (por ejemplo, DF$x). La transposición de una matriz se realiza con la función t; Esta función también funciona con marcos de datos.
Haciendo gr´aficas en R 29
- Abriendo m´ultiples dispositivos gr´aficos
- Disposici´on de una gr´afica
- Funciones gr´aficas
- Comandos de graficaci´on de bajo nivel
- Par´ametros gr´aficos
- Un ejemplo pr´actico
- Los paquetes grid y lattice
R tiene un conjunto de funciones gráficas que afectan un gráfico existente: comandos gráficos de bajo nivel. Para ilustrar algunas de las funciones gráficas de R, veamos un ejemplo simple de un gráfico bivariado con 10 pares de coordenadas generados aleatoriamente. De forma predeterminada, R dibuja gráficos de forma "inteligente": espaciado entre etiquetas de ejes, ubicación de etiquetas en ejes, etc. se calculan automáticamente para que el resultado del gráfico sea lo más legible posible.
El gráfico se dibuja de manera similar a la Figura 4. El título se agrega con el título de la función de bajo nivel, lo que permite agregar algunos parámetros como argumentos sin cambiar el resto del gráfico. Los comandos se enumeran a continuación y el gráfico resultante se puede ver en la Figura 6.
Los elementos se agregan al área del gráfico mediante funciones de bajo nivel. La idea principal detrás de las celosías (y enrejados) son los gráficos condicionales múltiples: un gráfico de dos variables se divide en varios gráficos con respecto a los valores de una tercera variable. La fórmula ˜x | z significa que la gráfica de y con respecto a x se dibujará como gráficas diferentes con respecto a los valores de z.
Luego viene la llamada a la función densidadplot() que produce un gráfico para cada submuestra. panel toma una función como argumento. Vimos anteriormente el panel de opciones que define cómo se muestran los diferentes grupos en el gráfico: aquí usamos un panel de funciones predefinido.superponer para superponer los grupos en el mismo gráfico. La opción clave agrega una leyenda al gráfico; La sintaxis aquí es un poco complicada, pero esto.
An´alisis estad´ısticos con R 46
F´ormulas
El uso de fórmulas es un elemento clave en el análisis estadístico con R: la nomenclatura utilizada es la misma para (casi) todas las funciones. Una fórmula generalmente se escribe como y ˜modelo donde y es la variable dependiente (o respuesta) y ymodel es un conjunto de términos para los cuales es necesario estimar una cantidad de parámetros. Estos términos están representados por símbolos aritméticos, pero tienen un significado muy especial en R.
Vemos que los operadores aritméticos en las fórmulas tienen significados muy diferentes a los que tendrían en las expresiones regulares. Para incluir operaciones aritméticas en una fórmula, puedes usar la función I(): la fórmula y˜I(x1+x2) define el modelo y=β(x1+x2) +α.
Funciones gen´ericas
Podemos ver la diferencia de este método comparando su rendimiento en una regresión lineal vs. La siguiente tabla muestra algunas funciones genéricas que realizan escaneos adicionales en un objeto resultante de un escaneo, donde el argumento principal es este último, pero en algunos casos se necesitan argumentos adicionales (por ejemplo, vista previa). También hay algunas funciones útiles que extraen información de un modelo o un objeto de fórmula, como alias() que encuentra términos linealmente dependientes en un modelo lineal especificado por una fórmula.
Paquetes
Muchos de los paquetes en la sección de contribuciones complementan la lista de métodos estadísticos disponibles en R. Estos paquetes se distribuyen por separado y deben instalarse y cargarse en R para funcionar. Para ver una lista completa y una descripción de los paquetes contribuidos, visite el sitio web de CRAN20. Se recomiendan muchos de estos paquetes porque cubren métodos estadísticos comúnmente utilizados en el análisis de datos.
En Windows, los paquetes recomendados se distribuyen con la instalación base de R en el archivo SetupR.exe.). MASS contiene muchas funciones, herramientas y datos de las bibliotecas "Modern Applied Statistics with S-PLUS" de Venables & Ripley. El procedimiento para instalar un paquete depende del sistema operativo y de cómo se instaló R: desde el código fuente o desde archivos binarios precompilados.
Si es lo último, se recomienda utilizar los paquetes precompilados disponibles en el sitio de CRAN. Si R se compila localmente, se puede instalar un paquete directamente desde el código fuente que normalmente se distribuye como un archivo '.tar.gz'. Por ejemplo, si queremos instalar el paquete ge, primero es necesario descargar el archivo ge 4.13-6.tar.gz de Internet (el número 4.13-6 indica la versión del paquete; normalmente solo hay una versión). disponible en CRAN).
Programaci´on pr´actica con R 54
Escribiendo un programa en R
Normalmente, los programas R se escriben en un archivo que se guarda en formato ASCII con la extensión '.R'. Un programa se suele utilizar cuando se quiere realizar una o varias operaciones muchas veces. En nuestro primer ejemplo, queremos hacer el mismo gráfico para tres tipos diferentes de aves y los datos están en tres archivos diferentes.
Primero, hagamos que nuestro programa sea lo más intuitivo posible ejecutando secuencialmente los comandos necesarios, teniendo cuidado de preasignar el dispositivo gráfico. El carácter '#' se utiliza para agregar comentarios a un programa y R lo ignora en tiempo de ejecución. El problema del primer programa es que puede hacerse bastante largo si queremos añadir otros tipos.
La estrategia que usamos aquí es poner estos argumentos en una matriz de caracteres tipográficos y luego usar la indexación para acceder a los diferentes valores. Tenga en cuenta que el argumento file[i] no se cita en enread.table() porque ese argumento ya es un carácter de tipo. Es más fácil agregar otros tipos ya que sus nombres están en los vectores al comienzo del programa.
Como en el ejemplo anterior, esto sólo funciona si el archivo Mybirds.R está en el directorio de trabajo de R; en caso contrario es necesario proporcionar la dirección completa.
Creando sus propias funciones
En R no es necesario declarar las variables utilizadas dentro de la función (a diferencia de otros lenguajes como C o Fortran). Cuando se ejecuta una función, R usa una regla llamada alcance lexicográfico para decidir si un objeto es local o global para una función. Seis se utiliza como nombre de un objeto dentro de la función, el valor de x en el entorno global (externo a la función) no cambia.
Esta vez print() usa el objeto x definido dentro de su entorno, es decir, el entorno de foo2. Hay dos formas de especificar argumentos para una función: por sus posiciones o por sus nombres (también llamados argumentos marcados). Usar valores predeterminados en la definición de una función es bastante útil y da como resultado una mayor flexibilidad.
El objetivo es simular el modelo con respecto a la tasa de crecimiento r y el número inicial de individuos en la población N0 (la capacidad de carga K generalmente se establece en 1, y lo usaremos como valor predeterminado); los resultados se mostrarán como un gráfico del número de individuos en función del tiempo. Agregaremos una opción para permitir al usuario ver los resultados en los últimos pasos de la simulación (de forma predeterminada se muestran todos los resultados). R también viene con sus propias preguntas frecuentes (Preguntas frecuentes) ubicadas en el directorio R HOME/doc/html/.
La versión de este R-FAQ se actualiza periódicamente en el sitio de CRAN: http://cran.r-project.org/doc/FAQ/R-FAQ.html.