R

Creado por José Fernando Vidal García

Crear Arrays

Concatenación (Array común)

C(x,y,z)

Rep (repetir)

Que algo se repita tantas veces

rep(x,n_veces)

Se repite x n veces

Repetir varias cosas

rep(c("mujer","hombre"),c(repetir_X_mujer,repetir_Y_hombre))

Repite mujer x veces y hombre y veces

Scan (meter muchos valores en terminal)

consola = scan()

what=”character”

(para especificar que le estas metiendo)

sep(”lo_que_separa”)

Puedes poner que escaneé un fichero poniendo dentro del paréntesis: "lenguajes.txt”

Leer un .dat

juegos=read.table("Juegos.dat")


Frecuencias

Absoluta

Cuantos hay de algo

table(gen)

Relativa

Cuantos hay de algo entre cuantos algos hay

table(gen)/length

Acumulada (ir sumando las absolutas)

cumsum(c(3,2,3,5))

Acumulada Relativa (ir sumando las relativas)

cumsum(table(pro)/length(pro))

Divides entre


Intervalos

Poner en una lista todos los números entre dos números

lista = 20:30

Incluye el 20 y el 30

Seq (secuencia)

bruma = seq(2,8,2)

Del 2 al 8 de 2 en 2, no se puede pasar

Ver un intervalo en concreto

usuarioscut=usuarios[usuarios>=65 & usuarios <=80]

Cambiar los resultados a intervalos

ej: internet=cut(internet,breaks=seq(0,90,10))

Si pones labels = c("ss",…) pones etiqueta a cada trozo cortado

Clasificará cada uno de los números segun en el intervalo en el que estén del 0 al 90 de 10 en 10


Diagramas/ Gráficos

Grafico de barras/ diagrama de barras

barplot(table(genero))

Diagrama circular

pie(table(genero)/length(genero))

Histograma

hist()

Para elegir los intervalos: hist([Ventas≤10],breaks=c(1,2,3))

Si quieres que esten derrados a la derecha poner right=FALSE

Para incluir el origen inculde.lowest


Cuantiles

Se representa con quantail()

Rango intercuartilico

Nº Atípico

Visualizarlos

boxplot()


Tablas

Definirla

tabla=xtabs(freq~gen+pelo)

Tablas de frecuencias conjuntas

prop.table(table(Ojos,Pelo))

tablas de frecuencias condicionadas

prop.table(table(Ojos,Pelo),1)

Con el uno eliges que variable quieres usar para sacar sus frecuencias relativas

Diagrama de barras

barplot(tabla)

Si pones barplot(tabla , beside = T) los separa

Añadir frecuencias marginales

tabla=addmagins(tabla)


Comandos básicos

rm (Borrar)

rm(”nombre variable”)

name (copiar solo las etiquetas)

se queda solo con las etiquetas

as.numeric

Se queda solo con los numeros

Breaks

Sirve para decir que divisiones quieres por ejemplo en los historgramas

Media

mean()

Moda

which(table(VentasEU)==max(table(VentasEU)))

Median

median() es la mediana

Summary

Te dice muchos datos como la media o la mediana

summary(VentasEU)

Resolver ecuaciones

which(table(VentasEU)==max(table(VentasEU)))

Asignar una variable

a=2

Length

length(prueba)

Es el conteo de cuantos elementos hay

Data.frame (crear una tabla con varios arrays)

Personas = data.frame(peso,nota,sexo)

Buscar variables dentro de un data frame

attach(nombre_dataframe)

detach(nombre_dataframe) (Parar de buscar)

Máximo o Mínimo de un Array

max(lista)

min(lista)

sum (Sumar todo)

sum(brum)

prod (Multiplicar todo)

prod(brum)

short

Ordena la lista

sort(list) Si le metes ,decreasing=T será decreciente

cbind

comparar dos variables

Unique

unique(lita2)

Quita los repetidos

Matriz

matrix(array, filas, columnas)

Rellena columna por columna


Varianza

La varianza es hacer a cada uno de los terminoss una resta por la media aritmetica y elevarlos cada uno al cuadrado, despues divides toda esa suma entre cuantos numeros habia

cov(X,x)

Coeficiente de variacion

desviacion tipica entre media

Cuasi-varianza

es lo mismo pero entre n-1

se escribe var()

Cuasi desviación típica

Es lo mismo pero en raíz cuadrada

Covarianza

Si es positiva aumentan las dos si es negativa una sube y la otra baja

cov(X,Y)

Desviación

Tipificación

Coeficientes de correlación y determinación

cor(X, Y )

r^2= cor(X, Y )*cor(X, Y )

Recta de Regresión

lm(formula = Y ~ X)

Media de clases

El punto medio de los intervalos por la frecuencia relativa de cada uno