R
Creado por José Fernando Vidal García
Crear Arrays
Concatenación (Array común)
C(x,y,z)
Rep (repetir)
Que algo se repita tantas veces
rep(x,n_veces)
Se repite x n veces
Repetir varias cosas
rep(c("mujer","hombre"),c(repetir_X_mujer,repetir_Y_hombre))
Repite mujer x veces y hombre y veces
Scan (meter muchos valores en terminal)
consola = scan()
what=”character”
(para especificar que le estas metiendo)
sep(”lo_que_separa”)
Puedes poner que escaneé un fichero poniendo dentro del paréntesis: "lenguajes.txt”
Leer un .dat
juegos=read.table("Juegos.dat")
Frecuencias
Absoluta
Cuantos hay de algo
table(gen)
Relativa
Cuantos hay de algo entre cuantos algos hay
table(gen)/length
Acumulada (ir sumando las absolutas)
Acumulada Relativa (ir sumando las relativas)
Intervalos
Poner en una lista todos los números entre dos números
lista = 20:30
Incluye el 20 y el 30
Seq (secuencia)
bruma = seq(2,8,2)
Del 2 al 8 de 2 en 2, no se puede pasar
Ver un intervalo en concreto
usuarioscut=usuarios[usuarios>=65 & usuarios <=80]

Cambiar los resultados a intervalos
ej: internet=cut(internet,breaks=seq(0,90,10))
Si pones labels = c("ss",…) pones etiqueta a cada trozo cortado
Clasificará cada uno de los números segun en el intervalo en el que estén del 0 al 90 de 10 en 10
Diagramas/ Gráficos
Grafico de barras/ diagrama de barras
barplot(table(genero))
Diagrama circular
pie(table(genero)/length(genero))

Histograma
hist()
Para elegir los intervalos: hist([Ventas≤10],breaks=c(1,2,3))
Si quieres que esten derrados a la derecha poner right=FALSE
Para incluir el origen inculde.lowest
Cuantiles
Se representa con quantail()
Rango intercuartilico
Nº Atípico
Visualizarlos
boxplot()
Tablas
Definirla
tabla=xtabs(freq~gen+pelo)
Tablas de frecuencias conjuntas
prop.table(table(Ojos,Pelo))
tablas de frecuencias condicionadas
prop.table(table(Ojos,Pelo),1)
Con el uno eliges que variable quieres usar para sacar sus frecuencias relativas
Diagrama de barras
Añadir frecuencias marginales
tabla=addmagins(tabla)
Comandos básicos
rm (Borrar)
rm(”nombre variable”)
name (copiar solo las etiquetas)
se queda solo con las etiquetas
as.numeric
Se queda solo con los numeros
Breaks
Sirve para decir que divisiones quieres por ejemplo en los historgramas
Media
mean()
Moda
which(table(VentasEU)==max(table(VentasEU)))
Median
median() es la mediana
Summary
Te dice muchos datos como la media o la mediana
summary(VentasEU)
Resolver ecuaciones
which(table(VentasEU)==max(table(VentasEU)))
Asignar una variable
a=2
Length
length(prueba)
Es el conteo de cuantos elementos hay
Data.frame (crear una tabla con varios arrays)
Buscar variables dentro de un data frame
attach(nombre_dataframe)
detach(nombre_dataframe) (Parar de buscar)
Máximo o Mínimo de un Array
max(lista)
min(lista)
sum (Sumar todo)
sum(brum)
prod (Multiplicar todo)
prod(brum)
short
Ordena la listasort(list) Si le metes ,decreasing=T será decreciente
cbind
comparar dos variables
Unique
unique(lita2)
Quita los repetidos
Matriz
matrix(array, filas, columnas)
Rellena columna por columna
Varianza
La varianza es hacer a cada uno de los terminoss una resta por la media aritmetica y elevarlos cada uno al cuadrado, despues divides toda esa suma entre cuantos numeros habia
cov(X,x)
Coeficiente de variacion
desviacion tipica entre media
Cuasi-varianza
es lo mismo pero entre n-1
se escribe var()
Cuasi desviación típica
Es lo mismo pero en raíz cuadrada
Covarianza
Si es positiva aumentan las dos si es negativa una sube y la otra baja
cov(X,Y)
Desviación
Tipificación
Coeficientes de correlación y determinación

cor(X, Y )
r^2= cor(X, Y )*cor(X, Y )
Recta de Regresión
lm(formula = Y ~ X)

Media de clases
El punto medio de los intervalos por la frecuencia relativa de cada uno







