Al importar los datos que vienen en el fichero EjercicioDescriptiva.txt, ponemos como nombre a la hoja de datos datos. Esta hoja no contiene datos faltantes. Importamos los datos mediante:datos<>EjercicioDescriptiva.txt") Al lanzar:names(datos) vemos que los nombres de las variables son los siguientes: [1] "CodigoINE" "Municipio" "Tasaactividad2001" "LineasADSL2007" [5] "Edadmedia2007" "Rentafamiliarporhabitante2003" "Crecimientovegetativo2006" "Numeroparados2007" [9] "Poblacion2007" "Poblacion2006" "Poblacion2003" "Poblacion2001" [13] "Provincia" "tasalineasADSL2007" "tasacrecimientovegetativo2006" "tasaparo2007" Calcular la media de la variable tasaparo2007:mean(datos$tasaparo2007) Calcular el coeficiente de variación de la variable tasaparo2007:sd(datos$tasaparo2007)/mean(datos$tasaparo2007) Obtener el coeficiente de asimetría de la variable tasaparo2007 library(e1071):skewness(datos$tasaparo2007) Obtener un histograma de la variabletasaparo2007:hist(datos$tasaparo2007) diagrama<>boxplot(datos$tasaparo2007) filtro<>datos$tasaparo2007>diagrama$stats[5])|(datos$tasaparo2007<> n<>sum(filtro) x(rep(1.25,n), datos$tasaparo2007[filtro], datos$tasaparo2007[filtro]) #Segundo ejercicio. Sobre la variable Tasaactividad2001
#1. Calcular la media.
mean(datos$Tasaactividad2001)
#2. Calcular el coeficiente de variación.
sd(datos$Tasaactividad2001)/mean(datos$Tasaactividad2001)
#3. Obtener el coeficiente de asimetría.
library(e1071)
skewness(datos$Tasaactividad2001)
#4. Obtener un diagrama de caja e identificar qué municipios andaluces destacan significativamente del resto como atípicos.
n<>
nombres<>
boxplot(datos$Tasaactividad2001)
identify(rep(1,n), datos$Tasaactividad2001, nombres) |
4. Provincia [ID: 1410052] Vamos a importar unos datos que vienen en el fichero EjercicioDescriptiva.txt. Esos datos tienen decimales separados por comas. Lo hacemos así: datos<>delim2("EjercicioDescriptiva.txt") Ahora queremos ver el nombre de las variables. Lo hacemos así: names(datos) El resultado es el siguiente [1] "CodigoINE" "Municipio" "Tasaactividad2001" "LineasADSL2007" [5] "Edadmedia2007" "Rentafamiliarporhabitante2003" "Crecimientovegetativo2006" "Numeroparados2007" [9] "Poblacion2007" "Poblacion2006" "Poblacion2003" "Poblacion2001" [13] "Provincia" "tasalineasADSL2007" "tasacrecimientovegetativo2006" "tasaparo2007" Obtener la distribución de frecuencias absolutas de la variable Provincia. tabla<>datos$Provincia) Obtener la distribución de frecuencias relativas. prop.table(tabla) Obtener un diagrama de barras. barplot(tabla) Obtener un diagrama de sectores. pie(tabla) |