Población: Conjunto de personas del que se hace el estudio. Elementos: Personas o cosas que forman parte de la población. Variables: El tema del que se hace el estudio. Muestra: Parte de la población se hace el estudio para luego generalizar los resultados. Variables cuantitativas: Se expresan en valores numéricos. Discretas: Se expresan en valores numéricos enteros, no admite decimales. Continuas: Se expresan en valores numéricos, admite decimales. Variables atributos: Se expresan en valores textuales. Ordenables: Admiten un orden. No ordenables: No admiten orden. Fuentes primarias: Fondo que dan información de primera mano (entrevistas y encuestas). Fuentes secundarias: Son reflexiones de las primarias (censos, padrones como INE y IBESTAT). / / TABLAS ESTADÍSTICAS Para realizar un estudio, primero se han de obtener los datos y después recopilar en una tabla. Frecuencia absoluta: Número de veces que aparece en la muestra un mismo valor de la variable, es decir, la cantidad de esta variable que tiene la muestra . Frecuencia relativa: Resultado de dividir la frecuencia absoluta con el tamaño de la muestra. Frecuencia absoluta acumulada: Es el número de veces que ha aparecido en la muestra un valor menor o igual, se acumulan los valores y se van sumando. Cuanto más grande sea el número de intervalos, más detalles de informaició tendremos, si es demasiado grande puede dificultar la lectura, y si es demasiado pequeño se pierde mucha información. Cuando el número de valores de la variable es muy elevado, hay que juntar los datos en grupos. Si el número es reducido, se puede hacer la tabla directamente. / / GRÁFICOS Para hacer un gráfico correctamente los ejes deben empezar de 0, los espacios entre cada intervalo deben ser iguales, el tipo de gráfico debe ser el adecuado pretendan en cuenta la información que queremos representar. Gráfico de columnas: No hace falta que los intervalos estén de manera continua en el eje horizontal ya que, a diferencia del histograma, los valores no son continuos. La altura de los rectángulos dependerá del valor de la variable. G. de barras: Es similar al gráfico de columnas pero los ejes están girados. Los rectángulos están dispuestos de manera horizontal. G. de líneas: Consiste en una seria de puntos situados donde coinciden los valores de cada eje. Estos puntos se adjuntan con una línea. G. de proporciones: Se utiliza para representar porcentajes de la frecuencia de las variables. G. de Dispersión: Muestra la dispersión entre las observaciones realizadas. Deben ser variables cuantitativas continuas. Medidas de centralización Media aritmética: Sumatorio de todos los valores de la variable dividido entre el tamaño de la muestra. Mediana: Valor central de una seria de datos ordenados de forma creciente o decreciente. Moda: Valor de la variable que tiene más frecuencia absoluta, lo que más se repite.Cuartil: Cada uno de los tres puntos que divide la frecuencia en cuatro partes iguales.



Medidas de dispersión Desviación media: Consiste en encontrar la diferencia entre cada uno de los valores de la variable, y dividir entre el tamaño de la muestra. Varianza: Consiste en elevar al cuadrado las desviaciones para eliminar los signos negativos. Desviación típica: Es la raíz cuadrada de la varianza. Coeficiente de variación: Consiste en dividir la desviación típica entre la media aritmética. El resultado se expresa en tanto por ciento. Curva de Lorenz: Es una representación gráfica que muestra si una distribución de frecuencias tiene mucha concentración o no. Se hace una diagonal recto partiendo desde el punto 0. Si la curva está más cerca de la diagonal, querrá decir que hay menos concentración, y viceversa. / / / ASSOSSIACIONS bivariables Variable independiente: Aquella variable que noes ve modificada por la otra. Variable dependiente: Aquella que se ve afectada por el comportamiento de la variable independiente. Forma: Se puede conseguir trasladando los valores de las dos variables a un sistema de coordenadas. Si los puntos se sitúan sobre una recta o curva, es que hay relación entre las dos variables. Fuerza: Nos indica si la relación entre dos variables es importante o no. Coeficiente de correlación: Determina la fuerza de una relación y el sentido . Será positiva si el sentido es ascendente y será negativa si el sentido es descendente. C. de Spearman: Permite calibrar la correlación entre dos variables a partir de los valores ordinales. Los valores reales son sustituidos por números ordinales para organizarlos mejor. C. de Pearson: Permite calibrar la correlación entre dos variables partiendo de sus valores reales. INTRODUCCIÓN AL ANÁLISIS MULTIVARIANTE Análisis factorial: Es una técnica que pretende una reducción de la dimensión de datos. Tiene como objetivo buscar el mínimo de dimensión de datos con el máximo de información contenida en los datos. Este puede ser exploratorio o confirmatorio. Confirmatorio: Matriz de información espacial (cada variable tiene unos valores que le permiten situarse en un espacio, como unos ejes de coordenadas), Matriz de correlaciones (Estudia el grado de conexión entre dos variables) , Matriz factorial, extracción de factores (indica la relación entre los factores y las variables), Rotación de factores (pretende hacer girar los ejes de coordenadas que representan los factores, para conseguir que se aproximen al máximo a las variables. Intenta que mejore la correlación entre variables y factores), Interpretación de factores (pretende conocer el contenido de cada factor, estudiar su composición) Exploratorio: Selección de variables (no elegir las variables de forma aleatoria, puede ser positivo factorizar previamente las variables)Medidas de similitud o de distancia (define proximidad, y su tipo viene dado por la escala de medida de variables) Algoritmo de agrupación, métodos jerárquicos (consiste en procesos de agrupación o desagrupación).