Conceptos básicos y definiciones de un objeto de investigación estadística. El método general y agregado general, como logrando la homogeneidad de alta calidad del agregado estadístico

  • Econometrics: una rama de la ciencia, cuyo propósito es dar medidas cuantitativas a las relaciones económicas.
  • Los métodos estadísticos son un elemento esencial en las ciencias sociales, y principalmente con la ayuda de estos métodos, las enseñanzas sociales pueden enfrentarse al nivel de las ciencias.
  • El objetivo es dar una descripción cuantitativa de la relación entre las variables económicas, los econometría se asocian principalmente con los métodos de regresión y correlación.
  • Cualquier estudio econométrico comienza con la especificación del modelo, es decir. De la formulación de la forma del modelo en función de la teoría de la comunicación correspondiente entre las variables.
  • De todo el círculo de factores que afectan la base productiva (Y), es principalmente necesario asignar los factores que afectan más sustancialmente.
  • La ecuación de regresión simple caracteriza la relación entre dos variables, que se manifiesta como alguna regularidad solo en promedio para la combinación de observaciones.
  • En la ecuación de regresión, la correlación esencialmente, la síntesis se presenta en forma de una conexión funcional, una función matemática pronunciada.
  • El valor aleatorio de ε, o indignación, incluye el impacto de los factores que no se tienen en cuenta en el modelo, los errores aleatorios y las características de medición.
  • Suponiendo que los errores de medición se reducen al mínimo, el enfoque de la investigación económica se paga a los errores del modelo de especificación.
  • Al estudiar la relación entre dos signos, el método gráfico de selección de la forma de la ecuación de regresión es bastante visual. Se basa en el campo de correlación.
  • Los principales tipos de tendencias utilizadas en la cuantificación de los enlaces entre dos variables: logarítmico, lineal, potencia, polinomio, exponencial.
  • Un método analítico para elegir el tipo de ecuación de regresión se basa en el estudio de la naturaleza material de la comunicación de las características estudiadas.
  • Cuanto más cerca sea el coeficiente de determinación a uno, mayor será la ecuación de regresión es adecuada para pronosticar el próximo año.
  • Un ejemplo de regresión no lineal en las variables explicativas incluidas en él puede servir como las siguientes funciones: hipérbole equilátero, polinomios de diferentes grados.
  • La regresión no lineal en los parámetros estimados incluye funciones: potencia, indicativo, exponencial.
  • Suponiendo que los errores de medición se reducen al mínimo, el enfoque de la investigación económica se paga a los errores del modelo de especificación.
  • Al estudiar la relación entre dos signos, el método gráfico de selección de la forma de la ecuación de regresión es bastante visual. Se basa en el campo de correlación.
  • Los principales tipos de tendencias utilizadas en la cuantificación de los enlaces entre dos variables: logarítmico, lineal, potencia, polinomio, exponencial.
  • Un método analítico para elegir el tipo de ecuación de regresión se basa en el estudio de la naturaleza material de la comunicación de las características estudiadas.
  • Cuanto más cerca sea el coeficiente de determinación a uno, mayor será la ecuación de regresión es adecuada para pronosticar el próximo año.
  • Un ejemplo de regresión no lineal en las variables explicativas incluidas en él puede servir como las siguientes funciones: hipérbole equilátero, polinomios de diferentes grados.
  • La regresión no lineal en los parámetros estimados incluye funciones: potencia, indicativo, exponencial.
  • Suponiendo que los errores de medición se reducen al mínimo, el enfoque de la investigación económica se paga a los errores del modelo de especificación.
  • Al estudiar la relación entre dos signos, el método gráfico de selección de la forma de la ecuación de regresión es bastante visual. Se basa en el campo de correlación.
  • Los principales tipos de tendencias utilizadas en la cuantificación de los enlaces entre dos variables: logarítmico, lineal, potencia, polinomio, exponencial.
  • Un método analítico para elegir el tipo de ecuación de regresión se basa en el estudio de la naturaleza material de la comunicación de las características estudiadas.
  • Cuanto más cerca sea el coeficiente de determinación a uno, mayor será la ecuación de regresión es adecuada para pronosticar el próximo año.
  • Un ejemplo de regresión no lineal en las variables explicativas incluidas en él puede servir como las siguientes funciones: hipérbole equilátero, polinomios de diferentes grados.
  • La regresión no lineal en los parámetros estimados incluye funciones: potencia, indicativo, exponencial.
  • Suponiendo que los errores de medición se reducen al mínimo, el enfoque de la investigación económica se paga a los errores del modelo de especificación.
  • Al estudiar la relación entre dos signos, el método gráfico de selección de la forma de la ecuación de regresión es bastante visual. Se basa en el campo de correlación.
  • Los principales tipos de tendencias utilizadas en la cuantificación de los enlaces entre dos variables: logarítmico, lineal, potencia, polinomio, exponencial.
  • Un método analítico para elegir el tipo de ecuación de regresión se basa en el estudio de la naturaleza material de la comunicación de las características estudiadas.
  • Un polinomio de cualquier orden se reduce a la regresión lineal con sus métodos para estimar parámetros y hipótesis de pruebas.
  • Dado que el índice de correlación calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Errores de aproximación Para cada observación, es habitual determinar en el porcentaje del módulo.
  • La regresión del par puede dar un buen resultado al modelar, si se puede descuidar el efecto de otros factores que afectan al objeto del estudio.
  • La regresión múltiple se usa ampliamente para resolver los problemas de la demanda, la rentabilidad de las acciones, al estudiar la función de los costos de producción, en los cálculos macroeconómicos.
  • El análisis teórico a menudo no permite responder inequívocamente la cuestión de la relación cuantitativa de los signos en consideración y la viabilidad de incorporar el factor en el modelo.
  • Un polinomio de cualquier orden se reduce a la regresión lineal con sus métodos para estimar parámetros y hipótesis de pruebas.
  • Entre la regresión polinomial no lineal se usa con mayor frecuencia por un segundo grado Parabol; En algunos casos, un polinomio de tercer orden.
  • Dado que el índice de correlación calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Errores de aproximación Para cada observación, es habitual determinar en el porcentaje del módulo.
  • La regresión del par puede dar un buen resultado al modelar, si se puede descuidar el efecto de otros factores que afectan al objeto objeto.
  • La regresión múltiple se usa ampliamente para resolver los problemas de la demanda, la rentabilidad de las acciones, al estudiar la función de los costos de producción, en los cálculos macroeconómicos.
  • El análisis teórico a menudo no permite responder inequívocamente la cuestión de la relación cuantitativa de los signos en consideración y la viabilidad de incorporar el factor en el modelo.
  • Un polinomio de cualquier orden se reduce a la regresión lineal con sus métodos para estimar parámetros y hipótesis de pruebas.
  • Entre la regresión polinomial no lineal se usa con mayor frecuencia por un segundo grado Parabol; En algunos casos, un polinomio de tercer orden.
  • Dado que el índice de correlación calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Errores de aproximación Para cada observación, es habitual determinar en el porcentaje del módulo.
  • La regresión del par puede dar un buen resultado al modelar, si se puede descuidar el efecto de otros factores que afectan al objeto objeto.
  • La regresión múltiple se usa ampliamente para resolver los problemas de la demanda, la rentabilidad de las acciones, al estudiar la función de los costos de producción, en los cálculos macroeconómicos.
  • Un polinomio de cualquier orden se reduce a la regresión lineal con sus métodos para estimar parámetros y hipótesis de pruebas.
  • Entre la regresión polinomial no lineal se usa con mayor frecuencia por un segundo grado Parabol; En algunos casos, un polinomio de tercer orden.
  • Dado que el índice de correlación calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Errores de aproximación Para cada observación, es habitual determinar en el porcentaje del módulo.
  • La regresión del par puede dar un buen resultado al modelar, si se puede descuidar el efecto de otros factores que afectan al objeto objeto.
  • La regresión múltiple se usa ampliamente para resolver los problemas de la demanda, la rentabilidad de las acciones, al estudiar la función de los costos de producción, en los cálculos macroeconómicos.
  • El análisis teórico a menudo no permite responder inequívocamente la cuestión de la relación cuantitativa de los signos en consideración y la viabilidad de incorporar el factor en el modelo.
  • Cuanto más fuerte de los factores multicolinaridad, menos confiable, la evaluación del importe de la cantidad de variaciones explicadas sobre los factores individuales que utilizan el método de mínimos cuadrados.
  • Suponiendo que los errores de medición se reducen al mínimo, el enfoque de la investigación económica se paga a los errores del modelo de especificación.
  • Al estudiar la relación entre dos signos, el método gráfico de selección de la forma de la ecuación de regresión es bastante visual. Se basa en el campo de correlación.
  • Los principales tipos de tendencias utilizadas en la cuantificación de los enlaces entre dos variables: logarítmico, lineal, potencia, polinomio, exponencial.
  • Un método analítico para elegir el tipo de ecuación de regresión se basa en el estudio de la naturaleza material de la comunicación de las características estudiadas.
  • Cuanto más cerca sea el coeficiente de determinación a uno, mayor será la ecuación de regresión es adecuada para pronosticar el próximo año.
  • Un polinomio de cualquier orden se reduce a la regresión lineal con sus métodos para estimar parámetros y hipótesis de pruebas.
  • Entre la regresión polinomial no lineal se usa con mayor frecuencia por un segundo grado Parabol; En algunos casos, un polinomio de tercer orden.
  • Dado que el índice de correlación calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Entre la regresión polinomial no lineal se usa con mayor frecuencia por un segundo grado Parabol; En algunos casos, un polinomio de tercer orden.
  • Dado que el índice de covarianza calcula la proporción del factor y la suma total de las desviaciones de las desviaciones, entonces R2 tiene el mismo significado que el coeficiente de determinación.
  • Los errores de aproximación no son para cada observación, es habitual determinar en el porcentaje del módulo.
  • La regresión del par puede dar un buen resultado al modelar, si se puede descuidar el efecto de otros factores que afectan al objeto objeto.
  • La regresión múltiple se usa ampliamente para resolver los problemas de la demanda, la rentabilidad de las acciones, al estudiar la función de los costos de producción, en los cálculos macroeconómicos.
  • El análisis teórico a menudo no permite responder inequívocamente la cuestión de la relación cuantitativa de los signos en consideración y la viabilidad de incorporar el factor en el modelo.
  • Cuanto más fuerte de los factores multicolinaridad, menos confiable, la evaluación del importe de la cantidad de variaciones explicadas sobre los factores individuales que utilizan el método de mínimos cuadrados.
  • El valor aleatorio de ε, o indignación, incluye el efecto de los factores registrados en el modelo, errores aleatorios y características de medición.

    El valor aleatorio de ε, o indignación, incluye el impacto de los factores no registrados en el modelo, no los errores y las características de medición aleatorias.

    9. ¿Qué fuentes son la presencia en el modelo de la ecuación de regresión de una variable aleatoria ε?

    Su presencia en el modelo se debe a dos fuentes: especificación del modelo, carácter selectivo de los datos de origen.

    Su presencia en el modelo se debe a dos fuentes: la naturaleza selectiva de los datos de origen, las características de la medición de las variables.

    Su presencia en el modelo se debe a dos fuentes: especificaciones de modelos, características de medición variable.

  1. Su presencia en el modelo se debe a tres fuentes: la especificación del modelo, la naturaleza selectiva de los datos de origen, las características de la medición de las variables.

  2. Su presencia en el modelo no es causada por tres fuentes: la especificación del modelo, la naturaleza selectiva de los datos de origen, las características de la medición de las variables.

10. ¿Desaparece en la ecuación de regresión de algún factor significativo a los errores de especificación?

    Los errores de especificación no solo incluirán la opción incorrecta de una u otra función matemática, sino también las desventajas en la ecuación de regresión de cualquier factor significativo, por ejemplo, el uso de regresión de pares en lugar de múltiples.

    Los errores de especificación solo incluirán la opción incorrecta de una u otra función matemática, pero también fallará en la ecuación de regresión de cualquier factor sustancial, por ejemplo, el uso de regresión emparejada en lugar de múltiples.

    Los errores de especificación incluirán no solo la opción incorrecta de una u otra función matemática, sino también la contabilidad obligatoria en la ecuación de regresión de un factor sustancial, por ejemplo, el uso de regresión de pares en lugar de múltiples.

    Los errores de la especificación no solo incluirán la opción incorrecta de una u otra función matemática, sino también las desventajas en la ecuación de regresión de cualquier factor sustancial, por ejemplo, el uso de regresión emparejada en lugar de múltiples.

    Los errores de especificación se relacionarán no solo a la elección incorrecta de una u otra función matemática, sino también abruptamente en la ecuación de regresión de cualquier factor significativo, por ejemplo, no uso de la regresión emparejada en lugar de múltiples.

11. ¿Cuándo la ecuación de regresión no tiene un significado práctico y lo que hace posible obtener un significado práctico de la ecuación de regresión?

    Si la totalidad de los datos es heterogénea, la ecuación de regresión no tiene un significado práctico. Para obtener un buen resultado, generalmente se excluyen los datos con valores anómalos de las características estudiadas.

    Si la totalidad de los datos es heterogénea, la ecuación de regresión no tiene un significado práctico. Para obtener un buen resultado, generalmente se excluyen los datos con valores anómalos de las características estudiadas.

    Si la totalidad de los datos es heterogénea, la ecuación de regresión tiene un significado práctico. Para obtener un buen resultado, generalmente se excluyen los datos con valores anómalos de las características estudiadas.

    Si la totalidad de los datos es heterogénea, la ecuación de regresión no tiene un significado práctico. Para obtener un mal resultado, generalmente se excluyen los datos con valores anómalos de las características estudiadas.

    Si la totalidad de los datos es heterogénea, la ecuación de regresión no tiene un significado práctico. Para obtener un buen resultado, generalmente no se excluye del conjunto de datos con valores anómalos de las pruebas en estudio.

12. ¿Cuál es el peligro en el uso práctico de los métodos de regresión representan errores de medición?

"

La palabra "estadística" tiene un origen latino (de estado., que significa "cierto estado de cosas", un estado). En la Edad Media, se usó para caracterizar el estado político del estado y se utilizó en el significado de la palabra "Estudios de Estado", (Gottfried Ashneval, siglo XVIII, Alemania). Como la ciencia, las estadísticas ocurrieron solo en el siglo XVII, cuando los gobiernos de varios países de Europa occidental comenzaron a recolectar de tipo diferente Información sobre sus ciudadanos. Sin embargo, la contabilidad estadística existía en los tiempos antiguos, mencionando que los exámenes estadísticos también se encuentran en los tiempos bíblicos.

Por otros 5 mil años. El censo de la población se realizó en China, donde se realizó la propiedad de los ciudadanos en la antigua Roma, el uso del medio era bien conocido en la vida de Pythagora. En la Edad Media, la comparación fue hecha por el potencial militar de diferentes países, el número de su población, la propiedad nacional, las tierras.

En las fuentes de ciencias estadísticas estaban en dos escuelas, la Escuela Alemana descriptiva e inglesa de la aritmética política.

Representantes de la Escuela Descriptiva (Curring (1606-1661), Aachenval (1719-1772), A. Buje (1724-1793) y otros creían que la tarea de las estadísticas es una descripción de los lugares de interés del estado: los territorios, el público , clima, religión, limpieza, etc., solo en forma verbal, sin números y fuera de la dinámica, es decir, sin reflejar las características del desarrollo de los estados en ciertos períodos, sino solo en el momento de la observación. Fueron "aritméticos políticos ", que estaba dirigido a estudiar los fenómenos sociales con la ayuda de las características numéricas: las medidas y los números de peso. La aritmética política observada el nombramiento básico de estadísticas en el estudio de los fenómenos sociales masivos, conscientes de la necesidad de contabilizar en un examen estadístico de la Requisitos de la ley de grandes números, ya que la regularidad se puede manifestar solo con una cantidad suficientemente grande de la totalidad analizada. V. PETTY (1623-1687) fue un representante prominente y fundador de esta área. Es la escuela de aritmética política B se ha convertido en la fundación en el desarrollo de las estadísticas modernas.

En el siglo XIX. Se desarrolló el desarrollo de estadísticas belgas Adolf Ketle (1796-1874) (1796-1874), que fue el primero en aplicar métodos modernos de recolección de datos, se considera el fundador del ejercicio en los valores promedio. La dirección matemática en las estadísticas desarrolladas en las obras del británico - Sir Francis Galton (1822-1911) y Karl Pearson (1857-1936), Ronald Fisher, que hizo una contribución significativa al desarrollo de la teoría de la correlación y tuvo un impacto significativo. En las estadísticas modernas. * Nota. El signo (*) está marcado por la publicación, sobre la base de los cuales se compila la revisión temática.

El progreso de la metodología estadística promovió las obras de estadísticas rusas, a.a. ChuProv (1874-1926), B.C. NEMCHINOVA (1894-1964), S.G. Strumina (1877 - 1974), v.n. Starovsky (1905-1975), etc.

El desarrollo de la ciencia estadística, la expansión del alcance del trabajo estadístico práctico llevó a un cambio en el contenido del concepto de "estadísticas". Actualmente, este término se usa en tres valores:

primeramenteLas estadísticas entienden la rama de las actividades prácticas, que está destinada a recopilar, procesar, analizar y publicar datos en masa en varios fenómenos de la vida pública. La recopilación de datos se realiza en cada región y en el país en su conjunto sobre el número y la composición de la población, se calculan empresas y organizaciones, se recopilan los datos sobre el volumen de volúmenes de producción y ventas, etc. Esta actividad es nivel profesional Es realizado por el Servicio de Estadísticas del Estado Federal (Comité de Estadísticas del Estado de la Federación de Rusia) y el sistema de sus instituciones organizadas por una base administrativa-territorial, por ejemplo, el Comité Regional de Estadísticas Estatales de Rostov, o el Departamento de Estado InterDistrict de TaganRog Estadísticas, etc.

en segundo lugarLas estadísticas se llaman materiales digitales que sirven para caracterizar cualquier área de fenómenos públicos o distribución territorial de algún indicador publicado en la prensa periódica, libros de referencia, colecciones. Por ejemplo, la dinámica de los precios de la gasolina en la región de Rostov presentada durante los meses de verano del año en curso.

En tercer lugarLas estadísticas se denominan la rama de conocimiento, una disciplina científica especial, que se desarrolla ampliamente por los métodos de recopilación, sistematización, análisis, interpretación y exhibición de los resultados de la observación de fenómenos y procesos aleatorios de masas para identificar los patrones existentes en ellos. Por ejemplo, estudios de la relación entre la calidad de los recursos laborales y el crecimiento económico en las regiones de la Federación de Rusia.

Entonces, estadísticas - Este es un tipo de actividad científica y práctica destinada a obtener, procesar, analizar y almacenar información caracterizando los patrones cuantitativos de la vida de la sociedad a lo largo de su diversidad en una conexión inextricable con su contenido de calidad.

Si consideramos las estadísticas como una herramienta para aprender fenómenos y procesos socioeconómicos, entonces sujeto de estadísticas Consiste en estudiar el tamaño y los índices cuantitativos de los fenómenos sociales masivos en términos específicos del lugar y el tiempo, así como la expresión numérica de las leyes que se manifiestan en ellos.

Las estadísticas estudian su tema utilizando ciertas categorías, es decir,. Conceptos que reflejan las propiedades más comunes y esenciales, signos, vínculos y relaciones de objetos y fenómenos del mundo objetivo. El patrón identificado sobre la base de la observación masiva, es decir, se manifiesta solo en una gran masa de fenómenos a través de superar sus elementos informales de azar, se llama patrón estadístico.

La propiedad de los patrones estadísticos se manifiesta solo en la masa de fenómenos en la generalización de los datos de acuerdo con un número bastante grande de unidades, se refleja en la ley de grandes números, cuya esencia es que a medida que aumenta el número de observaciones, La influencia de los factores aleatorios se sujeta mutuamente y la acción de los principales factores que se cumplen. Y determinan el patrón. Por ejemplo, la característica de la situación ambiental implica el estudio de los patrones de dinámica de las emisiones de los contaminantes en el aire atmosférico de las regiones de la dinámica del volumen físico del producto regional bruto.

El conocimiento de los patrones es posible solo si no se está estudiando fenómenos individuales, sino los agregados de los fenómenos. Es decir, el objetivo del estudio estadístico es un conjunto estadístico: el conjunto de unidades del fenómeno estudiado, combinado con homogeneidad de alta calidad, determinada por la integridad, la interdependencia de los estados de las unidades individuales y la presencia de variación. Tal, por ejemplo, un conjunto de hogares, una combinación de empresas y firmas, una combinación de campos petroleros, un conjunto de regiones, etc.

Totalidad uniforme - Este es el tipo de combinación, en el que uno o más signos esenciales aprendidos son comunes a todas las unidades. Por ejemplo, la afiliación de las empresas a la misma industria: plantas del complejo metalúrgico o regiones relacionadas con una zona climática natural.

Combustión de Droinen - Este es el tipo de combinación, que incluye fenómenos de diferentes tipos. . Una combinación puede ser uniforme en un aspecto y heterogéneo en el otro. Las regiones incluidas en el mismo grupo de características ambientales y climáticas difieren en términos de desarrollo socioeconómico. Las plantas incluidas en el complejo metalúrgico de Rusia difieren en su especialización: se asignan grupos de tuberías para la producción de tuberías, o para la producción de hojas laminadas de hoja, etc. En cada caso individual, la uniformidad del agregado se establece mediante la realización de un análisis de alta calidad, para determinar el contenido del fenómeno público estudiado.

El agregado estadístico consiste en unidades de agregado. Unidades de agregado estadístico. Presentes elementos primarios homogéneos cualitativamente de esta totalidad. Cada unidad de agregado es caso privado Manifestaciones de patrón estudiado. La solución al problema de la unidad y los límites del agregado estudiado está determinado por el propósito del estudio. Esto se debe a la naturaleza compleja de los fenómenos socioeconómicos. En cada fenómeno separado, se implementan varios procesos al mismo tiempo. Por ejemplo, al estudiar la totalidad de los trabajadores, cada empleado puede verse como miembro de un grupo socio-profesional en particular, como empleado de una empresa, como residente de la ciudad de la aldea, etc., que es unidad de agregado -este límite de aplastamiento del objeto del estudio, en el que se conservan todas las propiedades del proceso que se están estudiando.

Las unidades de agregado tienen ciertas propiedades, cualidades que se llaman signos. Signo - una característica cualitativa de una unidad de agregado. Por ejemplo, signos de una persona: edad, piso, educación, peso, estado civil, etc. Signos de la empresa: una forma de propiedad, la industria, el número de empleados, la magnitud del capital autorizado, etc. Estadísticas estudian fenómenos a través de sus signos: cuanto más uniforme sea la totalidad, las características más generales tienen sus unidades, cuanto menos sus valores varían.

Por la naturaleza de la visualización de las propiedades de las unidades estudiadas el conjunto, los signos se dividen en dos grupos principales:

signos que tienen expresión cuantitativa directa,por ejemplo, el área del territorio, el número de residentes de la ciudad, etc. Pueden ser diferentes o continuamente variables. Los signos de variable discreta son signos, los valores individuales de los cuales difieren entre sí a algún valor finito (generalmente un entero). Por lo tanto, utilizamos signos discretos cuando se lleva a cabo la agrupación, por ejemplo, tiendas por el número de departamentos o en efectivo. En las tiendas puede ser uno, dos, tres, etc. Departamento, pero no puede ser uno y medio o dos y medio. Hay muchas señales cuyos valores difieren entre sí tan agradablemente pequeños y pueden tomar cualquier valor en algún intervalo. Tales signos se denominan signos continuamente variables o continuamente. Estos incluyen los índices de la condición económica, el ingreso promedio, el peso y las características voluminosas de los bienes;

signos que no tienen expresión cuantitativa directa.En este caso, las unidades individuales de agregado difieren en su contenido, por ejemplo, la especialización sectorial de las empresas y las organizaciones; La división de los recursos naturales por su origen: mineral, agua, tierra o división de la población en el piso: hombres y mujeres, etc. Tales señales suelen ser llamados atributos(En el "atributo" de la filosofía, una propiedad integral del sujeto). En el caso, cuando hay opciones opuestas para el signo, habla de alternativasíntoma (sí, no). Por ejemplo, los productos pueden ser adecuados o defectuosos (no adecuados); Cada persona puede estar casada o no, etc.

Una característica de un estudio estadístico es que solo los signos variables se estudian en él, es decir, Signos que reciben varios valores (para atributo, signos alternativos) o que tienen diferentes niveles cuantitativos en unidades individuales de agregado.

Dado que las estadísticas, como ya se mencionó, estudia el lado cuantitativo de los fenómenos masivos, existe la necesidad de generalizar las características de un agregado estadístico. Este rol realiza un indicador estadístico, que es una característica cuantitativa de algún tipo de propiedad de la totalidad.

Indicador estadísticoesta es una evaluación cuantitativa de las propiedades del fenómeno estudiado. Los indicadores estadísticos se pueden dividir en dos tipos principales. La primera vista es indicadores contables y estimados.que muestran dimensiones, volúmenes, niveles de fenómenos estudiados, por ejemplo, el volumen de productos industriales en la Federación de Rusia en 2003 ascendió a 8498.0 mil millones de rublos o una tasa de comercio minorista: 4483.5 mil millones de rublos. El segundo tipo de indicadores. analíticoque muestran cómo se desarrolla el fenómeno estudiado, desde qué partes consiste en todo, es decir, En qué proporción hay partes de un todo entre sí y cómo se distribuye el fenómeno en el espacio. Por lo tanto, en la composición del área económica del Cáucaso del Norte, el territorio de la región de Rostov es del 28,4%, y la República de Adygea - 2.1%. El analítico incluye valores relativos y promedio, indicadores de variación, etc. Por ejemplo, los ingresos promedio per cápita en efectivo de la población en 2003 en la Federación de Rusia ascendieron a 5129 rublos por mes.

Una de las características distintivas del rápido desarrollo de la ciencia es la aplicación generalizada de los métodos estadísticos y la tecnología de la computación en el desarrollo de la información. Actualmente, es imposible imaginar una disciplina que no usaría el método de cognición por los métodos de expresión numérica de patrones, conexiones, dependencia, medición de la tendencia, etc., en particular, se aplica a las ciencias económicas.

En la literatura estadística, se presta mucha atención al estudio y la aplicación de métodos y técnicas estadísticos individuales, pero los temas de la viabilidad y la secuencia del uso de uno u otro método estadístico, su uso integrado y la combinación de varios métodos no son suficiente. La absolutización de este o que el método de investigación no es más que el daño no trae. Solo una combinación de varios métodos puede dar un efecto notable. Es de estas posiciones que es necesario evaluar el papel y el lugar de modelado estadístico en el sistema de conocimiento de diversos procesos y fenómenos. En este documento, se intentó sistematizar la metodología para la aplicación integrada de los métodos estadísticos en estudios económicos, la viabilidad y secuencia del uso de métodos y técnicas estáticas en el análisis de procesos estáticos y dinámicos.

La primera etapa del estudio es la acumulación (recolección) de la información necesaria sobre el objeto que se está estudiando. Si las observaciones no son mucho, es posible regular, colocarlas en orden ascendente o orden descendente, es decir, para construir filas clasificadas. Si hay muchas observaciones, entonces tienes que recurrir a su agrupación. Las filas estadísticas son de carácter más diverso, tienen diferentes propósitos y para diferentes propósitos en el análisis económico. Algunas series estadísticas son filas variativas de distribución. Estas filas muestran la distribución de unidades del agregado estudiado en grupos individuales asignados para cualquier señal. Otro tipo de series estadísticas es la secuencia de números que refleja la cantidad de una vez u otra a tiempo. Estas son las llamadas filas de oradores. Le permiten analizar el cambio en cualquier fenómeno a tiempo, esto se discutirá más adelante. No le restable los valores de la serie de tiempo, se debe tener en cuenta que las filas variativas de distribución en el análisis estadístico pertenecen a un lugar especial, porque solo con la ayuda de la distribución de agregados complejos en grupos cualitativamente homogéneos, su estructura puede ser estudiado, la relación entre partes de un todo, etc., sin la cual nadie es impensable. Análisis económico. Las filas de distribución se pueden construir de acuerdo con la calidad (atributo) y sobre las características cuantitativas, un rasgo y varios, proporcionando así oportunidades extensas a los investigadores al estudiar fenómenos económicos complejos. Las filas de distribución se pueden representar en forma tabular o en geométrica, es decir, gráficos. El agregado estadístico presentado en forma de una fila clasificada de distribución se representa gráficamente como una fila. Está construido como: En el eje de abscisa, se aplican los números de elementos del rango de rango, y los valores del signo se posponen en el eje de la ordenada. Ogiva muestra claramente la intensidad del signo cambiado. Los rangos de distribución se representan gráficamente en forma de polígonos e histogramas. En forma de polígonos, generalmente se representan rangos variativos discretos de distribución. En este caso, los valores de la función se retrasan en el eje de abscisas, y la frecuencia (o frecuencia), en el eje de la ordenada. Los vértices se combinan con líneas rectas, lo que resulta en un polígono (polígono). En forma de un polígono, se pueden representar bandas de variación de intervalo. Para este propósito, se aceptan los valores promedio de la característica. Las filas de variación de intervalo se representan con mayor frecuencia como un histograma en el que se expresan las frecuencias en forma de rectángulos de la longitud correspondiente, y la base de rectángulos, basada en el eje de abscisa corresponde al intervalo del valor del carácter (FIG. uno).

Higo. uno.Histograma y polígono de distribución.

Distinguir distribuciones más simples y múltiples. La multopezas de distribución, como regla general, es un signo de la heterogeneidad del agregado estudiado. Los siguientes tipos más característicos se pueden distinguir de la variedad de formas de distribuciones simuladas: simétricas, moderadamente asimétricas, extremadamente asimétricas.

En la práctica, generalmente se encuentran distribuciones simétricas simétricas, más a menudo asimétricas, en las que las frecuencias en un lado del centro de dispersión disminuyen notablemente más rápido que en el otro. La distribución asimétrica en el límite se vuelve extremadamente asimétrica, en este caso, la frecuencia más alta se encuentra en uno de los extremos de la distribución.

Al resolver algunos problemas, es más conveniente utilizar las frecuencias de distribución acumuladas. La curva de las frecuencias de distribución acumuladas se llama "distribución de acumulación". Al construir acumulados en el eje de abscisa, los valores de la característica se posponen, las frecuencias acumuladas se acumulan en el eje. La construcción de una gama variacional de distribución y su imagen gráfica hace posible obtener la primera idea de sus acciones más características. Al mismo tiempo, el estudio estadístico del agregado no puede limitarse solo a la simple racionalización de los valores observados. Además, las filas de la distribución y sus gráficos son bastante engorrosos, ya que incluyen toda la información inicial. Por lo tanto, el camino más racional de la descripción estadística de la distribución será el cálculo de ciertas características numéricas, lo que refleja las propiedades reales de la totalidad. Tales características se encuentran principalmente entre las características de la tendencia central de una serie de distribución, es decir, encontrar su valor central; dispersión de signos para el centro de distribución; Distribución de la asimetría y la islas. ESTUDIO DE CARACTERÍSTICAS ESTADÍSTICAS DE DISTRIBUCIONES Es aconsejable comenzar con la consideración de lo más sencillo y al mismo tiempo que se utiliza con mayor frecuencia en el análisis estadístico, es decir, con el estudio de los valores promedio; Luego aprende a medir la variación, estudia las medidas del crimen y la isleanidad. Todos estos indicadores de esas u otras características de distribución son un solo sistema de características estadísticas.

Sin embargo, el uso de ciertos métodos estadísticos implica principalmente la homogeneidad del agregado: es imposible, por ejemplo, analizar una colección que consiste en diferentes categorías de fincas, incluidas las empresas de especialización diferente, etc. para resolver problemas con éxito, una comprensión profunda De la entidad del proceso estudiado o fenómeno es necesario. Dada la complejidad, la heterogeneidad de los fenómenos y procesos económicos, es necesario llevar a cabo el análisis para que las diferencias más significativas entre los grupos individuales de los fenómenos no sean atenuados, y se asignen a su estudio más exitoso. Al mismo tiempo, la Unión en el grupo de fenómenos similares similares ayuda a identificar sus características y características que, al estudiar cada fenómeno, pueden permanecer inadvertidas por separado. La asignación de tipos públicos / económicos de fenómenos en cada combinación es la condición principal para su análisis científico. Y esto se puede hacer, solo aplicando el método de los grupos tipológicos.

Los fenómenos masivos de las actividades económicas de las empresas, que son objeto de estudio estadístico, son complejas, tienen una característica de generalidad cualitativa de este fenómeno, pero al mismo tiempo hay diferencias. Por lo tanto, la producción de cualquier producto está involucrado en empresas agrícolas y fincas y las soluciones hechas sobre la base de tales conclusiones son ineficaces.

La agrupación de datos tipológicos es la principal recepción del estudio de los fenómenos económicos, que proporciona una comparabilidad cualitativa de las unidades del agregado y la posibilidad de obtener un valor cuantitativo generalizado de la característica.

1.2. Métodos para medir las características de generalización del agregado.

El método de agrupación permite estudiar el estado y las relaciones de los fenómenos económicos si los grupos se caracterizan por los indicadores que revelan los lados más esenciales del fenómeno en estudio.

Al analizar y planificar, es necesario confiar en los hechos aleatorios, pero en los indicadores que expresan los principales, típicos, indígenas. Tal característica da varios tipos de valores promedio, así como la moda y la mediana.

La cuestión de la homogeneidad del agregado no debe resolver formalmente en forma de su distribución. También, así como la cuestión de un promedio típico, debe abordarse, en función de las causas y condiciones que forman una totalidad. Uniforme es tal combinación, cuyas unidades se forman bajo la influencia de las principales causas y condiciones generales que determinan el nivel general esta característicaCaracterística de toda la población.

Según la teoría de los grupos tipológicos, el valor establecido en la evaluación de la uniformidad de la totalidad no pertenece a la forma de distribución, sino del tamaño de la variación y las condiciones de su formación. Para un agregado cualitativamente homogéneo, se caracteriza una variación dentro de ciertos límites, después de lo cual comienza la nueva calidad. Al mismo tiempo, a estos bordes para evaluar la homogeneidad cualitativa de la agregación, es necesario acercarse desde el punto de vista de la criatura del caso, y no formalmente, ya que la misma cantidad en diferentes condiciones expresa una nueva calidad. Por ejemplo, con el mismo número de empresas trabajadoras en algunas industrias son grandes, y otras son pequeñas.

Para un estudio integral y en profundidad de los fenómenos, para las características objetivas de los tipos de fenómenos, sus relaciones y procesos causados \u200b\u200bpor el desarrollo del sistema en su conjunto, es necesario combinar el medio de grupo con los promedios comunes. La combinación de dicho medio y es uno de los elementos principales para analizar sistemas complejos. Esta combinación se une a una completa que se complementa orgánicamente de los métodos estadísticos: el método de los valores promedio y el método de agrupación. Al calcular el promedio, los valores individuales que varían para un grupo se reemplazan con un valor promedio. Al mismo tiempo, las desviaciones aleatorias del valor de carácter para las unidades individuales en la dirección de creciente o disminución se están bateando mutuamente y se pagan mutuamente, y en el valor del medio, el tamaño característico típico es típico de este grupo. El valor promedio sirve como una característica del agregado y al mismo tiempo se refiere a un elemento separado: el portador de características de alta calidad del fenómeno. El valor del promedio es muy específicamente, pero simultáneamente y abstracto; Se obtiene por abstracción del individuo aleatorio para cada unidad para identificar que es común, típico, que es típico de todas las unidades y que forma este conjunto. Al calcular el tamaño promedio, el número de unidades de agregado debe ser bastante grande. El valor del promedio se define como la relación de los fenómenos totales al número de unidades del agregado en el grupo. Para datos no marcados, será la aritmética promedio simple:

y para los datos agrupados, donde cada valor de carácter tiene su frecuencia: el peso de la aritmética promedio:

dónde X I. - el valor de la característica; f. i. - La frecuencia de estos signos.

Dado que la aritmética promedio se calcula como la relación de la suma de los valores de la atribución al número total, nunca va más allá de estos valores. La aritmética promedio tiene una serie de propiedades que se utilizan ampliamente para optimizar los cálculos.

1. La suma de desviaciones de los valores individuales de la característica del valor promedio siempre es igual a cero:

Evidencia. NORTE.

Dividiendo la izquierda y la derecha.

2. Si los valores de la función (x i) cambian a k.veces, entonces la aritmética promedio también cambiará en x.hora.

Evidencia.

La aritmética promedio de los nuevos signos del signo indicará x, entonces:

Permanente 1 / k.puede sacar la cantidad de la cantidad, y luego obtendremos:

3. Si desde todos los signos del signo. X. i. Reste o agregue el mismo número constante, entonces la aritmética promedio disminuirá o aumentará esta cantidad.

Evidencia.

El promedio de las desviaciones de los valores característicos de un número constante será igual a:

De la misma manera, se demuestra en el caso de agregar un número constante.

4. Si las frecuencias de todos los signos de la señal reducen o aumentan en nORTE.una vez, el promedio no cambiará:

En presencia de datos sobre el volumen total y los valores conocidos de la característica, pero las frecuencias desconocidas, para determinar el promedio, use la fórmula de mediana rayos ponderados.

Por ejemplo, hay datos sobre los precios de las ventas de repollo y un ingreso total para varios plazos (Tabla 1).

Tabla 1.

Precio de venta de repollo y ingresos generales para varios plazos de implementación


Dado que el precio promedio representa la relación de los ingresos totales al volumen total del repollo, el número de repollo vendido se debe determinar primero. dIFERENTE TIEMPO La implementación como proporción de ingresos al precio, y luego defina el precio promedio del repollo realizado.

En nuestro ejemplo, el precio promedio será:

Si se calcula en este caso, el precio promedio de la implementación de la aritmética promedio es simple, obtendremos un resultado diferente que la posición real también buscará y exagere el precio promedio de venta, ya que el hecho de que caiga una gran parte en la implementación. en un repollo tardío con un precio más bajo.

A veces, se requiere determinar el valor promedio cuando los valores de caracteres se dan en forma de números fraccionarios, es decir, números de enteros inversos (por ejemplo, al estudiar la productividad a través del indicador de retorno, la intensidad del trabajo). En tales casos, es recomendable utilizar la fórmula armónica media:

Por lo tanto, el tiempo promedio requerido para la fabricación de una unidad de productos es el armónico promedio. Si x 1 \u003d 1/4 horas, x 2 \u003d 1/2 horas, x 3 \u003d 1/3 horas, luego la armónica promedio de estos números es:

Para calcular el valor promedio de las relaciones de dos indicadores idénticos, como las tasas de crecimiento, se aplica un promedio geométrico, calculado por la fórmula:

donde x 1 X 2 ...? ... x 4 - la proporción de dos de los mismos nombres, por ejemplo, las tasas de crecimiento de la cadena; nORTE.- La población de la relación de las tasas de crecimiento.

Los valores promedio considerados tienen la propiedad del Carranty:

Deje que, por ejemplo, tenga los siguientes valores. H.(20; 40), las vistas previamente consideradas de los valores promedio serán iguales:

Al estudiar la composición del agregado sobre la base típica, puede ser juzgado por el llamado promedio estructural: la moda y la mediana.

Mozose llama el significado más común de la señal en el agregado.En las filas de variación de intervalo, el intervalo modal es el primer hallazgo. En el intervalo modal encontrado, la moda se calcula por la fórmula:

donde x 0 - línea de fondo intervalo modal; d -la magnitud del intervalo; F 1, f 2, f. 3 - Frecuencias de los intervalos pre-modales, modales y postal.

El modo de moda en la fila de intervalo es bastante simple se puede encontrar sobre la base del gráfico. Para hacer esto, en la columna más alta del histograma de los límites de dos columnas adyacentes pasan dos líneas. Desde el punto de intersección de estas líneas, se reduce la perpendicular al eje de abscisa. El valor del atributo en el eje de abscisa y será mod (Fig. 2).


Higo. 2.

Para resolver problemas prácticos, el mayor interés suele ser una moda, expresada en forma de un intervalo, y no es un número discreto. Esto se explica por el diseño de la moda, que debe identificar los tamaños más comunes del fenómeno.

El promedio es el valor típico de todas las unidades de agregado homogéneo. La moda también es un valor típico, pero determina el tamaño de la característica característica de una parte significativa, pero aún no toda la totalidad. Es de gran importancia para resolver algunas tareas, por ejemplo, para predecir qué tamaños de zapatos, la ropa debe diseñarse para la producción en masa, etc.

Mediana- El valor del letrero ubicado en el centro de la fila clasificada. Indica la distribución central de las unidades del agregado y lo divide en dos partes iguales.

La mediana es la mejor característica de la tendencia central, cuando los límites de los intervalos extremos están abiertos. La mediana es una característica más aceptable del nivel de distribución y en el caso de que existan valores excesivamente grandes o excesivamente pequeños que proporcionan fuerte influencia En el valor promedio, y en la mediana - no. La mediana, además, tiene una propiedad de un mínimo lineal: la suma de los valores absolutos de las desviaciones de la característica del signo en todas las unidades del agregado del mínimo mediano, es decir.

Esta propiedad es de gran importancia para resolver algunas tareas prácticas, por ejemplo, para calcular la más corta de todas las distancias posibles para diferentes tipos de transporte, para acomodar las estaciones de mantenimiento para que la distancia a todas las máquinas atendidas por esta estación sea mínima, etc.

Al encontrar medianos, se determina su número de secuencia en una serie de distribución:

Además, respectivamente, el número de secuencia, la mediana en sí se encuentra en las frecuencias acumuladas. En una fila discreta, sin ningún cálculo, y en la serie de intervalos, el número de secuencia de la mediana, se encuentra el intervalo mediano en las frecuencias acumuladas, en las que el valor mediano ya está determinado por la ingesta más simple de interpolación. El cálculo de la mediana se lleva a cabo por la fórmula:

dónde H. 0 - Límite inferior del intervalo mediano; d.- la magnitud del intervalo; f._ 1 - Frecuencia acumulada al intervalo mediano; f.- La frecuencia del intervalo mediano.

Calcule la magnitud media, la moda y la mediana en el ejemplo de la distribución del intervalo. Los datos se muestran en la tabla. 2.


Por lo tanto, varios indicadores pueden usarse como centro de distribución: medio, moda y mediana,


y cada una de estas características tiene sus propias características. Por lo tanto, para el valor promedio, es característico que todas las desviaciones de ella de los valores individuales de la característica se paguen mutuamente, es decir,

La mediana es característica de que la cantidad de desviaciones de signos individuales de un signo (excluyendo signos) es mínimo. La moda caracteriza el valor de reconocimiento más común. Por lo tanto, dependiendo de los cuales las características estén interesadas en el investigador, y se debe seleccionar una de las características consideradas. En algunos casos, se calculan todas las características.

Su comparación e identificación de relaciones entre ellos ayuda a descubrir las características de la distribución de una u otra serie de variaciones. Entonces, en filas simétricas, como en nuestro caso, las tres características (medio, moda y mediana) sean aproximadamente coincididas. Cuanta más la discrepancia entre la moda y el valor promedio, el número más asimétrico. Se ha establecido que para series moderadamente asimétricas, la diferencia entre la moda y la aritmética promedio es aproximadamente tres veces más alta que la diferencia entre la mediana y la aritmética mediana:

Esta relación se puede utilizar para determinar un indicador por dos conocidos. A partir de esto, se deduce que la combinación de la moda, las medianas y el promedio es importante para las características del tipo de distribución.

1.3. Métodos para estudiar la variación y la forma de la distribución de los signos en un agregado homogéneo.

La descripción estadística del agregado estaría incompleta si se limita a los indicadores de la tendencia central, es decir, los valores promedio, la moda y las medianas, que son como una serie de signos cambiantes de la característica. En algunos casos, el valor de reconocimiento se concentra cerca de algún centro muy estrechamente, en otros casos, existe una dispersión significativa, aunque el valor promedio puede ser el mismo. En este sentido, el valor promedio como un indicador de la tendencia central no da una característica exhaustiva del agregado común. Hay una necesidad de estudiar la naturaleza de la dispersión de un rasgo. Aunque las desviaciones del promedio y están reguladas por comunes para todas las unidades del conjunto de razones por las razones del promedio, pero al mismo tiempo se deben a razones individuales. Por ejemplo, las desviaciones de la productividad laboral de los trabajadores individuales que trabajan en una brigada y, por lo tanto, en las mismas condiciones de trabajo, son causadas por condiciones y razones no generales, pero por las circunstancias individuales de los trabajadores y sus calificaciones, la salud, el estado de ánimo , inteligencia, etc. Por lo tanto, el estudio de las desviaciones del tamaño promedio y los patrones de distribución es de gran interés para el investigador. Esto es principalmente importante para estimar la uniformidad del agregado, que caracteriza este valor promedio, ya que la variación en ciertos límites se caracteriza por un conjunto cualitativamente homogéneo. Por lo tanto, cuanto menor sea la variación, el conjunto homogéneo cualitativamente, el más típico del valor promedio que lo caracteriza.

La medición de la variación es de gran importancia y para estudiar la estabilidad de los fenómenos y procesos económicos estudiados. Así que agricultura Es muy importante, no solo para obtener el rendimiento promedio de los cultivos, sino también para garantizar su estabilidad y espacio de tiempo, y para esto necesite aprender a calcular los indicadores de estabilidad, ¡aprenda cómo medir la variación de los fenómenos estudiados. ? 1.25 pero.

Para evaluar la variación, las estadísticas conocen y utilizan varios indicadores. El más simple de ellos es el alcance de la variación calculada por la fórmula: x max - x min, es decir, como una diferencia entre el signo máximo y mínimo. Sin embargo, este indicador está lejos de ser perfecto, ya que cuando se construye, solo se involucran los signos extremos de la característica que pueden ser aleatorios.

Más precisamente, es posible determinar la variación de la característica utilizando un indicador que tiene en cuenta la desviación de todos los valores de la característica del promedio. Estos son los llamados indicadores absolutos: desviación lineal mediana pero¿Y desviación cuadrática secundaria? La desviación lineal promedio es la aritmética promedio de los valores absolutos de las desviaciones de los valores individuales de la característica del valor promedio. Pero la cantidad de desviaciones del promedio.

siempre es igual a cero (una de las propiedades del tamaño promedio), por lo tanto, para calcular la desviación lineal promedio, se resumen las desviaciones absolutas sin tener en cuenta su signo:


La desviación cuadrática promedio también puede ser simple y ponderada:

La desviación cuadrática promedio es el indicador más común de la variación, es una desviación lineal ligeramente más grande. Se ha establecido que en distribuciones simétricas o moderadamente asimétricas, la relación entre ellos se puede escribir como:

1,25pero.

También debe tenerse en cuenta que la desviación lineal promedio será mínima si se calcula a partir de la mediana, es decir:

La desviación cuadrática promedio es mínima al calcularla desde la aritmética media, la misma se refiere a la dispersión, que es el cuadrado de la desviación cuadrática promedio.

Dispersión

se usa ampliamente en el análisis de la dispersión, pero no como una medida de variación, ya que su dimensión no corresponde a la dimensión de la característica.

Considere el cálculo de la desviación media lineal y media cuadrada en el ejemplo de los datos dados en la tabla. 3.

Tabla 3.

Análisis del tiempo de procesamiento de partes por trabajadores de dos brigadas.


El número promedio de tiempo de procesamiento es de 124 min en ambas brigadas. Para la primera brigada x 1 \u003d 992/8 \u003d 124m. Y para el segundo - x 2 \u003d 1240/10 \u003d 124 min.

Los valores medianos también son los mismos en ambas brigadas. Entonces, para la primera brigada de HM \u003d (116 + 132) / 2 \u003d 124 min. Para la segunda brigada - HM \u003d (122 + 126) / 2 + 124 min

Los valores modales en este caso no se pueden definir, ya que no se repite cada uno de los signos de signos.

Sobre la base de los resultados obtenidos, se puede concluir que ambos agregados se caracterizan por los mismos indicadores del centro de distribución, sino que pueden diferir en la naturaleza de la dispersión de los valores individuales del atributo en torno a estos centros.

Para la característica de dispersión, calculamos la desviación lineal promedio. Para la primera brigada:


La comparación de las desviaciones promedio lineales y medias cuadráticas indica que las variaciones del tiempo de procesamiento en la primera brigada son significativamente más altas que en la segunda brigada.

También se debe tener en cuenta que la desviación cuadrática promedio en ambos casos es algo más grande que la desviación lineal promedio:

1 \u003d 1,22a 1;

2 \u003d 1,20A 2.

Esto sugiere que estamos tratando con una distribución moderadamente asimétrica.

Los parámetros considerados de la variación (variación de la variación, la desviación lineal promedio, la desviación promedio cuadrática) hacen posible comparar el grado de homogeneidad de varios conjuntos, pero en relación con una sola característica, ya que estos se denominan valores que tienen Las unidades de medida igual que el signo.

Sin embargo, a menudo el investigador tiene que comparar las variaciones de varios signos, y por lo tanto, estos indicadores de la variación no se pueden utilizar.

Para la característica de la variación de varias características, los indicadores relativos de la variación dada a una base se calculan, es decir, expresados \u200b\u200ben porcentaje (la fracción de la variación de la variación, la desviación lineal promedio y la desviación cuadrática promedio) desde el promedio. Valor del signo estudiado.

Estos son el llamado coeficiente de oscilación, desviación relativa y coeficiente de variación.

El coeficiente de oscilación se calcula por la fórmula:


En nuestro ejemplo, estos indicadores componen:


Todos los parámetros relativos calculados de variaciones también muestran una variación más fuerte del tiempo de procesamiento de las partes al trabajar primera brigada en comparación con la segunda, donde el tiempo de procesamiento promedio es más objetivo, característico más típico del trabajo de esta brigada en su conjunto, es decir, La segunda brigada como una totalidad es más uniforme.

Los indicadores relativos de la variación, como ya se señalan, le permiten comparar el grado de variación de las características que tienen las mismas unidades de medición, pero diferentes niveles de medio. Por ejemplo, el rendimiento de los cultivos de grano y las papas, aunque tienen las mismas unidades de medición, pero en indicadores absolutos de la variación de estos signos serían incorrectamente, ya que los niveles de grano y las papas son muy diferentes. Entonces, por ejemplo, en la región, la desviación sólida-cuadrada fue: de acuerdo con el rendimiento de los centavos de RYE - 5 con hectáreas (C / ha) y el rendimiento de las papas - 20 C / ha, y el rendimiento del centeno. Fue 25 C / ha, y papas - 200 c / ha. El coeficiente de variación es respectivamente igual a:

Esto significa que en el rendimiento de las papas, la combinación de las granjas de esta área es más uniforme que el rendimiento del centeno, es decir, el rendimiento de las papas es más estable que el rendimiento del centeno.

La comparación de los indicadores absolutos de variaciones de la misma característica de los diferentes agregados a veces conduce a una conclusión diferente a la comparación de los indicadores relativos de la variación.

Por lo tanto, si en una tasa de variación absoluta es mayor que en otra, y el nivel promedio del rasgo en estudio también es significativamente mayor que en otro, entonces la tasa de variación relativa puede ser menor.

Por ejemplo, si la desviación quadrática promedio del rendimiento del centeno en un área era de 5 C, en otra: 3 C, y el rendimiento medio mismo, respectivamente, fue de 25 y 10 C / ha, luego los parámetros relativos del plomo de la variación a una opinión.

En consecuencia, el crecimiento de los rendimientos asociados con cierto aumento en el indicador absoluto de la variación puede no reducir su estabilidad.

Los indicadores de variación relativa también son necesarios para comparar la variación de varias características que tienen diferentes unidades de medición, ya que los parámetros absolutos de la variación en este caso no se pueden usar como una medida de variación.

Por ejemplo, al comparar la variación del rendimiento y el costo de uno u otro cultivo, no se pueden usar indicadores de variación absolutas, ya que tendrán diferentes unidades de medición: C / ha y frotar. Por 1 t. En este caso, es recomendable utilizar la desviación cuadrática promedio para calcular la llamada desviación normalizada:

caracterizando la desviación de los valores individuales de la característica del promedio ( Xi?X.) y cayendo por unidad de desviación mediana cuadrática. La desviación normalizada permite comparar las desviaciones expresadas en varias unidades de medición. Las desviaciones casi normalizadas varían en el rango de 0 a 3.

Sin embargo, en las unidades agregadas, individuales que tienen t\u003e3. Esto indicará la heterogeneidad del agregado, y dichas unidades del agregado son recomendables para excluirse como anómalas, atípicas para la totalidad.

Si la totalidad es pequeña (3? nORTE.? 8), entonces la uniformidad del agregado, es decir, verificar que la vida útil de los datos primarios se puede llevar a cabo de la siguiente manera. Calcule el indicador que caracteriza la relación de la diferencia entre los valores dudosos y vecinos del rango de rango en orden de creciente fila a la diferencia entre los valores extremos, es decir:

si hay dudas de la primera señal del signo, y:

si hay una duda de la última señal de este último.

El valor calculado P.comparación con su valor de la tabla para un número dado de observaciones y el nivel de probabilidad. Si un P. F\u003e. P. Pestaña, entonces el valor dudoso debe excluirse del procesamiento. Si P. F.< P. Pestaña, entonces el valor dudoso no se descarte. Considere esta técnica en el ejemplo.

Supongamos que se obtienen los siguientes resultados del contenido de cenizas en muestras de alimentación en porcentaje: 2.25; 2,19; 2,11; 2.38; 2.32 y 3.21.

Hemos analizado los datos en orden ascendente de sus valores: 2.11; 2,19; 2.25; 2.32; 2.38; 3,21.

Calcular:

Tabla 4.ValoresP. dependiendo del grado de fiabilidad (P)

y el número total de signos (n)

Valor P. Pestaña \u003d 0.70. En consecuencia, el valor de 3,21 debe ser excluido como un atípico para una población dada.

Con el número de valores de la característica más de tres (y más de ocho), puede usar otra metodología para determinar la idoneidad de los datos primarios. En todos los valores, la característica en el agregado primero calcula el valor promedio (X) y la desviación cuadrática promedio (?), Luego, sobre la base de la diferencia (excluyendo un signo) entre el valor de desviación máximo (X MAX) y el promedio El valor del criterio R MAX se encuentra en la fórmula:

El valor de R MAX se compara con su valor de tabla con un número dado de valores de signo para la probabilidad p \u003d.0.99 (Tabla 5).

Si r max > TABLA R, el valor dudoso (X) debe excluirse, si R MAX< R табл, то значение (X max) следует принимать в расчет.

Para n\u003e¿20 R indicador máximo? 3 y la condición de la idoneidad es:

Tabla 5.Valores r max Para la fiabilidadp \u003d. 0.99 en acción

de la cantidad de unidades de agregadonORTE.


Vamos a pasar al ejemplo anterior y calcular:


Al calcular el tamaño promedio y la desviación cuadrática promedio, se utilizan todos los signos. Luego contamos:

Para n \u003d6, Tabla R _ 2,13; Desde 2.22\u003e 2.13, el valor dudoso de 3,21 debe ser descartado del procesamiento estadístico. Si la duda no causa uno, sino varios valores, luego calcula primero los cálculos solo para uno de ellos (la más definir). Después de su excepción, el cálculo se repite para el próximo valor dudoso, calculando el recién X.¿y?.

Al verificar la vida útil utilizando cualquier técnica, no se puede excluir más de un tercio de las unidades del agregado.

Si una excepción está sujeta a más de un tercio de todas las unidades de agregado, entonces este conjunto se considera que no es uniforme.

Al estudiar fenómenos económicos, se producen estadísticas con una variedad de variaciones de características que caracterizan las unidades individuales de agregado. Los valores de los signos varían bajo la influencia de varias causas y condiciones. Cuantas más diversas se encuentran las condiciones que afecten el tamaño de la característica, mayor será su variación.

Los indicadores considerados de la tendencia central e indicadores de la variación son casos particulares de algún sistema unificado de características estadísticas de la distribución. Un solo sistema característico puede estar representado por los momentos de la distribución estadística. Si, al calcular los momentos de una constante arbitraria, se recibe la aritmética promedio, entonces tales momentos se llaman Central.

La fórmula general de los momentos centrales de K-TH PEDIDO tiene la forma:

En otras palabras, los momentos centrales de la orden K-Th son la aritmética promedio. k - X.grados de desviaciones de los signos de la señal de la aritmética media.

1. El momento central de la orden cero es igual a uno k \u003d. 0:

2. El momento central del primer orden es cero en k \u003d. 1:

3. El momento central del segundo orden es la dispersión de esta distribución cuando k \u003d. 2:

4. El momento central del tercer orden tiene la forma:

Si la distribución es simétrica, no es difícil ver que el momento central del tercer orden es cero, ya que las desviaciones menos ( X. i. - X.) 3 En la rama izquierda de la distribución se equilibran con desviaciones positivas en el lado derecho. Tal reembolso mutuo de las desviaciones en las filas de distribución simétrica conservan la fuerza para todos los puntos centrales extraños.

Conferencia 1.3.

Análisis de exploración de datos.

Los principales puntos de monitoreo del análisis de exploración.

Diapositiva 2.

El propósito del análisis de exploración es presentar los datos observados de una forma compacta y simple que le permita identificar los patrones y las comunicaciones existentes en ellos. El análisis exploratorio incluye la transformación de datos y los métodos de representación visual, identificando valores anormales, una estimación aproximada del tipo de distribución, alisado.

El análisis de exploración a plazo también se aplica en un sentido más amplio que los datos de preprocesamiento. Por ejemplo, en los procedimientos multidimensionales, como el análisis factorial, la escala de datos multidimensionales, el propósito del análisis de exploración, además del análisis de los datos primarios, es determinar el número mínimo de factores que reproducen satisfactoriamente la matriz de covarianza (correlación) o el Matriz de los nombres de las variables observadas.

Diapositiva 3.

Según la conferencia anterior, creemos que el investigador tiene observaciones en forma de "objeto de objeto" o el vector de una característica y ausencia parcial o completa de una información a priori sobre el mecanismo causal de estos datos. Al analizar, suelen surgir las siguientes preguntas.

1. ¿Qué procesamiento se sometió a observaciones?

2. ¿Qué modelo elegir?

3. ¿Qué conclusiones se pueden hacer?

Para seleccionar un método de procesamiento, es necesario un modelo de los datos observados. Antes de realizar la observación, es necesario especificar la naturaleza y las propiedades del valor medido, es decir. Use una información a priori. Cuanto más completa sea una información a priori, más precisa y al menos puede obtener los resultados necesarios. Por lo tanto, la formalización de los métodos para la recopilación, el procesamiento y el uso de información priori es de gran importancia. Sobre la base del análisis de esta información, se construye el modelo del fenómeno estudiado, se selecciona el equipo, se está desarrollando la técnica del experimento.

Diapositiva 4.

Para obtener más información completa sobre el fenómeno estudiado, un análisis primario de los datos llamados análisis exploratorio (análisis de datos exploratorios). El análisis de exploración es necesario en todos los casos, con la excepción de las tareas muy simples. Por ejemplo, la selección de la familia de modelos del fenómeno investigado en la mayoría de los casos debe preceder a un análisis preliminar y gráfico de los datos. Para ilustrar esto, considere el modelo de una regresión lineal unidimensional simple. De acuerdo con este modelo, se asume que las observaciones. nORTE. Parejas ( x. 1 ,Y 1), …, (x n, y n) Puede ser descrito por la ecuación



Como un análisis preliminar mínimo, puede considerar el calendario de puntos de dispersión ( x J.,Y j.). Como resultado del análisis de los gráficos, puede concluir la constancia de la dispersión. Y yo, Sobre la viabilidad de transformar las variables, identificar la presencia de observaciones anormales, excluir la investigación especial. Después de dicho procesamiento de datos, suponiendo que el modelo (1) sea cierto, es necesario estimar los parámetros B 0, B 1 y realizar un análisis gráfico de los residuos entre los valores observados y estimados. Y yo. Sobre la base de este análisis, puede confirmar u ofrecer otro modelo.

Diapositiva 5.

Considerar los procedimientos de reconocimiento más simples relacionados con datos de preprocesamiento. Complementan los métodos establecidos en la primera conferencia al considerar formas específicas de envío de datos. Aclaremos la necesidad de análisis de exploración sobre temas de evaluación específicos.

Evaluación media. Considerar el ejemplo más simple Estimaciones del promedio verdadero mETRO.variable aleatoria independiente x. Por selección nORTE.. Si se calcula la estimación del promedio, surge la pregunta: "¿Cuánto es la estimación del verdadero significado verdadero?" Como un verdadero significado mETRO. No está disponible, luego se determina el intervalo de confianza, que con una probabilidad dada cubre el verdadero significado.

La actitud tiene t-distribución de estudiantes. Muy a menudo construye intervalos de confianza del 95%, creyendo que el valor t. Se distribuye normalmente. Para la distribución normal, el valor. t. será igual a 1.96, mientras que para t-distribución con el número de grados de libertad. v. (v. = nORTE. - 1) igual a 1; 3 y 12, la cantidad t., respectivamente, es 12.7; 4.3 y 2.18. por lo tanto con pequeñas muestras Utilizando la distribución normal en su lugar t-las distribuciones conducen a grandes errores en la estimación del intervalo. Una gran diferencia en las estimaciones de intervalo se asocia con la diferencia. t-distribuciones de lo normal en las colas de la distribución.

Diapositiva 6.

Las colas de distribuciones reales tienen, por regla general, una mayor variación que la distribución normal. La naturaleza de la diferencia entre la distribución real de la normalidad puede ser diferente:

1. La mayoría de las mediciones se llevan a cabo en unidades específicas, por ejemplo, en miligramos, micrones y sus valores son limitados. Para la ley de distribución normal, los valores se cambian de: ¥ hasta + ¥.

2. Asimetría afilada de algunas distribuciones (por ejemplo, C 2, F.) Con muestras pequeñas, bordes nublados a una distribución uniforme.

3. Comportamiento en "colas" de distribución. Uno o más valores distinguidos dramáticamente de la masa principal de observaciones pueden cambiar significativamente la dispersión promedio y catastrófica. Los valores injustivos son casi inevitables en los datos experimentales. El número de tales valores en los datos médicos alcanza hasta un 30%, y en experimentos especialmente entregados, es aproximadamente el 1% de todos los datos.

La evaluación del promedio medio tiene grandes ventajas: la influencia de los agregados generales que tienen expectativas matemáticas, la suficiencia, la integridad y, en consecuencia, la eficiencia total para las distribuciones normales, el Poisson, la gamma y con las condiciones suficientemente amplias, una distribución conveniente de asintóticamente normal, que en muchos casos se logra aproximadamente con Muestras medianas nORTE.. También hay desventajas de tal evaluación: su efectividad es cero para una distribución uniforme, y para algunas muestras, una observación inyectable ya puede hacer una evaluación media-brimética de inútiles.

Diapositiva 7.

Si la normalidad de la distribución se rompe por datos liberados, entonces es recomendable aplicar robusto(Robusto - fuerte, saludable, docena) estimados. Un ejemplo de una estimación robusta del promedio, tolerante a la desviación de las colas de distribución de la normalidad es mediana Distribución. Es, como el valor medio de las observaciones, no depende de una o más mediciones inverosímiles más grandes.

Mediana, como robusta, no es una evaluación efectiva de la evaluación promedio de la pensión alimenticia para la distribución normal.

Diapositiva 8.

Medir dispersión. En la práctica, se utilizan las siguientes medidas para caracterizar la varianza de los datos: la desviación media de la media de la media de S o su dispersión cuadrada, así como las estimaciones RAMAN R. De estos valores se denotan respectivamente. S., S. 2 , R.. Estimación de la dispersión S. Se usa ampliamente, y es útil en transformaciones de tipo lineal. Y \u003d B + A X.Para algunas distribuciones S 2 \u003d ∞, y el canje es aplicable; Las desviaciones grandes en las observaciones también pueden hacer que la estimación de la dispersión sea muy grande, lo que conduce a un tipo de distribución que no sea el verdadero.

La evaluación de dispersión sobre el alcance selectivo se refiere a procedimientos rápidos. Debido a la aparición de beneficios computacionales de alta velocidad de la computadora R. comparado con S. Se están volviendo cada vez más importantes, pero hay beneficios asociados con la simplicidad del cálculo. R. y la capacidad de aplicar esta estadística para no especialistas. Entonces, el alcance desapareció casi por completo. S. De los sistemas de control de calidad, en los que se toman las muestras de pequeños volúmenes después de intervalos de tiempo cortos y las tarjetas de control se basan en valores promedio y columpios.

Cabe señalar que el alcance se puede utilizar para reconocer grandes errores inverosímiles en los cálculos. S. Para muestras de cualquier población general. Se desprende de la relación limitada S / R..

Diapositiva 9.

Resumiendo las estimaciones consideradas, es necesario concluir que existen razones para no manejar todos los datos por igual. Antes de continuar con el procesamiento de observaciones, es necesario verificar la uniformidad de la muestra y, si es heterogénea, luego se divide en capas. La presencia de observaciones claramente distinguidas también viola la uniformidad de la muestra. En este caso, uno de los enfoques se basa en detectar y eliminar estos datos asignados.

Eliminación de observaciones distinguidas bruscamente garantiza la seguridad de la evaluación, pero proporciona eficiencia solo si el límite claro se determina entre datos remotos y no remotos. Una zona de datos "dudosa" es adyacente a datos explícitamente distinguidos (Fig. 1), que no siempre se puede reconocer. Es fácil permitir la eliminación incorrecta y la conservación irrazonable, para esperar una eficiencia completa incluso idealmente después de la eliminación. Estas dificultades se pueden superar aplicando métodos de estimación robustos. Los algoritmos robustos aseguran la eficiencia de seguridad y evaluación en presencia de datos distinguidos y dudosos.

Higo. 1. Densidad de distribución. Datos de partición en tres grupos.

Diapositiva 10.

Sobre la calidad de los resultados. El propósito del estudio es responder a la pregunta: puede aplicar los resultados en la práctica. La idoneidad de los resultados obtenidos puede estimarse mediante métodos rechazados. Los métodos más utilizados por la recolección simple y doble.

Vuelva a comprobar. La verificación del modelo obtenido se lleva a cabo en datos que no sean aquellos para los cuales se calculan los parámetros del modelo. En este caso, puede seleccionar la selección de observaciones en dos (o más) partes. Una parte se usa para su procesamiento, y la otra es verificar. Después de eso, la parte se puede cambiar en lugares, lo que puede dar algunas más información, aunque existen ciertas dificultades derivadas de la conexión entre las dos evaluaciones de calidad del modelo.

Esta recepción se puede llevar a cabo para múltiples divisiones de datos, por ejemplo, es posible dividir la selección por 10 partes iguales. En cualquier 9 de ellos, está evaluando el modelo, y en la parte restante para verificar. Después de eso, repita el procedimiento 9 veces, tomando nuevas 9 partes cada vez. En algunos casos, el procedimiento se complica. El cálculo se realiza de acuerdo con todos los datos sin una observación, y verificando el valor descartado. Los cálculos se repiten para cada una de las observaciones de la muestra. No debe ser seducido por los resultados de un cheque simple, ya que la muestra de control siempre será más como un trabajo en la muestra de objetos para los cuales se utilizarán los resultados de la investigación.

Doble vuelva a verificar. Una verificación de datos es excelente, tanto de aquellos en los que se construyeron el modelo y los que se utilizan para calcular los parámetros del modelo. Los médicos tal método de comprobación llamado "dos veces ciego". "Los datos frescos" para la reclamación se pueden recolectar después de seleccionar el modelo y calcular los parámetros. Si la recepción de dichos datos no es posible, puede referirse a los datos de archivo siempre que permanecen desconocidos mientras se construyó el modelo y se calcularon los parámetros de este modelo. Con doble recordamiento, es importante que los datos utilizados para verificar son diferentes de los de los cuales se realizaron las evaluaciones. Puede usar estos años si pueden atribuirse a una vez u otros investigadores.

Diapositiva 11.

Muestras heterogéneas

Los métodos estándar para evaluar cualquier estadística de datos selectivos se basan en el supuesto de que la muestra se toma de una combinación homogénea con la estructura simple de la ley de distribución. Mientras tanto, en la práctica, la muestra se genera a menudo bajo la influencia de varias causas y condiciones, y pueden representarse como una unificación de un determinado conjunto de muestras homogéneas, cada una de las cuales tiene una estructura simple. Por ejemplo, es imposible ser considerado un ingreso homogéneo de los ricos y otros ciudadanos del estado, ya que tienen una base económica diferente; Objetos de varios costos que difieren en las consecuencias económicas nacionales.. Los ejemplos incluyen secuencias inhomogéneas de modelos dinámicos en las tareas de analizar vibraciones en ingeniería mecánica; Sísmogramas en geofísica; Cardiogramas con la frecuencia de los latidos del corazón deteriorada.

La naturaleza de la heterogeneidad puede ser diferente. Por ejemplo, es posible combinarse de agregado con varios medios y dispersión o con el mismo promedio, pero con diferentes dispersiones. Una clase importante de muestras inhomogéneas también forman muestras que contienen uno o más mediciones increíblemente grandes o pequeñas.. Tratamiento de heterogéneo.

Deje que las observaciones constan de tres capas homogéneas, cada una de las cuales se puede describir mediante una regresión unidimensional simple. Estas dependencias se muestran en la FIG. 2, donde directamente son las líneas de regresión de cada totalidad. Si procesa la muestra combinada de estos conjuntos, obtenemos la dependencia de regresión representada en la FIG. 2 punteado recto. Obviamente, la regresión en los datos combinados está privada de cualquier significado.

Para determinar la uniformidad de la muestra, es necesario un análisis significativo detallado de la totalidad estudiada. Este análisis debe basarse en una señal significativa no aleatoria de que el conjunto inicial se puede representar como una combinación de varios agregados homogéneos. Por ejemplo, las declaraciones de impuestos se pueden dividir en grupos en volúmenes de ingresos; instituciones - por el número de empleados; Fincas - para el área total de la tierra y los ingresos brutos. Al separar la muestra en las capas, se requiere responder a las preguntas, cuya característica es mejor producir un paquete, cómo determinar los límites entre las capas, cuántas capas deben ser.

Diapositiva 12.

Separación del agregado inhomogénoso para homogéneo.

Deje que la muestra del conjunto estudiado de x 1, ..., x n, contenga los elementos de dos variables aleatorias independientes con las densidades de las distribuciones f (x, q 1) y f (x, q 2). Denote por A: el conjunto de elementos de muestreo pertenecientes a la primera variable aleatoria, en el conjunto de elementos de muestreo desde el segundo conjunto. Se requiere encontrar estimaciones 1, 2 parámetros desconocidos Q 1, Q 2 y configurar A y B. Para estimar estas cuatro incógnitas, use el método de máxima probabilidad. Desconocidos Q 1, Q 2 y A y en la condición de la maximización de coordenadas de la función de referencia

En cada paso, el valor de la función de probabilidad se maximiza según uno de los desconocidos. 1) < f(x i , 2),. Если f(x i , 1) = f(x i , 2), то оба варианта одинаково правдоподобны, что для непрерывных распределений является маловероятным событием. Далее берем следующий элемент и относим его в то или иное множество. Полученные множества сравниваем с множествами на предыдущем шаге. Если они отличаются, то переходим к шагу 2, в противном случае алгоритм останавливается, и задача считается решенной.

La desventaja del algoritmo es que se detiene en el primer máximo local de la función de probabilidad. En parte, esta desventaja se puede evitar resolviendo el problema en varias particiones iniciales en los subconjuntos A y V. Si los resultados finales para varias condiciones iniciales son diferentes, entonces se toma la solución por la cual el valor de la función de probabilidad es más. De ello se deduce que el algoritmo anterior es aplicable para muestras que contienen más de dos capas.

Verifique el agregado estadístico de homogeneidad utilizando el coeficiente de variación sobre la base del volumen de productos comerciales.

Variación: volatilidad, cambio en el tamaño del signo en un agregado estadístico, es decir. Adopción por unidades de agregado o sus grupos de signos diferentes.

El coeficiente de variación es una medida relativa de variación y representa la relación de la desviación cuadrática promedio al valor promedio de la característica de variación, se calcula por la fórmula:

Desviación cuadrática secundaria;

El signo promedio.

La desviación media cuadrática en el marco de este problema se calcula por la fórmula:

Cuanto menor sea el valor del coeficiente de variación, la uniformidad es el conjunto estadístico. Un conjunto se considera homogéneo si el coeficiente de variación no excede el 33%.

Calcule el coeficiente de variación para toda la totalidad de las empresas sobre la base del volumen de productos comerciales.

Los cálculos se presentan en la Tabla 6.

Tabla 6.

Número de empresa Q - x miércoles. (Q - X Wed) 2
163,3 -757,156 573285,208
236,5 -683,956 467795,810
843,3 -77,156 5953,048
1005,9 85,444 7300,677
696,3 -224,156 50245,912
1031,3 110,844 12286,392
1361,2 440,744 194255,274
1712,9 792,444 627967,493
538,9 -381,556 145584,981
350,4 -570,056 324963,843
2149,9 1229,444 1511532,549
352,8 -567,656 322233,334
1187,1 266,644 71099,023
262,4 -658,056 433037,699
438,8 -481,656 231992,502
1150,5 230,044 52920,242
249,4 -671,056 450316,155
655,3 -265,156 70307,704
2549,5 1629,044 2653784,354
536,8 -383,656 147191,926
311,2 -609,256 371192,874
809,7 -110,756 12266,892
166,7 -753,756 568148,108
2185,1 1264,644 1599324,447
2066,2 1145,744 1312729,314
TOTAL: 12217715,762
920,456
488708,630
699,077
Variación Pricent 0,759

De la mesa vemos que el coeficiente de variación es del 48.7%. Esto significa que el agregado es inhomogéneo, porque Un conjunto se considera homogéneo si el coeficiente de variación no excede el 33%.



Calcule el coeficiente de variación sobre la base del volumen de productos comerciales obtenidos como resultado de una agrupación simple (cláusula 3.1).

Los resultados de los cálculos se presentarán en las Tablas 7,8,9 y 10.

Tabla 7.1-AIA GRUPO.

Número de empresa Volumen de producción comercial (Q), MLN. Q - x miércoles. (Q - X Wed) 2
163,3 -218,146 47587,744
236,5 -144,946 21009,388
696,3 314,854 99132,944
538,9 157,454 24791,714
350,4 -31,046 963,864
352,8 -28,646 820,602
262,4 -119,046 14171,987
438,8 57,354 3289,464
249,4 -132,046 17436,187
655,3 273,854 74995,929
536,8 155,354 24134,818
311,2 -70,246 4934,522
166,7 -214,746 46115,911
TOTAL: 0,000 379385,072
381,446
34489,552
185,714
Variación Pricent 0,487

Tabla 8.2-AIA GRUPO.

Número de empresa Volumen de producción comercial (Q), MLN. Q - x miércoles. (Q - X Wed) 2
843,3 -161,333 26028,44
1005,9 1,266667 1,604444
1031,3 26,66667 711,1111
1187,1 182,4667 33294,08
1150,5 145,8667 21277,08
809,7 -194,933
TOTAL: 119311,3
1004,633
19885,222
141,015
Variación Pricent 0,140

Tabla 9.3-Yay Group,

Número de empresa Volumen de producción comercial (Q), MLN. Q - x miércoles. (Q - X Wed) 2
1361,2 -175,850 30923,223
1712,9 175,850 30923,223
TOTAL: 61846,445
1537,050
20615,482
143,581
Variación Pricent 0,093

Tabla 10. 4º Grupo.

Número de empresa Volumen de producción comercial (Q), MLN. Q - x miércoles. (Q - X Wed) 2
2149,9 -87,775 7704,451
2549,5 311,825 97234,83
2185,1 -52,575 2764,131
2066,2 -171,475 29403,68
TOTAL: 137107,1
2237,675
68553,544
261,827
Variación Pricent 0,117

Conclusiones según datos:

En el 1er grupo, el coeficiente de variación es del 48.7%. Esto significa que el agregado no es homogéneo.

En el segundo grupo, el coeficiente de variación es del 14%. Esto significa que el agregado es homogéneo.

En el 3er grupo, el coeficiente de variación es del 9,3%. Esto significa que el agregado es homogéneo.

En el cuarto grupo, el coeficiente de variación es del 11,7%. Esto significa que el agregado es homogéneo.

¿Te gustó el artículo? Compártelo
Cima