Estadistica

Desde Chavacano de Zamboanga Wikipedia - El Libre Enciclopedia
El normal distribucion, un muy comun densidad de probabilidad, usao extensivamente na el inferencial estadistica.
Ta emplea el descriptivo estadistica con maga diagrama de dispersion y maga grafico de maga linea para mostra con el maga observao relacion entre maga diferente variable, aqui usando con el conjunto de datos flor iris.

El estadistica (del Plantilla:Lang-de, Plantilla:Lit "descripcion de un estado o pais") es el disciplina que ta trata con el recopilacion, organizacion, analisis, interpretacion y presentacion de maga dato. Al aplica con el estadistica a un cientifico, industrial o social problema, convencional empeza con un estadistico poblacion o probabilistico modelo que estudia. El maga poblacion puede maga diverso grupo de maga persona o maga objeto como "todo el maga residente de un pais" o "cada atomo componiendo con un cristal". Ta trata el estadistica con cada aspecto de maga dato, incluio el planificacion del recopilacion de maga dato na maga termino del diseño de maga encuesta y maga experimento.

Cuando irrealizable maga dato de un censo, ta recoge el maga estadistico con maga dato desarrollando con maga diseño de maga especifico experimento y maga muestreo de maga encuesta. Ta asegura el representativo muestreo que razonablemente extensible maga inferencia y maga conclusion del muestra al total poblacion. Ta involucra un experimental estudio con el recopilacion de maga medida del sistema na estudio, el manipulacion del sistema, y entonces el recopilacion de maga adicional medida utilizando el mismo procedimiento, para determina si ya modifica el manipulacion con el maga valor del maga medida. Por el contrario, hinde ta implica un observacional estudio con experimental manipulacion.

Ta emplea el analisis de maga dato con dos maga principal estadistico metodo: (1) el descriptivo estadistica, que ta resumi con el maga dato de un muestra utilizando con maga indice como el media o el tipico desviacion. y (2) el inferencial estadistica, que ta saca con maga conclusion del maga dato sujeto a maga aleatorio variacion (p.ej. maga error de observacion, o variacion del muestreo). Na el mayoria del maga situacion, ta trata el descriptivo estadistica con dos maga conjunto de maga propiedad de un distribucion (muestra o poblacion): ta trata el medida de centralizacion (o ubicacion) de caracterizar con el central o tipico valor del distribucion, mientras que ta caracteriza el medida de dispersion (o variabilidad) con el grado na que ta divergi el maga miembro del distribucion del de ellos centro y entre si. Ta hace posible el representacional marco del teoria del probabilidad —que ta trata con el analisis de maga aleatorio fenomeno— con maga inferencia na el matematico estadistica.

Ta involucra un estandar estadistico procedimiento con el recopilacion de maga dato llevando a un prueba del relacion entre dos maga conjunto de maga estadistico dato, o entre un conjunto de maga dato y maga sintetico dato extraio de un idealizao modelo. Propuesto un hipotesis para la estadistico relacion entre el dos maga conjunto de maga dato, y comparao esto como un alternativo a un idealizao nulo hipotesis de ningun relacion entre el dos maga conjunto de maga dato. Un rechazo o refutacion del nulo hipotesis realizao usando con maga estadistico prueba que ta cuantifica con el sentido na el que probable como falso el nulo, a traves del maga dato usao na el prueba. Trabajando desde un nulo hipotesis, reconocio dos maga basico forma de error: maga error de tipo I (un rechazo del nulo hipotesis cuando veridico este, llevando a un "falso positivo") y maga error de tipo II (hinde rechazao el nulo hipotesis cuando gayot falso este, llevando a un "falso negativo"). Manada problema asociao ya con este representacional marco, desde el obtencion de un suficiente muestral tamaño, hasta el especificacion de un adecuao nulo hipotesis.

Ademas, al error susceptible el maga proceso de estadistico medicion, na cuanto al maga dato ansina generao. Manada de este maga error clasificao como aleatorio (ruido) o sistematico (sesgo) pero tambien posible otro maga tipo de error (p.ej. un pifia, como el notificacion de maga incorrecto unidad por parte de un analista). Puede el presencia de maga faltante valor o censura lleva a maga sesgao estimacion, y desarrollao maga especifico tecnica para trata con tal maga problema.

Introduccion[revisa | revisa codigo]

El estadistica es un matematico cuerpo del ciencia que ta referi al recopilacion, analisis, interpretacion o explicacion, y presentacion de maga dato, o como un rama del matematica. Segun algun gente, el estadistica es un distinto matematico ciencia imbes de un rama del matematica. Masquen ta emplea maga dato manada cientifico investigacion, por lo general ta trata el estadistica con el uso del maga dato en el contexto del incertidumbre, y el toma de maga decision frente al incertidumbre.

Matematico estadistica[revisa | revisa codigo]

El matematico estadistica es el aplicacion del matematica al estadistica. Ta usa ele con manada matematico tecnica, incluio el matematico analisis, el lineal algebra, el estocastico calculo, maga diferencial ecuacion y el teoria del probabilidad na el teoria del medida.

Historia[revisa | revisa codigo]

El Ars Conjectandi de si Bernoulli fue el primer obra que ya trata con el teoria del probabilidad como actualmente entendio.

Ta remonta maga formal discusion acerca del inferencia al islamico matematica y al maga criptografo, durante el Edad de Oro del islam entre el aca-8 y aca-13 maga siglo. Ya escribi si Jalil ibn Ahmad (717–786) con el Libro de maga criptografico mensaje, que ta contene con uno del maga primer uso del maga permutacion y del maga combinacion, para enumera con todo el maga arabe idioma palabra con y sin maga vocal. Ya dale el Manuscrito sobre el desciframiento de maga criptografico mensaje de si al-Kindi con un detallao descripcion del uso del analisis de maga frecuencia para descifra con maga cifrao mensaje, un temprano ejemplo del inferencial estadistica para el descodificacion. Mas tarde ya hace si Ibn Adlan con un importante contribucion al uso del tamaño del muestra para el analisis de maga frecuencia.

Masquen ta introduci el italiano erudito si Girolamo Ghilini na 1589 con el termino estadistica (Plantilla:Lang-it) con referencia a un coleccion de maga hecho e informacion sobre un estado, el aleman Godofredo Achenwall na 1749 fue quien ya empeza a usa con el termino (Plantilla:Lang-de) como un coleccion de cuantitativo informacion, na el moderno uso de este ciencia. Ta remonta a 1663 el mas antiguo escrito que ya contene con estadistica na Europa, con el publicacion de Maga natural y politico observacion sobre el maga cuento del mortalidad (English: Natural and Political Observations Made Upon the Bills of Mortality) por si John Graunt. Ya centra el maga temprano aplicacion del estadistico pensamiento na el necesidad del maga estados de basa con el de ellos maga politica na maga demografico y economico dato, de ahi el etimologia stat- del palabra estadistica.

Ya realiza si Carl Friedrich Gauss con maga gran contribucion al maga probabilistico metodo llevando al estadistica.

Ya desarrolla el maga matematico fundacion del estadistica durante maga discusion sobre maga juego de azar entre tal maga matematico como si Gerolamo Cardano, Blaise Pascal, Pierre de Fermat, and Christiaan Huygens. Masquen examinao ya el idea de probabilidad en el antiguo y medieval derecho y filosofia y (como el obra de si Juan Caramuel), ya toma forma el teoria del probabilidad lang a maga final del aca-17 siglo, particularmente na el postumo obra de si Jacob Bernoulli Ars Conjectandi. Este el primer libro donde el reino del maga juego de azar y el reino de lo probable (ocupao del opinion, el evidencia y el argumento) combinao y sometio a matematico analisis. Ya describi si Adrien-Marie Legendre con el metodo de maga minimo cuadrao por primera vez na 1805, masquen baka ta emplea si Carl Friedrich Gauss conele una década antes, na 1795.

Si Karl Pearson, un fundador del matematico estadistica.

Ya emerge el moderno campo del estadistica a maga final del aca-19 y maga principio del aca-20 maga siglo na tres maga etapa. Ya lidera el primer onda, a maga principio del siglo, el obra de si Francis Galton y si Karl Pearson, que ya transforma con el estadistica na un rigoroso matematico disciplina usao para el analisis, no solo na el ciencia, sino ademas na el industria y el politica. Ya inclui el maga contribucion de si Galton con el introduccion de tal maga concepto como el tipico desviacion, el correlacion, el analisis del regresion y el aplicacion de este maga metodo al estudio del variedad del maga humano caracteristica; entre otro maga, el altura, el peso y el longitud del maga pestaña. Ya desarrolla si Pearson con el coeficiente de correlacion de si Pearson (definio como un producto-momento), el metodo de maga momento (estadistica) para el ajustamiento de maga distribucion a maga muestra, y el distribucion de si Pearson, entre manada otro cosa. Ya funda si Galton y si Pearson con Biometrika como el primer revista del matematico estadistica y del bioestadistica (na aquel entonces llamao biometria), y ya funda si Pearson con el primer universitario departamento de estadistica na el mundo, al University College de Londres.

Ya inicia si William Sealy Gosset con el segundo onda del maga decada 1910 y 1920, y ya alcanza este onda al de suyo culminacion na el maga perspicacia de si Ronald Fisher, que ya escribi con el maga libro de texto que ya defini con el academico disciplina na maga universidad alrededor del mundo. El maga mas importante publicacion de si Fisher fue el de suyo seminal papel de 1918, The Correlation between Relatives on the Supposition of Mendelian Inheritance (el primero na usa con el estadistico termino varianza), el de suyo clasico obra de 1925, Statistical Methods for Research Workers y el de suyo obra de 1935, The Design of Experiments, donde ya desarrolla si Fisher con maga rigoroso modelo para el experimental diseño. Ya origina ele con tal maga concepto como el suficiencia, el auxiliar estadistica, el lineal discriminante analisis y el informacion de si Fisher. Ademas ya acuña si Fisher con el termino nulo hipotesis durante el experimento del catador de te, que "nunca probao o establecio, pero baka desprobao, na el curso del experimentacion" (English: is never proved or established, but is possibly disproved, in the course of experimentation). Na el de suyo libro de 1930, The Genetical Theory of Natural Selection, ya aplica ele con el estadistica a manada biologico concepto como el principio de si Fisher (descrio por si A. W. F. Edwards como "siguro el mas celebrao argumento na el evolutivo biologia", English: probably the most celebrated argument in evolutionary biology) y el Modelo de runaway sexual seleccion de si Fisher, un concepto na el sexual seleccion sobre un efecto de positivo alimentacion incuntrao na el evolucion.

Ya emerge el tercero y final onda —que principalmente ya mostra con el perfeccionamiento y ampliacion de maga anterior desarrollo— del colaborativo obra de si Egon Pearson y si Jerzy Neyman durante el decada 1930. Ya introduci ellos con el concepto de un error de tipo II, el estadistico poder y el maga intervalo de confianza. Na 1934 ya demostra si Jerzy Neyman que el estratificado aleatorio muestreo fue por lo general un mejor metodo de estimacion que el intencional muestreo (un cuota).

Hoy dia, aplicao el maga estadistico metodo na todo el maga campo que ta involucra con el toma de maga decision, y para hace con maga preciso inferencia a partir de un conjunto de maga cotejao dato, y para toma con maga decision frente al incertidumbre basao na el estadistico metodologia. Ya acelera el uso de maga moderno computadora con maga estadistico calculo a gran escala, ademas de facilita con maga nuevo metodo cuyo manual realizacion impractico. Ta segui el estadistica como un area de activo investigacion, por ejemplo na el problema de paquemodo analiza con maga macrodato.

Maga estadistico dato[revisa | revisa codigo]

Recopilacion de maga dato[revisa | revisa codigo]

Muestreo[revisa | revisa codigo]

Cuando imposible el recopilacion de maga completo dato de un censo, ta recoge el maga estadistico con maga muestral dato desarrollando con maga especifico experimental diseño y maga muestreo de encuesta. Tambien ta provee el estadistica mismo con maga herramienta de prediccion y pronostico a traves de maga probabilistico modelo.

Ta debe un muestra, para queda utilizable como guia para todo un poblacion, representa verdaderamente con el general poblacion. Ta asegura el representativo muestreo que extensible maga inferencia y maga conclusion del muestra al total poblacion. Un gran problema es el determinacion al extento al que verdaderamente representativo el muestra elegio. Ta ofrece el estadistica con maga metodo para estima y corregi con cualquier estadistico sesgo dentro del muestra y el maga procedimiento para el recopilacion de maga dato. Hay tambien maga metodo de experimental diseño capaz de mitiga con este maga problema al inicio de un estudio, fortaleciendo con el de suyo capacidad para discerni con maga verdad sobre el poblacion.

El teoria del muestreo es parte del matematico disciplina del teoria del probabilidad. Ta emplea el matematico estadistica con el probabilidad para estudia con el maga muestral distribucion de maga muestral estadistico y, mas generalmente, con el maga propiedad del maga estadistico procedimiento. Valido el uso de cualquier estadistico metodo cuando ta satisface el sistema o poblacion bajo consideracion con el maga supuesto del metodo. El diferencia de punto de vista entre el clasico teoria del probabilidad y la teoria del muestreo es, aproximadamente, que ta empeza el teoria del probabilidad por el maga inicial parametro de un total poblacion para deduci con maga probabilidad pertenecieinte al maga muestra. Por otro lado, ta move el estadistico inferencia na el opuesto direccion, usando con el inductivo razonamiento para hace con maga inferencia del maga muestra al maga parametro de un mas grande, o del total, poblacion.

Maga experimental y observacional estudio[revisa | revisa codigo]

Un comun objetivo para un estadistico proyecto es el investigacion del causalidad, y particularmente el elaboracion de maga conclusion de maga cambio na el maga valor de maga predictor, o maga independiente variable, sobre maga dependiente variable. Hay dos maga principal tipo de maga causal estadistico estudio: maga experimental estudio y maga observacional estudio. Na ambo maga tipo de estudio, ya observa el maga investigador con el efecto del maga diferencia de un (o maga) independiente variable sobre el comportamiento del dependiente variable. Ta yace el diferencia del dos maga tipo na el realizacion del estudio. Puede muy efectivo cada uno. Ta involucra un experimental estudio con el toma de maga medicion del sistema na estudio, el manipulacion del sistema, y entonces el toma de maga adicional medida (con maga diferente nivel de medida) usando con el mismo procedimiento, para determina si ya modifica el manipulacion con el maga valor del maga medida. Por lo contrario, hinde ta involucra un observacional estudio con experimental manipulacion. Na cambio, recopilao maga dato e investigao maga posible correlacion entre el maga predictor y el respuesta. Masquen ta funciona mejor el maga herramienta del analisis de maga dato na maga dato de maga aleatorizao controlao prueba, tambien aplicable a otro maga tipo de maga dato —como maga natural experimento y maga observacional estudio— para el que ta usa un estadistico con un modificao, mas estructurao metodo de estimacion (p.ej. el maga diferencia na maga diferencia o el variable instrumental, entre manada otro) que ta produci con consistencia.

Maga experimento[revisa | revisa codigo]

El maga basico etapa de un estadistico experimento son:

  1. El planificacion del investigacion, incluio el numero de maga replicacion del estudio, usando con el siguiente informacion: maga preliminar estimacion sobre el magnitud del medio efecto del tratamiento, el maga alternativo hipotesis y el estimao experimental variabilidad. Necesario el consideración del seleccion de experimental maga sujeto y del etica del investigacion. Ta recomenda el maga estadistico que ta compara el maga experimento con (por lo menos) un nuevo tratamiento con un estandar tratamiento o control, para permiti con un imparcial estimacion del diferencia na el maga efecto del tratamiento.
  2. El experimental diseño, usando con el bloqueo para reduci con el influencia del maga factor de confusion, y con el aleatorio asignacion de maga tratamiento a maga sujeto para permit con maga imparcial estimacion del maga efecto del tratamiento y del error de medicion. Na este etapa, ta escribi el maga experimentador y el maga estadistico con el protocolo de investigacion que ay guia con el realizacion del experimento y que ta especifica con el primario analisis del maga experimental dato.
  3. El realizacion del experimento y el analisis del varianza, ambo maga siguiendo con el protocolo de investigacion.
  4. Un mas detallao examinacion del conjunto de maga dato na maga secundario analisis, para sugeri con maga nuevo hipotesis para maga futuro estudio.
  5. El documentacion y presentacion del maga resultao del estudio.

Ta conlleva el maga experimento sobre el humano comportamiento con maga especial preocupacion. Ya examina el famoso estudio de si Hawthorne con maga cambio al ambiente de trabajo na el planta de Hawthorne de Western Electric. Ya quere el maga investigador sabe si ya aumenta un aumento de iluminacion con el productividad del maga trabajador na el linea de ensamble. Primero ya medi el maga investigador con el productividad na el planta, entonces ya modifica con el iluminacion na un area del planta y ya comproba si ya afecta el maga cambio na el iluminacion con el productividad. Ya resulta que ya aumenta gayot el productividad (bajo el maga experimental condicion). Sin embargo, hoy dia muy criticado el estudio por maga error na el maga experimental procedimiento, especificamente el falta de un grupo de control y del ceguera. Ta referi el efecto Hawthorne al descubrimiento de que ya cambia un resultao (na este caso, el productividad del maga trabajador) por causa del observacion mismo. Ya queda mas productivo el maga participante na el estudio de si Hawthorne, hinde por el cambio de iluminacion, sino por queda observao.

Observacional estudio[revisa | revisa codigo]

Un ejemplo de un observacional estudio es uno que ta explora con el asociacion entre el tabaquismo y el cancer de pulmon. Tipicamente ta emplea este tipo de estudio con un encuesta para recoge con maga observacion sobre el area de interes, y entonces ta realiza con un estadistico analisis. Na este caso, ta recoge el maga investigador con maga observacion, y de maga fumador y de maga hinde fumador, baka por medio de un estudio de cohorte, y entonces ta busca ellos con el numero de maga caso de cance de pulmon na cada grupo. Un estudio de control de maga caso es otro tipo de observacional estudio na el que maga persona con y sin el resultao de interes (p.ej. el cancer de pulmon) invitao a participa, y recogio el de ellos maga historia de exposición.

Maga tipo de maga dato[revisa | revisa codigo]

Ya tiene manada intento de produci con un taxonomia de maga nivel de medida. Ya defini el psicofisico si Stanley Smith Stevens con cuanto escala: nominal, ordinal, de intervalo y de razon.

  • Hinde ta tene el maga nominal medicion con cualquier significativo orden de clasificacion entre el maga valor, y ta permiti ellos con cualquier inyectivo (uno a uno) transformacion.
  • Ta tene el maga ordinal medicion con maga impreciso diferencia entre maga consecutivo valor, pero ta tene un significativo orden entre aquel maga valor, y ta permiti con cualquier transformacion que ta preserva con aquel orden.
  • Ta tene el maga medicion de intervalo con maga significativo distancia entre el maga medicion definio, pero arbitrario el nulo valor (p.ej. maga medicion de temperatura na maga grado Celsius o maga grado Fahrenheit) y ta permiti con cualquier lineal transformacion.
  • Ta tene el maga medicion de razon con un significativo nulo valor ademas distancia entre el maga medicion definio, y ta permiti con cualquier transformacion de escala.

Debio a que hinde razonable mensurable numericamente maga variable conformando lang con maga nominal o ordinal medicion, tiene vez ellos agrupao juntos como maga categorico variable, mientas que agrupao maga medida de intervalo y de razon como maga cuantitavo variable, que puede queda discreto o continuo, debio al de ellos numerico naturaleza. Na manada situacion hay un debil correlacion entre este maga distincion y maga tipo de dato na el maga ciencia del computacion, ya que representable el maga dicotomico categorico variable por el logico tipo de dato, el maga politomico categorico variable por maga arbitrariamente asignao entero na el entero tipo de dato, y el maga continuo variable por el real tipo de dato involucrando aritmetica na flotante coma. Pero ta depende tal mapeo (del maga tipo de dato na el maga ciencia del computacion al maga tipo de dato na el estadistica) de cual categorizacion del segundo implementao.

Propuesto otro maga categorizacion. Por ejemplo, ya distingui si Mosteller y si Tukey (1977) con maga grado, maga rango, maga contao fraccion, maga recuento, maga cantidad y maga saldo. Ya describi si Nelder (1990) con maga continuo recuento, maga continuo razon, maga razon de conteo y maga categorico modo de maga dato. (Mira tambien con Chrisman (1998) y van den Berg (1991).)

El cuestion —de si o hinde apropriao el aplicacion de maga diferente tipo de maga estadistico metodo al maga dato obtenio por maga diferente tipo de maga procedimiento de medicion— complicao por maga cuestion acerca del transformacion de maga variable y el preciso interpretacion de maga pregunta de investigacion. "Meramente ta refleja el relacion, entre el maga dato y cosa ta describi, con el hecho de que para cuanto tipo de estadistico declaracion, puede tiene maga valor de verdad hinde invariante bajo algun maga transformacion. Ta depende el posible sensiblidad, de contempla con un transformacion, del pregunta que ta trata uno de responde.."[1]Plantilla:Rp

Maga metodo[revisa | revisa codigo]

Descriptivo estadistica[revisa | revisa codigo]

Un descriptivo estadistica (na el sentido de un contable sustantivo) es un estadistica que ta describi o ta resumi cuantitativamente con el maga caracteristica de un coleccion de informacion, mientras que el descriptivo estadistica (na el sentido de un hinde numerable sustantivo) es el proceso de usa y analiza con aquel maga estadistica. Hay que distingui con el descriptivo estadistica del inferencial estadistica (o inductivo estadistica), ya que ta intenta el descriptivo estadistica de resumi con un muestreo, imbes de usa con el maga dato para aprende para conoce con el poblacion representao por el muestra de maga dato.

Inferencial estadistica[revisa | revisa codigo]

El inferencial estadistica es el proceso de usa con el analisis de maga dato para deduci con el maga propiedad de subyacente un distribucion de probabilidad. Ta inferi un analisis por inferencial estadistica con el maga propiedad de un poblacion, por ejemplo probando con maga hipotesis y derivando con maga estimacion. Asumio que el observao conjunto de maga dato es un muestreo de un mas grande poblacion. Contrastable el inferencial estadistica con el descriptivo estadistica. Ta trata el descriptivo estadistica con el maga propiedad lang del maga observao dato, y hinde ta depende ele del asuncion de que ta proveni el maga dato de un mas grande poblacion.

Terminologia y teoria del inferencial estadistica[revisa | revisa codigo]

Maga estadistica, maga estimador y maga pivotal cantidad[revisa | revisa codigo]

Considera con maga variable aleatorio independiente e identicamente distribuio con un conocio distribucion de probabilidad: ta definie el estandar inferencial estadistica y el estadistico estimacion con un muestreo como el aleatorio vector del vector columna de este maga variable. Ta describi un distribucion de probabilidad, que puede tene con maga desconocio parametro, con el estadistico poblacion ansina examinao.

Un estadistica es un aleatorio variable que es un funcion del aleatorio muestra, pero hinde un funcion de maga desconocio parametro. Puede tene el distribucion de probabilidad del estadstica, sin embargo, con maga desconocio parametro. Considera ya con un funcion del desconocio parametro: un estimador es un estadistica usao para estima con tal funcion. Maga comunmente usao estimador son el muestral medio, el muestral varianza sin sesgo y el muestral covarianza.

Un pivotal cantidad o pivote es un aleatorio variable que es un funcion del aleatorio muestra y del desconocio parametro, pero hinde ta depende cuyo distribucion de probabilidad del desconocio parametro. Maga ampliamente usao pivote son el tipificao unidad, el distribucion χ² y el distribucion t de si Student.

Entre dos maga estimador de un cierto parametro, considerao como mas eficiente el estimador con el menor medio cuadratico error. Ademas, considerao como sin estadistico sesgo un estimador, si el de suyo esperao valor igual al verdadero valor del desconocio parametro estimao, y considerao como asintoticamente sin sesgo si ta converge el de suyo esperao valor al limite al verdadero parametro de tal parametro.

Para maga estimador, ta inclui otro maga deseable parametro con (1) maga estimador hinde sesgao de minimo varianza (o UMVUE) que ta tene con el menor varianza para todo el maga posible valor del parametro estimao (por lo general, un propiedad mas facil de verifica que el eficiencia) y (2) maga consistente estimador que ta converge na probabilidad al verdadero valor de cara parametro.

Tiene pa el cuestion de paquemodo obtene con maga estimador na un cierto situacion y lleva a cabo con el calculo. Para esto propuesto cuanto metodo: el metodo de maga momento, el estimacion por maximo verosimilitud, el metodo de maga minimo cuadrao y el mas reciente metodo de maga estimador ecuacion.

Nulo hipotesis y alternativo hipotesis[revisa | revisa codigo]

Na manada situacion ta involucra el interpretacion del estadistico informacion con un nulo hipotesis que es usualmente (pero hinde necesariamente) que hinde ta existi ningun relacion entre maga variable o que hinde ya ocurri ningun cambio con el tiempo.

El mejor ilustracion para un novato es el situacion incuntrao a un penal juicio. Ta afirma el nulo hipotesis, H0, que inocente el acusao, mientras que ta afirma el alternativo hipotesis, H1, que culpable el acusao. Producio el acusacion por sospecha de culpabilidad. Ta opone el H0 (estatus quo) con el H1, y mantenio H0 sino apoyao el H1 por evidencia "mas alla de todo razonable duda". Sin embargo, hinde ta implica el "falta de rechazo del H0", na este caso, con el inocencia sino que meramente insuficiente el evidencia para condena con el acuaao. Ansina hinde necesariamente ta acepta el jurao con el H0 sino que hinde ta rechaza conele. Masquen hinde "probable" un nulo hipotesis, probable gayot el de suyo cercania al verdad por medio de un potencia de un estadistico prueba, que ta proba con maga error de tipo II.

Cosa ta llama el maga estadistico con un alternativo hipotesis es simplemente un hipotesis que ta contradeci con el nulo hipotesis.

Error[revisa | revisa codigo]

Trabajando desde un "nulo hipotesis", reconocio dos maga amplio categoria de error:

  • Maga error de tipo I donde falsamente rechazao el nulo hipotesis, que ta dale con un "falso positivo".
  • Maga error de tipo II donde hay un falta de rechaza con el nulo hipotesis, y un falta de anota con un verdadero diferencia entre dos maga poblacion, que ta dale con un "falso negativo".

Ta referi el tipico desviacion al extento al que ta diferi el maga individuo observacion na un muestra de un central valor, como el medio del muestra o del poblacion, mientras que ta referi el estandar error a un estimacion del maga diferencia entre el medio del muestra y el del poblacion.

Un estadistico error es el cantidad por el que ta diferi un observacion del de suyo esperao valor. Un residual es el cantidad por el que ta diferi el valor que ta asumi el estimador del esperao valor na un cierto muestra (tambien conocio como prediccion).

Usao el medio cuadratico error para obtene con maga eficiente estimador, un ampliamente usao clase de maga estimador. El raiz del medio cuadratico error es simplemente el cuadrao raiz del medio cuadratico error.

Un ajuste de maga minimo cuadrao: na rojo el maga punto ajustao, na azul el ajustao linea.

Ta busca manada estadistico metodo a minimiza con el residual suma de maga cuadrao, y llamao este maga "metodo de maga minimo cuadrao" na contraste con maga minimo absoluto desviacion. Ta pondera el segundo mas con maga chico y gran error, mientras que ta pondera el primero mas con maga gran error. Ademas, diferenciable el residual suma de maga cuadrao, que ta provee con un practico propiedad para hace con un analisis del regresion. El metodo del maga minimo cuadrao, aplicao al lineal regresion, llamao el metodo del maga ordinario minimo cuadrao, y el metodo del maga minimo cuadrao, aplicao al hinde lineal regresion, llamao el metodo del maga hinde lineal minimo cuadrao. Ademas, na un modelo de lineal regresion, el hinde deterministico parte del modelo llamao el termino de error, el disturbancia o mas simplemente el ruido. Na cuanto al lineal regresion y el hinde lineal regresion, ta trata con ellos el metodo del polinomial regresion, que tambien ta describi con el varianza na un prediccion del dependiente variable (el eje Y) como un funcion del independiente variable (el eje X) y el maga desviacion (maga error, ruido, maga trastorno) del estimao (ajustao) curva.

Tambien sujeto al error el maga proceso de medicion que ta genera con maga estadistico dato. Manada este maga error clasificao como aleatorio (ruido) o sistematico (sesgo), pero tambien puede importante otro maga tipo de error (p.ej. pifia, como el notificacion de maga incorrecto unidad de medicion por parte de un analista). Puede llega el presencia de maga valor faltante, o del censura, a maga sesgao estimacion, y desarrollao maga especifico tecnica para trata con este maga problema.

Estimacion por intervalo[revisa | revisa codigo]
Maga intervalo de confianza: el rojo linea es el verdadero valor para el media na este ejemplo, y el maga azul linea son maga aleatorio intervalo de confianza para 100 maga realizacion.

Ta mostra el mayoria del maga estudio con un parte lang del poblacion, ansina que hinde ta representa completamente el maga resultao con el general poblacion. Lang ta aproxima el poblacional valor cualquier maga estimacion obtenio del muestra. Para el maga estadistico, ta permiti el maga intervalo de confianza con un expresion de cuanto ta coincide el estimacion del muestra con el verdadero valor na el total poblacion. Frecuentemente expresao ellos como maga intervalo de confianza del 95%. Formalmente, un intervalo de confianza del 95% para un valor es un rango donde, si repetio el muestreo y el analisis bajo el maga mismo condicion (produciendo con un diferente conjunto de maga dato) ay inclui el intervalo con el verdadero (poblacional) valor na el 95% de todo el maga posible caso. Hinde ta implica que el probabilidad, que ta yace el verdadero valor dentro del intervalo de confianza, es del 95%. Desde el frecuentista perspectiva, hinde ta tene razon tal reclamo, ya que el verdadero valor hinde un aleatorio variable. (O ta yace, o hinde ta yace, el verdadero valor dentro del intervalo de confianza.) Sin embargo, verdadero gayot que —antes del muestreo de maga dato, y armao con un plan sobre paquemodo construi con el intervalo de confianza— el probabilidad es del 95% de que ay cubri el intervalo (hinde calculao pa) con el maga verdadero valor: a este punto. el maga limite del intervalo son maga aleatorio variable (hinde observao pa). Un enfoque que ta produci gayot con un intervalo —interpretable como tene con un cierto probabilidad de contene con el verdadero valor— es el uso de un creible intervalo del bayesian estadistica: ta depende este enfoque de un diferente manera de interpreta con el significancia de "probabilidad", es deci, como un bayestiano probabilidad.

Na principio, el maga intervalo de confianza puede simetrico o asimetrico. Un intervalo puede asimetrico por funciona como un inferior o superior limite de un parametro (intervalo del izquierdo lado o intervalo del derecho lado), pero tambien puede asimetrico si ta viola el intervalo de dos maga lado con el simetria alrededor del estimacion. Tiene vez el maga limite de un intervalo de confianza alcanzao asintoticamente y utilizao para aproxima con el maga verdadero limite.

Significacion[revisa | revisa codigo]

Raramente ta dale el estadistica con un simple respuesta de Si/Hinde al pregunta bajo analisis. Na manada situacion ta depende un interpretacion del nivel de estadistico significacion aplicao al maga numero, y ta referi al probabilidad de que un correcto rechazo, por un valor, del nulo hipotesis (tiene vez denominao como el valor p).

Na este grafico el negro linea es el distribucion de probabilidad para el estadistico de contraste, el critico region es el conjunto de maga valor al derecha del observao punto de maga dato (el observao valor del estadistico de contraste) y el valor p representao por el verde area.

El estandar enfoque es proba con un nulo hipotesis contra un alternativo hipotesis. Un critico region es el conjunto de maga valor del estimador que ta llega a un refutacion del nulo hipotesis. El probabilidad de un error de tipo I es poreso el probabilidad de que ta pertenece el estimador al critico region si verdadero el nulo hipotesis (estadistico significacion). El probabilidad de un error de tipo I el probabilidad de que hinde ta pertenece el estimador al critico region si verdadero el alternativo hipotesis. El estadistico poder de un prueba es el probabilidad de que correctamente ta rechaza con el nulo hipotesis cuando falso el nulo hipotesis.

Al referi a un estadistico significacion, hinde necesariamente ta significa kita que el general resultao significante na maga termino del real mundo. Por ejemplo, na un graqn estudio de un farmaco, demostrable que ta tene el farmaco con un estadisticamente significante pero muy chico beneficioso efecto, ansina que hinde siguro ta ayuda el farmaco con el paciente perceptiblemente.

Masquen na principio el aceptable nivel de estadistico significacion puede tema de debate, el nivel de significacion es el mas grande valor p que ta permiti que ta rechaza el prueba con el nulo hipotesis. El prueba logicamente equivalente a un declaracion de que el valor p es el probabilidad (asumiendo que verdadero el nulo hipotesis) de observa con un resultao por lo menos tan extremo como el estadistico de contraste. Poreso, cuanto mas chico el nivel de significacion, tanto mas bajo el probabilidad de comete con un error de tipo I.

Algun maga problema frecuentemente asociao con este representacional marco (mira con criticismo del contraste de hipotesis):

  • Un diferencia altamente estadisticamente significante puede carece pa de cualquier practico significacion, pero posible formula adecuadamente con maga prueba para trata con esto. Ta involucra un respuesta anda mas alla de informa lang con el nivel de significacion para inclui con el valor p al informa si rechazao o aceptao un hipotesis. Sin embargo, hinde ta indica el valor p con el tamaño del efecto, ni el de suyo importancia, ademas de parece exagera con el importancia del maga menor diferencia na el maga gran estudio. Un mejor y cada vez mas comun enfoque es informa con maga intervalo de confianza. Masquen producio este maga por el maga mismo calculo como ellos de maga contraste de hipotesis o maga valor p, ta describi ellos con el tamaño del efecto ademas del incertidumbre que ta rodea conele.
  • Falacia del transpuesto condicional, tambien conocio como el falacia del frecuencia base: ta surgi maga criticismo porque ta forza el enfoque (del contraste de hipotesis) con el favorecimiento de un hipotesis (el nulo hipotesis), ya que lo evaluao es el probabilidad del observao resultao por el nulo hipotesis, y hinde el probabilidad del nulo hipotesis por el observao resultao. Ta ofrece el bayesiano inferencia con un alternativo a este enfoque, masquen ta requeri ele con el establecimiento de un probabilidad a priori.
  • Hinde automaticamente ta verifica un rechazo del nulo hipotesis con el alternativo hipotesis.
  • Como todo na el inferencial estadistica, ta confia este enfoque na el tamaño del muestra, ansina que bajo maga distribucion de grueso cola puede existi un grave error de calculo.Plantilla:Fix/category[clarification needed]
Maga ejemplo[revisa | revisa codigo]

Algun maga bien conocio estadistico procedimiento y contraste de hipotesis son:

Exploratorio analisis de maga dato[revisa | revisa codigo]

El exploratorio analisis de maga dato (EAD) es un metodo de analiza con maga conjunto de maga dato para resumir con el de ellos maga principal caracteristica, a menudo con maga visual metodo. Puede o hinde involucra ele con un probabilistico modelo, pero el primario proposito del EAD es determina que puede deci kanaton el maga dato, ademas del maga formal tarea de modela con el maga dato mismo o proba con un hipotesis.

Mal uso[revisa | revisa codigo]

Puede produci el mal uso del estadistica con maga sutil pero grave error na el descripcion e interpretacion: sutil porque ta hace hasta maga profesional con tal maga error, y grave porque puede llega ellos a maga devastador error de decision. Por ejemplo, ta confia na el estadistica, entre otro maga area de estudio, el social politica, el medico practica y el confiabilidad de tal maga estructura como el maga puente.

Hasta con el correcto aplicacion de maga estadistico tecnica, para maga persona que ta carece de pericia, dificil pa el interpretacion del maga resultao. Puede o hinde concorda el estadistico significacion de un tendencia na el maga dato —que ta medi con el extento al que causable un tendencia por aleatorio variacion na el muestra— con un intuitivo sentido del de suyo significancia. El estadistico literacia es el conjunto de maga basico estadistico tecnica (y escepticismo) que ta requeri el gente para trata con el informacion na el de suyo cotidiano vida propiamente.

Hay un general percepcion de que hay un frecuente e intencional mal uso del estadistico conocimiento, por un busqueda de maga manera de interpreta con el maga dato, o un interpretacion de maga dato lang, favorable para el presentador. Un desconfianza y malentendido del estadistica asociao con el frase "Maga mentira, maga maldito mentira y maga estadistica" Puede el mal uso del estadistica inadvertido e intencional, y ta resumi el libro Como menti con el maga estadistica (English: How to Lie with Statistics), por si Darrell Huff, con un rango de maga consideracion. Na un intento de arroja con luz sobre el uso y mal uso del estadistica, realizao maga revision del maga estadistico tecnica utilizao na maga particular campo, p.ej. Warne, Lazo, Ramos, and Ritter (2012).

Para evita con el mal uso del estadistica, ta inclui maga manera con el uso de maga adecuao diagrama y el evitacion del sesgo. Puede ocurri el mal uso cuando el maga conclusion sobregeneralizao y afirmao como representativo de mas de cosa realmente son, na manada situacion por un omision (o deliberao o inconsciente) del muestral sesgo. El maga grafico de barra son discutiblemente el maga diagrama mas facil de usa y entende, y realizable o por mano o por maga simple programa de computadora. Hinde notao maga posible sesgo o error, ya que hinde ta busca el mayoria del gente con ellos. Ansina, puede un reclamo considerao como creible, hasta si hinde bien representao. Para que creible y preciso el maga dato recopilao de maga estadistica, debe representa el muestra tomao con el total. Segun Huff, "Destruible por [el sesgo] el fiabilidad de una muestra [...] hay que permiti con algun grado de escepticismo."[2]

Para ayudar con el comprension del maga estadistica ta propone si Huff con un serie de maga pregunta a plantea na cada caso:

  • ¿Ta deci quien conele? (¿Ta tene ele con un hacha para mole?)
  • ¿Paquemodo ta sebe ele? (¿Ta tene ele con el maga recurso para sabe con el maga hecho?)
  • ¿Cosa ta falta? (¿Ta tene ele a nosotros con un completo imagen?)
  • ¿Ya cambia ba alguien con el tema? (¿Ta ofrece ele a nosotros con el correcto respuesta al incorrecto problema?)
  • ¿Ta tene ele sentido? (¿Consistente el de suyo conclusion logico y consistente con cosa ta sabe ya kita?)

Mal interpretacion: correlacion[revisa | revisa codigo]

El problema del factor de confusion: Puede correlao X y Y, hinde porque hay algun causal relacion entre ellos, sino que ta depende ambo maga de un tercer variable Z. Denominao Z como un factor de confusion.

Particularmente notable el concepto del correlacion para el potencial confusion causable por ello. Na manada situacion ta revela el estadistico analisis de un conjunto de maga dato que ta tene dos maga variable (propiedad), del poblacion bajo consideracion, con un tendencia de varia junto, como si conectao. Por ejemplo, puede conclui un estudio del maga anual ingreso, que tambien ta investiga con el edad de fallecimiento, que ta tene el maga pobre con maga mas corto vida que el maga afluente. Denominao el dos maga variable como correlao, masquen puede o hinde causa cualquier del dos maga con el otro. El fenomeno de correlacion causable por un tercero, anteriormente hinde considerao, fenomeno, llamao un variable de acecho o un variable de confusion. Para este razon, nuay ningun manera de inferi inmediatamente con el existencia de un causal relacion entre el dos maga variable.

Maga aplicacion[revisa | revisa codigo]

Aplicao estadistica, teoretico estadistica y matematico estadistica[revisa | revisa codigo]

Ta compone el aplicao estadistica, tiene vez llamao el estadistico ciencia, con el descriptivo estadistica y el aplicacion del inferencial estadistica. Ta trata el teoretico estadistica con el maga logico argumento que ta subyace con el justificacion del maga enfoque al inferencial estadistica, ademas de engloba con el matematico estadistica. Ta inclui el matematico estadistica con hinde lang el manipulacion del maga distribucion de probabilidad necesario para el derivacion del maga resultao relacionao con el maga metodo de estimacion e inferencia, sino tambien cuanto aspecto del computacional estadistica y del experimental diseño.

Puede ayuda el maga [estadistico consultor]] con el maga organizacion y el maga empresa que ta carece con interno experiencia relevante al de ellos maga particular pregunta.

Automatico aprendizaje y mineria de maga dato[revisa | revisa codigo]

Maga modelo de automatico aprendizaje son maga estadistico y probabilistico modelo que ta captura con maga patron na el maga dato mediante el uso de computacional algoritmo.

Estadistica na el academia[revisa | revisa codigo]

Aplicable el estadistica a un amplio variedad de maga academico disciplina, incluio el maga natural y social ciencia, el gobierno y el negocio. Ta aplica el empresarial estadistica con el maga estadistico metodo na el econometria, el auditoria, el produccion y el maga operacion, incluio el mejora de maga servicio e investigacion de maga mercado. Ya incuntra un estudio de dos maga revista de tropical biologia que el doce maga mas frecuente estadistico prueba son:

Ta cubri un tipico curso de estadistica con el descriptivo estadistica, el probabilidad, el maga binomial y normal distribucion, el maga prueba de maga hipotesis, el maga intervalo de confianza, el lineal regresion y el correlacion. Ta enfoca maga moderno fundamental curso de estadistica para maga estudiante de pregrado na el correcto seleccion de prueba, el interpretacion de maga resultao y el uso de libre estadistico software.

Estadistico computacion[revisa | revisa codigo]

gretl, un ejemplo de un estadistico paquete de abierto codigo.

A partir del segundo mitad del aca-20 siglo, ya experimenta el potencia de computacion con un rapido y sostenio aumento, y ya tene esto con un sustancial impacto na el practica del ciencia del estadística. El primero estadistico modelo hinde firmi del clase del maga lineal modelo, pero ya causa maga poderoso computadora, acoplao a adecuado numerico algoritmo, con un aumento de interes na el maga hinde lineal modelo (como el maga artificial neuronal red) ademas del creacion de maga nuevo tipo de modelo (como el maga generalizao lineal modelo y el maga multinivel modelo).

Tambien ya lleva un aumento de potencia de computacion a un aumento del popularidad del maga computacionalmente intensivo metodo basao na el remuestreo, como el maga prueba de permutacion y el bootstrapping, mientras que ya hace mas factible maga tecnica como el muestreo de si Gibbs con el uso de maga bayesiano red. Ta tene el resolucion del computadora con maga implicacion para el futuro del estadistica con un nuevo enfasis na el "experimental" y "empirico" estadistica. Disponible ya un gran numero de estadistico software, tanto para maga general fin como maga especial. Ta inclui maga ejemplo de disponible software, capaz de realiza con maga complejo estadistico calculo, con tal maga programa como Mathematica, SAS, SPSS y R.

Empreserial estadistica[revisa | revisa codigo]

Na el empresarial mundo, el estadistica es un ampliamente usao herramienta para el gestion y el maga sistema de soporte al maga decision. Particularmente aplicable ele al financiero administracion, el direccion de marketing y el administracion del produccion. Muy utilizao tambien el estadistica na el contabilidad de gestion y el auditoria. Ta formaliza el disciplina del maga ciencia de administracion y gestion con el uso del estadistica, y de otro maga rama del matematica, para el maga empresa. (El econometria es el aplicacion de maga estadistico metodo al maga economico dato para dale con empirico contenido al maga [[Economia#Teoretico investigacion}economico relacion]].)

Destinao a maga maga estudiante de maga negocio un tipico curso de empreserial estadistica, y ta cubri ele con el descriptivo estadistica (el recopilacion de maga dato, ademas del de ellos descripcion, analisis y resumen), el probabilidad (tipicamente el maga binomial y normal distribucion), el maga prueba de maga hipotesis, el maga intervalo de confianza, el lineal regresion y el correlacion. Puede inclui maga subsiguiente curso con el pronostico, el temporal serie, el maga pono de decision, el multiple lineal regresion y otro maga tema del analitica de maga negocio mas generalmente. (Mira tambien con Empresarial matematica § Universitario nivel.) Frecuentemente ta inclui maga profesional certificacion na maga financiero servicio, como el CFA, con maga tema na el estadistica.

Maga aplicacion del estadistica al matematica o al maga arte[revisa | revisa codigo]

Tradicionalmente, ya hace el estadistica con maga inferencia mediante un semi-estandarizao metodologia considerao como "requerido aprendizaje" na el mayoria del maga ciencia. Ya cambia esta tradicion gracias el uso del estadistica na maga hinde inferencial contexto. Cosa anteriormente considerao como un seco sujeto, estudiao na manada campo como un requisito para un grado, visto ya con entusiasmo.Plantilla:Quien Inicialmente ridiculizao por algun maga matematico puristaPlantilla:Quien, considerao ya como esencial metodologia na cuanto area.

  • Na el teoria de maga numero, maga diagrama de dispersion, generao por un funcion de distribucion, transformable con maga bien conocio herramienta usao na el estadistica para revela con maga subyacente padron, que entonces baka llega a maga hipotesis.
  • Maga predictivo metodo del estadistica na el pronostico, combinando con el teoria del caos y el geometria de maga fractal, tiene vez utilizao para crea con maga obra de video.
  • Ya confia el procesual arte de si Jackson Pollock na el maga artistico experimento donde artisticamente revelao maga subyacente distribucion na el naturaleza. Con el llegada del maga computadora, aplicao el maga estadistico metodo para formaliza con tal natural proceso impulsao por maga distribucion, para realiza y analiza con maga obra de arte de video.[cita requerida]
  • El maga metodo del estadistica usable predicativamente na el performance, como na un truco de maga carta basao na un cadena de si Márkov que solo tiene vez ta funciona, el ocasion del cual predecible gracias al estadistico metodologia.
  • El estadistica usable para predicativamente crea con el arte, como na el estadistico o estocastico musica inventao por si Iannis Xenakis, donde especifico al performancia el musica. Masquen hinde firmi ta sucede como esperao este tipo de arte, ta comporta gayot ele na maga modo predecible y ajustable gracias al estadistica.

Maga especializao disciplina[revisa | revisa codigo]

Usao el maga estadistico tecnica na un amplio varieded de maga tipo de cientifico y social investigacion, incluio: el bioestadistica, el maga biologico red, el computacional biologia, el informatico sociologia, el maga social ciencia, el social investigacion y el sociologia. Ta usa cuanto campo de indagacion con el aplicao estadistica tan extensamente que ta tene ellos con el de ellos propio jerga. Ta inclui tal maga disciplina con:

Ademas, hay maga particular tipo de estadistico analisis que tambien ya desarrolla con el de ellos especializao jerga y metodologia:

Ta forma el maga estadistica con un herramienta clave na maga negocio y manufactura tambien. Ta permite ele con el comprension del variabilidad de maga sistema de medicion, maga proceso de control (como na el estadistico control de maga proceso o ECP), el resumen de maga dato, y el toma de maga decision impulsao por maga dato. Na este maga papel, ele un herramienta clave, y baka el unico confiable herramienta.[cita requerida]

Mira tambien[revisa | revisa codigo]

Maga fundacion y maga principal area del estadistica

Maga referencia[revisa | revisa codigo]

  1. Hand, D.J. (2004). Measurement theory and practice: The world through quantification. London: Arnold. Na ingles: "The relationship between the data and what they describe merely reflects the fact that certain kinds of statistical statements may have truth values which are not invariant under some transformations. Whether or not a transformation is sensible to contemplate depends on the question one is trying to answer."
  2. How to Lie with Statistics. New York: Norton. 1954. «The dependability of a sample can be destroyed by [bias]... allow yourself some degree of skepticism.»