Diccionario Económico, Diccionario Político, EEUU, Guatemala, Por País

Conceptos de estadística 101

0 Comments 05 julio 2007

Para los lectores que desean conocer más sobre algunos conceptos básicos de la estadística inferencial, sugiero algunos sitios de Internet. Primero lo que aparece en la Universidad de Michigan, en inglés, porque es una de las más reconocidas por la investigación de la opinión pública (encuestas):
 

The Vocabulary of Error Análisis

An error in a measurement is the difference between the result of the measurement and the true value of whatever you were trying to determine. An error can be expressed in two ways:

An absolute error is an error expressed in physical units. For example, if we measure the acceleration due to gravity in the lab room to be 9.7 ms, the absolute error is -0.1 ms. Absolute errors should always have the physical units indicated.

A relative error, or fractional error, is an error expressed as a fraction of the value measured or the true value (if the error is small, it makes little difference). In the above example, the error was 0.1/9.8 = 1% relative to the true value. If the true value is not known, relative errors are given with respect to the measurement. Relative errors should always be displayed as a percentage, to avoid confusion with absolute errors.

An uncertainty is a range, estimated by the experimenter, that is likely to contain the true value of whatever is being measured. For example, if you measure a distance with a meter stick you usually assign an uncertainty of ± 1mm to the result. Uncertainties can be expressed in absolute terms or relative terms, just as errors can. People often say “error” when they mean uncertainty, just because it doesn’t take as long, but what is meant can usually be figured out from the context. I’ll try not to do it myself in these pages.

A confidence level is the probability that the true value of your experiment falls within a given range of uncertainty. Confidence levels can be exactly defined if you have a good understanding of the nature of your errors.

A systematic error is not a way of expressing an error, but a breed of problem which often plagues experiments. A systematic error biases your measurements in some predictable way, although you may not know how to predict it. A simple example would be a voltmeter which only displays 90% of the true voltage, so the size of the error changes depending on what you’re measuring. Systematic errors can get very complex, but once understood you can modify your results to remove them.

A random error is an error which is present every time you take the measurement, but which varies unpredictably in size and direction. Random errors are always present, but fortunately follow well-behaved statistical rules. The effects of random errors can be reduced only by repeating the measurement as often as possible.

An illegitimate error is not one born out of wedlock, but a one-time mistake in the procedure which produces a bizarre value. If you know you made a mistake (for example, kicking the equipment in frustration) then you can just throw out that measurement. Usually the mistake is more subtle, for example misreading a display or an unexpected power surge in the equipment. In this case, people usually use some statistical criteria to throw out data which are well outside the normal range of possibility.

The precision of a measurement is the total amount of random error present. A very precise measurement has small random errors, but just because a measurement is precise doesn’t mean that it’s accurate (see below); undiscovered systematic errors might skew your results drastically.

The accuracy of a measurement is a way of talking about the total error in your final result. An accurate measurement is very close to the true value. Just because a measurement is accurate doesn’t mean it’s precise; an accurate value with a wide possible range isn’t very useful.

Más información en: http://instructor.physics.lsa.umich.edu/ip-labs/tutorials/errors/vocab.html
 

Errores en el muestreo
 

Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no muestral. El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma población.
 

Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran cuidado para asegurar que dos muestras del mismo tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles. El error muestral es un concepto importante que ayudará a entender mejor la naturaleza de la estadística inferencial.
 

Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominan errores no muestrales.
 

Más información en: http://www.itch.edu.mx/academic/industrial/estadistica1/cap01.html
 

El concepto de margen de error
 

El margen de error es derivado de la idea de intervalo de confianza (IC), concepto fundamental en ciencia estadística. En breve, un IC es un intervalo de valores que, en una investigación estadística, se estima que tiene una determinada probabilidad (95% por lo general) de contener el verdadero valor de una cualidad de un universo. Un ejemplo sencillo: Si se presume que en Omega (para el caso, un universo o población) la talla de los hombres alcanza en promedio 1.80mt, un IC al 95% de confianza podría ser el intervalo entre 1.77mt y 1.83mt (en este caso particular la amplitud del intervalo será 0.03mt). Si este IC (o cualquier otro que contuviese el valor 1.80) fuese elaborado en base a la información muestral, entonces no habrá sustento para rechazar la hipótesis de que la talla promedio de los hombres de Omega es 1.80mt.
 

Aquí retomamos por fin la sencillez en la discusión, además de encontrarnos ya bastante cerca de la comprensión del concepto de margen de error. Este margen aparece una vez que, por razones de construcción (las que ya he denominado ‘instrumentales’), el IC es transformado de manera que su centro es el valor 1, es decir, el 100%. La distancia entre el centro (que vale 100%) y cualquiera de los extremos del nuevo intervalo es lo que recibe la denominación de error. Por ejemplo, en nuestro ejemplo de la estatura, el intervalo transformado será de 98.33% a 101.67%, con lo que la amplitud será 1.67%. La amplitud es el valor absoluto de un ‘margen’ que denotamos ±1.67%. En definitiva, el margen caracterizado por la dicha amplitud es lo que conocemos como margen de error.
 

Más información en: http://www.geocities.com/arufast/a02error.html
 

Error de la estimación 
 

Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E = ?2 – ?1.
 

Nivel de confianza 
 

Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-?), aunque habitualmente suele expresarse con un porcentaje ((1-?)·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores ? de 0,05 y 0,01, respectivamente.
 

Más información en: http://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica
 

 

Share your view

Post a comment

Calendario

julio 2014
L M X J V S D
« jun    
 123456
78910111213
14151617181920
21222324252627
28293031  

Archivos Pasados

Categorías

CABI en Youtube

© 2014 The Black Box. Powered by Wordpress.

Daily Edition Theme by WooThemes - Premium Wordpress Themes

Switch to our mobile site