Sesgo, precisión e incertidumbre dentro del intervalo de trabajo de un método de ensayo químico
En química analítica aplicada, uno de los errores conceptuales más frecuentes consiste en hablar de sesgo, precisión e incertidumbre como si fueran propiedades rígidas e invariables del método. Esa simplificación puede ser cómoda, pero rara vez es metrológicamente correcta. Un método no se comporta del mismo modo en todo su intervalo de trabajo. Su desempeño cambia con el nivel de concentración, con la posición dentro del rango y, en muchos casos, con la propia relación entre señal y ruido.
Por eso, evaluar el desempeño de un método sin relacionarlo con su intervalo de trabajo conduce a conclusiones pobres, y a veces directamente engañosas. No basta con afirmar que “el método es preciso” o que “la incertidumbre es aceptable”. La cuestión verdaderamente importante es otra: ¿preciso en qué parte del rango?, ¿aceptable para qué niveles?, ¿con qué comportamiento absoluto y relativo?
El intervalo de trabajo no es un dato menor
El intervalo de trabajo define el conjunto de valores del mensurando para los cuales el método ha demostrado producir resultados técnicamente defendibles. No se trata de una formalidad documental. Es una característica central del desempeño analítico.
Desde una perspectiva práctica, puede distinguirse entre:
- intervalos acotados o estrechos, donde la amplitud del rango es reducida y el método suele mostrar un comportamiento más uniforme;
- intervalos amplios, donde el método cubre una variación importante de concentración, a veces de uno o más órdenes de magnitud.
Esta distinción tiene consecuencias directas. En un intervalo estrecho puede ser razonable, bajo ciertas condiciones, suponer que el sesgo, la dispersión y la incertidumbre varían poco. En un intervalo amplio, en cambio, esa suposición suele ser frágil. Allí es habitual que aparezcan cambios en la varianza, en la magnitud relativa del error y en la contribución de distintas fuentes de incertidumbre.
Sesgo: no siempre permanece igual dentro del rango
El sesgo expresa la diferencia sistemática entre el valor esperado del resultado y un valor de referencia aceptado. En lenguaje más operativo, indica la tendencia del método a sobrestimar o subestimar.
Ahora bien, esa tendencia puede manifestarse de maneras distintas a lo largo del intervalo de trabajo.
Sesgo aproximadamente constante en términos absolutos
Supóngase que un método presenta una sobrestimación cercana a 0.20 mg/L en varios niveles del rango. En términos absolutos, podría parecer estable. Sin embargo, el impacto relativo de ese mismo sesgo no será el mismo en toda la escala. A 2.00 mg/L, representa 10 %. A 20.00 mg/L, representa solo 1 %.
Es decir, un sesgo absoluto similar puede ser crítico en la zona baja y poco relevante en la zona alta.
Sesgo aproximadamente constante en términos relativos
También puede ocurrir lo contrario. Por ejemplo, un método con una recuperación sistemática próxima a 102 % puede exhibir un sesgo relativo bastante uniforme en todo el intervalo. En ese caso, el sesgo absoluto crecerá a medida que aumente la concentración. A niveles bajos, la diferencia en unidades será pequeña; a niveles altos, la diferencia absoluta será mayor, aunque el porcentaje se mantenga parecido.
Sesgo variable sin patrón simple
En muchos métodos reales, el sesgo no es constante ni en términos absolutos ni relativos. Puede ser mayor cerca del límite inferior por efecto del ruido, reducirse en la zona media y aumentar nuevamente en niveles altos por no linealidad, saturación instrumental, efectos de matriz o diluciones adicionales. Cuando esto ocurre, resumir el sesgo con un único valor para todo el intervalo resulta técnicamente pobre.
Precisión: absoluta y relativa no son lo mismo
La precisión describe la proximidad entre resultados independientes obtenidos bajo condiciones definidas. Suele expresarse mediante desviación estándar, varianza o coeficiente de variación. Pero, igual que el sesgo, su análisis depende de cómo se observe el rango.
Precisión absoluta aproximadamente constante
En ciertos métodos, la desviación estándar en unidades del mensurando cambia poco dentro de una parte del rango. Por ejemplo, un método puede presentar una dispersión de aproximadamente 0.10 mg/L tanto a 1.00 mg/L como a 10.00 mg/L. En términos absolutos, el comportamiento parece bastante estable.
Sin embargo, en términos relativos la situación cambia drásticamente. Una desviación estándar de 0.10 mg/L representa 10 % a 1.00 mg/L, pero solo 1 % a 10.00 mg/L. En otras palabras, la misma dispersión absoluta pesa mucho más cuando el nivel de concentración es bajo.
Precisión relativa aproximadamente constante
En otros casos, la dispersión aumenta casi proporcionalmente con la concentración. Allí el coeficiente de variación se mantiene aproximadamente constante, aunque la desviación estándar absoluta crezca. Este comportamiento es frecuente cuando predominan errores proporcionales, como ocurre en diversas etapas volumétricas o en respuestas instrumentales de carácter multiplicativo.
Heterocedasticidad: una realidad común, no una rareza
Cuando la varianza cambia con el nivel de concentración, el método presenta heterocedasticidad. Esto es muy común en química analítica. No debería tratarse como una excepción exótica, sino como una posibilidad bastante normal.
La heterocedasticidad obliga a ser más rigurosos. No resulta serio asumir varianza constante sin evidencia. Tampoco es defendible resumir la precisión de un intervalo amplio con una sola desviación estándar si la dispersión cambia claramente entre la zona baja y la zona alta.
Incertidumbre de la medición a lo largo del intervalo
La incertidumbre de la medición cuantifica la dispersión de los valores que podrían atribuirse razonablemente al mensurando. No debe confundirse con un error individual, ni con una corrección, ni con una simple tolerancia estadística. Es una expresión estructurada de la duda metrológica asociada al resultado.
Y, desde luego, esa incertidumbre tampoco suele permanecer constante en todo el intervalo de trabajo.
En intervalos acotados
Cuando el intervalo es estrecho y el método muestra un comportamiento suficientemente uniforme, puede ser defendible trabajar con una única estimación de incertidumbre, o con valores muy parecidos para todo el rango. Esto puede ocurrir, por ejemplo, en métodos diseñados para una ventana reducida de aplicación o para control rutinario alrededor de un valor nominal.
Pero incluso en esos casos, la uniformidad no debe darse por sentada. Debe demostrarse experimentalmente.
En intervalos amplios
En intervalos amplios, una única incertidumbre para todo el rango suele ser una simplificación débil. Lo más habitual es que la incertidumbre absoluta aumente con la concentración, que la incertidumbre relativa sea mayor en los niveles bajos, o que ambas sigan un patrón combinado.
Por eso, en rangos amplios suele ser técnicamente más sólido trabajar con:
- una función de incertidumbre;
- estimaciones por subrangos;
- un perfil de precisión;
- o un modelo combinado con componentes absolutos y proporcionales.
Una expresión útil para describir este comportamiento es la siguiente:
u(x) = √[a2 + (b·x)2]
En esta expresión, u(x) representa la incertidumbre estándar asociada al nivel de concentración x. El término a representa un componente aproximadamente constante, mientras que el término b·x representa un componente proporcional al nivel de concentración.
Este tipo de formulación suele describir mejor la realidad experimental que una incertidumbre fija aplicada sin matices a todo el intervalo.
Intervalos acotados frente a intervalos amplios
Cuando el intervalo es acotado
En un rango estrecho, por ejemplo de 8.00 a 12.00 mg/L, puede suceder que el sesgo absoluto cambie poco, que la desviación estándar se mantenga bastante estable y que una incertidumbre casi uniforme resulte defendible. En estas condiciones, un criterio de aceptación en términos absolutos puede ser razonable.
Pero eso no debe transformarse en una regla general. Un intervalo estrecho solo facilita la homogeneidad del comportamiento; no la garantiza.
Cuando el intervalo es amplio
La situación cambia claramente cuando el método cubre, por ejemplo, desde 0.50 hasta 100.00 mg/L. En esos casos, es esperable que el desempeño no sea uniforme. Cerca del límite inferior suele aumentar la influencia del ruido y empeorar la precisión relativa. En la zona media el método suele alcanzar su mejor comportamiento. En la zona alta, aunque la precisión relativa pueda seguir siendo aceptable, el error absoluto y la incertidumbre absoluta suelen incrementarse.
Por ello, en intervalos amplios resulta metodológicamente débil describir al método con un único valor global de sesgo, de precisión o de incertidumbre.
Aumento absoluto y aumento relativo: una distinción decisiva
Una fuente clásica de confusión consiste en afirmar, sin más, que “el error aumenta” dentro del rango. Esa frase, aislada, dice muy poco. Lo importante es distinguir cómo aumenta.
Aumento en términos absolutos
El error aumenta en términos absolutos cuando la diferencia en unidades del mensurando crece con la concentración. Esto puede ser perfectamente compatible con un método que conserve un comportamiento relativo razonable.
Aumento en términos relativos
El error aumenta en términos relativos cuando el porcentaje de error crece, aunque la diferencia absoluta no sea grande. Este escenario suele ser especialmente crítico en la zona baja del rango, donde un error pequeño en unidades puede representar una fracción considerable del valor medido.
En consecuencia, no debe preguntarse solo si el error aumenta, sino si lo hace en valor absoluto, en porcentaje, en ambos planos o con un cambio de régimen según la zona del intervalo.
Qué suele observarse en un método de ensayo químico
En muchos métodos analíticos, el patrón más común es el siguiente:
- en la zona baja del intervalo, empeoran la precisión relativa y la incertidumbre relativa;
- en la zona media, el método muestra su desempeño más estable;
- en la zona alta, pueden aumentar el error absoluto y la incertidumbre absoluta, aun cuando el comportamiento porcentual siga siendo aceptable.
Esto no significa necesariamente que el método sea inadecuado. Significa, más bien, que su comportamiento debe ser descrito con honestidad técnica. Lo importante no es forzar una uniformidad ficticia, sino documentar con claridad cómo cambia el desempeño a lo largo del rango y qué implicancias tiene eso para el uso previsto.
Implicancias para validación, verificación y uso rutinario
Cuando el intervalo de trabajo es amplio, validar el método con un solo nivel o con una visión global promedio es una práctica metodológicamente débil. El desempeño debe estudiarse en distintos puntos del rango precisamente porque lo que interesa es saber si sesgo, precisión e incertidumbre permanecen aceptables en cada zona relevante.
Esto exige, entre otras cosas:
- seleccionar niveles distribuidos dentro del intervalo;
- evaluar si la varianza es constante o dependiente del nivel;
- distinguir entre error absoluto y error relativo;
- evitar extrapolar el desempeño de una zona a otra sin evidencia experimental;
- definir si corresponde trabajar con un valor único de incertidumbre, con subrangos o con una función de incertidumbre.
Además, esta información no debería quedar encerrada en el informe de validación. También debe influir en la interpretación de resultados en rutina. No es técnicamente serio juzgar del mismo modo un resultado situado cerca del extremo inferior y otro ubicado en la zona media si la incertidumbre relativa es muy distinta entre ambos.
Conclusión
Sesgo, precisión e incertidumbre no deben tratarse como atributos inmóviles del método, sino como características cuyo comportamiento depende del intervalo de trabajo. En intervalos acotados, puede ser razonable encontrar un desempeño relativamente uniforme. En intervalos amplios, esa uniformidad rara vez debe asumirse sin evidencia.
La cuestión central no es solo cuánto error tiene un método, sino cómo cambia ese error dentro del rango, si lo hace en términos absolutos o relativos, y si esa evolución sigue siendo compatible con el uso previsto.
Desde una perspectiva metrológica rigurosa, cuanto más amplio es el intervalo de trabajo, menos defendible resulta describir el método mediante un único número de sesgo, de precisión o de incertidumbre. En esos casos, lo correcto es caracterizar el desempeño a lo largo del rango y sostener esa caracterización con evidencia experimental suficiente.
En definitiva, un método de ensayo químico no debe evaluarse solo por su desempeño promedio, sino por la forma en que conserva o pierde su aptitud analítica en cada zona relevante del intervalo de aplicación.