Influência dos Valores Censurados na Determinação da Concentração Média de Variáveis de Qualidade da Água

Autor: Thaisa de Souza Contar

Categoria(s):

Palavra(s)-chave: Dados censurados, Kaplan-Meier, Maximum Likelihood Estimator, qualidade da água, Regression on Order Statistics

Um dos problemas encontrados na análise estatística de dados provenientes de monitoramento da qualidade da água são os chamados dados, ou valores, censurados. Dados censurados indicam que valor medido é apenas parcialmente conhecido, ou seja, encontra-se abaixo ou acima do limite de detecção (LD) da técnica analítica de medição. Na literatura é comum a utilização do método de substituição, onde os valores censurados são substituídos por zero, 1⁄2LD ou LD. Porém, duas décadas de pesquisa revela que os valores censurados quando não tratados de maneira adequada levam a estimativas imprecisas dos parâmetros estatísticos (média e desvio padrão), especialmente quando o conjunto de dados possui poucas observações (n < 50) ou um elevado número de valores censurados (acima de 15% do total de observações). Neste contexto, o estudo ilustra como o valor calculado da concentração média das variáveis de qualidade da água é influenciado pela escolha do método de cálculo, do tamanho da amostra e do percentual de dados censurados e também chamar atenção para a importância deste tema no que diz respeito aos relatórios produzidos pelos programas brasileiros de monitoramento da qualidade da água. A análise foi realizada para os métodos paramétricos: Substituição Simples (SS), Estimação por Máxima Verossimilhança (MLE – Maximum Likelihood Estimator) e Gráficos de Probabilidade com Estatística de Regressão (ROS – Regression on Order Statistics) e o método não paramétricos de Kaplan-Meier (KM). Foram utilizados dados de concentração media das variáveis de qualidade da água (DQO, Nitrato e Fosfato) provenientes do programa de monitoramento da qualidade da água do Rio Cuiabá. Os resultados mostram que o método de substituição deve ser evitado, pois a média e desvio-padrão calculado são imprecisos e não podem ser reproduzidos.

Clique aqui e veja a dissertação completa