В ряду нескольких параллельных определений иногда обнаруживается результат эксперимента, резко отличающийся о т других результатов и от среднего арифметического всей серии. В этих случаях перед обработкой полученных данных с помощью методов математической статистики необходимо установить, не является ли такой результат грубой погрешностью (промахом) и не следует ли исключить его из выборки. Выбор критерия для исключения сомнительного результата имеет свои трудности. Универсального правила, которым можно было бы при этом руководствоваться, к сожалению, не существует.
Размах вариации – это показатель, представляющий собой разность между максимальной и минимальной вариантами совокупности, т.е. R= xmax– xmin.
Q-тест.
В обрабатываемой серии данных должны отсутствовать промахи. Поэтому прежде, чем проводить любую обработку данных (начиная с вычисления среднего), следует выяснить, содержит ли она промахи, и если да, то исключить их из рассмотрения. Для выявления промахов служит еще один статистический тест, называемый Q -тестом или тестом Диксона.
Алгоритм Q -теста состоит в следующем. Серию данных упорядочивают по возрастанию: x1 ≤ x2 ≤ ... ≤ xn-1 ≤ xn. В качестве возможного промаха рассматривают одно из крайних значений x1 или xn - то, которое дальше отстоит от соседнего значения, т.е. для которого больше разность x2 - x1 либо, соответственно, xn - xn-1. Обозначим эту разность как W1. Размах всей серии, т.е. разность между максимальным и минимальным значением xn - x1, обозначим W0. Тестовой статистикой является отношение
Эта величина заключена в пределах от 0 до 1. Чем дальше отстоит "подозрительное" значение от основной массы данных, тем выше вероятность того, что это промах - и тем больше, в свою очередь, величина ξ. Критической величиной служит табличное значение Q -коэффициента Q(P,n), зависящее от доверительной вероятности и общего числа данных в серии. Если тестовая статистика превышает критическую величину (ξ>Q), соответствующее значение считают промахом и из серии данных исключают. После этого следует проверить на наличие промахов оставшиеся данные (с другим значением Q), поскольку промах в серии может быть не один. При применении Q -теста вместо стандартной доверительной вероятности, равной 0.95, обычно используют значение P=0.90. Наиболее достоверные результаты получаются при n=5-7. Для серий большего или меньшего размера Q-тест недостаточно надежен.
Тест Граббса.
Наиболее распространенным (и официально закрепленным во многих нормативных документах) тестом выявления промахов является тест Граббса. Он существует в нескольких вариантах, самый простой из которых состоит в следующем. Кандидатом в промахи считается одно из крайних значений серии, максимальное xmax или минимальное xmin, - то, которое дальше отстоит от среднего x̄, т.е. то, для которого больше разность xmax - x̄ или x̄ - xmin. Тестовой статистикой служит величина отношения этой разности к стандартному отклонению серии
В данной формуле расчет x̄ и s(x) проводят для всей исходной серии, включая возможные промахи. Полученную величину ξ сравнивают с критическим значением – коэффициентом Граббса GR(P,n), зависящим от доверительной вероятности Р и размера серии п. Если ξ > GR(P,n), соответствующее значение считают промахом и отбрасывают. К оставшейся серии тест Граббса можно применить повторно, так как промах в серии может быть не один.