Математическая энциклопедия - непараметрические методы статистики
Связанные словари
Непараметрические методы статистики
методы математич. статистики, не предполагающие знания функционального вида генеральных распределений. Название "непараметрические методы" подчеркивает их отличие от классических параметрических методов, в к-рых предполагается, что генеральное распределение известно с точностью до конечного числа параметров, и к-рые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять гипотезы относительно их значений.
Пример. Пусть две независимые выборки, извлеченные из совокупностей с непрерывными генеральными функциями распределения Fи G; и пусть проверяется гипотеза Н о о равенстве распределений Fи Gпротив альтернативы сдвига, т. е. гипотезы
для всех tи нек-рого . В классич. варианте этой задачи предполагается, что функции распределения Fи Gнормальны, и для проверки рассматриваемой гипотезы используется Стъюдента критерий. При не-параметрич. постановке задачи о виде Fи Gне делается никаких предположений, кроме непрерывности. Типичным непараметрич. критерием для проверки гипотезы против является Вилкоксона критерий, основанный на сумме рангов элементов первой выборки в общем вариационном ряду. Гипотезу о равенстве распределений отвергают, если вычисленная по наблюдениям статистика критерия оказывается слишком большой или слишком малой. Статистика критерия Вилкоксона проста для вычислений, а ее распределение при Н о не зависит от F. Критич. значения, отвечающие заданному значимости уровню при небольших значениях ти п, находят по таблицам (см., напр., [1]); при больших ти п пользуются нормальной аппроксимацией.
В ряде случаев важно не столько проверить гипотезу об отсутствии сдвига, сколько оценить этот сдвиг , к-рыи может интерпретироваться, напр., как изменение урожайности при смене способа обработки почвы или дополнительное время сна при применении снотворного. Оценка параметра посредством величины , к-рая вполне удовлетворительна в нормальном случае, является очень неустойчивой к отклонениям от нормальности и может даже не быть состоятельной. Гораздо лучшими свойствами в этом отношении обладает непараметрич. оценка (см. [2]): медиана набора чисел Эта оценка тесно связана с критерием Вилкоксона. Можно сказать, что она находится в том же отношении к оценке в каком критерий Вилкоксона находится к критерию Стьюдента.
Несмотря на многообразие задач, решаемых с помощью непараметрич. методов, эти задачи можно условно разделить на две большие части: задачи проверки гипотез и задачи оценки неизвестных распределений и параметров, к-рые понимаются как нек-рые функционалы от этих распределений.
Непараметрич. проверка статистич. гипотез наиболее развитая часть Н. м. с. Требуется построить процедуру (критерий), позволяющую принять или отвергнуть проверяемую гипотезу при заданной альтернативе. Типичным примером является проверка согласия, другими важными для приложений примерами являются проверка симметрии, независимости и случайности.
Задача проверки согласия состоит в том, что по выборке из совокупности с генеральной функцией распределения требуется проверить гипотезу о том, что , где заданная непрерывная функция распределения. Непараметрич. характер задачи проявляется здесь в непараметричности альтернативы, к-рая может быть сформулирована, напр., в одностороннем варианте: или , либо в двустороннем:.
Задача проверки симметрии заключается в проверке симметрии генеральной функции распределения Gотносительно заданной точки , т. е. равенства
В качестве альтернатив могут выступать односторонние условия
со строгим неравенством хотя бы для одного tлибо двустороннее условие того же типа.
Задача проверки независимости возникает в тех случаях, когда необходимо проверить, являются ли независимыми два признака, наблюдаемые у одного и того же объекта, по независимым наблюдениям над такими объектами. Сходным образом формулируется и гипотеза случайности, когда предполагается, что элементы выборки независимые и одинаково распределенные величины. Наряду с альтернативами общего вида встречаются случаи, когда оказывается возможным указать, чем именно будут отличаться распределения элементов выборки при альтернативе; так возникают, напр., альтернативы тренда и регрессии.
Способы алгоритмич. построения непараметрич. процедур с заданными свойствами разработаны пока недостаточно, и большую роль в выборе подходящей процедуры играют обычно интуиция и эвристич. соображения. На этом пути накоплено большое количество способов и приемов решения часто встречающихся непараметрич. задач (см. [3]).
Большая группа непараметрич. критериев основана на использовании эмпирич. функции распределения. Пусть эмпирич. функция распределения, построенная по выборке объема пиз совокупности с генеральной функцией распределения F. В силу теоремы Гливенко Кантелли
с вероятностью 1. Таким образом, эмпирическая и истинная функции распределения с вероятностью 1 неограниченно сближаются, и на мере их близости можно основывать критерии согласия с гипотезой об истинной функции распределения.
Первыми критериями этого типа были Колмогорова критерий и Крамера Мизеса критерий, предложенные в начале 30-х гг. 20 в. и основанные соответственно на статистиках
и
Следует отметить, что обе эти статистики имеют распределения, не зависящие от генеральной функции распределения F, если только последняя непрерывна. Их предельные распределения, найденные в середине 30-х гг. А. Н. Колмогоровым и Н. В. Смирновым, табулированы, что позволяет приближенно найти границу критич. области, отвечающей заданному уровню значимости (см. [1]).
Предложено и изучено много вариантов критериев согласия, основанных на разности и , напр. Реньи критерий, критерии Андерсона Дарлинга, Ватсона и др. (см. [4]). Для успешного их применения в случае больших выборок необходимо в первую очередь знать соответствующие предельные распределения. Последние могут быть найдены с помощью подхода, в соответствии с к-рым статистика критерия представляется в виде непрерывного функционала от эмпирич. процесса
где эмпирическая функция распределения, построенная по выборке объема nиз равномерного распределения на [0, 1]. Процесс слабо сходится в пространстве D[0,1] к нек-рому гауссовскому процессу, т. н. броуновскому мосту (см. [6]). Поэтому предельное распределение изучаемой статистики совпадает с распределением соответствующего функционала от броуновского моста, к-рое вычисляется с помощью стандартных методов.
Существуют модификации статистик и , предназначенные для проверки гипотез о распределении в многомерном случае, а также для проверки гипотез независимости и симметрии. В этих случаях возникает ряд дополнительных трудностей. Напр., в многомерном случае все рассмотренные статистики теряют свойство универсальности (независимости от исходного распределения). Наиболее важен случай равномерного распределения на единичном кубе, поскольку выборку из многомерного распределения .можно тем или иным способом превратить в выборку из равномерного распределения. Однако ни точное, ни предельное распределения статистики Колмогорова неизвестны (1982) даже в этом простом случае. Сходные затруднения появляются и в том случае, когда проверяется не простая, а сложная гипотеза о распределении, т. е. если предполагается, что генеральная функция распределения имеет вид , где неизвестный параметр, одномерный или многомерный. В этом случае естественно оценить по выборке, напр, посредством оценки максимального правдоподобия , и сравнивать с . Статистики и их разновидности можно построить, как и в случае простой гипотезы. Однако распределения этих статистик как точные, так и предельные оказываются снова зависящими от вида F, а во многих случаях и от неизвестного истинного значения . Задача вычисления этих распределений трудна и точный вид их неизвестен, хотя для статистик типа в ряде случаев удается составить таблицы предельного распределения (см. [5]).
Для нек-рых других статистик известны процентные точки, вычисленные экспериментальным путем.
Наряду с рассмотренными выше критериями согласия строятся их двухвыборочные и многовыборочные аналоги, к-рые могут использоваться как для проверки согласия, так и для проверки однородности нескольких выборок (см. Смирнова критерии).
Общим свойством критериев согласия и однородности, основанных на эмпирич. функции распределения, является состоятельность против любых альтернатив. Однако выбор той или иной статистики в практич. задаче затруднен недостаточной изученностью их мощностных свойств. При больших объемах выборок можно опираться на значения асимптотич. относительной эффективности (АОЭ) по Питмену, вычисленные для ряда наиболее простых статистик (см. [7]).
Другую группу непараметрич. критериев образуют ранговые критерии. Наиболее раннее использование рангового критерия знаков встречается у Дж. Арбетнотта (J. Arbuthnolt, 1710), к-рый использовал его при анализе статистич. данных о рождаемости мальчиков и девочек для получения "аргументов в пользу божественного провидения". Однако современный период развития ранговых критериев начинается в кон. 30-х гг. 20 в. После опубликования в 1945 работы Ф. Вилкоксона (F. Wilcoxon), в к-рой был предложен ранговый критерий, носящий его имя, ранговые методы вступают в период интенсивного развития.
Использование ранговых процедур основано на следующем соображении. Поскольку вектор рангов вместе с вектором порядковых статистик содержит всю информацию, содержащуюся в выборке, то нек-рая доля этой информации содержится только в ранговом векторе. Поэтому можно строить статистич. процедуры, основываясь только на рангах и не используя знание самих выборочных значений. Преимуществом таких процедур является вычислительная простота, вытекающая из целочисленности рангов. Другой важной особенностью ранговых процедур является их применимость и в тех случаях, когда наблюдения носят не количественный, а качественный характер, лишь бы они допускали упорядочение, что особенно важно в исследованиях по социологии, психологии п медицине. Наконец, распределения ранговых статистик при основной гипотезе не зависят от генерального распределения, что позволяет раз и навсегда вычислить эти распределения.
По мере развитпя ранговых методов выяснилось, что доля информации, содержащаяся в векторе рангов, может оказаться значительной, что обеспечивает этим процедурам высокую эффективность. В рассмотренном выше примере, связанном с проверкой однородности двух выборок, расширение области применимости критерия приводит к потере в мощности, и в нормальном случае критерий Стьюдента имеет большую мощность, нежели любой ранговый критерий. Однако при большом числе наблюдений критерий Вилкоксона мало проигрывает критерию Стьюдента. Оказывается, что в нормальном случае АОЭ критерия Вилкоксона по отношению к критерию Стьюдента равна Если же генеральное распределение отлично от нормального, то указанная АОЭ может быть сколь угодно большой, но никогда не опускается ниже значения 0,864 (см. [4]). Более того, существует ранговый критерий (т. н. критерий нормальных меток), АОЭ к-рого по отношению к критерию Стьюдента равна 1 в нормальном случае и превосходит 1 при любом отклонении от нормальности. Таким образом, этот критерий асимптотически оказывается предпочтительнее критерия Стьюдента.