Энциклопедии, словари, справочники - онлайн

Вход

Регистрация

Поиск в словарях

Введите слово для поиска:

Выбор словаря:

Искать во всех

Математическая энциклопедия - стохастическая аппроксимация

Связанные словари

Математическая энциклопедия

Начала современного естествознания

Стохастическая аппроксимация

метод решения класса задач статистич. оценивания, в к-ром новое значение оценки представляет собой поправку к уже имеющейся оценке, основанную на новом наблюдении. Первая процедура С. а. была предложена в 1951 X. Роббинсом(Н. Robbins) и С. Монро (S. Мопге).

Пусть каждое измерение Yn(Xn) функции R(х), в точке Х n содержит случайную ошибку с нулевым средним. Процедура С. а. РоббинсаМонро для нахождения корня уравнения имеет вид

Если функция R(x), напр., убывает, |R(х)|растет не быстрее, чем линейная функция, а случайные ошибки независимы, то Х п стремится к корню х 0 уравнения с вероятностью 1 и в среднем квадратическом (см. [1], [2]). Из (1) видно, что процедура С. а. рекуррентна, т. е. получение нового значения оценки возможно без запоминания старых измерений Yn, и удобна, когда неизвестно заранее, в какой момент потребуется представление оценки она формируется непрерывно на основании наблюдений, имеющихся к данному моменту. Эти черты сближают С. а. с рекуррентными фильтрами и обусловливают популярность С. а. в теоретических и прикладных работах. Процедура (1) непосредственно обобщается на многомерный случай.

Другая процедура С. а., применимая для нахождения точки максимума функции регрессии R(x), принадлежит Дж. Киферу (J. Kiefer) и Дж. Вольфовицу (J. Wolfowitz). Пусть Yn(x) - наблюдение в точке х. Тогда процедура С. а. Кифера Вольфовица имеет вид

Доказывается, что Х п сходится к точке максимума xmax функции R(x), если, напр., R'(x)(x-xmax)<0при функция регрессии и дисперсия случайных ошибок растут не слишком быстро при и выполнены условия

Процедура С. а. Кифера Вольфовица также допускает многомерное обобщение: вместо правой части в (2) следует подставить приближенное значение градиента функции Yn(x).

Процедуры С. а. естественным образом обобщаются на непрерывный процесс наблюдений. Напр., если процесс наблюдений возмущается гауссовским белым шумом, то аналог процедуры (1) имеет вид dX(t) = a(t)dY(t). где

дифференциал наблюдаемого процесса, w(t) -винеровский процесс. Условия сходимости непрерывных процедур аналогичны приведенным выше условиям для дискретного времени (см. [2]). Основным инструментом доказательства сходимости процедур С. а. является теорема о сходимости неотрицательных супермартингалов (см. Мартингал).

Изучалось предельное поведение при соответствующей нормировке разности Х п -х 0 при Пусть в (1)

и почти наверное при При нек-рых ограничениях, основными из к-рых являются требования

при доказывается асимптотич. нормальность с параметрами величины Наименьшая дисперсия предельного распределения достигается при Такой выбор аневозможен, т. к. функция R(х)и ее производная неизвестны наблюдателю. Однако в ряде работ построены адаптивные процедуры, в к-рых а=а (п)зависит от наблюдений и приближается к a0 при Эти процедуры обладают асимптотически оптимальными в смысле асимптотич. дисперсии свойствами.

Результаты об асимптотич. нормальности известны и в многомерном случае. Пусть все корни матрицы

имеют отрицательные действительные части (I единичная матрица),

при почти наверное, и выполнены нек-рые другие не слишком ограничительные условия. Тогда вектор асимптотически нормален с нулевым средним и ковариационной матрицей

Приведенный выше результат об асимптотически оптимальной процедуре Роббинса Монро также обобщен на многомерный случай. Доказано, что случайный процесс Z п сходится к гауссовскому марковскому процессу в логарифмич. масштабе. При нек-рых условиях доказана сходимость моментов случайной величины Х п к моментам предельного закона.

Процедуры типа С. а. удобны в непараметрич. ситуации, т. к. они применимы при наличии скудной априорной информации о функции регрессии. Однако они применимы и для оценки параметра плотности по независимым наблюдениям X1 , . . . , Х п с этой плотностью. При нек-рых ограничениях рекуррентная процедура

информационная матрица Фишера плотности f) является состоятельной и асимптотически эффективной рекуррентной оценкой параметра Аналогичная процедура возможна и в случае непрерывного времени.

Изучалось поведение процедур С. а. в случае, когда функция регрессии имеет несколько нулей (несколько точек экстремума), различные модификации и обобщения процедур С. а.

Лит.:[1] Вазан М., Стохастическая аппроксимация, пер. с англ., М., 1972; [2] Невельсон М. Б., Xасьминский Р. 3., Стохастическая аппроксимация и рекуррентное оценивание, М., 1972; [3] Цыпкин Я. 3., Адаптация и обучение в автоматических системах, М., 1968; [4] его же, Основы теории обучающих систем, М., 1970.

Р. 3. Хасъминский.

Математическая энциклопедия. — М.: Советская энциклопедия

И. М. Виноградов

1977—1985

Математическая энциклопедия

Рейтинг статьи:

Комментарии:

Оставить комментарий

Вопрос-ответ:

Что такое стохастическая аппроксимация

Значение слова стохастическая аппроксимация

Что означает стохастическая аппроксимация

Толкование слова стохастическая аппроксимация

Определение термина стохастическая аппроксимация

stohasticheskaya approksimaciya это

Похожие слова

стохастическое программирование

стохастическое дифференциальное уравнение

стохастический процесс

стохастический интервал

стохастический интеграл

стохастический дифференциал

стохастический вычислительныйалгоритм

стохастический базис

стохастическая эквивалентность

стохастическая сходимость

стохастическая последовательность

стохастическая ограниченность

стохастическая неразличимость

стохастическая непрерывность

стохастическая матрица

стохастическая игра

стохастическая зависимость

стохастическая геометрия

стоуна решетка

стоуна пространство

стоуна - чеха бикомпактное расширение

стокса явление

стокса формула

стокса теорема

Ссылка для сайта или блога:

Ссылка для форума (bb-код):

Самые популярные термины

1	c2-распределение	61
2	f-распределение	37
3	g-расслоение	48
4	l-адические когомологии	65
5	l-род	28
6	l-функция	34
7	n-группа	25
8	p-адическое число	42
9	p-группа	39
10	p-делимая группа	34
11	p-отделимая группа	27
12	p-разрешимая группа	48
13	s-двойственность	30
14	t-распределение	59
15	w-распределение	33
16	w2-распределение	36
17	z-распределение	63
18	абак	267
19	абелев дифференциал	301
20	абелев интеграл	494

Контакты

Использование любых материалов, размещённых на сайте, разрешается при условии ссылки. При копировании материалов со страницы сайта www.terminy.info – обязательна прямая открытая для поисковых систем гиперссылка.