Медицинская энциклопедия - математические методы
Связанные словари
Математические методы
в медицине — совокупность методов количественного изучения и анализа состояния и (или) поведения объектов и систем, относящихся к медицине и здравоохранению. В биологии, медицине и здравоохранении в круг явлений, изучаемых с помощью М.м., входят процессы, происходящие на уровне целостного организма, его систем, органов и тканей (в норме и при патологии); заболевания и способы их лечения; приборы и системы медицинской техники; популяционные и организационные аспекты поведения сложных систем в здравоохранении; биологические процессы, происходящие на молекулярном уровне.
Степень математизации научных дисциплин служит объективной характеристикой глубины знаний об изучаемом предмете. Так, многие явления физики, химии, техники описываются М.м. достаточно полно. В результате эти науки достигли высокой степени теоретических обобщений. В биологических науках М.м. пока еще играют подчиненную роль из-за сложности объектов, процессов и явлений, вариабельности их характеристики, наличия индивидуальных особенностей. Систематические попытки использовать М.м. в биомедицинских направлениях начались в 80-х гг. 19 в. Общая идея корреляции, выдвинутая английским психологом и антропологом Гальтоном (F. Galton) и усовершенствованная английским биологом и математиком Пирсоном (К. Pearson), возникла как результат попыток обработки биомедицинских данных. Точно так же из попыток решить биологические проблемы родились известные методы прикладной статистики. До настоящего времени методы математической статистики являются ведущими М.м. для биомедицинских наук. Начиная с 40-х гг. 20 в. математические методы проникают в медицину и биологию через кибернетику (Кибернетика) и информатику (Информатика). Наиболее развиты М.м. в биофизике, биохимии, генетике, физиологии, медицинском приборостроении, создании биотехнических систем. Благодаря М.м. значительно расширилась область познания основ жизнедеятельности и появились новые высокоэффективные методы диагностики и лечения; М. м. лежат в основе разработок систем жизнеобеспечения, используются в медицинской технике.
Все большую роль во внедрении М.м. в медицину играют ЭВМ (см. Электронная вычислительная машина). В частности, применение методов математической статистики облегчается тем, что стандартные пакеты прикладных программ для ЭВМ обеспечивают выполнение основных операций по статистической обработке данных. М.м. смыкаются с методами кибернетики (Кибернетика) и информатики (Информатика), что позволяет получать более точные выводы и рекомендации, внедрять новые средства и методы лечения и диагностики.
Математические методы применяют для описания биомедицинских процессов (прежде всего нормального и патологического функционирования организма и его систем, диагностики и лечения). Описание проводят в двух основных направлениях. Для обработки биомедицинских данных используют различные методы математической статистики, выбор одного из которых в каждом конкретном случае основывается на характере распределения анализируемых данных. Эти методы предназначены для выявления закономерностей, свойственных биомедицинским объектам, поиска сходства и различий между отдельными группами объектов, оценки влияния на них разнообразных внешних факторов и т.п. На основе определенной гипотезы о типе распределения изучаемых данных в серии наблюдений и использования соответствующего математического аппарата с той или иной достоверностью устанавливаются свойства биомедицинских объектов, делаются практические выводы, даются рекомендации. Описания свойств объектов, получаемые с помощью методов математической статистики, называют иногда моделями данных. Модели данных не содержат какой-либо информации или гипотез о внутренней структуре реального объекта и опираются только на результаты инструментальных измерений.
Другое направление связано с моделями систем и основывается на математическом описании объектов и явлений, содержательно использующих сведения о структуре изучаемых систем, механизмах взаимодействия их отдельных элементов. Разработка и практическое использование математических моделей систем (математическое моделирование) составляют перспективное направление применения М.м. в биологии и медицине.
Статистические методы обработки стали привычным и широко распространенным аппаратом для работников медицины и здравоохранения, например диагностические таблицы, пакеты прикладных программ для статистической обработки данных на ЭВМ (см. Программирование). Однако использование этой группы М.м. вызвало ряд проблем принципиального характера, связанных с выбором адекватного задаче метода статистической обработки и содержательно обоснованного его применения. Эти факторы послужили причиной роста требований к качеству статистической обработки экспериментальных и клинических данных, в т.ч. для публикации результатов исследований в научных журналах. Ранее считалось достаточной обработка данных простейшими статистическими методами и простыми формами корреляционного и регрессионного анализа. Это, как показал опыт, далеко не всегда позволяет выявить сущность исследуемых явлений и, более того, не дает гарантий в отношении надежности результатов. В СССР сложившееся положение частично вызвано недостаточным количеством ЭВМ, а в основном — недостаточным уровнем подготовки работников медицины и здравоохранения в области прикладной статистики.
Существует несколько основных понятий, необходимых для эффективного использования методов современной многомерной статистики.
Статистическая совокупность — понятие, лежащее в основе всех статистических методов. Объекты, с которыми имеют дело в медицине, обладают большой вариабельностью — их характеристики меняются во времени и пространстве в зависимости от многих факторов, а также существенно отличаются друг от друга, Характеристики таких объектов обычно представляют в виде матрицы наблюдений, где столбцы соответствуют различным признакам, а строки — либо разным объектам, либо последовательным во времени наблюдениям за одним и тем же объектом.
Из-за вариабельности измеряемых признаков приходится считать их значения случайными величинами и пользоваться вероятностными (стохастическими) постановками задач: матрица наблюдений является выборкой, или выборочной совокупностью случайных величин из некоторой генеральной совокупности. Сама генеральная совокупность обычно трактуется как множество всех объектов определенного типа или как совокупность всех возможных реализаций какого-либо явления. Основными задачами статистического исследования являются выявление и анализ закономерностей, присущих объектам в выборке, с целью установления возможности и достоверности перенесения сделанных выводов на генеральную совокупность.
Признаки, характеризующие объекты в медицине и здравоохранении, подразделяются на количественные, порядковые и качественные. Для количественных признаков можно указать точную характеристику — число (например, вес, рост, величина АД, данные анализов), Для порядковых признаков (ранговых, если каждой градации ставится в соответствие число — ранг) точная характеристика невозможна, но можно указать степень выраженности соответствующего свойства (хрипы в легких — единичные, множественные; интенсивность кашля — слабая, средняя, сильная, очень сильная). Качественные признаки не поддаются упорядочиванию или ранжированию (цвет глаз — голубой, серый, карий).
Обычно объекты в биологии и медицине описываются множеством признаков одновременно. Набор учитываемых при исследовании признаков называется пространством признаков. Значения всех этих признаков для данного объекта однозначно определяют его положение как точку в пространстве признаков. Если признаки рассматриваются как случайные величины, то точка, описывающая состояние объекта, занимает в пространстве признаков случайное положение.
Закон распределения случайной величины — это функция, определяющая вероятность того, что какой-либо признак примет заданное значение (если он дискретен) или попадает в заданный интервал значений (если он непрерывен). При большом числе выборочных данных, значения которых варьируют незначительно, закон распределения может быть аппроксимирован гистограммой. Для построения гистограммы интервал значений признака разбивается на равные участки, для которых подсчитывается частота попадания случайной величины. При бесконечном увеличении числа наблюдений и участков частота стремится к вероятности, а вид гистограммы приближается к кривой, выражающей функцию плотности (или плотности вероятности) случайной величины.
Законы распределения могут быть одномерными и многомерными. В последнем случае закон описывает вероятность появления сочетанных значений признаков или попадания их в некоторую область пространства признаков. В прикладной статистике особую роль играют несколько наиболее часто используемых законов распределения. Наиболее разработана гипотеза о нормальном распределении (закон Гаусса), функция плотности вероятности f (x) для которого имеет вид:
где М — математическое ожидание,
σ — среднеквадратическое (стандартное) отклонение,
е — основание натуральных логарифмов (e = 2.718...).
Параметры закона Гаусса М и σ приближенно оцениваются по любой выборке из генеральной совокупности:
,
где N — объем выборки, х — значение исследуемого количественного признака для 1-го измерения.
Величина о, возведенная в квадрат, называется дисперсией: D = σ2 Дисперсия характеризует разброс (вариабельность) случайной величины около среднего значения. При нормальном распределении случайной величины ее наблюдаемые значения с большой вероятностью (равной 0,9972) отклоняются от М в ту или другую сторону не более чем на 3σ (правило трех сигм).
Оценка математического ожидания М по выборке (называемая выборочным средним) тоже является случайной величиной. Она описывается так называемым распределением Стьюдента. Это распределение зависит от числа наблюдений (числа степеней свободы) и приводится в справочниках по прикладной статистике. Критерий Стьюдента (t-критерий) используется для оценки и сравнения средних значений нормально распределенных случайных величин. Имеется обобщение закона и критерия Стьюдента на многомерный случай.
Выборочная дисперсия также является случайной величиной, распределение которой получило название распределения χ2 (хи-квадрат) Пирсона (по имени одного из основоположников биометрии). Таблицы значений χ2 включены во все пособия по статистике. На основании распределения χ2 строятся доверительные интервалы случайных величин.
Для сравнения выборочных дисперсий двух серий наблюдений используют распределение Фишера, которое зависит от числа степеней свободы обеих выборок и также представлено в табличной форме. Критерий Фишера (F-критерий) применяется для сравнения выборочных дисперсий и формирования оценок в регрессионном, дисперсионном и дискриминантном анализе.
Перечисленные типы распределений относятся к непрерывным случайным величинам. Для дискретных случайных величин используется распределение Пуассона (закон редких явлений):
где М — значение математического ожидания и равное ему значение дисперсии, Pk — вероятность того, что случайная величина принимает значение, равное k (здесь k — любое целое число).
Для таких же величин применяется закон распределения числа взаимоисключающих событий при конечном числе испытаний (биномиальное распределение). Эти распределения употребляются для описания случайных значений параметров в медицинской диагностике, при анализе популяционных процессов и т.п.
Статистическое оценивание применяют в медицинских исследованиях, когда получаемых данных недостаточно для установления вида функции распределения случайных величин. В этом случае предполагают, что реализуется один из законов распределения, а матрицу наблюдений используют для оценки параметров этого закона.
Статистические оценки могут быть точечными или интервальными. В первом случае оценка дается в виде чисел (как правило, это среднее значение и дисперсия). Во втором случае определяется интервал, в котором исследуемая случайная величина находится с заданной вероятностью. Получаемые оценки должны относиться к генеральной совокупности. Интервальная оценка генерального среднего (математического ожидания) производится на основе распределения Стьюдента (при числе наблюдений не более 50—60) или на основе гипотезы о нормальном распределении (при большем числе наблюдений). Для оценки генеральной дисперсии применяется распределение χ2. Интервал, в котором с заданной вероятностью находится генеральный параметр, называется доверительным интервалом, сама такая вероятность — доверительной вероятностью. В медицинских исследованиях используют три порога доверительной вероятности β: 0,95; 0,99; 0,999. Чем точнее требуется результат, тем большим порогом задается исследователь и тем шире (при прочих равных условиях) получается доверительный интервал. В статистике наряду с понятием доверительной вероятности употребляется термин «уровень значимости». Соответственно применяются три уровня значимости 0,05; 0,01 и 0,001.
Проверка статистических гипотез используется чаще всего для определения принадлежности двух имеющихся выборок к одной и той же генеральной совокупности. Подобные задачи возникают, например, при анализе заболеваемости, эффективности лекарственных препаратов и т.п.
Гипотеза о том, что обе выборки не различаются, т.е. принадлежат к одной генеральной совокупности, называется иногда нуль-гипотезой. Эта гипотеза принимается, если ее значимость, получаемая на основании статистических критериев, превышает допустимый порог (р > 0,95). Однако при р < 0,95 отвергнуть эту гипотезу нельзя: ответ остается неопределенным, и для получения окончательного вывода требуются дополнительные данные. Гипотеза отвергается в том случае, если ее значимость (вероятность правильности) становится меньше заданного стандартного порога.
При проверке статистических гипотез используются параметрические и непараметрические критерии. В первом случае производится сравнение параметров двух выборочных распределений (средних и дисперсий) и делается заключение о равенстве или различии этих параметров в генеральных совокупностях. Гипотеза о равенстве средних значений проверяется по критерию Стьюдента, равенство дисперсий — по критерию Фишера. Описание соответствующих процедур можно найти в любом пособии по математической статистике.
В последние годы большую популярность приобрели непараметрические критерии (Уилкоксона, Колмогорова — Смирнова и др.). Их достоинством является то, что они не содержат ограничений, вытекающих из гипотез о типе распределения случайных величин, а опираются на единый принцип — непрерывности распределений.
Эти критерии применимы и для анализа порядковых данных. Однако по сравнению с параметрическими методами они менее чувствительны к различиям в выборках. Чаще всего непараметрические критерии используются для сравнения эмпирического распределения с теоретическим, в частности при проверке имеющейся статистической совокупности на принадлежность к типу нормальных распределений.
Дисперсионный анализ — статистический метод, применяемый для выявления влияния отдельных факторов (количественных, порядковых или качественных) на изучаемый признак и оценку степени этого влияния. Если изучается действие количественного фактора, то предварительно производится его разбивка на градации. Для каждой градации подсчитывается среднее значение изучаемого признака, затем дисперсия среднего по градациям фактора относительно общего среднего и, наконец, общая дисперсия изучаемого показателя (независимо от значения фактора).
В теории дисперсионного анализа показано, что общая дисперсия D равна дисперсии средних по градациям фактора DF (доля дисперсии за счет действия исследуемого фактора — объясненная дисперсия) плюс остаточная дисперсия за счет действия случайных факторов (DS): D = DF + DS. Чем больше эта величина, тем сильнее влияние фактора на изучаемый признак.
Для количественной оценки степени влияния вычисляют показатель F по формуле:
,
где L — число градаций фактора, N — объем статистической совокупности.
Показатель влияния F затем сравнивается со стандартным значением Fst в таблице Фишера (для выбранного уровня значимости при соответствующем числе степеней свободы). Если F > Fst то факт влияния считается достоверно доказанным.
Описанная схема называется однофакторным дисперсионным анализом.
Анализ зависимости между признаками. Для оценки степени взаимозависимости двух количественных признаков чаще всего используют коэффициент ковариации или его нормированное значение — коэффициент корреляции:
где xi и yi — значения первого и второго признаков в 1-м наблюдении, σx и σy — стандартные отклонения первого и второго признаков; N — объем выборки, Х и Y — математические ожидания х и у.
При отсутствии связи между признаками величина R равна 0, при возрастании степени связи абсолютная величина R увеличивается. При наличии детерминированной (функциональной) связи величина R равна + 1 или 1 (если увеличение одного признака сопровождается соответственно увеличением или уменьшением другого). При промежуточных значениях R каждому фиксированному значению одного признака отвечает некоторое распределение значений другого, с тем меньшей дисперсией, чем больше абсолютная величина R. В простейшем виде коэффициент корреляции отражает линейную связь между признаками, когда изменения обоих признаков пропорциональны во всем диапазоне.
При наличии нелинейной связи, например при квадратичной зависимости одного признака от другого, коэффициент корреляции может быть равен нулю. В таких случаях для выявления связи применяют другой показатель — корреляционное отношение, которое фиксирует наличие любой связи между признаками. Область значений одного признака разбивается на участки, для каждого из них определяется среднее значение другого признака. Далее вычисляется корреляционное отношение:
,
где DF — дисперсия второго признака за счет влияния первого, D — общая дисперсия второго признака. Величина корреляционного отношения, как и коэффициента корреляции, лежит между нулем и единицей.
Если исследуется группа тесно связанных между собой признаков, то корреляция между двумя из них может сильно изменяться под влиянием третьего. Так, зависимость АД от минутного выброса сердца существенно меняется при изменениях сосудистого сопротивления. Для анализа подобных случаев применяют показатели частной корреляции, позволяющие нейтрализовать влияние третьих признаков. Частный коэффициент корреляции вычисляется на основе парных коэффициентов корреляции:
,
где Rxy (z) — частный коэффициент корреляции между признаками Х и Y при нейтрализации влияния признака Z, а Rxy, Rxz Ryz — парные коэффициенты корреляции.
В случае необходимости анализа влияния нескольких признаков на один (множественная корреляция) применяется более громоздкая, требующая больших объемов вычислений процедура.
Если исследованию подлежит связь между порядковыми признаками (например, связь между выраженностью реакции Манту и степенью развития туберкулезного процесса), то применяют так называемый ранговый коэффициент корреляции — каждому уровню признака присваивается свой ранг, для каждого наблюдения вычисляется разница рангов.
Регрессионный анализ. Регрессией называется зависимость среднего значения одной случайной величины от некоторой другой (или от нескольких случайных величин), а регрессионным анализом — раздел математической статистики, объединяющий прикладные методы исследования регрессионных зависимостей. Регрессионный анализ приобрел большую популярность в связи с распространением ЭВМ.
Если xi и yi — наблюдаемые случайные величины, ei — случайная ошибка с нулевым математическим ожиданием, то регрессия записывается в виде:
yi = f (xi) + ei, i = 1, 2,..., N,
где f — функция регрессии.
Если xi — скалярная величина (число), то регрессия называется парной (связывающей пару случайных величин), если xi — вектор, то множественной.
Задачей регрессионного анализа является нахождение «наилучшей» функции f, описывающей зависимость у от х. Оценка производится либо по методу наименьших квадратов, либо по методу максимума правдоподобия (что возможно только при известном распределении величин у).
При использовании регрессионного анализа важно правильно выбрать вид и степень сложности регрессионной модели. Классический путь состоит в учете биологических, физических и других предпосылок, а качество полученной модели оценивается по величине остаточных отклонений. Возможен способ проверки гипотезы линейности по остаточным отклонениям — вычисляется показатель нелинейности и производится проверка достоверности его отличия от нуля по критерию Фишера. Другой подход предложен в 1970-х гг. В.Н. Вапником: при малых выборках сложность регрессионной модели должна быть тем меньше, чем меньше объем выборки, имеющейся в распоряжении исследователя. Разработаны критерии оптимальной сложности регрессии в зависимости от дисперсии остаточных отклонений и объема выборки.
Факторный анализ — совокупность методов исследования многомерных признаков за счет снижения их размерности (путем введения так называемых общих факторов, которые непосредственно наблюдаться не могут). В медицине методы факторного анализа применяются для решения двух взаимосвязанных задач: группировки исходной системы признаков на основе их корреляционных связей и сжатия информации за счет построения системы обобщенных индикаторов.
В факторной модели каждый исходный признак представляется в виде комбинации новых показателей (общих факторов), число которых, как правило, устанавливается меньше числа исходных. Такой метод описания удобен, например, для получения обобщенных индексов, характеризующих состояние системы здравоохранения различных регионов или однородных учреждений (исходные показатели — заболеваемость, смертность, количество профосмотров — заменяются набором обобщенных показателей, определяющих ресурсное обеспечение, качество врачебного обслуживания и т.п.).
Недостатком факторного анализа является трудность содержательной интерпретации общих факторов.
Кластерный анализ — группа методов статистической обработки, которая включает методы классификации объектов, в т.ч. автоматические, на основе их сходства. Кластерный анализ, как и факторный, «сжимает» информацию. Но если факторный анализ снижает размерность пространства признаков, то кластерный уменьшает число рассматриваемых объектов. Совокупность объектов разбивается на кластеры — группы объектов, обладающие сходными свойствами, поэтому вместо всей группы можно рассматривать один объект, характеризующий ее. Так, ряд административных территорий может быть представлен в виде одного кластера, объединяющего регионы с одинаковой эпидемиологической обстановкой. Кластерный анализ включает методы, которые исходно не принимают во внимание вероятностную природу обрабатываемых данных. При постановке задач кластеризации число кластеров, на которое должно быть разбито исходное множество объектов, может задаваться заранее или выявляться в процессе решения.
Алгоритмы кластерного анализа направлены на получение наилучшего в определенном смысле качества разбиения совокупности объектов на группы.
Распознавание образов. Характерной особенностью одного из подходов к разработке алгоритма распознавания является применение обучающей выборки («обучение с учителем»). В качестве обучающей выборки используется группа объектов с заранее установленным классом принадлежности. При реализации другого подхода распознавания («без учителя») задача состоит в поиске такого способа классификации, который позволяет получать наилучшее разбиение групп объектов на классы (образы). Методы распознавания образов широко распространены в медицине — в машинной диагностике, при выделении групп риска, выборе альтернативных тактик лечения и т.д.
Разработано большое число подходов к распознаванию образов. Наиболее часто применяются методы дискриминантного анализа, метод Бейеса, метод обобщенного портрета, метод ближайшего соседа.
Другие методы прикладной статистики (исследование временных рядов и краткосрочное прогнозирование развивающихся во времени процессов, планирование эксперимента и др.) учитывают специфику задач и возможности использования для их решения ЭВМ.
Если для решения каких-либо задач не удается найти строгие формальные методы, то прибегают к интуитивно найденным способам, эффективность которых проверяется на практике. Поскольку подобные приемы являются результатом и имитируют интеллектуальную деятельность человека, они получили название эвристик. Эвристические методы применяются для таких задач анализа данных, как классификация, распознавание образов и т.п.
Математическое моделирование систем является вторым кардинальным направлением применения М.м. в медицине. Основным понятием, используемым при таком анализе, является математическая модель системы.
Под математической моделью понимается описание какого-либо класса объектов или явлений, выполненное с помощью математической символики. Модель представляет собой компактную запись некоторых существенных сведений о моделируемом явлении, накопленных специалистами в конкретной области (физиологии, биологии, медицине). Иногда можно встретить и устаревшее значение термина «математическое моделирование» как процесса анализа модели на ЭВМ. Чтобы избежать путаницы, во втором случае используют понятие «вычислительный эксперимент».
В математическом моделировании выделяют несколько этапов. Основным является формулирование качественных и количественных закономерностей, описывающих основные черты явления. На этом этапе необходимо широкое привлечение знаний и фактов о структуре и характере функционирования рассматриваемой системы, ее свойствах и проявлениях. Этап завершается созданием качественной (описательной) модели объекта, явления или системы. Этот этап не является специфическим для математического моделирования. Словесное (вербальное) описание (часто с использованием цифрового материала) в ряде случаев является конечным результатом физиологических, психологических, медицинских исследований. Математической моделью описание объекта становится только после того, как оно на последующих этапах переводится на язык математических терминов. Модели в зависимости от используемого математического аппарата подразделяются на несколько классов. В медицине и биологии чаще всего применяются описания с помощью уравнений. В связи с созданием компьютерных методов решения так называемых интеллектуальных задач начали распространяться логико-семантические модели. Этот тип моделей используется для описания процессов принятия решений, психической и поведенческой деятельности и других явлений. Часто они принимают форму своеобразных «сценариев», отражающих врачебную или иную деятельность. При формализации более простых процессов, описывающих поведение биохимических, физиологических систем, задач управления функциями организма, применяются уравнения различных типов.
Если исследователя не интересует развитие процессов во времени (динамика объекта), можно ограничиться алгебраическими уравнениями. Модели в этом случае называются статическими. Несмотря на кажущуюся простоту, они играют большую роль в решении практических задач. Так, в основе современной компьютерной томографии лежит теоретическая модель поглощения излучения тканями организма, имеющая вид системы алгебраических уравнений. Решение ее компьютером после преобразований представляется в виде визуальной картины томографического среза.
Для описания свойств систем, изменяющихся во времени, используются динамические модели, чаще всего в виде обыкновенных дифференциальных уравнений:
,
где х1, х2..., xn — переменные, а1, а2,... am — параметры модели, u1, u2,..., ue — внешние воздействия на систему, t — время, n = 1, 2,..., N.
Величина — производная xi по времени (скорость изменения xi). Разница между переменными х и параметрами а в уравнении заключается в следующем. К переменным относятся такие величины, которые могут влиять друг на друга и согласованно изменяться под действием внешних воздействий во время изучения объекта. Параметры отражают те свойства объекта, которые характеризуются неизмененными значениями в течение всего времени изучения объекта (модель с неизмененными постоянными параметрами) или меняются со временем, но вне всякой связи с изменением переменных (модель с изменяющимися параметрами). Параметрами модели являются коэффициенты описывающих ее уравнений. Следует отличать указанный смысл термина «параметры модели» от принятого в биомедицинской литературе, где часто под параметрами понимаются любые количественные характеристики состояния организма или его систем.
После записи математической модели проводится ее анализ с точки зрения адекватности задаче, которую планируется решать с ее помощью, — верификация модели. Верификация состоит в том, что на созданной модели воспроизводится (например, с помощью ЭВМ) круг моделируемых явлений или процессов, для которых имеется достоверный экспериментальный материал. При определенном совпадении результатов расчета с экспериментальными данными модель считается адекватной. В противном случае необходимо уточнять исходные концепции и допущения, а затем снова верифицировать модель. Удовлетворяющая исследователя модель анализируется и обсчитывается на ЭВМ, что и называется вычислительным экспериментом. При анализе результатов вычислительных экспериментов следует учитывать, что модель — всегда лишь упрощенное описание реальных явлений. Поэтому выводы, получаемые с помощью моделирования, требуют дополнительного осмысливания.
Компартментальное моделирование распространено в медицине и биологии. Согласно определению американского фармаколога и биохимика Шеппарда (С.W. Sheppard, 1948), компартмент — это некоторое количество вещества, выделяемое в биологической системе и обладающее свойством единства, поэтому в процессах транспорта и химических преобразований его можно рассматривать как целое. Например, в качестве особых компартментов рассматривают весь кислород в легких, всю углекислоту в венозной крови, количество введенного препарата в межклеточной жидкости, запас гликогена в печени и т.п. Модели, в которых исследуемая система представляется в виде совокупности компартментов, потоков вещества между ними, а также источников и стоков всех веществ, называются компартментальными.
В компартментальной модели каждому компартменту соответствует своя переменная состояния — количественная характеристика компартмента (концентрация, масса вещества, парциальное давление газа и т.п.). Вещество попадает в систему через источники — естественные (физиологические процессы внешнего дыхания, например источник кислорода) или искусственные (капельница или инъекции); удаляются через стоки — естественные (например, почка) или искусственные (например, аппаратура гемосорбции). Темпы (скорости) потоков вещества из одного компартмента в другой часто предполагаются пропорциональными концентрациям или количествам вещества в компартменте. Поэтому компартментальные модели описываются системой дифференциальных уравнений, число которых N равно числу рассматриваемых компартментов:
,
где xi — количественная характеристика i-го компартмента (количество или концентрация), i, k = 1, 2,..., N; qij — так называемые транспортные коэффициенты, произведение qijxj определяет скорость потока в i-й компартмент из j-го (индекс О относится к среде), goi — приток в i-й компартмент из окружающей среды.
Компартментальные модели широко применяются в фармакокинетике (Фармакокинетика) для анализа процессов транспорта и накопления в организме лекарственных препаратов. Такие модели часто называют камерными. Камера — условно выделяемая часть организма (иногда она может соответствовать конкретной части — плазме крови, межклеточной жидкости, в которой данное вещество можно считать распределенным равномерно). Очевидно, что вещество в каждой камере можно рассматривать как компартмент. Если в модели имеется несколько веществ одновременно, то одной камере соответствует несколько компартментов (например, количество кислорода в межклеточной жидкости и количество препарата в ней же). Понятие «камера» является, т.о., более узким по сравнению с компартментом. Поэтому камерные модели используются в фармакокинетических моделях для исследования поведения только одного вещества — введенного препарата.
Интегрированные и минимальные модели. При математическом моделировании выделяют два независимых круга задач, в которых используют модели. Первый носит теоретический характер и направлен на расшифровку структуры систем, принципов ее функционирования, оценку роли и потенциальных возможностей конкретных регуляторных механизмов и т.п. Модели, создаваемые для таких задач, носят название интегрированных (интегральных). В них стремятся наиболее полно учесть имеющиеся данные о структуре системы, ввести максимально возможное число параметров и переменных. По мере накопления знаний о биологическом объекте в интегрированных моделях наблюдается тенденция к усложнению структуры и повышению размерности описывающих их уравнений.
Другой круг задач имеет более практическую направленность. В медицине они применяются, например, с целью получения конкретных рекомендаций для индивидуального больного или группы однородных больных: определение оптимальной суточной дозы препарата для данного больного при различных режимах питания, физической нагрузки и т.д. В моделях этого типа сознательно ограничивается сложность описания, поэтому они часто называются минимальными.
Если для интегральных моделей достаточно выполнить требования верификации, т.е. обеспечить качественное совпадение основных процессов в модели и оригинале, непротиворечивость модели исходным теориям и фактам, то при разработке минимальных моделей требования к их адекватности возрастают. Индивидуализация математического описания требует специальной процедуры, которая в теории управления и кибернетике называется идентификацией. Идентификация — количественный выбор параметров модели, дающий наиболее близкое совпадение с результатами контрольных экспериментов (например, в смысле минимума среднеквадратической ошибки или по другим статистическим критериям). Разработаны многочисленные методы идентификации, позволяющие решить эту задачу для линейных моделей. В нелинейных случаях для идентификации применяют компьютерные процедуры (в т.ч. эвристические).
Метод черного ящика. Первым примером упрощенного описания живых систем в медицине и биологии была модель черного ящика, когда все выводы делались только на основе изучения реакций объекта (выходов) на те или иные внешние воздействия (входы) без учета внутренней структуры объекта. Соответствующее описание объекта в понятиях вход — выход оказалось неудовлетворительным, т.к. оно не учитывало изменения его выходных реакций на одно и то же воздействие из-за влияния внутренних изменений в объекте. Поэтому метод черного ящика уступил место методам пространства состояний, в которых описание дается в понятиях вход — состояние — выход. Наиболее естественным описанием динамической системы в рамках теории пространства состояний является компартментальное моделирование, где каждому компартменту соответствует одна переменная состояния. В то же время соотношения вход — выход по-прежнему широко используются для описания существенных свойств биологических объектов.
Выбор тех или иных М.м. при описании и исследовании биологических и медицинских объектов зависит как от индивидуальных знаний специалиста, так и от особенностей решаемых задач. Например, статистические методы дают полное решение задачи во всех случаях, когда исследователя не интересует внутренняя сущность процессов, лежащих в основе изучаемых явлений. Когда знания о структуре системы, механизмах ее функционирования, протекающих в ней процессах и возникающих явлениях могут существенно повлиять на решения исследователя, прибегают к методам математического моделирования систем.
Библиогр.: Афифи А.А. и Эйзен С. Статистический анализ, пер. с англ., М., 1982; Кощеев В.А. Автоматизация статистического анализа данных, М., 1988; Марчук Г.И. Математические модели в иммунологии, М., 1985; Новосельцев В.Н. Теория управления и биосистемы, М., 1978; Романовский Ю.М., Степанова Н.В. и Чернавский Д.С. Математическая физика, М., 1984; Урбах В.Ю. Статистический анализ в биологических и медицинских исследованиях, М., 1975, библиогр.: Ферстер Э. и Ренц Б. Методы корреляционного и регрессионного анализа, пер. с нем., М., 1983; Штейн Л.Б. Опыт прогнозирования в медицине с помощью ЭВМ, Л., 1987.
1. Малая медицинская энциклопедия. — М.: Медицинская энциклопедия. 1991—96 гг. 2. Первая медицинская помощь. — М.: Большая Российская Энциклопедия. 1994 г. 3. Энциклопедический словарь медицинских терминов. — М.: Советская энциклопедия. — 1982—1984 гг