ЭФФЕКТИВНОЕ ПРЕДСТАВЛЕНИЕ И ОЦЕНКА ДИНАМИКИ

МЕДСТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ.



С.А.Гончаров, Сафронов С.Н., В.И.Осадчий, В.А.Хромушин, С.В.Штарков


Анализ медстатистических данных занимает важное место в принятии управленческих решений. В настоящее время имеется большое число математических методов, которые можно использовать для задачи анализа данных. Однако их использование нуждается в наглядном представлении и оценке динамики изменения медстатистических показателей, особенно для руководителей в иерархической пирамиде управления.

Один из возможных подходов в решении поставленной задачи является введение в функцию, которой можно представить с определенным приближением N наблюдений в заданном временном интервале, еще одной переменной, определяющей степень усреднения исходной функции. Для этого можно воспользоваться методом наименьших квадратов [1], представив усредненное несколькими срезами:

срез 1 f1(x) = c0 + a1 x; (1)

срез 2 f2(x) = c0 + b1 x + b2x2; (2)

срез 3 f3(x) = c0 + c1 x + c2 x2 + c3 x3. (3)

и т. д.

Каждый срез представлен полиномом различной степени, коэффициенты которого получены путем решения системы уравнений в частных производных относительно каждого коэффициента. Каждая производная взята от функции меры ошибки, представленной как квадрат разности наблюдаемых значений и выбранной степенной функции, приравненной нулю.

В результате первый срез (1) с наибольшим усреднением будет представлен линией, наклон которой будет показывать общую тенденцию изменения статистического показателя, и ее можно сравнить со скоростью. Второй срез (2) с меньшим усреднением и мерой ошибки будет показывать динамику общей тенденции в изменении статистического показателя и ее можно сравнить с ускорением. Третий срез (3) с более высокой точностью приближения к исходному числовому ряду, для которого сумма квадратов отклонений минимальна, в большей степени отражает динамику показателя и показывает характер изменения ускорения.

В большинстве случаев можно ограничиться степенным рядом третьей степени. Чаще всего в практике приходиться анализировать медленно изменяющиеся процессы, такие как рождаемость, смертность, а также такие нозоологии, как новообразования, психические заболевания, туберкулез и пр. Для таких процессов степенным рядом третьей степени достаточно точно можно осуществить приближение и весьма наглядно представить смысл срезов. В то же время указанный вариант является далеко не единственным. Возможно использовать степенные ряды более высокой степени, а также использовать иные математические модели описания исследуемых процессов.

Представленные срезы позволяют построить поверхность, на переднем плане которой будет находиться срез 1, на дальнем - срез 3, а в середине - срез 2. Промежуточные точки, необходимые для построения поверхности, могут быть получены тем же методом наименьших квадратов из числового ряда f1(xi), f2(xi), f3(xi), где i - номер выборки, соответствующий временной выборке исходного ряда медстатистических данных. Имея математические зависимости, можно построить поверхность для следующего периода времени - экстраполировать данные.

На построенном участке экстраполированной поверхности можно выделять цветовой гаммой тенденции от угрожающей до максимально благоприятной. Это наиболее удобно для руководителей высокого ранга, использующих обобщ╦нную информацию, когда не столь важно знать численное значение параметра, а "ощущать" величину (степень) тенденции (предрасположенности, склонности и т.д.)

Полученная в таком виде поверхность подготовлена для восприятия пользователем динамики процессов, компактна и информационно насыщена. Достаточно простой математический аппарат обработки текущей и ретроспективной информации с определ╦нной точностью строит трудо╦мкий прогноз.

Положенный в основу метод наименьших квадратов можно различным образом использовать для обеспечения качественных характеристик приближения. С этой целью возможно меру ошибки дополнить взвешивающей функцией [2]. Возможно также использовать квадрат ошибки как весовую функцию и многократно повторить приближение методом наименьших квадратов каждый раз с новым квадратом ошибки, что позволит реализовать чебышевское приближение [1].

Введение дополнительной переменной в исходный числовой ряд открывает ряд возможностей по оценке динамики процесса. Так, построенную поверхность можно разделить на две части линией, полученной от решения уравнения f1(x)=f2(x), при этом линия x=0 не учитывается. Назов╦м е╦ линией раздела первого порядка. Интерпретировать раздел поверхности можно, как выделение левой части поверхности, где в основном формируется поведение среза 2, и правой части, где динамика процесса предопределена как следствие динамики левой части.

Количественную оценку динамики среза 2 можно характеризовать процентом снижения коэффициента при переменной первой степени:

(4).

Эта оценка со знаком плюс характеризует ухудшение показателей, а его величина - степень ухудшения.

Аналогично можно разделить поверхность линией второго порядка, полученной от решения уравнения f2(x) = f3(x) и характеризовать динамику среза 3 процентом снижения коэффициента при переменной второй степени:

(5).

На поверхности линию раздела первого порядка можно разместить между срезами 1 и 2, а линию второго порядка - между срезами 2 и 3, выделив цветом каждую часть поверхности. Анализ внешнего вида этих поверхностей позволяет сделать исследователю вывод о наличии "внутри" процесса тенденций развития от совершенно спокойной до крайне неспокойной.

Предложенные оценки далеко не являются единственно возможными. Сам подход, предполагающий введение еще одной переменной, позволяет найти ряд других оценок, в том числе эффективных для определенных категорий нозоологий. Априорно известный характер ряда нозоологий позволяет надеяться на решение таких задач, как определение скрытого периода развития, динамических параметров следующего периода с учетом составляющих. Для решения такого рода задач, а также для доказательной медицины представляет интерес анализ методом алгебраических моделей конструктивной (интуиционистской) логики [3].

Предложенный подход по представлению данных в определенной степени напоминает вейвлет-преобразование [4]. Аналогично ему в предложенном способе имеет место изменение масштаба, за счет чего удается наглядно отобразить данные на поверхности. Представленный способ авторами не противопоставляется вейвлет-анализу и рассматривается как один из вариантов, расширяющий арсенал средств исследователя. Тем не менее отдельные приемы, характерные для вейвлет-анализа, могут быть удачно использованы для предложенного способа.

В частности, возможно вместо срезов использовать усреднение наименьшими квадратами с изменяемым интервалом определения функции, принятой для аналитического представления исследуемого процесса. Предположим, что между узловыми точками функция ведет себя как степенной ряд степени n. Первоначально методом наименьших квадратов находим постоянные коэффициенты в полном интервале определения функции, т. е. с полным исходным числовым рядом. В результате этого находим аналитическую зависимость, определяющую первую строку поверхности.

Затем изменяем интервал (например, уменьшаем в два раза), используя начальную часть числового ряда. Методом наименьших квадратов в этом интервале определяем постоянные коэффициенты степенного ряда. Полученную аналитическую зависимость используем для нахождения значения в центре выбранного интервала. После этого интервал смещаем на один шаг, т. е. исключаем первое значение и прибавляем к интервалу следующее значение. Аналогичным образом определяем коэффициенты степенного ряда и находим новое значение в центре интервала. Назовем эту процедуру сканированием наименьшими квадратами с телескопическим интервалом (СНКТИ). Многократно применяя ее получим значения второй строки поверхности. Следует заметить, что в начале и в конце сканирования остаются зоны невычисленных значений. Их можно вычислить из полученных функций на первом и последнем тактах сдвига.

Для получения следующей строки еще раз уменьшим интервал и осуществим сканирование по вышеизложенной методике. Многократное повторение СНКТИ каждый раз с новым интервалом позволяет построить поверхность, на переднем плане которой с наибольшим масштабом, а на дальнем плане - с наименьшим масштабом, наличествуют усредненные данные числового ряда. Таким образом, на переднем плане можно увидеть общие тенденции изменения процесса, а на дальнем - более детальные.

Следует заметить, что выбор степенного ряда при СНКТИ влияет на детализацию изображения поверхности. При больших значениях степени ухудшается передний план, на котором не будет должным образом просматриваться общая тенденция изменения процесса. В то же время нежелательно отказываться от возможности более точного приближения в выбранном интервале. В этом вопросе требуется компромиссное решение.

Изложенный второй способ представления данных требует иных, чем в первом способе, оценок динамики процесса. Для исследования медстатистических данных важно оценить во времени степень влияния на результат порождающих факторов. Желательно, чтобы на отображаемой поверхности они просматривались, например, как выделенные на общем фоне зоны. Одним из возможных вариантов решения поставленной задачи является построение "разностных" значений поверхности.

Для ее построения необходимо найти разность значений каждой текущей отображаемой строки поверхности и первой строки. Такая поверхность не будет отягощена информацией о характере процесса. На ней будет только необходимая для восприятия и анализа информация о сгруппированных точках в зонах максимума, минимума или типа "волна". Для количественной оценки степени влияния можно использовать среднеарифметическую величину разностных значений поверхности в ее сечении xi. Данный способ позволяет более точно и чутко "ощущать" тенденции развития процесса.

Математический анализ медстатистических данных имеет свои особенности.

Чаще всего объем статистических данных имеет ограничения по временным выборкам. Предложенные способы (особенно первый) ориентированы на работу с ограниченным массивом данных. Разумеется, это не означает, что предложенные способы не зависят от числа данных: чем больше данных, тем выше точность приближения. Тем не менее, предложенные способы работоспособны с этим ограничением.

Важным фактором анализа статистических данных является наглядность их представления, позволяющая оценить динамику процесса по ее составляющим. Представленные способы позволяют это сделать. Более того, количественная оценка, многовариантность представления в виде поверхности расширяют возможности исследования за счет выбора различных математических моделей, различной степени их приближения, в том числе параметров сканирования (второй способ).

Представляется также интересным сравнение процессов по характеру их динамики, что открывает дополнительные возможности в анализе взаимосвязанных процессов. В этом вопросе может быть полезным сравнение между собой поверхностей, в том числе и "разностных". Это позволит учесть те информационные признаки, значимость которых существенна для процесса, но которые в явном виде не просматриваются.

Изложенные подходы в представлении и оценке динамики медстатистической информации расширяют арсенал средств исследователя и могут быть полезны в доказательной медицине.



Литература.

1. Хемминг Р. В. Численные методы для научных работников и инженеров. Изд. 2-е, исправленное - М. : Наука, 1972.

2. Сафронов С. Н., Хромушин В. А. Моделирование процессов, характеризующих чрезвычайные ситуации. // Вестник новых медицинских технологий, 1994-Т.1, N 2 -С.95.

3. Щеглов В.Н. Алгебраические модели конструктивной логики для управления и оптимизации химико-технологических систем. Автореферат диссертации на соискание ученой степени кандидата технических наук; Технологический институт им.Ленсовета.-Л., 1983.

4. DeVore R. A. , Lucier B. I. Wavelets, Acta Numerica (ed. A. Iserles), Cambridge, 1992.