ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ

Прогнозный мониторинг вторых волн эпидемии COVID-19 в Иране, России и других странах

Д. А. Ковригин1, С. П. Никитенкова2
Информация об авторах

1 Нижегородский государственный технический университет имени Р. Е. Алексеева, Нижний Новгород, Россия

2 Национальный исследовательский Нижегородский государственный университет имени Н. И. Лобачевского, Нижний Новгород, Россия

Для корреспонденции: Светлана Павловна Никитенкова
пр. Гагарина, д. 23, г. Нижний Новгород, 603950; moc.liamg@avoknetikins

Информация о статье

Вклад авторов: Д. А. Ковригин — планирование исследования, анализ литературы, анализ и интерпретация данных, подготовка черновика и финального варианта статьи; С. П. Никитенкова — планирование исследования, интерпретация данных, подготовка черновика и финального варианта статьи.

Статья получена: 13.07.2020 Статья принята к печати: 02.08.2020 Опубликовано online: 13.08.2020
|

Эпидемия в Иране привлекала внимание обозревателей и исследователей относительно высоким уровнем общих случаев заражения [15]. Обработка официальных статистических данных с целью прогнозирования вторых волн на основе логистической модели показала, что первая волна представляла собой лишь предвестник распространения новой, более высокой волны эпидемии, уже прокатившейся по этой стране и породившей в начале июня третью волну [6]. (Под волной эпидемии здесь следует понимать процесс переноса и распространения инфекции на новую территорию с новым населением либо ее возврат на старую территорию, частично или полностью восстановившуюся после первой эпидемии.)
Недавно вторые волны эпидемии стали отчетливо наблюдать в Швеции, США, Украине, Сербии, Румынии, Чехии, Эквадоре и некоторых других странах. Строгих математических моделей для описания, в частности, критических точек, в которых появляются вторые волны эпидемии, пока нет. (Под строгой теорией здесь следует понимать аксиоматику на основе принципа максимума. Всякая эпидемия естественным образом «стремится» занять всю территорию и охватить все население, которые ей «предоставлены».)

На сегодняшний день в средствах массовой информации все чаще появляются сообщения об ожидании второй волны эпидемии в России. Однако острый вопрос  о том, быть или не быть второй волне эпидемии в России, без строгого анализа входных данных остается открытым.
Целью работы было математически описать вторые волны эпидемии с помощью простейшей динамической системы, параметры которой вычисляли с использованием таблиц с официальными данными (источник данных: https://covid.ourworldindata.org/), а также выявить условия, наиболее благоприятные для возникновения вторых волн.

МАТЕРИАЛЫ И МЕТОДЫ

Для построения логистической кривой выстраивали табличные автокорреляционные зависимости Ni + 1 = ƒc(Ni ), где Ni — количество зарегистрированных случаев за один день в стране с номером c. С помощью метода наименьших квадратов определяли полиномиальные аппроксимации табличных функций ƒc, которые обозначали как Fc. Численные эксперименты подтверждают достаточность квадратичной аппроксимации функций ƒs от аргумента Ni.

Это означает, что динамическая модель принимает вид точечного аналитического отображения с правой частью

Fc (Ni ) = a0 + a1Ni + a2Ni2.

Здесь aj — параметры, определяемые из таблиц (источник данных: https://covid.ourworldindata.org/). Время перехода из состояния Ni в состояние Ni + 1 составляет один день. Данные обрабатываются с помощью несложных критериев отбора с использованием стандартного программного обеспечения Maple (Maplesoft; Канада).

Временную эволюцию каждой отдельной волны эпидемии в странах, обладающих качественной статистикой, адекватно описывают решения логистического уравнения, когда фазовая точка динамической системы переходит из нулевой неустойчивой стационарной точки N = 0 в устойчивое состояние равновесия N = N*, где N* — положительный корень квадратного уравнения

N* = a0 + a1N* + a2N*2.

Устойчивому состоянию соответствует почти нулевой прирост заболеваний [7]. На момент достижения устойчивого равновесия логистическое уравнение уже не является достаточным для описания эволюции заболевания в развитом человеческом обществе. Дальнейшая судьба инфицированных людей зависит от качества карантинных мер, медицинской помощи и т. д. Нет сомнения в том, что теоретически эпидемия может развиваться во второй и третий раз и т. д. непредсказуемым образом, если пренебречь надлежащими противоэпидемическими мерами.

Нетрудно догадаться, что параметр a0 теоретически должен быть нулевым, хотя на практике он отличен от нуля. Поэтому, можно интерпретировать относительный показатель a0/N* как качество статистических данных, которое тем выше, чем больше N*. Положительный параметр a1, всегда несколько больший единицы, определяет максимальную скорость распространения эпидемии. Чем выше культура социальной гигиены в обществе, тем ближе этот параметр к единице. Критический параметр, определяющий стабильное устойчивое состояние N*, — это отрицательное число a2. Отметим, что математическая биофизика связывает этот параметр с концепцией внутривидовой конкуренции, но в нашем случае попытка проинтерпретировать его ни к чему существенному не приведет. Остается предположить, что этот параметр является показателем медицинских мероприятий и других эффективных действий по преодолению эпидемии.

Согласно расчетам, вторая волна эпидемии, как правило, поднимается после прохождения пороговой точки, представляющей собой точку перегиба логистической кривой [810]. Указанное пороговое значение N можно вычислить из линейного уравнения a1 + 2a2N = 1. В случае возникновения второй волны эпидемии для расчетов можно использовать ту же динамическую систему. Однако ее новые параметры a1 рассчитывали по новым входным данным с помощью простого алгоритма. Из старых входных данных вычитали расчетные данные, предоставляемые логистической кривой первой волны. Вычислительный процесс можно продолжать до тех пор, пока входные данные не будут представлены суперпозицией различных отдельных логистических кривых. В случае невозможности указанной декомпозиции входных данных полагается, что описанный выше алгоритм не работает и такие входные данные опускают. Идея такого алгоритма впервые появилась в эконометрике [11]. Имеются примеры успешного его применения в математической биофизике [12]. В контексте нынешней пандемии существенный интерес представляет работа [13], в которой авторы с учетом влияния второй волны осуществили корректировку результатов своей предыдущей статьи [14], встретив прежде ощутимые проблемы с прогнозированием.

РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

Рассмотрим конкретный пример истории эпидемии в одной из стран, не избежавших возникновения второй волны. Пусть это будет наиболее ярко проявившая себя в данном отношении страна — Иран (:media_ 1;).
Примерно в середине апреля в Иране поднялась вторая волна эпидемии. Процесс ее распространения еще весьма далек от завершения, поскольку с начала июня происходит отчетливый рост третьей волны. Отметим, что еще две-три недели назад вышеизложенный алгоритм декомпозиции вторых волн не распознавал третью волну, интерпретируя данные как статистические погрешности.

Попытаемся теперь явно выявить первую волну эпидемии в Иране, оценивая абсолютную и относительную погрешности между входными и прогнозными данными, которые описывает логистическая кривая. Квадратичное отклонение абсолютной погрешности минимально, если порог первой волны достигается на 93-й день с начала эпидемии (:media_ 2;). (Обратите внимание, что при поиске минимума реализуется динамический априорный анализ данных, который не обязан охватывать всю историю эпидемии.)
На :media_ 2; слева сплошной линией представлена экспоненциальная аппроксимация расхождения между фактическими и прогнозными данными, демонстрирующая, что абсолютная ошибка велика в течение всей истории эпидемии. Относительная же ошибка становится приемлемой, когда абсолютная ошибка минует свое максимальное значение. Установлено, что выходные данные мониторинга, от начала эпидемии и почти до точки указанного максимума, удовлетворительно описывает экспоненциальная зависимость. Этот факт нельзя назвать откровением: продемонстрированное на графиках поведение реальных данных во времени не является специфичным признаком истории эпидемии только лишь Ирана. Авторы многих работ по проблематике пандемии заметили такую закономерность для множества других территорий, но обычно связывают ее с эффективными противоэпидемическими мероприятиями на ранних стадиях эпидемии. Однако проще полагать, что эта неизбежная регулярная ошибка обусловлена только лишь спецификой мониторинга данных. Оказалось, что аналитическую аппроксимацию входного набора данных можно продолжить и далее, начиная с точки максимума абсолютной ошибки и заканчивая точкой перегиба логистической кривой с помощью степенной функции [15, 16].

На основании вышеописанной информации авторы предприняли специальное исследование на тему регулярной составляющей ошибки мониторинга официально зарегистрированных случаев распространения нынешней пандемии, анализируя историю эпидемии в основном стран Западной Европы, достигших ее пика [17]. Условие достижения пика эпидемии было необходимо для использования апостериорного анализа данных, который приводит к тем же результатам, что реализуются и при динамическом априорном анализе. Регулярную составляющую ошибки мониторинга удалось выявить аналитически. Эта ошибка объяснила причину неудач априорного математического прогнозирования вероятных событий эпидемии в различных странах мира, которое было предпринято в многочисленных исследованиях. Обработка статистических данных практически всех стран, достигших эпидемического пика, показала, что указанная регулярная ошибка мониторинга подчинена несложной закономерности: чем выше пик эпидемии, тем больше временная задержка мониторинговых данных по сравнению с прогнозом.

Вернемся к задаче идентификации первой эпидемии в Иране, следуя методике априорного анализа. Абсолютная ошибка между мониторинговыми и прогнозными данными минимальна, если первую волну эпидемии адекватно описывать дискретным логистическим уравнением

Ni +1 = 1,118Ni – 1,344 × 10-6Ni2.

Решение этого уравнения показано на рис. 3, где отмечена критическая пороговая точка, составляющая 44 217 случаев инфицирования.

Теперь осуществляем декомпозицию входных данных с учетом того, что ранняя история эпидемии адекватно аппроксимируется логистической кривой, представленной на последнем рисунке. На следующем этапе обработки входных данных идентифицируем вторую волну эпидемии. Вычисления проводим рекурсивно тем же способом, что применяли выше. Вторая волна также адекватно может быть описана дискретным логистическим уравнением, но с иной правой частью:

Ni + 1 = 1,056Ni – 3,202 × 10-7Ni2 (:media_ 4;).

Из рис. 4 видно, что оставшаяся часть данных, соответствующая второй и третьей волнам, уже не может быть представлена в виде единственной логистической линии. Это означает, что в Иране характер эпидемии принял форму непрерывного волнового каскада, наиболее неблагоприятного для борьбы с эпидемией. Во всяком случае, Иран уже не сможет избежать третьей волны эпидемии.

Можно повторить изложенные выше рассуждения и вычисления, используя данные по истории эпидемии в других странах, например Швеции. Первая волна эпидемии в этой стране, по сравнению с Ираном, имела сравнительно небольшую высоту с порогом около 15 000 зарегистрированных случаев, достигнутым через 115 дней с начала эпидемии (рис. 5).
Ситуацию, аналогичную обстановке в Швеции, можно наблюдать в Украине (:media_ 6;). Различие состоит в том, что в этой стране нет никаких признаков приближения к пику второй эпидемии, а напротив, имеется риск возникновения следующей волны.

По сравнению с другими странами вторая эпидемия в США приобретает гигантские масштабы (рис. 7).

На сегодняшний день в средствах массовой информации все чаще появляются сообщения об ожидании второй волны эпидемии в России. Все они, как правило, основаны на спекуляциях и оставляют вопрос о том, быть или не быть второй волне эпидемии в России, открытым.

Средства математики позволяют установить факт: вторая волна эпидемии в России уже поднялась в первой половине мая и полностью сформировалась к настоящему моменту. Высота второй волны достигла примерно половины высоты первой, и, в свою очередь, в конце июня породила третью волну эпидемии. На рис. 8 представлена декомпозиция история эпидемии в России в виде суперпозиции первой и второй волн.

Несмотря на индивидуальные различия в динамике распространения эпидемии в различных странах, закономерность подъема второй волны остается той же: переход через точку, где скорость нарастания эпидемии текущей волны максимальна, наиболее рискован при несоблюдении правил самоизоляции и иных санитарных норм. Вторые волны эпидемии коварны тем, что они проявляются не сразу, а спустя достаточно длительный промежуток времени. Например, в Иране вторая волна ощутимо проявила себя не менее чем через два месяца.

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Обычно указывают несколько различных механизмов, каждый из которых может генерировать вторые волны при эпидемии. Первые два механизма обусловлены непосредственной передачей вируса и изменением его поведения, способствующим появлению дополнительных способов распространения инфекции. Третий механизм связан с неоднородностью населения: каждая новая волна либо захватывает иную область, либо вновь прокатывается по прежней территории. Четвертый механизм вызван мутацией вируса, способствующей замедленной восприимчивости к инфекции у людей. Еще один механизм обусловлен ослабевающим иммунитетом. Каждый механизм может быть учтен в сложных математических моделях для прогнозирования вторых волн [18]. По мнению авторов, вторые волны являются не в последнюю очередь следствием нестрогого соблюдения людьми карантина и санитарных правил. Как показывает опыт многих стран Западной Европы, возможны и досадные случайности, но они маловероятны. Например, в Италии не отказались от строго пограничного контроля, настоятельно порекомендовав гражданам перемещаться только в пределах страны, пусть даже в убыток деловой деятельности, а Чешская республика сняла все ограничения. На сегодняшний день Италия удовлетворительно справляется с последствиями эпидемии, а в Чехии сформировалась мощная вторая волна. Неизвестно, случайность это или закономерность.

В настоящей работе авторы отказались от многофакторных моделей, которые в идеальной реализации предназначены для изучения влияния, например, пограничного контроля в начале вспышки, прогнозирования сроков самоизоляции, оценки необходимого количества доступных препаратов и др. Дело в том, что практика последних месяцев показала, что наша примитивная двухпараметрическая модель и другие, хорошо апробированные и широко известные математические методы обработки статистических данных, непосредственно применяемые для описания будущих событий распространения пандемии, оказались неэффективными при решении вопиюще важной и неотложной проблемы. Это суждение авторов работы, открытое для аргументированной критики. Между тем не секрет, что агрегированная динамика пандемии весьма проста, — она достаточно полно может быть описана решением известного логистического уравнения, не столь важно какого, дискретного или дифференциального. Делу не помогают ни более развитые версии этой математической модели, основанные на введении новых неизвестных переменных, ни приемы многопараметрической модификации логистического уравнения. В любом случае, моделирование дает удовлетворительный результат лишь на малом горизонте времени, ограниченном одной-двумя неделями [19]. В качестве примера можно привести способ обработки данных статистическим институтом Хопкинса, который резонно ограничивает прогнозные тренды одной неделей. Таким образом, мы имеем дело с прогнозным мониторингом, который при всей своей ценности все же бесполезен для разработки среднесрочных и стратегических планов мероприятий по преодолению пандемии [20].
Другие многообещающие предсказывающие технологии, основанные на теории графов [21], теории перколяции [22] и имитационном моделировании [23], оказались слишком неповоротливыми в прагматическом плане, чтобы выработать четкий и конкретный результат по возникшему актуальному вопросу.
Парадокс состоит в очевидной неэффективности использования известных методик обработки статистических данных для получения адекватного количественного результата, несмотря на то что, казалось бы, все о динамике пандемии качественно спрогнозировано.

Чтобы понять причину неудач прогнозирования, мы обратили свое внимание на статистические данные, которые используют для выработки прогноза, поскольку непосредственно от них этот прогноз зависит. Известно, что по вполне естественным причинам статистические данные необязательно безупречны. Отметим, что, в отличие от экспериментальных данных, с которыми имеют дело, скажем, в физических экспериментах, данные по эпидемической ситуации не могут быть избыточными, они только недостаточны. Сложно представить себе ситуацию, когда в сводке мониторинга о количестве вновь выявленных случаев заражения регулярно появляются избыточные данные. Скорее всего, следует ожидать, что данные будут занижены из-за недостатка информации. Поэтому естественно полагать, что в данных содержится регулярная составляющая ошибки с недостатком. Действительно, исчерпывающие данные по пандемии могут быть получены лишь только апостериорно, но жизнь требует достоверной априорной информации. Нам удалось обнаружить указанную регулярную составляющую ошибки, которая объясняет причину неудач априорного математического моделирования вероятных событий эпидемии в различных странах мира [17]. Интересно, что за пороговой точкой и вплоть до достижения пика эпидемии прогнозные и реальные данные, как правило, практически совпадают. Объяснить это просто: при переходе через пороговую точку скорость прироста зарегистрированных случаев инфицирования снижается, в то время как к решению задачи мониторинга привлечен максимум усилий персонала.

Осознав сложность задачи прогнозирования, авторы решили ограничиться простейшей логистической моделью, поскольку, с одной стороны, с точки зрения теории колебаний для ее построения требуется минимум информации: начальное количество случаев, заключительное пиковое число, и число дней от начала эпидемии до ее пика. С другой стороны, надежность модели определяют не количеством неизвестных параметров, которые следует найти из статистического анализа входных данных, а качеством этих данных. Косвенно достоверность модели подтверждается консервативностью параметров логистических кривых первых волн, в то время как параметры текущей волны медленно изменяются во времени из-за указанного естественного несовершенства входных данных.

ВЫВОДЫ

В настоящей работе проведено исследование динамики появления и подъема второй волны эпидемии в Иране, Швеции, США, Украине и России. Анализ входных данных по общему числу случаев заражения показывает, что наиболее благоприятное время для возникновения вторых волн определяют критические точки эпидемии, в которых скорость прироста общего числа случаев максимальна. Это означает, что переход через эти точки наиболее ответственен с точки зрения неукоснительного соблюдения правил самоизоляции и иных санитарных норм.
Ценность моделирования определяется тем, что факт возникновения вторых волн можно установить гораздо раньше, прежде чем он станет очевидным на графиках истории эпидемии. Примером служит не совсем очевидная вторая волна в России, поднявшаяся в начале мая и породившая третью волну эпидемии в конце июня. Россия и Иран пока еще могут избежать четвертой волны эпидемии, если тому будут выставлены надежные барьеры.
Алгоритм исследования вторых волн представляет собой процедуру рекурсивной декомпозиции входных данных по набору различных логистических кривых, параметры которых неизвестны заранее и определяются в процессе вычисления. На первом шаге можно осуществить проверку возможности адекватной аппроксимации входных данных единственной логистической кривой. Если это не удается, можно осуществить попытку выделить вторую логистическую волну и т. д. Декомпозиция по логистическим линиям во многом схожа с широко известным методом Фурье или вейвлет-анализом. Однако в нашем случае алгоритм декомпозиции не завершается результатом, если входные данные для этого непригодны, а именно не представляют собой монотонно возрастающую табличную функцию.

КОММЕНТАРИИ (0)