Сотрудники Санкт-Петербургского Центра интеллектуальной логистики вычисли алгоритм распространения коронавируса и разработали новую модель прогнозирования развития эпидемий CBRR (Case-Based Rate Reasoning – Рассуждение на основе прецедентов). Начиная с весны 2020 года Центр даёт достаточно точные прогнозы прироста заболеваемости на месяц вперед с помощью оригинального метода статистического анализа.
В интервью редакции Сибирь.Реалии руководитель Центра, доктор физико-математических наук Санкт-Петербургского университета Виктор Захаров рассказал, как математикам удалось добиться точности прогноза и почему в 2021 году не стоит ожидать снятия локдаунов, отмены масочного режима и возвращение к нормальной жизни.
– Что представляет собой метод прогнозирования, разработанный Центром интеллектуальной логистики?
– Основным инструментом являются разработанные нами интеллектуальные алгоритмы извлечения информации о динамике пандемии в разных странах из больших баз данных. На основе этой модели мы уже сделали несколько совершенно точных прогнозов течения пандемии в России. Отклонение прогнозируемых траекторий от фактически реализовавшихся составляли около одного процента. Например, мы точно спрогнозировали пик заболеваемости в Москве на 10–12 декабря, а в Петербурге на 15–16 декабря. Мы спрогнозировали, сколько будет заболевших в этих городах на пике. Эти значения необходимо учитывать, чтобы понимать уровень загрузки системы здравоохранения и планировать ее работу на перспективу. Это позволяет надеяться, что наша модель будет востребована для мониторинга в национальных системах здравоохранении разных стран, а также, возможно, и Всемирной организацией здравоохранения.
– Объясните основной принцип построения вашей модели?
– Наша модель называется CBRR – Case Based Rate Reasoning, или Рассуждение на основе прецедентов. Страна, для которой строится прогноз, называется страной-последователем (Country Follower), остальные – странами-предшественниками (Country Predecessor). Суть этого подхода в том, что существуют страны-предшественники, в которых наблюдаемый процесс распространения вируса прошел раньше на месяц или два, и страны-последователи, которые являются объектом прогнозирования. Особенность нашей модели в том, что для прогнозирования эволюции эпидемии в России мы используем разнообразные статистические данные о динамике распространения нового коронавируса в странах, где эпидемия началась раньше. Важная составляющая нашей модели – формирование цепочки ESC (Epidemic Spreading Chain) стран распространения эпидемии. Это цепочка включает в себя несколько стран, упорядоченных по времени выхода их на одинаковые значения выбранных параметров.
Модель CBRR построена на итеративном подходе: данные, на основании которых строятся прогнозы, на период 2–3 недели обновляются в реальном времени.
– Как можно предсказать "поведение" вируса, с которым человечество прежде не сталкивалось?
– Действительно, на начальных периодах развития эпидемии информации было немного. И не сразу стало понятно, на что опираться, если мы хотим прогнозировать её динамику. Поэтому мы исследовали большой массив статистических данных в странах-предшественниках, изменение статистических показателей там – ежедневный прирост выявленных случаев, количество болеющих и показатель смертности. В первую очередь мы следили за параметром общего количества инфицированных, за тем, как растет их число. Мы обнаружили похожие показатели статистики в этих странах. Это позволило сформулировать гипотезу о том, что COVID-19 внедряется в человеческую популяцию не сразу, а постепенно, но при этом он ведет себя в разных странах примерно одинаково. Таким образом, на основании опыта стран-предшественников можно делать достаточно точные прогнозы относительно течения эпидемии в странах-последователях.
– Каким образом вы выбирали страны-предшественники для России? Я так понимаю, что это Великобритания, Италия, Испания, Франция. Но не Германия, например. Почему именно эти страны?
– Мы смотрели на то, как ведет себя основной показатель, который мы ввели для прогнозирования, – процентный прирост заболеваемости. Уровни процентного прироста в динамике Испании, Италии, Франции и Великобритании достигали примерно тех же значений, что и в России, но примерно на месяц, на три недели раньше. Германия двигалась во времени очень близко к нам по этим показателям. Поэтому она не могла быть предшественником, с точки зрения построения модели. Мы же хотим анализировать некоторую историю, для того чтобы делать прогноз на будущее. В этом смысле Германия нам не подходила.
– Почему вы не использовали китайскую статистику? Ведь Китай – это не только страна-предшественник, но и первоисточник коронавирусной эпидемии.
– Те карантинные меры, которые предпринимались в Китае, в значительной степени отличались от того, что делалось в Италии, Испании, Франции, Великобритании, а затем и в России. У нас, по сравнению с европейскими странами, социальные карантинные мероприятия выглядят примерно похожими. Они проводятся в соответствии с рекомендациями ВОЗ (Всемирной организации здравоохранения). Каждая страна применяла их немного по-разному, но общая политика была похожа. В Китае все происходило значительно более жестко в смысле изоляции населения. Людей фактически блокировали в их домах, обеспечивая им доставку продуктов и медикаментов. И это дало свой эффект, потому что удалось остановить распространение эпидемии по стране и внутри городов. Но в европейской культуре такой подход крайне сложно реализовать. Все-таки для Китая традиционно подчинение власти. В этом, наверное, заключена особенность восточной культуры, в которой люди рассматривают власть как единственную инстанцию, защищающую их от угрозы хаоса. А для верной настройки нашей модели необходимо, чтобы в странах ESC использовались сравнительно одинаковые меры сдерживания эпидемии: карантин, самоизоляция, социальная дистанция и тому подобные.
– Насколько можно доверять официальным данным распространения эпидемии в России? Ведь отечественную статистику неоднократно критиковали за манипуляцию данными о количестве заболевших и умерших от COVID-19.
– Мы берем оперативные данные на сайте стоп-коронавирус.рф. Они там обновляются ежедневно. И они практически, может быть, с очень небольшой погрешностью повторяют те данные, которые размещаются на странице соответствующего сайта Университета Джонса Хопкинса в США. Фактически сама структура этих данных согласована с Всемирной организацией здравоохранения. Как происходит получение информации? Этот вопрос в разных странах решается по-разному, то есть у каждого своя модель сбора информации. Во Франции и Испании, к примеру, мы наблюдаем "скачки" статистики, когда там задним числом добавляют данные за выходные дни, когда лаборатории не работают. Все это зависит от регламентов, которые выбираются в каждой стране. Наверняка, здесь возникают погрешности, но поскольку ВОЗ принимает эти данные, видимо, статистические погрешности не очень значительны.
– Получается, что все зависит от пропускной способности лабораторий? Вы говорили, что в Петербурге в конце осени была достигнута предельная нагрузка на лаборатории, и в результате количество новых случаев заражения много дней подряд оставалось одним и тем же. То есть случаев явно больше, но лаборатории уже не способны их зафиксировать.
– Об этой проблеме говорили и в Комитете по здравоохранению тоже. При значительном росте новых случаев заболевания появляются люди, чей диагноз надо уточнить, но мощности лабораторий не хватает, чтобы сделать это оперативно. Такие люди получают результаты тестов с некоторым запаздыванием. Но в итоге после определенного периода времени, когда количество новых случаев начинает уменьшаться, ситуация нормализуется. Вот как сейчас уже в Питере, мне кажется, что этот период кончился и отложенные тесты сделаны.
– Как у нас происходит обработка данных, полученных из лаборатории?
– Человек, признанный заболевшим, получает ковидный номер, который заносится в базу данных. Именно это является основой для официальной статистики. Все остальные данные, которые, насколько мне известно, тоже собираются, когда возникает вопрос о том, что есть симптомы, но пока нет подтверждения, для того чтобы он затем попал в базу данных. Поэтому здесь могут быть задержки, но в целом, мне кажется, все люди, которые заболели, они в итоге попадают в эту базу данных.
– В Петербурге в процентном отношении декабрьский прирост заболеваемости был значительно выше, чем в Москве. С чем вы это связываете?
– С более жесткими ограничениями, которые действуют в Москве. Насколько я понимаю, местные власти решают эти вопросы в контакте с бизнесом, поскольку экономика сильно страдает от вводимых ограничений. Сделать точную оценку влияния "локдаунов" на экономику достаточно трудно.
– Но вы наблюдали прямую зависимость: более жесткий локдаун – меньший прирост заболеваемости?
– Такая зависимость, конечно, есть. Вопрос установления количественных характеристик – более сложный. В разных странах сейчас появляются научные статьи на эту тему. Например, в корейском журнале я недавно видел статью, авторы которой пытались оценить, сколько людей нужно было бы протестировать для уточнения ситуации, чтобы ослабить мероприятия локдауна. Они называют определенные цифры. Я в эти цифры не верю, потому что авторы используют модели, параметры которых недостаточно обоснованы и не проверены на практике. Они их как-то подбирают экспериментальным путем, а это сразу приводит к отклонениям получаемых прогнозов от фактической ситуации. В целом понятно, что если проводить больше тестирований, то ситуация становится более ясной и власть получает больше информации для принятия решений – как действовать в рамках локдауна, когда его снимать.
– Судя по вашим графикам, к концу декабря заболеваемость в России вышла на плато. А что вы прогнозируете на январь-февраль?
– По тому, что у сейчас происходит в Петербурге (статистические данные которого мы изучаем особенно пристально), можно сказать, что мы в конце декабря почти уже вышли на плато по количеству болеющих людей. Вообще, Россия прошла уже через три пика по этому показателю. Такая же динамика была в Италии и во Франции. По моим представлениям, сейчас количество болеющих людей должно идти на спад. И мы дальше в ближайшие месяц-два будем наблюдать снижение процентного прироста. На более дальнюю перспективу прогнозы сейчас делать сложно. Многое зависит от того, как будет идти вакцинация, от эффективности вакцины.
При этом есть еще такой важный показатель, который сказывается на эпидемиологической ситуации, – средняя продолжительность болезни. К примеру, в Австрии это 10–12 дней, в Италии – 23–25 дней.
– А в России?
– Если говорить о Петербурге, средняя продолжительность болезни сейчас примерно 27–28 дней, в Москве то же самое, а по России в целом чуть меньше – 21–22 дня.
– С чем это связано?
– Во-первых, с иммунным ответом людей, то есть конкретной популяции в стране, и с технологиями проведения мероприятий по лечению и, возможно, с какими-то регламентами выписки.
– То есть у нас лечат дольше?
– Получается, что у нас лечат дольше, чем в Австрии. Но этот параметр тоже меняется со временем. Я не знаю, с чем это связано, об этом надо спросить инфекционистов.
Примерно 60 процентов взрослого населения должно быть вакцинировано, тогда эпидемия уйдет
– Как вы считаете, есть надежда на то, что мы вернемся в 2021 году к нормальной жизни?
– Надежда всегда есть. Но что значит "нормальная жизнь"? По отношению к прошлому году, наверное, да, хотя тоже относительно. Какие-то санитарные ограничительные мероприятия наверняка останутся. Тут многое будет зависеть от темпов вакцинации, того, как эффективно будет работать вакцина. Сейчас вакцинация в большинстве стран идет медленно, этот процесс еще в начальной стадии, количество вакцинированных людей еще невелико.
– В России – меньше одного процента на начало января.
– При этом Россия продает сейчас вакцину другим государствам. Но все-таки вакцинация в мире идет. Когда весь мир достигнет цифры, которая требуются для снятия ограничений? Примерно, 60 процентов взрослого населения должно быть вакцинировано, тогда эпидемия уйдет. А чтобы этого достичь… Представляете, умножить количество людей в мире, которые у нас сейчас, – около 8 миллиардов… Сколько нужно сделать вакцин?
– Либо люди должны переболеть?
– Да, либо уже переболевшие получат соответствующие антитела, но при этом нужно провести тесты и понять, сколько людей, переболев, стали невосприимчивыми к вирусу. Когда цифра встанет в районе золотого сечения – примерно две трети популяции, то все стабилизируется.
– То есть пока пять миллиардов человек не переболеют, говорить об окончании эпидемии рано?
– Да, либо реально переболеют и получат иммунитет, либо будут вакцинированы.
– Можно ли посчитать, когда это произойдет?
– ВОЗ утверждает, что 2021 год будет, возможно, даже хуже 20-го, имея в виду неравномерные темпы вакцинации в развитых и неразвитых странах. Предполагаю, что темпы распространения коронавируса и новых его штаммов в бедных странах неизбежно скажутся и на ситуации в развитых. Если, конечно, не будет сохраняться жесткий запрет на потоки людей из таких стран. В эпидемиологии, так же как в экологии, важной является проблема трансграничного переноса. Как вы знаете, для решения проблемы загрязнения атмосферы выбросами парниковых газов был подписан Киотский протокол. Возможно, пришло время для аналогичного договора о трансграничном распространении новых коронавирусов. Инициатором могла бы стать Всемирная организация здравоохранения (ВОЗ).