![]() |
![]() |
|||
![]() |
![]() |
![]() |
![]() |
|
Дослідники Світового центру даних «Геоінформатика і сталий розвиток» при КПІ ім. Ігоря Сікорського на основі методології Форсайту здійснили друге прогнозне моделювання ймовірних фаз подальшого розвитку коронавірусної інфекції в Україні.
На короткотерміновому часовому горизонті (до одного тижня) найбільш ймовірним є продовження лінійного характеру поширення коронавірусу в Україні (перебування в стані «плато», на що вказало перше дослідження київських політехніків з окремими «сплесками», як це спостерігалося 17, 23, 30 квітня та 2 травня 2020 року. На середньостроковому часовому горизонті (до кінця серпня 2020 року) процес поширення коронавірусу в Україні може пройти такі фази. До третьої декади травня 2020 року найбільш ймовірним буде наростання пандемії із змінним характером (лінійне зростання може тимчасово переходити в експоненціальне і навпаки). Це пояснюється найгіршим в Європі дотриманням режиму карантину (мобільність автомобільного та пішого пересування в Україні 1.5-3 рази вища ніж в країнах Європи), найнижчим в Європі відсотком проведених тестів на коронавірус (в 3,5-8 разів нижчим ніж в Європі), одним з найвищих в Європі відсотком інфікованих лікарів (19,1% від загальної кількості хворих) та деякими іншими несприятливими факторами. Протягом третьої декади травня найбільш ймовірним може бути пік пандемії. Повільне згасання пандемії коронавірусу може відбуватися протягом найтеплішої пори року в Україні, з кінця травня до кінця серпня 2020 року, по мірі поступового набуття населенням колективного імунітету, покращенням роботи системи охорони здоров’я, підвищенням соціальної відповідальності і свідомості населення. Протягом осінньо-зимового періоду 2020-2021 років не виключена поява другої хвилі пандемії. ФОРСАЙТ COVID-19: СЕРЕДНЯ ФАЗА РОЗВИТКУ Зміст 1. Особливості середньої фази розвитку коронавірусу в Україні 2. Аналіз територіальної нерівномірності госпіталізації хворих на території України 3. Короткотермінові прогнози розповсюдження COVID-19 в середній фазі розвитку пандемії 3.1. Застосування багатошарових нейронних мереж типу BackPropagationдля прогнозування захворювання COVID-19 3.2. Штучна нейронна мережа з нейронами типу SigmPL(SigmoidPiecewiseLinear) для короткострокового прогнозування кількості хворих COVID-19 в Україні 4. Прогнозування розвитку пандемії коронавірусу на середньостроковому часовому горизонті 4.1. Прогнозування кількості хворих в Україні на COVID-19 з використанням класичної експоненційної моделі 4.2.Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні Висновки Посилання Команда проекту 1. Особливості середньої фази розвитку коронавірусу в Україні Україна входить у третій місяць боротьби з пандемією коронавірусу. Заходи, які було вжито урядом країни, в цілому дозволили суттєво уповільнити процес стрімкого розповсюдження хвороби і знизити важкі наслідки від неї, як це спостерігалося в деяких країнах Європи і США. Тому перше форсайтне дослідження Світового центру даних «Геоінформатика і сталий розвиток» від 04.04.2020 показало, що для України функція швидкості змінювання кількості випадків COVID-19 набуває свого максимуму на 51-52 день від першого зареєстрованого хворого, а саме на другу половину квітня 2020 року. Після досягнення цього максимуму, в наслідок жорстких карантинних заходів в країні, мав би відбутися «злам» попередньої тенденції і розпочатися зниження швидкості зростання кількості випадків захворювання (функція кількості захворювань на COVID-19 мала змінити характер з експоненціального на лінійний). В цілому, в третій декаді квітня 2020 року так це і відбулося (рис. 1). ![]() Рисунок 1. Щоденна кількість зареєстрованих випадків захворювань громадян України на коронавірус Разом з тим, оптимістичні очікування припинення розвитку розповсюдження коронавірусу в кінці квітня – на початку травня 2020 року, які висловлювалися як представниками офіційної влади, так і рядом експертів, включаючи експертів Світового центру даних «Геоінформатика і сталий розвиток», можуть дещо змінитися в гіршому напряму у зв’язку з наступними факторами:
Зазначені дані публікуються щодня і відображають переміщення населення різних країн і регіонів світу на картах Apple Maps у порівнянні з відповідними показниками на базову дату 13 січня 2020 року. Ці дані надсилаються з пристроїв користувачів картографічного сервісу Apple і репрезентують тільки частину населення, яке використовує прилади та сервіси компанії. Тому ці дані не репрезентують поведінку населення в цілому, але дають досить важливу оцінку динаміки мобільності людей. ![]() Рисунок 2. Зміна динаміки мобільності населення України та інших країн Європи під час карантинних заходів (посилання) За цими даними зменшення автомобільної мобільності під час карантину в Україні склало в середньому до 60%, пішої мобільності до 45%. Для порівняння, в Іспанії за цей же час автомобільна мобільність знизилася до 20% та до 10% мобільність пішого пересування, в Італії – до 23% та 15%, Польщі до 40% і 25% відповідно. Таким чином, під час карантину мобільність автомобільного та пішого пересування в Україні 1.5-3 рази вища ніж в обраних для порівняння країнах Європи. Це вказує на менш ефективне додержання карантинних заходів в Україні у порівнянні з обраними країнами Європи, що не дає змогу очікувати високої ефективності подолання пандемії коронавірусу, і як наслідок, відтермінування в часі бажаних результатів від введених обмежень. 2. Аналіз територіальної нерівномірності госпіталізації хворих на території України Аналіз кількості госпіталізованих хворих на COVID-19 в Україні вказує на значну територіальну нерівномірність їх розподілу в різних регіонах і різних населених пунктах країни (рис. 3). Ці диспропорції обумовлені особливостями комунікації населення в різних регіонах України, різними релігійними традиціями, нерівномірністю міграційних потоків, регіональними особливостями протидії та боротьби з епідемією. Середній темп приросту хворих за останній тиждень для України становив 7%. У середньому по країні госпіталізовано близько 37% хворих, від усіх інфікованих, решта 63% перебувають в режимі самоізоляції. Разом з тим, в різних регіонах і населених пунктах України спостерігалася значна нерівномірність цього приросту і відповідно кількості госпіталізованих хворих. Так, відношення кількості хворих до загальної кількості населення в різних регіонах і населених пунктах України коливається від 0,47 хворих на 10.000 осіб на Сході і Півночі України до 17-18 хворих на 10.000 осіб в Західних і Центральних регіонах України. Зокрема, в Центральній частині країни переважну кількість хворих сконцентровано в містах та обласних центрах з населенням понад 100 тис. осіб. У Західній Україні високу кількість хворих виявлено, як в обласних центрах, так і в невеликих населених пунктах міського типу, до яких відбулося повернення великої кількості мігрантів з Європи. ![]() Рисунок 3. Розподіл госпіталізованих хворих на COVID-19 в населених пунктах України (посилання) Порівняння кількості госпіталізованих хворих до загальної кількості апаратів штучної вентиляції легень вказує на можливість виникнення небезпечної ситуації в різних населених пунктах України (рис. 4). ![]() Рисунок 4. Різниця між кількістю госпіталізованих хворих та апаратами ШВЛ в лікарнях України (посилання) Ґрунтуючись на наведених даних про суттєву неоднорідність розповсюдження COVID-19 в Україні необхідно зробити певні застереження стосовно прогнозування цього процесу та вибору моделей і методів для такого прогнозування. Перш за все ці застереження необхідно зробити стосовно широкого класу так званих «детермінованих» моделей, включаючи різноманітні поліноміальні моделі, відомі епідеміологічні моделі класу SIR («сприйнятливі – інфіковані – видужалі», англ. Susceptible— Infected— Recovered) в вигляді систем звичайних диференціальних рівнянь та варіацій цих моделей, таких, як:
Клас «детермінованих» моделей перестає працювати в разі неоднорідності популяції (наприклад, різної щільністі населення в різних районах), різних шляхів передачі інфекції та наявності факторів випадковості і суттєвої нестаціонарності досліджуваних процесів. Тому, будь які прогнози, отримані для України, з її характерними ознаками неоднорідності та нестаціонарності процесів розповсюдження коронавірусу на основі використанням вищезгаданого класу моделей не можуть вважатися коректними, а певні співпадіння прогнозованих даних можуть мати випадковий, для певних часових відрізків, характер. Звичайно, «детерміновані» моделі можуть застосовуватися до порівняно невеликих територій з суттєво однорідними умовами розповсюдження епідемії із застереженням, що результати прогнозування носять гіпотетичний характер. 3. Короткотермінові прогнози розповсюдження COVID-19 у середній фазі розвитку пандемії Для здійснення короткотермінових прогнозів розповсюдження COVID-19 в середній фазі розвитку пандемії (на часовий горизонт, що не перевищує один тиждень) скористаємося апаратом нейромереж. З цією метою застосуємо:
Кожен з цих підходів має свої переваги і недоліки, на чому буде зроблено наголос в ході їх застосування. 3.1. Застосування багатошарових нейронних мереж типу Back Propagation для прогнозування захворювання на COVID-19 Для прогнозування поширення вірусу SARS-CoV-2 використано багатошарову нейронну мережу типу Back Propagation [1]. Ця мережа відповідно до теореми про універсальну апроксимацію для нейронної мережі Back Propagation [2] може апроксимувати будь-яку неперервну нелінійну обмежену функцію від n змінних Y = F (x1, x2, ..., xn). Таку її властивість було використано для побудови моделі короткострокового прогнозу (5-7 днів) поширення COVID-19. Структуру нейронної мережі наведено на рис. 5, де (Input) – вхідний шар, куди подається вектор вихідних даних X = {x1, x2, ..., xn}; (Hidden) – прихований шар (насправді може бути кілька прихованих шарів); (Output) – вихідний шар Y = {y1, y2, ..., ym). Прихований шар складаєтья з 10 нейронів. ![]() Рисунок 5. Структура нейронної мережі Back Propagation Кількість входів даної мережі – два. В якості входів обрано поточне і попереднє значення кількості інфікованих з лагом -1: x(t), x(t-1). Для навчання нейронної мережі використовується механізм «ковзного вікна», довжина якого складає 6 точок даних. На цих даних відбувається навчання зазначеної мережі, після чого виконується прогноз на заданий інтервал вперед. Далі вікно пересувається на одну позицію вибірки даних і процес навчання мережі і прогнозування продовжується. Критерій навчання мережі, з довільним числом прихованих шарів наступний (посилання): ![]() де di - реальне значення i-ої точки вибірки; yI(w) - прогнозоване значення нейронної мережі Back Propagation з ваговою матрицею w для i-ї точки; M - обсяг вибірки. Таким чином, критерій E(w) являє собою середній квадрат помилки апроксимації. Для оцінки точності прогнозу використовувався критерій середньої абсолютної помилки у відсотках MAPE (mean percentage absolute error): ![]() Функції активації для нейронів прихованого шару ![]() ![]() ![]() Для мінімізації критерію E (w) використовувався алгоритм навчання нейронної мережі Левенберга - Марквардта, що являє собою поліпшений алгоритм градієнтного спуску. Прогноз здійснювався методом ковзного вікна на 1,2,3 і 5 кроків вперед. Кількість виходів даної мережі дорівнює 1: y = x (t + k), де k -горизонт прогнозування, k= 1,2,3,4,5. Прогноз поширення COVID-19 в Україні і в м. Києві на 5-денний період часу вперед (з 01.05.20 по 05.05.20) наведено в таблиці 1. Середня абсолютна похибка у відсотках виконаного прогнозу складає MAPE = 2.215%. Таблиця 1. Прогноз захворюваності в Україні і м. Києві на 5 днів вперед
3.2. Штучна нейронна мережа з нейронами типу SigmPL(SigmoidPiecewiseLinear) для короткострокового прогнозування кількості хворих COVID-19 в Україні Найчастіше поведінка прогнозованого процесу може кілька разів суттєво змінюватися протягом спостережуваного періоду, що робить неможливим описати процес однією моделлю. Часовий ряд розповсюдження коронавірусу SARS-CoV-2 є суттєво нестаціонарним (рис. 6). У зв’язку з цим для розв'язання задач прогнозування таких процесів доцільно використовувати методи з регуляризацією, засновані на використанні алгоритму м’якої кластеризації. Зазначені властивості притаманні штучній нейронній мережі з нейронами типу SigmPL (Sigmoid Piecewise Linear) [3]. Скористаємося цією мережею для короткострокового прогнозування (з горизонтом прогнозування до одного тижня) кількості хворих на COVID-19 в Україні. Вихідними даними для прогнозування є відкриті дані МОЗ України щодо кількості підтверджених хворих, кількості летальних наслідків та кількості людей, які видужали від інфекції COVID-19. ![]() Рисунок 6. Нестаціонарний характер часового ряду розповсюдження коронавірусу в Україні Оскільки часовий ряд (рис. 6) є нестаціонарним та має експоненціальний тренд для покращення прогнозуючих якостей моделей виконано трансформацію даних за такою формулою: ![]() В результаті отримано трансформований часовий ряд, який наведено на рис. 7. ![]() Рисунок 7. Трансформований часовий ряд розповсюдження коронавірусу в Україні Перші 35 значень даного ряду обрано до навчальної вибірки, дані, що залишилися – до тестової. Як видно з графіку трансформованого ряду він все ще є нестаціонарним і з великою ймовірністю складається з декількох потенційних умовних розподілів – отже, є доцільним застосування методів, адаптованих під ці умови. Для порівняння було побудовано три різних прогнозуючих моделі, які приймають на вхід три попередніх значення трансформованого часового ряду і прогнозують його наступне значення – тобто прогнозами цих моделей є співвідношення ![]() ![]() Для розв'язання задачі прогнозування запропоновано метод прогнозування з регуляризацією, заснований на використанні алгоритму м’якої кластеризації та штучних нейронів нового типу SigmPL. Порівнювалися наступні моделі:
Після налаштування параметрів моделей (окрім «наївної» моделі, що не потребує налаштування параметрів) було отримано наступні значення похибки моделей на тестових даних:
Отже, штучна нейронна мережа з нейронами типу SigmPLмає найменшу похибку у порівнянні з іншими моделями. Її використання для прогнозування кількості підтверджених хворих на COVID-19 на наступні 6 днів дало такі результати: 01 травня 2020 року – 11101 Підтвердження хворих 02 травня 2020 року – 11986 Підтвердження хворих 03 травня 2020 року – 13112 Підтвердження хворих 04 травня 2020 року – 14536 Підтвердження хворих 05 травня 2020 року – 16324 Підтвердження хворих 06 травня 2020 року – 18559 Підтвердження хворих. Консервативніший прогноз, який отримано як зважене середнє декількох моделей виглядає так: 01 травня 2020 року – 11049 Підтвердження хворих 02 травня 2020 року – 11824 Підтвердження хворих 03 травня 2020 року – 12759 Підтвердження хворих 04 травня 2020 року – 13884 Підтвердження хворих 05 травня 2020 року – 15238 Підтвердження хворих 06 травня 2020 року – 16866 Підтвердження хворих. Результати короткострокового прогнозування кількості хворих на COVID-19 в Україні на наступний тиждень, отримані з використанням багатошарової нейронної мережі типу Back Propagationта штучної нейронної мережі з нейронами типу SigmPL наведено на рис. 8. Бачимо, що мережа Back Propagation вказує на більш спокійний, лінійний характер розвитку пандемії на часовому відрізку 01.05.20 – 06.05.20, в той час, як нейронна мережа з нейронами типу SigmPL вказує на можливе продовження експоненціального характеру розвитку цього процесу. Експерти Світового центру даних «Геоінформатика і Сталий розвиток» схиляються до другого сценарію розповсюдження короновірусу в Україні (експоненційне зростання). ![]() Рисунок 8. Короткостроковий прогноз кількості інфікованих вірусом SARS-CoV-2 на часовому відрізку 01.05.20 – 06.05.20 4. Прогнозування розвитку пандемії коронавірусу на середньостроковому часовому горизонті Під середньостроковим часовим горизонтом будемо розуміти відрізок часу до чотирьох місяців, починаючи з 01.05.2020. Для здійснення прогнозування на цьому часовому горизонті скористаємося двома методами:
4.1. Прогнозування кількості хворих в Україні на COVID-19 з використанням класичної експоненційної моделі Відповідно до цієї моделі прогнозується число хворих на кожен день. Воно дорівнює загальній кількості хворих мінус кількість тих, хто видужав і мінус кількість померлих людей. Позначимо: t[i] = щоденні відмітки часу; x[i] = число активних випадків хвороби в цей день. Розглянемо функції: ![]() Зробимо заміни: ![]() Знайдемо потрібні коефіцієнти a, b, c для вихідної функції ![]() Підставивши ці коефіцієнти в рівняння, отримаємо експоненційну модель прогнозу: ![]() Результати прогнозування числа хворих на коронавірус в Україні на основі використання моделі (3) наведено на рис. 9 і в таблиці 2. ![]() Рисунок 9. Прогнозування кількості хворих на коронавірус в Україні Таблиця 2. Прогнозування кількості людей, хворих на коронавірус в Україні з використанням моделі (3)
Виходячи з отриманих даних прогнозування можливий сценарій подальшого розвитку пандемії COVID-19 в Україні (середньостроковий сценарій 1) складається з наступних фаз: 1. Поточний розвиток пандемії COVID-19
2. Пік пандемії
3. Згасання епідемії
4.2. Прогнозування розвитку пандемії COID-19 з використанням методу подібності в математичному моделюванні На першому кроці застосування цього методу здійснювався вибір країни (країн) – прототипів, характер розвитку пандемії в яких є найбільш наближеним до характеру розвитку цього процесу в Україні. З цією метою було застосовано кореляційно-регресійний аналіз для порівняння головних показників України з відповідними показниками країн Європи. Країни для порівняння вибиралися виходячи з таких показників:
В результаті застосування цих критеріїв для порівняння з Україною було обрано 11 країн Європи (таблиця 3). Таблиця 3. Кореляційно-регресійний аналіз
Розглянуто такі набори даних:
Дослідження спрямовувалось на оцінювання подібності даних для України до даних 11 країн Європи, обраних для порівняння. Для показників P1-P4 обраховано відповідні коефіцієнти кореляції ri,j, де i=1..4; j=1..11; значення P5 нормовано відносно значення показника для України за формулою: ![]() З використанням наявних даних і введених критеріїв P1-P5 було обраховано індекс подібності: ![]() На основі використання обрахованого індексу подібності та групи таких показників, таких як населення країни, щільність населення країни, територіальна наближеність країни Європи до України, в якості країн-прототипів для виконання прогнозного моделювання було обрано Польщу і Румунію (рис. 10). ![]() Рисунок 10. Вибір країн-прототипів для України На основі використання середньозважених значень зареєстрованої кількості випадків COVID-19 в країнах-прототипах (Румунії та Польщі) побудовано наступну прогнозну модель для України: ![]() де t –кількість днів від початку епідемії в Румунії. Результати прогнозного моделювання подальшого розповсюдження коронавірусної хвороби в Україні наведено в таблиці 4. Таблиця 4. Результати прогнозного моделювання подальшого розповсюдження коронавірусної хвороби в Україні на основі порівнянь з країнами-прототипами
Порівняння результатів прогнозного моделювання розповсюдження коронавірусу в Україні, отриманих з використанням класичної експоненціальної моделі і методу подібності в математичному моделюванні на середньостроковому часовому інтервалі показує, що обидва ці методи дають близькі за характером розвитку досліджуваних процесів результати. Враховуючи, що зазначене прогнозне моделювання виконано з використанням двох різних незалежних методів, можемо вважати, що виявлені в результаті цього дослідження тенденції розвитку короновірусу в Україні характеризуються певною ступінню адекватності. Висновки:
Посилання:
Науковий керівник проекту: М.З. Згуровський. Команда проекту: О.С. Войтко, Н.В. Горбань, І.М. Джигирей, Б.Р. Дудка, К.В. Єфремов, Ю.П. Зайченко, П.О. Касьянов, М.М. Перестюк, І.О. Пишнограєв, В.В. Путренко, В.М. Синєглазов Додатково: ФОРСАЙТ COVID-19: Вплив на економіку і суспільство |
Контакт: тел.: +380 (44) 246-27-83, +380 (44) 246-27-84 (*147) факс: +380 (44) 246-27-83, +380 (44) 246-27-84 (*122) м. Київ, вул. Смілянська, 4 Карта проїзду e-mail: inf@euroosvita.net |
При повному або частковому відтворенні інформації посилання на www.euroosvita.net обов'язкове у вигляді відкритого для пошукових систем гіперпосилання.
www.euroosvita.net не несе відповідальності за інформацію отриману з інших сайтів |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |