Вибори-2019. Рейтинги кандидатів.

01.04.2019 Фінальні показники головних кандидатів перед першим туром, підраховані за допомогою нашої моделі 28.03.2019, практично співпали з результатами національного екзит-полу в день голосування.

19.03.2019 Ми змінили форму подачі графіків. Головна зміна - разом із рівнями підтримки кандидатів, ми показуємо скільки відсотків виборців ще не визначилось. Через те, що частка таких людей дуже велика, доволі важко спрогнозувати результат голосування. Також, ви можете обрати один з трьох типів графіків (див. випадаючий список під заголовком – наверху сторінки).

21.01.2019 Ми опублікували перший варіант графіків.

Як читати графік

Напрямок часу на графіку - знизу вверх, тобто наверху знаходяться найсвіжіші результати. Кожна лінія — це динаміка медіанного значення рівня підтримки кандидата, який ми порахували за допомогою імовірнісної моделі. Далі всюди замість слів «рейтинг кандидата» ми будемо використовувати вираз «рівень підтримки».

Пам'ятайте, що значення рівня підтримки у вигляді одного числа — це завжди спрощення. Результатом цієї моделі є розподіл імовірності для рівня підтримки, і окрім серединного значення (медіани), потрібно звертати увагу на можливий «коридор значень».

Тому дивіться на смугу однакового кольору навколо кожної лінії — це коридор усіх можливих значень рівня підтримки для даного кандидата. Тобто, з великою ймовірністю (0.95, або 95%) саме у цьому діапазоні знаходиться рівень підтримки. Найбільш імовірними є показники ближче до лінії, по краях смуги — менш імовірні значення.

Наголошуємо — це агрегований рівень підтримки кандидата згідно різних опитувань. Ми не робимо прогнозу результатів виборів!

Про модель

Модель, яку ми використали для агрегації, є експериментальною, ми не даємо гарантій щодо її точності, й вона може бути змінена протягом поточної виборчої кампанії. Використовуйте її результати на свій страх та ризик.

Це перша з відомих нам спроб застосувати «poll of polls» для даних соцопитувань українських служб, хоча за останні роки моделі подібного типу стали дуже популярними серед американських ЗМІ, в першу чергу — завдяки публікаціям сайту Fivethirtyeight.

Проблема з українськими опитуваннями полягає в тому, що у нас вони дуже рідко проводяться, навіть під час виборчої кампанії. Для порівняння, під час фінальної частини президентської кампанії 2016 року в США результати соцопитувань з'являлися ледь не щоденно. Однак за допомогою моделі (якщо вона коректна) ви можете побачити динаміку рівня підтримки навіть у ті періоди, коли опитування не проводились.

Інша проблема, не менш важлива — немає гарантій, що навіть найбільш послідовні (у сенсі частоти опитувань) та найбільш респектабельні (результати яких найбільше збігалися з результатами виборів у минулому) соціологічні установи не будуть «накручувати» відсотки для замовника опитування *. Йдеться не стільки про маніпуляції з арифметикою: бажаного ефекту можна досягти за допомогою «дизайну» опитування — наприклад, формулюючи відповідним чином запитання або формуючи вибірку відповідно до потреб замовника.

Тому для того, щоб якомога точніше оцінити рівень підтримки кандидатів, ми використали всі наявні на сьогодні результати соціологічних опитувань, проведені найбільш авторитетними соціологічними службами**. Якщо звести дані правильно, то агрегований показник буде більш точно відображати рівень підтримки, ніж кожне окреме соцопитування ***.

Методологія

Для агрегації результатів різних соцопитувань ми використовуємо ієрархічне баєсівське моделювання із залежністю від часу, та низку припущень/спрощень:

- Кожен кандидат має справжній (прихований) рівень підтримки, який ми можемо оцінити завдяки результатам соцопитування і визначити похибку такої оцінки. Похибка кожної соціологічної служби залежить не лише від вибірки, але й від низки інших факторів. Іншими словами, результати опитувань різних соціологічних установ, хоча і можуть відрізнятися один від одного, але залежать від справжнього рівня підтримки для конкретного кандидата.

- Справжній рівень підтримки, що був вчора, мало відрізняється від рівня підтримки, що є сьогодні, та змінюється згідно з процесом «випадкового блукання» (тому в моделі зростає невизначеність, якщо довго немає результатів нових опитувань).

- Справжні рівні підтримки кандидатів не залежать і не впливають один на одного, і моделюються окремо (досить сміливе припущення, яке при поточному низькому рівні підтримки кандидатів можна використовувати, хоча воно й не зовсім коректне).

* Кому із соціологів взагалі не можна вірити? Див. наш проект «Псевдосоціологи»

** Які соцопитування використовує наша модель: дивіться таблицю із опитуваннями тут. Таблиця type1 – це відсотки серед усіх виборців, type2 – серед тих, хто піде голосувати, type3 – серед тих, хто піде голосувати і визначився (саме ці дані повинні бути найближчими до справжніх результатів виборів). Інколи у звітах щодо опитування немає саме цих даних, тому ми перераховуємо їх використовуючи ту форму результатів, що є у наявності.

*** Сторінка на Вікпедії, з даними та графіками що показують рівень підтримки кандидатів серед виборців, що збираються голосувати і визначились. На сторінці для цих графіків використаний інший спосіб "усереднення" та інтерполяції для даних соцопитувань.