Дубілет написав відповідь на звинувачення у фальсифікації результатів оцінки статево-вікової структури населення. Пояснюємо, в чому проблема
Нагадаємо, нещодавно міністр Дмитро Дубілет презентував результати альтернативної оцінки кількості населення. Вчора уважні спостерігачі помітили, що отримані ним результати оцінки статево-вікової структури населення України, якщо розділити їх на коефіцієнт 0.888, збігаються з аналогічними даними від Держстату.
До слова, фахівці називають такий графік "віковою пірамідою", Дубілет чомусь називає його "ялинкою".
Сьогодні Дубілет написав відповідь на цю критику, у якій серед іншого звинувачував анонімних пройдисвітів у замовних публікаціях, говорив про корупційні схеми та погрожував написати у ДБР, і навіть згадав про свою репутацію.
Однак давайте відкинемо лірику, повернемося до суті дискусії і ще раз нагадаємо, у чому проблема з результатами Дубілета. Одразу зауважимо, що ми зараз не говоримо про загальну кількість реального населення, яку озвучив Дубілет на прес-конференції.
Наразі навіть не має значення, наскільки вона близька до реальності. Ми говоримо лише конкретно про один з трьох головних результатів дослідження, які Дубілет озвучив на конференції і в дописах, а саме - про статево-вікову структуру населення. От саме ці дані було фальсифіковано, з наукової точки зору (ту саме вікову піраміду, яку ви бачите нижче).
Якщо прочитати його пояснення і подивитися слайди виступу, то можна спробувати реконструювати закриту методологію Дубілета і припустити, що "піраміда" з його доповіді була побудована наступним чином:
1. За основу беруть дані про статево-віковий розподіл (або "вікову піраміду"), які знаходяться у вільному доступі на сайті Держстату. Це - кількість людей(чоловік і жінок, окремо) однакового віку, починаючи з 0 років і закінчуючи 100 років і старше.
2. Потім, за допомогою реєстрів Пенсійного фонду (наскільки вони точні? - ред.) за своєю методологією (якою? -ред. ), команда Дубілета підрахувала кількість людей, які входять в групу, скажімо старше 65 років - наприклад, таких людей 6 млн 248 тис.
3. Далі, беремо точно таку саму групу в даних Держстату і запам'ятовуємо її кількість (наприклад, 7 млн 34 тис 551 людини). Якщо розділити число з пункту №2 на число з пункту №3, то вийде 0.888 (або, як його вже назвали злі язики, "коефіцієнт Дубілета").
4. Далі відбувається логічний стрибок, або, як його називає Дубілет, "екстраполяція": тепер візьмемо цей самий коефіцієнт і перемножимо його на кількість людей у всіх інших роках з "вікової піраміди" Держстату, і овва! Ми маємо оновлену статево-вікову структуру населення, вона ж "вікова піраміда", безкоштовно, без цих ваших нудних старомодних переписів населення!
Так в чому ж проблема? Хоча б у тому, що немає жодного підтвердження, що різні групи населення змінювалися з такою самою швидкістю, або навіть у ту ж саму сторону, як і група "пенсіонерів" (65 років і старше). Наприклад, коли "пенсіонерів" у дійсності менше (тобто, їхня реальна частка - це 0.888 від того, що є в даних Держстату), то це зовсім не означає, що так само пропорційно можна зменшити кількість наймолодшої групи, віком до 14 років. Хоча б тому, що без додаткових досліджень ми нічого не знаємо про динаміку цієї групи: за час, коли дані Держстату відхилилися від реальних, ця група могла вирости у чисельності, зменшитися (або, найімовірніше, вона взагалі не змінилася в кількості).
Те саме стосується всіх інших вікових груп населення. Однак команда Дубілета зробила саме таким чином - помножила відомі дані Держстату для всіх груп на однаковий коефіцієнт 0.888. Після цього Дубілет заявив, що тепер у нас є нова структура населення, і навів графік "піраміди населення" серед результат своєї оцінки. Це більше схоже на підлаштування значень під потрібний результат. Саме тому ми оцінюємо такий підхід, як фальсифікацію.
І саме тому важливий справжній перепис населення - не лише щоб дізнатися про кількість людей за віком і статтю, але й для того, щоб дуже детально визначити склад десятків детальних зрізів суспільства. З досвіду США, це дуже корисно для багаточисельних бізнесів (де знаходиться мій клієнт?), для уряду (де знаходяться різні групи, якої допомоги вони потребують, аудит реєстрів (соцдопомога або пенсії в нашому випадку), куди спрямовувати ресурси?), для планування будь-яких довгострокових політик уряду тощо. І це, зрештою, в перспективі може принести більше коштів, ніж буде витрачено на проведення перепису. Звісно, так буде за умови, що результати перепису будуть такими ж відкритими і деталізованими, як у США.
Звісно, можна й потрібно обговорювати питання: які методи для проведення перепису? чому такий бюджет? Однак, жодна приблизна оцінка населення не замінить справжнього, якісного перепису населення.
Також ми звертаємося до Дмитра Дубілета з пропозицією оприлюднити (викласти на github, наприклад) всі дані, методологію та програмний код, який було використано для проведення оцінки населення. Для того, щоб кожен міг перевірити правдивість отриманих результатів і щоб не було звинувачень у фальсифікаціях. Зрештою, так прийнято робити в середовищі дослідників, котрі дбають про свою репутацію.