Розгадав капчу - допоміг оцифрувати старі надруковані матеріали (для Google)

Щоденно близько 200 млн людей - для того щоб довести в інтернеті, що вони справді люди, а не боти - відповідають на питання спеціальних програм. Google, у своєму стилі, використовує цей ресурс з мільйонів користувачів, для того щоб оцифровувати тексти.

Всі ви бачили веб-форми з розмитими цифрами або буквами, які потрібно розпізнати і вгадати - задача, яку не можуть виконати більшість програм-роботів, однак яка під силу людям. Більшість знає, що така перевірка називається "капча" ( від скорочення CAPTCHA). Меншість - що це один з різновидів "тесту Тюрінга" (до речі, сьогодні у нього день народження!).

Отже, щоденно люди добровільно відповідаючи на "капчі", виконують близько 150,000 годин роботи. Є декілька геніальних способів використання цього ресурсу - наприклад, власники порносайтів перенаправляють "капчі" з інших веб-сторінок, наприклад для реєстрації нового екаунта електронної пошти, на свої сайти, і заповнені живими людьми "капчі" допомагають таким власникам отримати безліч екаунтів на різних сайтах, які вони часто використовують для спаму.

Інший, не менш геніальний спосіб, використовує Google. Їх програма, під назвою reCAPTCHA, допомагає оцифровувати старі газети та книги.

Користувачу дають розмиті зображення двох слів - одне контрольне (його значення вже відоме), а інше з тих, які автоматична програма розпізнавання не змогла обробити.

Якщо користувач, відповідаючи на питання "капчі", вірно вгадав контрольне слово, значить Google вважає, що друге слово також вгадано правильно, і записує його значення в базу. Після того, як достатня кількість людей дасть однакову відповідь для таких слів, воно вважається розпізнаним.

Ось так, одне слово за один раз, тисячі користувачів інтернету допомагають Google оцифровувати друковані книги, або сторічної давності підшивку New York Times.

інтернет технології crowdsourcing

Знак гривні
Знак гривні