Se un captcha è in grado di difendere bene dagli spam bot e lascia passare gli utenti umani indisturbati, riduce notevolmente l’impegno richiesto per l’amministrazione di un sito. I gestori di una pagina che offrono contenuti generati dagli utenti si risparmiano la fatica di dover verificare manualmente i post. Inoltre un server viene drasticamente alleggerito quando gli input automatici e le richieste vengono bloccate preliminarmente, prima che vengano chiamate in causa le reazioni del sistema con un maggior impiego di risorse. Ma cosa contraddistingue un buon captcha?
La ricerca IA fa continuamente dei progressi. L’abilità di programmi specializzati di estrapolare i testi distorti o di risolvere esercizi logici migliora a vista d’occhio. Già nel 2014 un team di ricercatori di Google ha reso noto un modo (download del PDF su arxiv.org), con cui si possono risolvere i classicireCAPTCHA nel 99,8 % dei casi. Come base dati sono stati utilizzati 10 milioni di numeri civici di case che il team ha generato con Google Street View.
Molti servizi di captcha tentano di compensare i progressi dell’apprendimento automatico attraverso procedimenti di verifica sempre più difficili. Nella prassi i captcha sfiorano non di rado i limiti dell’irrisolvibilità.
Già nel 2010 i ricercatori della Stanford University (download del PDF su http://web.stanford.edu) indicavano che i captcha rappresentavano in molti casi una grande sfida per gli stessi utenti reali. In uno studio è stato richiesto a più di 1.100 persone di risolvere quasi 318.000 captcha basati sugli schemi più comuni dell’epoca.
In media i tester hanno portato a termine i captcha grafici in 9,8 secondi. Per i captcha sonori hanno invece avuto bisogno di 28,4 secondi, più del triplo del tempo richiesto per quelli grafici. Mostrando lo stesso captcha grafico a 3 tester differenti, questi sono giunti alla stessa soluzione solo nel 71 % dei casi. Per quanto riguarda i captcha sonori, la coincidenza era nettamente inferiore con una quota del 31 %. Inoltre i ricercatori hanno notato una frequenza di rimbalzo del 50 % nel caso di captcha sonori. L’uso di un procedimento di Human Verification e il modo in cui questo viene realizzato si ripercuotono sulla motivazione di un visitatore di interagire con il sito in questione.
A questo proposito già nel 2009 l’azienda SaaS MOZ ha pubblicato un articolo sul blog sull’effetto dei captcha sul tasso di conversione dei moduli web. In uno studio sul caso l’autore di YouMoz, Casey Henry, ha analizzato in un periodo di tempo di sei mesi più di 50 siti aziendali ed è giunto alla conclusione che i tassi di conversione dei moduli online (ad esempio per la registrazione alle newsletter) in media scendevano del 3,2 % nel caso in cui fossero stati attivati dei captcha. Tuttavia anche lo spam si riduceva dell’88 %.
Proprio le aziende che generano introiti nel momento in cui gli utenti interagiscono con il sito, dovrebbero riflettere se una frequenza di rimbalzo in questo ordine di grandezza è accettabile. Qui serve calcolare i costi dei metodi antispam alternativi con le perdite generate dai captcha.