Lo scraping non sempre è legale e gli scraper (coloro che praticano lo scraping) devono innanzitutto rispettare i diritti d’autore di un sito web. Il web scraping può avere conseguenze piuttosto negative per alcuni negozi e fornitori web, ad esempio, se questo influisce sul posizionamento del sito nei motori di ricerca tramite aggregatori. Non è raro quindi per un’azienda querelare un portale di confronto al fine di prevenire il web scraping. In Germania, ad esempio, la Corte d’Appello di Francoforte ha stabilito nel 2009, in un caso simile, che una compagnia aerea deve consentire lo scraping attraverso portali di confronto dal momento che le sue informazioni sono, in ultima analisi, liberamente accessibili. La compagnia aerea aveva, comunque, la possibilità di adottare misure tecniche per prevenire lo scraping.
La questione è stata affrontata anche dalla Corte di Giustizia dell’Unione Europea e dal Garante per la privacy (AGCOM) in tempi più recenti, dove è stato anche stabilito che se un sito in questione proibisce esplicitamente nelle sue condizioni l’uso di software di scraping o crawling, chi non rispetta queste indicazioni può incorrere in sanzioni.
Lo Scraping è quindi legale se i dati estratti sono liberamente accessibili a terzi sul web. Per essere al sicuro dal punto di vista legale quando si utilizza il web scraping è quindi necessario considerare quanto segue:
- Verificare e rispettare i diritti d’autore. Se i dati sono protetti dal diritto d’autore, non devono essere pubblicati altrove.
- Gli operatori del sito hanno il diritto di installare misure tecniche che impediscono il web scraping. Queste non devono essere aggirate.
- Se l’utilizzo dei dati è correlato al login dell’utente o a un contratto di utilizzo, non devono essere sottoposti a scraping.
- Non è consentito nascondere annunci pubblicitari, termini di utilizzo o disclaimer con la tecnologia di scraping.
Sebbene lo scraping sia in molti casi consentito, può certamente essere utilizzato in modo improprio per scopi distruttivi o addirittura illegali. La tecnologia viene, ad esempio, spesso utilizzata per lo spam. Gli spammer possono servirsene per raccogliere indirizzi e-mail e inviare e-mail di spam a questi destinatari.