x

x

Il fenomeno di Scraping

Lo “scraping” è genericamente inteso come una raccolta dati che viene realizzata sulla base di un’automazione non autorizzata allo scopo di estrarre dati da un sito web o da un’applicazione
Il fenomeno di Scraping
Il fenomeno di Scraping

Abstract

La raccolta di dati può avvenire per mezzo di estensioni o di software che simulano la navigazione effettuata da utenti reali, al fine di filtrare e acquisire informazioni, dunque dati, che non sempre sono di dominio pubblico. Le informazioni acquisite in forma non autorizzata possono essere oggetto di successiva elaborazione, anche al fine di costituire un database strutturato, e possono senz’altro avere natura di dato personale, fino a consentire la creazione di specifici profili personali.


Sommario

  1. Screen scraping and web scraping
  2. Profili di illiceità del data scraping


1. Screen scraping and web scraping

Il data scraping (raschiatura di dati) è essenzialmente un modo di trasferire i dati da un sistema all'altro, ma differisce dai metodi di trasferimento di dati più convenzionali. La differenza principale è nell'uscita. I dati “raschiati” non servono come input per un altro programma informatico, ma sono destinati alla visualizzazione per l'utente finale. La raschiatura dei dati è quindi una tecnica molto grezza che viene utilizzata solo quando non c'è altro modo per estrarre i dati da un sistema, come un sistema operativo che non è più compatibile con l'hardware moderno. L'output è spesso molto destrutturato perché cose come la formattazione, dati binari e altre informazioni aggiuntive non vengono trasferiti. Questo può anche causare l'arresto dei programmi durante lo scraping dei dati. Ci sono diverse varianti tecniche all'interno della raschiatura dei dati. La forma più antica è lo “screen scraping” (raschiatura dello schermo). Con tale tecnica, uno strumento speciale è collegato a un sistema informatico obsoleto. Lo strumento di raschiatura finge di essere un utente e simula i comandi chiave per navigare attraverso l'interfaccia di sistema. Lo strumento estrae quindi i dati dal sistema e li trasmette al nuovo sistema. Questo metodo di lavoro ha ispirato strumenti di automazione più moderni che funzionano sulla stessa base. Oltre alla schermatura, vi è anche il “web scraping” che viene utilizzato per estrarre i dati dalle pagine web. Questa tecnica è una particolare tecnica di crawling.


2. Profili di illiceità del data scraping

Il web scraping assume oggi un ruolo insostituibile per identificare tendenze ed effettuare indagini statistiche sull’uso di prodotti e servizi, azioni alla base del marketing digitale, nonché per acquisire un vantaggio concorrenziale. In linea teorica, l’implementazione e la diffusione di strumenti automatizzati come quelli descritti non risultano di per sé  un pratica illegale, ma possono verificarsi usi illeciti. Per focalizzare in che occasione si versa in una condotta illecita, occorre chiarire che lo scraping può avere ad oggetto dati personali oppure informazioni di natura non personale. Nel primo caso, considerato che già il solo accesso al dato costituisce ai sensi dell’art. 4 n. 2 del GDPR un trattamento di dati personali, è necessario che detto trattamento avvenga nel rispetto della normativa vigente: questo si traduce nell’obbligo di prestare idonea informativa su finalità e modalità del trattamento nei confronti degli interessati, nella quale dovrà essere indicata, tra le altre cose, la base giuridica del trattamento. Pertanto, in primo luogo, è necessario che gli utenti vengano resi edotti sulle modalità di utilizzo dei propri dati; dopodiché, nel caso in cui la base giuridica non possa essere alternativa al consenso, sarà necessario ottenere l’autorizzazione al trattamento da parte di ciascun singolo. L’utilizzo di tecniche di scraping per la realizzazione di scopi commerciali o addirittura di profilazione si rappresenta, quindi, illecito se effettuato in assenza di un valido consenso. Spesso il ricorso al sistema automatizzato di scraping mira ad aggirare l’ostacolo della cessione di dati tra titolari autonomi del trattamento, condizionata alla garanzia da parte del cedente di aver fornito adeguata informativa e di aver ottenuto il consenso alla comunicazione a terzi. Ciò detto sull’evidente frizione con la normativa privacy di alcune tecniche di scraping, come si è avuto modo di osservare nei precedenti citati, in realtà il data scraping è potenzialmente idoneo ad integrare una comportamento illecito quando si traduce nell’accesso non autorizzato ed indiscriminato al database altrui: la possibilità di accedere, e pertanto trasferire, informazioni di tipo commerciale, know-how, segreti industriali ed altri dati a valore aggiunto si traduce evidentemente in una violazione di confidenzialità, se non addirittura di diritti autorali, che oltre ad integrare un danno economico per l’attività del soggetto proprietario potrebbe comportare un pregiudizio reputazionale non indifferente in caso di rivelazione di informazioni “scomode”.