Linee guida per siti ed applicazioni web della Regione Emilia-Romagna"La realizzazione/modifica/fornitura del sito/applicazione/prodotto/servizio oggetto del contratto dovrà rispondere ai criteri di accessibilità stabiliti dalla Legge 9 Gennaio 2004, n. 4, "Disposizioni per favorire l'accesso dei soggetti disabili agli strumenti informatici" e successive integrazioni e variazioni, in particolare dal Decreto Ministeriale 8 luglio 2005 - Allegato A. Il prodotto/servizio fornito dovrà inoltre rispettare le indicazioni esposte nelle “Linee Guida per realizzare siti e applicazioni web accessibili per la Regione Emilia-Romagna”, nella versione più aggiornata reperibile online all’indirizzo: http://www.regione.emilia-romagna.it/lineeguida Il rispetto dei requisiti di accessibilità verrà verificato dal cliente all’atto della consegna da parte del fornitore, e sarà poi accertato dal competente Servizio attraverso le verifiche preliminari alla presa in carico, prima della messa online del sito e delle applicazioni o di loro modifiche sostanziali. L’Amministrazione inoltre si riserva in qualunque momento, su propria iniziativa o su segnalazione di terzi, di effettuare verifiche di accessibilità ed usabilità sui servizi web oggetto del presente contratto resi dal fornitore, il quale dovrà provvedere alla messa a norma di quanto eventualmente riscontrato difforme a seguito di tali verifiche ".
I requisiti obbligatori da soddisfare indicati nel Decreto Ministeriale citato, sono 22 per i siti e le applicazioni internet (D.M. 8/7/2005 - Allegato A) . Esistono anche 11 requisiti per i sistemi operativi, le applicazioni ed i prodotti da scaffale (D.M. 8/7/2005 - Allegato D). Quando si scrive un contratto o un capitolato tecnico per l’acquisto di beni/servizi che riguardano sistemi operativi, applicazioni o prodotti a scaffale è necessario inserire una clausola simile a questa:
"Il prodotto oggetto del contratto dovrà rispondere ai criteri di accessibilità stabiliti dalla Legge 9 Gennaio 2004, n. 4, "Disposizioni per favorire l'accesso dei soggetti disabili agli strumenti informatici" e successive integrazioni e variazioni, in particolare dal Decreto Ministeriale 8 luglio 2005 - Allegato D. Il rispetto dei requisiti di accessibilità verrà verificato dal cliente sulla base di quanto dichiarato a tal proposito dal fornitore, e potrà poi essere accertato dal competente Servizio attraverso le verifiche preliminari alla presa in carico. "
Va anche ricordato che il 1°marzo 2006 è stata introdotta un’altra legge per tutelare le persone disabili (Legge 67/2006 "Misure per la tutela giudiziaria delle persone con disabilità vittime di discriminazioni" ): questa norma dà il diritto ad agire, da soli o tramite associazioni, ogni volta che si verifica un comportamento discriminatorio. Ne consegue che:.
Anche se non esiste un contratto di fornitura (ad esempio, se si realizza “in casa” il sito Web) e la legge non preveda sanzioni esplicite, i siti pubblici devono necessariamente essere accessibili.
Raggiungere un buon grado di accessibilità richiede attività che riguardano tutti i soggetti coinvolti: responsabili, redattori e tecnici.
Spesso si sente parlare di accessibilità e usabilità in maniera confusa. In effetti per certi versi hanno obiettivi parzialmente sovrapposti ma i metodi di cui dispongono per raggiungerli sono molto diversi: l´usabilità si serve di osservazione sistematica e test sugli utenti; per realizzare contenuti web accessibili al maggior numero di persone invece è necessario seguire alcune regole tecniche.
Per ottenere siti web di qualità è necessario seguire entrambe le strade, in un processo evolutivo continuo di integrazione fra usabilità e accessibilità.
"il grado in cui un prodotto può essere usato da particolari utenti per raggiungere certi obiettivi con efficacia, efficienza e soddisfazione, in uno specifico contesto d´uso".
L´usabilità di un sito web è data quindi da una serie di fattori che influiscono sull´esperienza che l´utente fa navigando nelle sue pagine, interagendo con il sistema.
L´utente che naviga fra i documenti non dovrebbe mai chiedersi se parole, immagini, pulsanti, situazioni o azioni diverse hanno lo stesso significato; "situazioni simili" debbono essere coerenti nelle azioni, nella terminologia, nei colori, nello stile, nei caratteri e così via; la coerenza va applicata alla grafica (stessa rappresentazione grafica = stessa informazione o stessa azione), agli effetti (stesso comando = stesso effetto, stessa azione conseguente), alla presentazione (stessa informazione = stessa posizione). Inoltre, ci vuole coerenza anche rispetto agli standard e alle convenzioni: l´utente naviga anche in altri siti e deve potersi aspettare di interagire con il nostro sistema come è abituato a fare negli altri (ad es. l´utente che vede una frase sottolineata si aspetta che rappresenti un link, pertanto è bene riservare questa rappresentazione per i link). La mancanza di coerenza genera confusione e porta a una perdita di credibilità.
Il sistema deve sempre tenere l´utente informato su cosa sta succedendo tramite adeguati feedback che corrispondono ad ogni azione dell´utente (es.: quando si invia una form il sistema dovrebbe dare un messaggio di "Invio avvenuto" oppure quando si clicca su un link la pagina di destinazione deve avere un titolo che assomigli al titolo del link, ecc.). I feedback devono essere forniti in un tempo ragionevole: dopo un secondo l´utente avverte il ritardo nella risposta del sistema, dopo 8 secondi il 50% degli utenti abbandona il sito (per operazioni lunghe quindi è bene mostrare indicatori di "avanzamento" per far sapere all´utente che la sua transazione è in corso).
Il sistema non deve mai imprigionare l´utente in situazioni che non hanno vie d´uscita visibili (in alcune pagine potrebbe essere utile avere un ritorno a una pagina precedente o successiva, e in genere alla homepage), né limitare la sua libertà di movimento; l´utente deve avere la sensazione di tenere la situazione sotto controllo, deve poter prevedere gli effetti delle proprie azioni (es.: avvertire quando il link aprirà una nuova finestra, informare sulle dimensioni di un file prima di scaricarlo, ecc.).
È meglio evitare che un problema si presenti piuttosto che prevedere vari messaggi di errore (prestare molta attenzione alle pagine che prevedono il riempimento di form evidenziando ad esempio i campi obbligatori, non consentendo di digitare caratteri alfanumerici in campi numerici, indicando chiaramente il formato dei campi data o valuta, ecc.)
In caso di errore, i messaggi debbono essere costruttivi, cioè orientare l´utente alla soluzione e non all´individuazione di colpe e deve essere data la possibilità di riscrivere solo la parte errata; fornire funzionalità di annullamento delle operazioni, come "undo" e "redo" o di ripristino delle condizioni di default.
Il linguaggio utilizzato a livello di interfaccia deve essere semplice e familiare per l´utente e rispecchiare i concetti e la terminologia a lui noti.
È più facile riconoscere una cosa vedendola direttamente piuttosto che recuperarla dalla memoria, pertanto le azioni possibili e i comandi debbono essere chiaramente indicati o facilmente ritrovabili ogni qualvolta sono necessari. Ove possibile, è bene utilizzare il percorso di navigazione, cioè l´indicazione sempre presente sulla pagina di quali pagine sono state visitate per arrivare dalla home a quella attuale (ricalcando la struttura dell´albero di navigazione).
Spesso le caratteristiche che rendono un sistema facile da imparare infastidiscono l´utente esperto; sarebbe utile quindi includere nel sistema anche scorciatoie, tasti o pulsanti che consentano una navigazione più rapida e riducano il numero delle interazioni necessarie (utilizzare ad esempio gli "accesskey", combinazioni di tasti che permettono di saltare direttamente in una determinata posizione della pagina particolarmente utili perché facilitano la navigazione dei non vedenti e di coloro che non usano il mouse).
Le interfacce non dovrebbero contenere elementi irrilevanti né ridondanti: ogni informazione superflua in più riduce la visibilità delle informazioni importanti. Limitare le possibilità di scelta offerte all´utente: se in una pagina ci sono 50 pulsanti, esiste una sola possibilità su 50 che l´utente compia l´azione giusta per raggiungere il suo scopo.
Normalmente un buon prodotto non dovrebbe aver bisogno di documentazione per essere usato, però in certi casi può essere necessario fornire aiuti in linea o manuali utente: in questo caso è bene fornire informazioni essenziali, semplici e facili da ricercare.
Gli aspetti tecnici e procedurali necessari per progettare, sviluppare, testare e gestire in modo sicuro un’applicazione regionale sono stati definiti nel “Disciplinare tecnico in materia di sicurezza delle applicazioni informatiche nella Giunta della Regione Emilia-Romagna”, approvato con Determinazione n. 2651 del 2007 (.pdf, 1.5Mb).
Il Disciplinare è uno strumento utile per chi si occupa di:
Chi ha responsabilità sulle suddette attività, deve considerare le minacce di sicurezza e le contromisure disponibili relativamente a dati e informazioni trattate dall’applicazione, secondo le indicazioni fornite nel Disciplinare. Tali indicazioni si basano sul fondamento che un'applicazione è sicura quando è in grado di preservare confidenzialità , integrità e disponibilità delle risorse, assicurando costantemente:
Un paragrafo importante del Disciplinare riguarda le Misure minime di sicurezza previste dal Codice in materia di protezione dei dati personali (D. Lgs. 196/03). Ogni applicazione utilizzata per il trattamento di dati personali, deve infatti rispettare le seguenti misure di sicurezza:
Nel caso l'applicazione sia utilizzata per il trattamento di dati sensibili e/o giudiziari, deve inoltre rispettare le seguenti misure di sicurezza:
Ai sensi del D. Lgs. n. 196/2003 "Codice in materia di trattamento dei dati personali", quando siti e applicazioni trattano dati personali e/o sensibili/giudiziari, le operazioni che vengono effettuate su di essi devono essere previste da leggi o regolamenti.
Inoltre, è obbligatorio dare adeguata informativa su tutti i trattamenti dei dati personali che vengono effettuati dal titolare.
L´informativa può essere resa inserendola nella pagina Web del sito regionale, PRIMA del pulsante di INVIO del form
Una pagina pubblicata sul web non viene indicizzata dai motori di ricerca se non è raggiungibile dalla Home Page del sito seguendo dei link.
In tal caso quella pagina potrebbe venire indicizzata da un motore di ricerca solo se venisse specificato manualmente al robot di indicizzare quella particolare pagina. Ovviamente la prassi deve essere quella di organizzare il sito in modo che ci siano opportuni link fra una pagina e l'altra.Se pubblichiamo una pagina sul web, non sarà possibile trovarne immediatamente il contenuto con una ricerca, ma sarà necessario aspettare il tempo che il robot abbia raggiunto quella pagina e l'abbia inserita nel database insieme alle informazioni in essa contenuta.
Se un sito ha un suo dominio (per esempio http://www.miosito.it/) non viene indicizzato automaticamente, ma è necessario che il responsabile del sito ne faccia esplicita richiesta al Servizio Sistema Informativo - Informatico Regionale, mandando un messaggio a PubblicaWeb@regione.emilia-romagna.it
http://www.regione.emilia-romagna.it/ermes/cerca/default.asp
che è presente anche in alto a destra nella Home Page e in quasi tutte le pagine di ERMES, il motore di ricerca Google restituisce l'elenco delle pagine e dei documenti indicizzati contenenti tali parole, secondo un ordine dipendente dalla rilevanza delle parole cercate all'interno delle pagine.
In particolare Google elenca i primi 10 risultati fornendo i seguenti dati:
Il titolo della pagina presente nell'elenco è inoltre un link alla pagina stessa, così è sufficiente cliccare sul titolo per visualizzarla. Ci sono poi opportuni link per scorrere nell'elenco dei risultati.
Perciò, è di fondamentale importanza che un file html contenta il TITLE (titolo) e che esso sia significativo, affinché i risultati di una ricerca siano leggibili per chi scorre l'elenco dei risultati. Per la stessa ragione è molto utile che il file html contenga la descrizione (il meta tag description) della pagina, come indicato più avanti nelle raccomandazioni.
Per maggiori dettagli e funzionalità avanzate del motore, vedere: Istruzioni sull'uso del motore di ricerca di ERMES(pdf, 282).
Lo spider percorre la "ragnatela" del world wide web seguendo i link contenuti nelle pagine. Ciò avviene a partire dalle pagine già presenti nell'indice. Quando un nuovo sito viene creato e messo online, risulterà irraggiungibile da qualsiasi spider finché in almeno una pagina web presente nell'indice di quel motore di ricerca non verrà inserito un link al nuovo sito. In tale modo lo spider potrà raggiungerlo e leggerne il contenuto per poterlo così indicizzare. Dal punto di vista del sito linkato, questo link è detto "inbound link", vale a dire un link che conduce verso di esso. Dal punto di vista del sito in cui si inserisce il link, questo è detto "outbound link", un link verso l'esterno. E' dunque compito del webmaster assicurarsi che almeno un link di questo tipo esista. La cosa importante è che la pagina in cui viene inserito il link al nostro sito sia già indicizzata in tutti i motori di ricerca principali. Ogni motore di ricerca consente di vedere l'elenco di tutte le pagine di un sito contenute nell'indice, in questo modo:
Se non si conosce personalmente alcun webmaster di un sito già indicizzato disponibile a inserire un link verso il nostro sito, vi sono numerose altre strade perseguibili.
Le directory sono cataloghi di siti suddivisi per categorie, aperti a nuove segnalazioni. Non tutte le directory sono però adeguate allo scopo: alcune sono strutturate in modo dinamico e le loro pagine non sono indicizzate. E' il caso ad esempio della directory di Virgilio.
Le directory migliori da questo unto di vista sono Open Directory (http://dmoz.org) e Yahoo! (http://dir.yahoo.com). Se il sito è in lingua italiana è opportuno invece segnalarlo nelle versioni locali (rispettivamente http://dmoz.org/World/Italiano/Regionale/ e http://dir.yahoo.com/Regional/Countries/Italy/). La segnalazione va fatta dalla pagina della categoria di appartenenza del proprio sito (cliccando sull'apposito link). Va detto che i tempi di attesa possono essere anche molto lunghi, e l'inserimento non è assicurato. Per Open Directory, si deve verificare che la categoria di appartenenza abbia un editor di riferimento (gli editor sono dei volontari e non tutte le categorie sono coperte). Se questo manca ci si deve rivolgere all'editor della categoria superiore e i tempi si allungano. Nel caso di Yahoo!, tutte le categorie sono coperte ma comunque i tempi di attesa sono lunghi. E' previsto peraltro un servizio di inclusione rapida, a pagamento.
Ogni settore di attività ha i suoi portali verticali di riferimento che ospitano link ai siti ritenuti interessanti, sia in forma di semplice elenco, sia di directory specialistica, sia all'interno delle pagine di contenuto. Come nel caso delle directory, ci si deve accertare che la pagina in cui verrà inserito il link sia effettivamente a sua volta indicizzata altrimenti non serve a nulla ottenere un link. N.B: E' possibile che per inserire il link il portale richieda un pagamento.
Ci si può rivolgere al webmaster di un altro sito già indicizzato, chiedendogli di inserire un link reciproco. La cosa ha senso specialmente se i due siti si occupano degli stessi argomenti, in toto o in parte. Lo scambio può essere accettato dal sito già presente nel motore di ricerca perché è sempre meglio aumentare il numero di link, e quindi la link popularity. Inoltre un link in più può portare anche nuovi visitatori. E' dunque probabile che lo scambio venga accettato. Ovviamente, uno scambio di link difficilmente verrà accettato da un diretto concorrente.
Il blog è un tipo di sito generalmente molto ben indicizzato.
Si tratta infatti di siti personali aggiornati quotidianamente e che ricevono molti link. Peraltro, l'autore del blog tende ad inserire attivamente i link che ritiene interessanti integrandoli in modo ipertestuale nel contesto del "diario". E' più probabile quindi che si riceva il link in modo spontaneo che non a seguito di una richiesta. Evidentemente, per ricevere un link del genere devono essere ospitati contenuti interessanti per il blogger. Le pagine che contengono notizie, specialmente se esclusive, tendono ad attirare i blogger.
Sia esso un internet service provider, una web agency, o un altro partner, chi realizza siti spesso prevede un area del proprio sito dedicata alla presentazione dei propri lavori. Qualora il link non venga inserito spontaneamente, si può chiedere che ciò avvenga, eventualmente anche sotto forma di scambio. Se da un lato questo tipo di sito è solitamente ben inserito negli indici dei motori di ricerca, si deve tenere presente anche che i siti delle società che realizzano progetti web tendono ad essere particolarmente sofisticati, e questo generalmente non va di pari passo con la leggibilità per gli spider.
Si deve sempre fare attenzione a che tipo di sito ospiterà il link, in modo da evitare di essere collegati a siti che fanno spamming. Si rimanda al paragrafo per la descrizione dello spamming nei motori di ricerca.
Alcuni webmaster inseriscono un link nei guestbook dei siti personali, nei forum o nei newsgroup. La cosa generalmente non è vista di buon occhio, perché molti frequentatori di questi "luoghi virtuali" la considerano scorretta e contraria alla "netiquette". Nella migliore delle ipotesi la richiesta verrà ignorata con conseguente perdita di tempo. In casi estremi, sono addirittura possibili ritorsioni di vario genere.
Vi sono infine altri tipi di link che sono inutili perché non vengono letti dagli spider, come i link sponsorizzati, i link nei banner, e generalmente tutti i link pubblicitari.
Innanzitutto, una premessa: è ovvio che quando passa lo spider il server web dev'essere pronto, altrimenti non sarà possibile indicizzare il sito e si dovrà attendere un nuovo passaggio. In ogni caso, server troppo lenti a rispondere agli spider (più di 3-4 secondi) per 2-3 volte di fila possono essere ignorati da questi ultimi, fino al successivo passaggio che potrebbe avvenire a distanza di mesi.
Si consiglia di mantenere un design semplice perché non tutte le pagine risultano intelligibili per lo spider. Lo standard consigliato è HTML 4.0.1, e il sito dovrebbe essere visibile con tutti i browser principali. Per avere una validazione certa, si consiglia di utilizzate un browser di testo come Lynx. Se caratteristiche avanzate quali Javascript, cookies, ID di sessione, frame, DHTML o Flash impediscono di visualizzare l'intero sito in un browser di testo, anche gli spider dei motori di ricerca potrebbero incontrare problemi durante la lettura del sito.
Persino alcune funzionalità html, come ad esempio i frames e le image map non sono ben supportate e nel caso che le pagine possiedano queste componenti, il loro contenuto potrebbe essere precluso all'indicizzazione. Solitamente gli spider leggono solo il file html principale e non eventuali altri file integrati nella pagina, come ad esempio le immagini. Attualmente il motore in grado di leggere il maggior numero di tipi di file non-html è Google.
Nel caso poi di pagine web con molto testo, lo spider non archivierà tutto il contenuto ma si limiterà a memorizzarne solo una parte. Si consiglia una dimensione sotto i 15 KB, meglio ancora fra 5 e 10 KB (immagini comprese).
Di fondamentale importanza sono i link interni. Devono essere leggibili per gli spider, altrimenti gli spider non percorrono tutto il sito. A dispetto di quanto dichiarato recentemente da alcuni motori di ricerca, i link non scritti in html (ad esempio all'interno di animazioni in flash o in istruzioni javascript) sono ancora baluardi insormontabili e non vengono seguiti dagli spider. Essi pertanto sono da evitare, o quantomeno vanno inseriti dei link html alternativi. Il classico esempio è il link che consente di saltare la presentazione in flash nella homepage di un sito.
Anche nel caso in cui i link sono html, è necessario seguire alcune regolette: Gli HREF non debbono contenere backslash "\" (usati per errore tipicamente al posto della normale barra "/"), né pipe "|", né spazi. I browser, come Netscape o Explorer, riescono in alcuni casi a seguire link contenenti questi caratteri, ma il funzionamento non è mai garantito anche perché i caratteri vietati potrebbero essere intercettati da dispositivi di rete che li modificano (ad esempio alcuni gateways). In dettaglio i caratteri vietati sono { } | \ ^ [ ] ` (cfr: http://www.ietf.org/rfc/rfc2396.txt (inglese)):
Altri caratteri, pur non essendo vietati, hanno uno specifico significato nei link. Ad esempio i carattere ":" serve a delimitare il protocollo usato (tipicamente "http") dal resto dell'URL. È bene quindi non usare questi caratteri in un URL se non nel loro specifico significato.
I caratteri riservati sono: ; / ? : @ & = + $ , e lo spazio.
Il fatto che tali caratteri non debbono comparire in un URL non significa comunque che essi non possono essere usati nel nome di una risorsa, è infatti possibile usare nell'URL la codifica di tali caratteri. Ad esempio la codifica dello spazio è "%20" e se abbiamo un file di nome "esempio file.htm" sulla root del nostro sito, lo potremo richiamare con l'URL: http://www.miosito.it/esempio%20file.htm. I caratteri non riservati e non vietati, che si possono liberamente usare nei link anche non codificati, sono: tutti i caratteri alfanumerici (lettere e numeri) e - _ . ! ~ * ' ( )
Un discorso a parte meritano i frames. I motori di ricerca indicizzano i singoli frame che costituiscono una pagina a frame, quindi la ricerca potrebbe portare a reperire non già la pagina intera ma una sua parte (ad esempio solo il menù). I singoli frame sono infatti delle vere e proprie pagine html, dunque, come tali, vengono spiderizzate singolarmente e indicizzate a seconda del loro contenuto testuale. Se si utilizzano i frame, per esempio, nella home page del sito, il testo sarà contenuto nei frames e non nella home page che, apparendo "vuota", non avrà un alto valore di ranking e, pertanto, non apparirà nel risultato della ricerca. Per sopperire in parte a questo problema si può replicare nel tag
<NOFRAME> tutto il contenuto della pagina, in modo particolare i link. Si consiglia inoltre di attribuire alla home page un titolo significativo in relazione alla ricerca in cui si vuole comparire e utilizzare la sezione testo alternativa dei tag HTML che la prevedono (object, frameset, script).
Esistono problemi per l'indicizzazione dei siti web dinamici. Com'è noto, alcune tecnologie come l'asp o il php consentono di generare pagine web "on demand" in base a determinati parametri. Benché lo spider sia in grado di leggere le pagine dinamiche, a patto che non vengano generati dinamicamente anche i link, spesso il numero di esse è talmente elevato che non vengono indicizzate tutte. Questo per evitare che lo spider sovraccarichi di richieste il server bloccandolo di fatto. Il numero elevato di pagine può diventare un problema anche nel caso di siti statici, specialmente se il sito è strutturato a vari livelli con cartelle e sottocartelle. Normalmente, tutti i file html presenti nella root, se linkati dalla homepage o fra di essi, vengono presi in considerazione dallo spider. Anche i file contenuti nelle cartelle sono facilmente raggiungibili dagli spider, ma se vi sono sottocartelle cominciano ad esserci difficoltà. Ulteriori livelli, del tipo www.sito.it/cartella/sottocartella/sottosottocartella sono progressivamente sempre meno raggiungibili.
Le pagine dinamiche (asp, php, aspx, ecc...) spesso contengono informazioni nascoste collegate al percorso di navigazione che l'utente ha seguito per raggiungerle. In questo caso se esistono dieci percorsi di navigazione che raggiungono la stessa informazione, il motore di ricerca la indicizzerà dieci volte. Da notare che i percorsi di navigazione possono essere anche infiniti, e ciò provocherebbe diversi problemi allo spider del motore di ricerca. Le pagine dinamiche, quando possibile, non debbono quindi contenere nel codice informazioni nascoste collegate al percorso che è stato seguito per raggiungerle, all'utente che è collegato, all'orario o comunque alla sessione di lavoro all'interno della quale la pagina viene consultata.
Si riporta a questo proposito l'avvertenza contenuta nelle linee guida di Google:
Consentite ai motori di ricerca di eseguire la scansione dei vostri siti senza ID di sessione o argomenti che ne rilevano il percorso in tutto il sito. Queste tecniche sono utili per la rilevazione del comportamento del singolo utente, ma lo schema di accesso dei programmi automatizzati è completamente differente. L'utilizzo di queste tecniche può condurre a un'indicizzazione incompleta, poiché i programmi automatizzati non sono in grado di eliminare gli URL che hanno un aspetto diverso, ma puntano effettivamente alla stessa pagina.
Nel caso che sia assolutamente necessario mantenere all'interno della pagina informazioni di questo tipo, le pagine dinamiche non debbono poter essere raggiungibili dal motore di ricerca più di una volta, in particolare è bene evitare che si formino cicli di pagine che si richiamano a vicenda. Ciò può essere fatto usando correttamente il tag <meta name="robots" content="..."> dell'HTML. Un metodo suggerito è il seguente:
Si è visto che ogni motore di ricerca è dotato di numerosi spider che percorrono incessantemente il web. Tuttavia gli indici dei motori contengono rimandi a miliardi di pagine, ed è possibile che passi diverso tempo fra una visita dello spider e la successiva. Se nel frattempo la pagina viene modificata dal webmaster, tale modifica non sarà registrata finché, appunto, lo spider passa nuovamente dal sito in questione. Lo stesso vale se una pagina viene rimossa da un sito. Rimarrà nell'indice il riferimento a una pagina non più esistente e chi cerca potrebbe cliccare e trovare un errore 404 "page not found". Questo è il motivo per cui, sovente, una ricerca genera determinati risultati ma cliccando sui link restituiti dalla ricerca non si trova quanto si era cercato: la pagina nel frattempo può avere cambiato contenuto, o addirittura non esistere più.
Sebbene vi siano motori di ricerca generalmente più veloci nel "refresh" dell'indice, vi è una certa irregolarità nel passaggio degli spider, per cui non è detto che un motore abbia necessariamente un indice più vecchio in toto. Alcuni possono essere già passati da una porzione del web, altri da una diversa. Generalmente, maggiore il numero degli "inbound link" che conducono a una pagina, maggiore sarà la frequenza di passaggio dello spider. Questo perché gli spider lo possono trovare seguendo tante via possibili. Viceversa, un sito collegato al resto del web da un solo link, dovrà attendere che uno spider passi proprio da lì, e questo può richiedere un attesa fino a 6 mesi e più. Nel frattempo, nell'indice rimarranno le informazioni indicizzate al momento dell'ultimo passaggio.
Questo problema viene in parte risolto da alcuni motori, come Google, che individuano i siti che variano più velocemente e a questi riservano una frequenza di aggiornamento più elevata, cioè lo spider li visita più spesso. Questo spider veloce, detto "freshbot", è in grado di visitare quotidianamente i siti "privilegiati". Non vi sono metodi per assicurarsi il passaggio del freshbot, ma vi sono ottime probabilità se un sito viene aggiornato quotidianamente ed ha un PageRank di minimo 5 (vedi il paragrafo per la spiegazione del PageRank). Inoltre vi sono, come detto, le pagine indicizzate con il "pay per inclusion" che ricevono quotidiana visita dagli spider.
Talvolta risulta importante evitare che un sito, o parti di esso, vengano indicizzate, per esempio se si vuole escludere dall'indicizzazione una versione in costruzione o un'area riservata. Ciò può avvenire in due modi:
· attraverso l'uso del file "robots.txt" nella root del sito;
· attraverso l'uso del meta tag ROBOTS nell'intestazione delle singole pagine HTML:
<META name="robots" content="[index/noindex] [, follow/nofollow]>
Nel file "robots.txt" contenuto nella root del sito web è possibile specificare quali spider (agent) si vogliono escludere e cosa non deve essere indicizzato tramite la regola "Disallow: "cartella da non indicizzare".
Ad esempio nel file "www.regione.emilia-romagna.it/robots.txt" ci potrebbe essere scritto:
User-Agent: *
Disallow: /images
Attraverso il meta tag ROBOTS è invece possibile specificare per ogni singola pagina HTML se la pagina stessa deve essere indicizzata o meno e se i link in partenza da essa debbono essere seguiti o meno. Ad esempio se si vuole che una pagina sia indicizzata ma non ne siano seguiti i link in partenza si potrà scrivere:
META name="robots" content="index, nofollow"
Se invece si vuole che una pagina non sia indicizzata ma lo siano quelle raggiungibili da essa (tranne diversa indicazione) si potrà scrivere:
META name="robots" content="noindex, follow"
Il default è "index, follow", cioè di default un robot indicizza le pagine e ne segue i link.
Se si vuole invece solo limitare le visite degli spider per non sovraccaricare di richieste il server web, si consiglia di accertarsi che il server web che ospita il nostro sito supporti l'intestazione HTTP If-Modified-Since. Questa funzione consente al server web di comunicare ai motori di ricerca se il contenuto è stato modificato dall'ultima volta che è stato indicizzato. L'implementazione di questa funzione consentirà di limitare l'uso di larghezza di banda e di ridurre il sovraccarico. I passaggi degli spider dei vari motori di ricerca sono registrati nei file di log. Per individuarli è necessario conoscere il nome che li identifica a livello di richiesta al server. I più noti sono Googlebot e Yahoo! ma ne esistono molti altri.
Supponendo di ottenere un'indicizzazione ottimale, in virtù della quale lo spider visita regolarmente tutte le pagine del nostro sito, ci si deve preoccupare di che cosa dare in pasto allo spider in modo da ottenere un buon posizionamento. Esistono infatti tutta una serie di elementi che vengono privilegiati nel momento in cui il motore di ricerca stabilisce, mediante un algoritmo, l'ordine in cui vengono mostrati i listing (i risultati di una ricerca sotto forma di link e descrizioni alle pagine indicizzate). Si deve capire, insomma, che cosa fa sì che una pagina sia posizionata prima di un'altra. Se si vuole massimizzare le probabilità di ottenere un buon posizionamento, è dunque fondamentale stabilire alcuni punti fondamentali:
Dunque, un sito ha infiniti posizionamenti possibili, perché infinite sono le parole chiave che si possono cercare nei motori di ricerca. Ciò vale, è bene sottolinearlo, anche se ci si limita a considerare solo le parole chiave effettivamente contenute in un singolo sito. In ogni pagina, le combinazioni possibili delle parole chiave in stringhe di ricerca sono, in genere, moltissime.
Il primo passo verso una buona ottimizzazione consiste dunque nell'individuare quante e quali sono le keyword per le quali si vorrebbe essere posizionati. Una quantificazione del numero di keyword "posizionabili" è molto difficile. Ciò dipende innanzitutto dalla "competitività" delle keyword stesse. Più "universali" esse sono, infatti, più saranno le pagine in tutto il web che le potranno contenere, e maggiore sarà il numero di pagine in concorrenza con le nostre. Viceversa, posizionarsi per keyword "di nicchia", che si riferiscono ad argomenti di cui si occupano in pochi nel web, è ovviamente più facile.
Solitamente, un sito può essere ben posizionato per innumerevoli keyword poco competitive (contenute in poche pagine nel web), ma per un ristretto numero di keyword competitive. Volendo comunque stabilire un ordine di grandezza, si può dire che un obiettivo ragionevole di un ottimo ed esaustivo lavoro di ottimizzazione è l'essere ben posizionati per un numero di keyword pari al numero delle pagine del nostro sito effettivamente indicizzate in ciascun motore di ricerca. Ad esempio, l'obiettivo di ERMES in Google in questo caso sarebbe il posizionamento in prima pagina per circa 100.000 keyword (tante essendo le pagine attualmente indicizzate da Google).
La ragione della corrispondenza fra nº di pagine indicizzate e il nº di keyword risiede nel fatto che sono i motori di ricerca stessi a fare questa corrispondenza. Agli "occhi" del motore di ricerca, infatti, ogni pagina web indicizzata ha un determinato "tema", espresso da una keyword, ed è proprio per questa keyword che la pagina avrà buone chance di posizionarsi bene. Il tema di una pagina viene in buona parte ricavato dal motore di ricerca a partire da 3 elementi:
Questi non sono gli unici elementi presi in considerazione, ma, a patto che i termini siano poi ripetuti nel testo della pagina, essi sono generalmente determinanti.
Si prenda ad esempio la seguente pagina: esempi/vignolabologna.htm
In questo caso abbiamo i seguenti termini
In questo caso il tema che emerge agli occhi dei motori di ricerca è "treno vignola bologna", e le probabilità che la pagina sia ben posizionata per la keyword "treno vignola bologna" è molto alta (a patto che abbia una link popularity adeguata).
Se le keyword sono specificate nel tag title, i motori di ricerca sono in grado di individuarle anche negli url dove compaiono tutte attaccate senza spazi vuoti.
Per quanto riguarda gli altri termini (ad esempio "emilia romagna"), la probabilità è minore perché essi non sono presenti in tutti e tre gli elementi considerati. Piuttosto, sarà più probabile che a ben posizionarsi in ricerche per la keyword "emilia romagna" sia la homepage di ERMES, perché in essa "emilia romagna" emerge effettivamente come tema. Infatti, nella homepage si trovano i seguenti elementi
Quando invece i 3 elementi principali non coincidono, e in ciascuno si trovano parole diverse, è più difficile per il motore di ricerca individuare il tema della pagina. Certamente saranno molti di più i termini candidati ad essere il tema della pagina, e dunque la rosa delle keyword potenzialmente ben posizionate è più ampia. Il rovescio della medaglia è che per tutte queste keyword la pagina sarà più debole rispetto a eventuali pagine concorrenti in cui invece tali keyword sono individuate come il "tema" della pagina. Ecco dunque che il rapporto "una pagina/una keyword" consente di dare una misura del "monte keyword" posizionabile per un sito. Ovviamente, in virtù di quanto detto, si dovrà operare in modo da conferire un tema a ciascuna singola pagina del sito, tramite url, titolo e anchor text.
Il nome a dominio non ha nulla a che vedere con la costruzione di una pagina web, ma è comunque molto importante perché negli algoritmi viene dato un grande peso ad esso. Sebbene la lunghezza massima sia 63 caratteri, è più ragionevole registrare domini più corti che contengono al massimo 2-3 parole. Di conseguenza, se si intende registrare un dominio ai fini del posizionamento, è consigliabile un nome che contenga le 2-3 keyword che si ritengono più importanti (es. turismo-emilia-romagna.it). Le keyword possono anche non essere separate dal segno "-", a patto che lo siano poi nel testo della pagina in modo che il motore le riconosca come parole distinte. L'efficacia maggiore si ha quando il dominio contiene un'unica keyword. Com'è facile verificare, digitando una keyword singola nei motori di ricerca, spesso il primo risultato è proprio un sito con indirizzo www.keyword.xyz. Questo a patto, naturalmente, che il sito in questione risponda almeno ai criteri minimi per l'indicizzazione: testo sufficiente, title tag, assenza di spamming, ecc.Quando la keyword è contenuta in un dominio di terzo livello (del tipo keyword.nomedominio.xyz) l'efficacia è minore, ma può comunque dare un buon contributo al posizionamento.
NB: nel caso delle regioni italiane, la regolamentazione vigente prevede che il dominio principale debba essere di terzo livello, vale a dire regione.nomeregione.it. In tal caso il dominio potrebbe diventare di 4º livello, ad esempio turismo.regione.emilia-romagna.it
Le keyword nel nome della pagina hanno grande importanza per l'ottimizzazione. Si consiglia però di non esagerare, limitandosi a titoli non più lunghi di 20-25 caratteri.
E' assolutamente essenziale inserire il titolo della pagina nel title tag, specificando le keyword principali all'inizio. Conviene inserire al max. 4-5 keyword e comunque non più di 80 caratteri. Ogni singola pagina dovrebbe avere un titolo diverso in modo da aumentare il numero di parole chiave per cui si può essere trovati. Il tag title dev'essere posizionato all'inizio della sezione head.
Per alcuni motori di ricerca è importante inserire nel tag meta description un breve riassunto del contenuto della pagina, di circa 25-30 parole, che contenga all'inizio anche le keyword inserite nel title tag. Questo testo viene preso in considerazione sia per il ranking, sia come descrizione nella pagina dei risultati. Ogni singola pagina deve avere una descrizione dedicata. Il tag meta description dev'essere il primo nella sezione head. E' possibile inserire del testo anche nel tag meta "keyword" , ma viene considerato solo da Yahoo! e comunque ha poca importanza per l'algoritmo di questo motore.
La pagina ideale deve contenere una quantità di testo media, idealmente una videata senza scroll verticale. Dev'essere maggiore la quantità di testo rispetto a quella del codice html, minimo il doppio. E' consigliabile inserire almeno un paragrafo di testo e inserire le keyword nella prima frase. Il motori danno maggiore importanza al primo paragrafo, le prime 5-10 righe, specialmente se i termini sono contenuti anche nel tag title. Se si desidera che una pagina venga visualizzata per una particolare keyword, è importante che la keyword density (proporzione tra il nº di volte in cui si ripete tale keyword nel body e il numero totale di parole contenute nel body) sia compresa fra 5% e 25%.
Le keyword inserite nel tag <h..> hanno un discreto peso. Tale peso è relativo all'importanza del titolo (<h1> è il titolo principale).
Il testo contenuto in file grafici (gif, jpg, ecc) viene ignorato dai motori di ricerca. Le keyword possono tuttavia essere inserite nel tag "alt image" e nel nome del file immagine, ed hanno un buon peso in termini di ranking.
Le parole contenute nel tag href sono tenute in particolare considerazione dai motori di ricerca e aumentano il ranking sia nel caso di link interni (specialmente dalla homepage) che esterni (specialmente a siti con alta link popularity). Utilizzare link non formattati, evitando link all'interno di applet java, animazioni flash ed altri sistemi non html standard.
In alternativa, linkare dalla homepage una mappa del sito html.
I metodi sono i medesimi da impiegare per ottenere i link necessari all'indicizzazione, descritti nel paragrafo sull'importanza dei link. Si tratterrà ovviamente di impiegarli tutti in modo da incrementare il più possibile i link di qualità. Ciò significa da un lato dare priorità ai siti con PR alto, ed evitare dall'altro link da siti a rischio perché in odore di spamming.
Un link nelle già citate Open Directory e Yahoo! Directory è indicato per aumentare il PR, però solo se la categoria in cui si viene inseriti abbia un PR alto. Open Directory ha un PR medio leggermente più alto di Yahoo! Directory, sia per le versioni internazionali che per quelli locali. Ad esempio, it.dir.yahoo.com/Istituzioni/Amministrazioni_locali/Regioni/Emilia_Romagna/ ha PR 4 dmoz.org/World/Italiano/Regionale/Europa/Italia/Emilia-Romagna/ ha PR 5
Per loro natura, i portali verticali hanno PR molto alto. Tuttavia, spesso sono strutturati in modo dinamico, e dunque può darsi che la pagina in cui viene inserito il link non sia indicizzata da Google. In tal caso avrebbe PR 0 e sarebbe del tutto inutile in funzione del PR.
I webmaster di siti che hanno PR alto sono generalmente consapevoli di ciò, e verosimilmente non sono disposti a scambiare un link senza avere nulla in cambio. La "merce di scambio" potrebbe essere un link da una pagina con PR equivalente, o comunque significativo. In alternativa, se il sito che richiede lo scambio riceve molte visite, il link può portare "in dote" un certo numero di nuovi visitatori. Un'altra possibilità è quella che vede la richiesta di denaro in cambio del link: inutile dire che in questo caso è particolarmente importante accertarsi che il partner sia affidabile e garantisca l'inserimento e il mantenimento del link per il tempo pattuito.
I blog hanno generalmente PR alto perché la comunità dei bloggers tende a formare una fitta rete di link reciproci. Dunque i blog sono un ottima fonte di PR e, come si è detto, si otterrà più facilmente un link se si pubblicano contenuti interessanti per i blogger. In casi fortunati è possibile ottenere un effetto domino in virtù del quale la pagina linkata inizialmente in un blog viene linkata anche da altri bloggers della comunità che la ritengono interessante.
Anche i siti di provider e web agency hanno generalmente ottimo PR, per una serie di motivi: sono da lungo tempo presenti in rete, ricevono link dai siti dei clienti, svolgono a loro volta attività di aumento del proprio PR per meglio posizionarsi nei motori di ricerca. In questo caso non ci sono problemi di concorrenza, perché con ogni probabilità la sfera delle keyword di interesse non coincide in alcun modo. In questo caso come negli altri, è utile ribadirlo, ci si deve assicurare che i link vengano posizionati in pagine accessibili dagli spider, specialmente se il sito dell'agenzia utilizza tecnologie sofisticate, cosa frequente nel settore.
Lo spamming è l'attività contraria alla netiquette, cioè l'insieme delle regole di comportamento universalmente accettate dagli utenti della rete Internet. Tipici esempi di spamming sono le email pubblicitarie, le finestre pop-up, gli script che installano dialer, i post nei forum contenenti link pubblicitari. Per quanto riguarda i motori di ricerca, le forme di spamming più comuni hanno come scopo quello di fare leggere agli spider cose che l'utente non vede attraverso la navigazione. Il caso più estremo è quello in cui si cerca di dirottare su siti a pagamento utenti che cercano parole chiave molto generiche come "mp3", "viaggi", "sesso" e così via. Nel corso del tempo, i motori di ricerca sono stati adeguati in modo da essere in grado di rilevare la maggior parte dei casi in cui tali tecniche vengono impiegate. In tal caso il sito non viene indicizzato e, se lo spamming persiste, il sito viene escluso dall'indice. Dato l'alto numero di pagine contenute negli indici, tuttavia, è possibile che l'individuazione dello spamming non sia immediata, e pertanto le pagine "colpevoli" possono rimanere a lungo indicizzate. Vi sono inoltre alcune forme di spamming che possono essere individuate solo manualmente. E' dunque possibile la segnalazione da parte degli utenti di forme di spamming non rilevate dai motori di ricerca.
Google: spamreport@google.com o http://www.google.com/contact/spamreport.html
Yahoo!: http://add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam
Configurazione del web server in modo da fornire pagine web diverse in base all'identità di chi effettua un interrogazione. Dunque lo spamming consiste nel far sì che al motore di ricerca venga servita una pagina diversa da quella visualizzata dal browser, allo scopo di ottenere un posizionamento preferenziale di un sito per parole chiave che in realtà non fanno parte del contenuto del sito stesso. Generalmente il web server si identifica lo user agent dello spider (o l'indirizzo IP) per "consegnargli" la versione della pagina preparata per i motori di ricerca, anziché quella normale visualizzata dai browser (un elenco completo degli user agent si trova all'indirizzo www.robotstxt.org).
Il tag meta refresh è un istruzione html standard che forza il browser a caricare un'altra pagina. Ciò viene interpretato dai motori di ricerca come un tentativo di fare indicizzare una pagina, quella in cui è presente il redirect, che di fatto non viene vista dagli utenti perché essi vengono appunti reindirizzati verso una pagina diversa. Queste pagine vengono definite "doorway pages", e vengono create appositamente per i motori di ricerca nei casi in cui i siti sono inaccessibili dagli spider. E' la situazione tipica che si presenta quando il sito viene realizzato con tecniche sofisticate che mal si conciliano con le esigenze dei motori di ricerca. Se comunque il redirect è necessario, per evitare di correre il rischio di essere considerati "spammer", è necessario definire un delay di minimo 10 secondi tramite il parametro previsto nell'istruzione meta refresh.
In alternativa, è possibile fare eseguire il redirect tramite un javascript o un flash, tecnica che però è considerata spamming se combinata all'utilizzo di una pagina doorway. Inoltre, si deve tenere conto del fatto che il motore di ricerca non sarà in grado di seguire i link. Nel caso in cui la pagina in questione sia la homepage e il link sia l'unico passaggio attraverso il quale si accede al resto del sito, ciò impedisce al motore di ricerca di andare oltre la homepage. Se si tratta di una presentazione in flash (o altri sistemi) si può ovviare a ciò inserendo il classico link html "skip intro" che consente di saltare l'introduzione. In tutti i casi, è possibile usare il tag "link" nell'intestazione nel modo seguente: link href="altra_pagina.htm".
Del testo contenente le keyword può essere reso invisibile utilizzando un colore uguale a quello dello sfondo (bianco su bianco, nero su nero, ecc).
La ripetizione eccessiva (più di 2 volte) delle keyword all'interno dei singoli tag meta e title è considerata spamming. Inoltre un tag non può essere ripetuto, neppure se contiene testo diverso.
Pagine identiche nello stesso sito e siti duplicati in domini diversi sono considerati spamming.
Oltre allo spamming insito nelle modalità di costruzione delle pagine web, vi è quello legato alla creazione artificiosa di link popularity. Con il successo di Google, infatti molti webmaster hanno cercato di creare delle pagine solo per poterci inserire dei link che facciano aumentare il PageRank tramite link reciproci con altri siti. Tali pagine sono conosciute come FFA, free for all. Si tratta in pratica di uno scambio di link di massa fra pagine che contengono solo tanti link decontestualizzati. La maggior parte delle FFA viene oramai individuata dai motori di ricerca in breve tempo. Si possono comunque trovare pagine FFA ben indicizzate, ma nel momento in cui il motore di ricerca le dovesse individuare come spamming, tutti i siti linkati verrebbero penalizzati di conseguenza. Si tratta di un rischio che non vale la pena di correre, tanto più che raramente le pagine FFA hanno PR alto.
Esistono inoltre siti con alto PR che ospitano link a pagamento. Alcuni webmaster consci del valore di un link dalle loro pagine hanno infatti pensato di sfruttare economicamente la cosa. Si tratta di un'infrazione delle linee guida che ha portato alcuni gestori di siti a ricevere citazioni in giudizio dai motori di ricerca.
Va fatta molta attenzione anche allo scambio di link verso siti web che usano trucchi di posizionamento considerati spamming. Un legame di questo tipo potrebbe essere sanzionato con una penalità nei motori di ricerca, e in casi estremi con l'esclusione. Se un sito viene escluso da un motore di ricerca a causa dello spamming, si devono rimuoverne le cause, e successivamente segnalare la natura dei cambiamenti effettuati:
Google: help@google.com
Yahoo!: http://add.yahoo.com/fast/help/us/ysearch/cgi_feedback
Infine, si sconsiglia di utilizzare programmi per il submit automatico e la verifica automatica del ranking. Tali programmi sfruttano le risorse di elaborazione dei motori di ricerca e sono pertanto da questi osteggiati. Il loro utilizzo massiccio e indiscriminato può portare ad una penalità specialmente in Google, particolarmente attento alla cosa.
(in ordine di importanza)
Si devono ottenere il maggior numero possibile di link dai seguenti tipi di sito:
Si devono evitare link dai seguenti tipi di sito:
Di seguito sono elencati i principali comportamenti da evitare, considerati tipici esempi di spamming:
Art. 53: Le pubbliche amministrazioni centrali realizzano siti istituzionali su reti telematiche che rispettano i principi di accessibilità, nonché di elevata usabilità e reperibilità , anche da parte delle persone disabili, completezza di informazione, chiarezza di linguaggio, affidabilità, semplicità dì consultazione, ...
Poichè si tratta di principi generali, esiste una direttiva ("Direttiva per la qualità dei servizi on-line e la misurazione della soddisfazione degli utenti") che approfondisce e specifica meglio sia quali siano le caratteristiche che devono avere i siti Web, sia come affrontarne la progettazione.
Ecco un breve schema riassunto da quel documento, più specifico per i servizi on-line, ma utile anche per i siti web.
Deve essere possibile valutare la soddisfazione degli utenti, il minimo che si possa fare è attivare i log sul server per monitorare i comportamenti dei navigatori sul sito. I log, sono i files che registrano i comportamenti degli utenti, e sono analizzati da appositi software statistici.
Dalle analisi statistiche è possibile monitorare il comportamento del visitatore: quante volte lo si può contare in termini di presenza nel sito Web, quante volte è tornato, quali sono le pagine che ha visto, come è arrivato sul sito, il tempo di permanenza in quelle pagine, quali sono le keyword (parole chiave) che ha utilizzato per cercarlo con i motori di ricerca, quali sono i percorsi maggiormente utilizzati e quali meno, qual è il tipo di browser più utilizzato. Queste informazioni risultano estremamente utili al fine di valutare se la struttura delle pagine e la sequenza di navigazione facilitano o scoraggiano il visitatore alla permanenza sul sito e a comprendere quali sono i contenuti ritenuti più interessanti e quindi da valorizzare e quali invece da eliminare o modificare.
Buona parte delle rilevazioni statistiche sul traffico generato dai siti Internet sono effettuate da programmi che analizzano i file di log (= file di registro); in questi file vengono memorizzati, momento per momento, i dati rilevati dal server web; i programmi di analisi statistica non fanno altro che elaborare e riportare in forma comprensibile (grafici, tabelle) tutte le informazioni in essi contenute.
La rilevazione e soprattutto l´interpretazione dei dati di traffico di un sito Internet sono processi che non producono dati inequivocabili e certi. La determinazione del numero di persone che hanno visitato un sito Internet in un certo arco di tempo rimane comunque un´indagine statistica, legata alla definizione di determinati parametri ed ai metodi scelti per la rilevazione di quei parametri.
In definitiva, si potrebbe concludere che le rilevazioni statistiche del traffico generato da un sito, più che essere prese in se stesse come numeri assoluti, dovrebbero essere prese in senso relativo, cioè come rapporto proporzionale esistente tra le visite ricevute dalle differenti pagine di un sito. Ossia, se il sistema di rilevazione adoperato ci dice che due pagine di uno stesso sito ricevono l´una 1000 visite al mese e l´altra 200, è molto probabile che il numero effettivo di volte in cui qualcuno ha caricato le due pagine sia più o meno differente da quello registrato dalle statistiche, ma è altresì molto probabile che il rapporto tra le volte in cui la prima pagina è stata caricata e le volte in cui è stata caricata la seconda sia prossimo a quel 5:1 rilevato dal sistema di misurazione in uso.
Per questo motivo diventa estremamente importante effettuare un´attenta interpretazione dei dati per non trarre conclusioni errate e forvianti, per far ciò occorre, per prima cosa, conoscere la terminologia utilizzata e, soprattutto, le definizioni dei principali parametri oggetto delle analisi statistiche. Vanno infine valutate, in fase di interpretazione dei dati, le scelte effettuate dagli amministratori del sistema di elaborazione delle statistiche (ad esempio la durata del sessione timeout, l'uso o meno di rilevazione attraverso cookie o IP, l'applicazione di filtri, ecc.).
è l´operazione eseguita da un server (un proxy, ad esempio) o da un computer cliente, consistente nel memorizzare una copia locale di una risorsa recuperata da Internet, con lo scopo di servire all´utente che ne fa richiesta quella copia locale, in luogo del documento originale presente su Internet. L´attività di caching, se da un lato aumenta le prestazioni di una rete in termini di risparmio di tempo e banda di connessione ai siti internet, dall'altro può contribuire a falsare in notevole misura la veridicità dei dati di traffico rilevati dai log file di un server web. E' possibile però prevenire questa perdita di traffico, inserendo nel codice delle pagine del sito sottoposto a rilevazione statistica un comando che, definendo la scadenza immediata della validità di ogni pagina, costringa l'utente interessato a collegarsi effettivamente alla risorsa richiesta, non potendola più recuperare dalla cache. Questa soluzione ha però degli svantaggi: in primo luogo una maggiore occupazione di banda, in secondo luogo un´attesa più lunga per il caricamento delle pagine (rispetto all´attesa per quelle recuperate direttamente dalla memoria del proxy) da parte dell´utente, il quale potrebbe essere negativamente influenzato - per quanto riguarda future visite - da un simile inconveniente.
Letteralmente "biscotto". Si tratta di un file di testo che viene generato dal browser dell´utente in seguito ad un messaggio inviato dal server web in risposta alla richiesta di collegamento ricevuta. Il cookie viene memorizzato sul computer cliente. Esso contiene delle informazioni che identificano univocamente quell´utente rispetto al sito Internet che lo ha generato. Ad ogni successiva connessione, il server web richiederà al browser il cookie precedentemente memorizzato. Se questo viene trovato, il server potrà utilizzare le informazioni in esso contenute per vari scopi:
Tutte le rilevazioni statistiche di traffico-web originate dall´uso di cookie sono soggette principalmente a due variabili: a) che l´utente collegato abbia abilitato nel proprio browser il supporto per i cookie; b) che effettui i successivi collegamenti per mezzo dello stesso browser.
è un protocollo di comunicazione che, installato su un server di rete, consente di governare automaticamente e centralmente l´assegnazione degli indirizzi IP a ciascuna macchina connessa ad Internet all´interno della rete. DHCP è in grado sia di assegnare IP statici, cioè indirizzi sempre uguali nel tempo, sia IP dinamici, cioè indirizzi con scadenza a breve termine (generalmente la durata di una sessione di connessione ad Internet). Il fatto che moltissimi utenti si colleghino alla Rete per mezzo di IP dinamici ricevuti automaticamente via server DHCP è un´ulteriore fonte di incertezza per le rilevazioni statistiche del traffico generato da un sito. Infatti l´indirizzo IP soggetto ad assegnazione dinamica è un´informazione insufficiente per identificare nel tempo in modo non ambiguo un singolo visitatore del sito (lo stesso IP potrebbe essere assegnato in successione ad x utenti di una stessa rete).
è il sistema che traduce i nomi di dominio in indirizzi IP. Un nome di dominio è un nome letterale, associato in modo univoco ad un indirizzo IP numerico, per identificare una risorsa su Internet. Ogni volta che un utente invia tramite il proprio browser una richiesta di collegamento specificando un nome di dominio (ad es.: www.regione.emilia-romagna.it), il server DNS competente intercetta la richiesta e trasforma la stringa letterale nel corrispondente indirizzo IP. Se quest´ultimo non è contenuto nella propria tabella di corrispondenze, la richiesta viene inoltrata ad un altro server DNS, e così via finché il nome letterale non viene risolto nella stringa numerica corrispondente. A questo punto, tutti i DNS interpellati si aggiornano automaticamente, inserendo nei rispettivi database la nuova corrispondenza trovata. Questo sistema di chiamate e aggiornamenti incrociati tra una serie di server DNS decentrati è più veloce, pratico e sicuro di un sistema basato su un unico server DNS centralizzato.
La sigla IP sta per Internet Protocol. è un numero di 32 bit che rappresenta univocamente ogni mittente o ricevente di pacchetti di dati attraverso Internet. Nella sua forma più comune l´IP address è espresso come una serie di quattro numeri, separati tra loro da un punto. Ognuno dei quattro numeri può variare (con alcune limitazioni) tra 0 e 255. Qualsiasi comunicazione che avviene su reti appartenenti ad Internet deve comprendere necessariamente l´indirizzo IP del mittente e quello del destinatario, allo scopo di poter essere istradata correttamente.
Letteralmente: traslazione dell´indirizzo di rete. è un meccanismo che consente, tramite appositi sistemi hardware e software, di far corrispondere una serie di indirizzi IP usati solo in rete locale ad una serie, generalmente meno numerosa, di indirizzi IP pubblici. Si ottengono così molteplici vantaggi:
L´uso di questa traslazione degli indirizzi IP da parte di molte reti rappresenta una perdita d´informazioni per la rilevazione statistica degli accessi ad un sito. Se, infatti, non si dispone della tabella di traduzione usata da un server NAT, non è possibile sapere se le richieste giunte da un certo IP fanno capo ad una o più macchine, né tantomeno a quali.
è un server che agisce da filtro tra le richieste di connessione a siti Internet, provenienti in genere dall´interno della rete LAN o WAN a cui il proxy appartiene, ed i siti stessi. La richiesta di accedere ad una risorsa su Internet, proveniente da un computer appartenente ad una LAN o ad una WAN, viene intercettata dal proxy di rete in modo del tutto trasparente per l´utente. Se la pagina richiesta non è presente nella cache (= memoria tampone) del proxy, la richiesta viene inoltrata al sito che ospita la risorsa, così da recuperare la pagina ed inviarla all´utente. Se, viceversa, la pagina è già presente nella cache del proxy, questa viene inoltrata direttamente all´utente, senza che occorra inviare alcuna richiesta al sito Internet che ospita la risorsa. L´uso di un proxy server fornisce essenzialmente due vantaggi:
Come si può comprendere, il fatto che molti accessi ad un sito provengano da proxy di reti più o meno ampie può falsare grandemente la valutazione del numero di pagine effettivamente viste (page views), numero che potrebbe essere ben superiore a quello rilevato tramite l´analisi dei file di log. Si pensi ad esempio a quanti utenti potrebbero essere serviti da un´unica pagina prelevata da un proxy di America On Line e conservata nella sua cache.
è un meccanismo per mezzo del quale un utente che ha richiesto di collegarsi ad un certo indirizzo Internet viene reindirizzato automaticamente ad un indirizzo differente. Capita spesso, così, che una medesima pagina web possa essere raggiunta, in virtù di appositi reindirizzamenti, da un certo numero di indirizzi diversi. Ai fini della rilevazione del numero effettivo di page view ottenuto in un certo periodo, occorre perciò tenere conto di tutti i redirect effettuati dal web server nel periodo considerato.
Mentre la trasformazione da un indirizzo letterale al corrispondente indirizzo numerico è detta forward DNS lookup, l´operazione contraria - cioè il risalire da un indirizzo IP noto al corrispondente nome di dominio - è detta reverse DNS lookup. Appositi software sono in grado, interrogando dei server DNS, di ottenere il nome di dominio a partire dall´IP numerico. Un sistema di rilevazione dei dati di traffico ha più valore se è in grado di effettuare il reverse DNS lookup, dal momento che per l´interprete umano la lettura di una serie di IP numerici dice poco o nulla, mentre molto più utile risulta la corrispondente serie di indirizzi letterali: solo questa è in grado, infatti, di informare effettivamente gli amministratori di un sito sulla provenienza degli accessi registrati.
Si tratta di programmi che automaticamente effettuano, in base a determinati criteri, una serie di richieste di file ad un server web, allo scopo di indicizzare i contenuti di quel sito per conto di un motore di ricerca. Le richieste provenienti da spider possono incidere fortemente sulla rilevazione del traffico generato da un sito. Per tale motivo, gli accessi prodotti da spider vengono in genere evidenziati dai sistemi di misurazione statistica, in modo che se ne possa tener conto e non risultino così falsati i valori relativi alle visite ricevute da parte di utenti umani, oppure possono essere filtrati in modo da non venire conteggiati i loro accessi.
è la durata massima predefinita di una visita ad un sito da parte di un utente unico. Non esiste uno standard per questa durata e neppure un consistente accordo in proposito. La lunghezza di una sessione può variare da un minimo di 10-15 minuti ad un massimo di un´ora. Nella maggior parte dei casi essa è impostata su 20 o 30 minuti. Se dura 20 minuti, ciò significa che ad un utente unico - riconosciuto come tale perché ha il medesimo indirizzo IP - vengono attribuite due visite al sito, nel caso in cui una sua richiesta di pagina giunga oltre 20 minuti dopo la precedente richiesta registrata. Viceversa, se l´intervallo trascorso tra questi due eventi è inferiore a 20 minuti, allora viene conteggiata per quell´utente un´unica visita. Come è facile comprendere, la durata di sessione è un parametro del tutto arbitrario, che nulla ha a che vedere con l´effettivo comportamento degli utenti collegati ad un sito e che può tuttavia influenzare le valutazioni del settore commerciale di un´azienda, circa la misura della fedeltà degli utenti ai siti presi in considerazione. Poniamo ad esempio che un sito, avendo un timeout di sessione impostato su 20 minuti, registri molte visite di utenti unici nell´arco di un mese di rilevazione: se ne potrebbe ricavare l´idea che dietro quelle visite ripetute si celino utenti fidelizzati. Basterebbe però probabilmente aumentare di soli dieci minuti il timeout di sessione, per scoprire che il numero di visite al sito da parte di utenti unici è nettamente diminuito! Ancora una volta è la conoscenza del significato e della reale portata dei numeri offerti dalle statistiche di traffico che aiuta a non commettere pericolosi errori di valutazione.
è l´indirizzo, unico e inequivocabile, di una risorsa su Internet. Qualsiasi documento - sia esso un file immagine, un file di testo, una risorsa multimediale, ecc. - è localizzabile precisamente per mezzo della URL. Questa comprende:
è il tempo medio speso da un utente unico su una singola pagina del sito. Può essere calcolato in due modi:
Il valore si ottiene dividendo il numero complessivo di pagine richieste da un utente unico per il numero di visite effettuate da quell´utente nell´arco di tempo considerato. Incrociando i dati ottenuti per questo parametro con quelli relativi altempo medio per visita, è possibile ipotizzare il comportamento-tipo degli utenti del sito. Ad esempio, una media di poche pagine viste per utente, accoppiata ad una lunga durata media delle visite registrate, potrebbe indicare che i visitatori del sito trovano con relativa facilità ciò che stanno cercando e leggono a fondo i contenuti reperiti. Viceversa, una media di molte pagine viste in rapida successione nel corso di poche e brevi visite potrebbe indicare che la struttura del sito è caotica, che gli utenti non riescono a trovare ciò che stanno cercando e che perciò non sono invogliati a ritornare. Naturalmente queste supposizioni devono essere avanzate a ragion veduta: cioè facendo la tara di tutti i possibili fattori di incertezza dei dati statistici rilevati.
è il tempo medio speso da un utente unico per una visita al sito. Il valore si ottiene dividendo il tempo complessivo speso dall´utente sulle pagine del sito nel periodo considerato per il numero di visite che ha effettuato nello stesso periodo di tempo. Poiché il numero di visite effettuato da un utente unico in un certo arco di tempo dipende dal parametro arbitrario della durata di sessione (cfr. la voce session timeout), è evidente che anche la durata media di una visita risulta influenzata dal valore assunto da questo parametro.
è la classifica espressa in valori percentuali dei browser utilizzati dagli utenti che si collegano ad un sito. Questa informazione è utile soprattutto ai responsabili tecnici, per tarare al meglio la struttura delle pagine e la presentazione dei contenuti, in modo che siano navigabili per mezzo di ciascuno dei vari tipi di browser che risultano presenti in questa classifica. Se, ad esempio, analizzando l´elenco dei browser utilizzati, si scopre che una discreta percentuale di visitatori utilizza un browser non compatibile con alcune soluzioni tecniche implementate sul sito, sarebbe opportuno ricalibrare le pagine in modo da renderle accessibili anche alla fetta di utenza penalizzata dalle precedenti scelte tecniche.Va comunque precisato che la verifica pratica di quali tipi di browser si colleghino alle pagine di un sito non dovrebbe aver alcuna importanza, se quelle pagine sono state codificate fin dall´inizio nel rispetto dei linguaggi standard per il Web definiti dal W3C.
Costituisce un hit qualsiasi richiesta di file pervenuta ad un server web. Così, se una pagina web è costituita da un file HTML e da sei immagini, la visualizzazione completa all´interno della finestra di un browser sia della pagina sia delle immagini in essa contenute corrisponderà alla registrazione di sette hit nell´apposito file di log del server. Un equivoco comune, consiste nel confondere le richieste di accesso con le pagine realmente caricate: un numero, quest´ultimo, che è in realtà quasi sempre nettamente inferiore al numero di hit registrato.
è l´elenco in ordine decrescente delle nazioni da cui proviene il maggior numero di accessi ad un sito.
è la classifica, in ordine decrescente, delle pagine che hanno ricevuto più contatti in un determinato arco di tempo. In base ai filtri impostati, possono essere considerati in questo elenco alcuni tipi di file - ad esempio HTML e ASP - e non altri. è utile comunque, per i tecnici e per i responsabili editoriali di un sito, considerare attentamente la classifica delle pagine più richieste, sia per correggere eventuali problemi di natura tecnica - come un sovraccarico del server web dovuto ad errori di programmazione - sia per correggere problemi di struttura logica del sito: alcune pagine, ad esempio, potrebbero essere al vertice della classifica delle più richieste non per i loro contenuti, ma perché sono delle strettoie obbligate da cui passare per raggiungere determinati altri contenuti; altre pagine, al contrario, potrebbero ricevere pochi contatti soltanto perché non sono state rese sufficientemente visibili agli utenti (vedi least requested pages).
Il numero di pagine viste su un sito è forse l´informazione più importante che le statistiche web possano fornire, ma è anche l´informazione di gran lunga più ambigua e difficile da determinare, sia per la difficoltà di definire univocamente cosa sia una pagina sia per l´impossibilità oggettiva di conoscere il rapporto preciso tra pagine servite e pagine caricate da un utente umano (a causa dell´interferenza di numerose variabili quali proxy, NAT, cache locali, spider, ecc.). L´oggetto principale registrato da un server web come una pagina è il file HTML, che contiene le chiamate a tutti gli altri oggetti - immagini, suoni, elementi multimediali, ecc. - che servono a completare quell´entità piuttosto astratta che è la "pagina". Ma non solo i file HTML hanno diritto ad essere considerati "pagine": anche i file cosiddetti "dinamici", cioè quelli che contengono elementi di programmazione in grado di generare contenuti differenti a seconda dei casi, sono a buon diritto da considerarsi "pagine". Rientrano in questa categoria i file con estensione ASP, PHP, PHP3, PL e simili. Ma possono rientrarvi - ed è una scelta dell´amministratore di rete impostare di conseguenza opportuni filtri sul server - anche i file TXT, i file RTF, i file DOC, i PDF ed altri ancora. Insomma: non è per niente semplice creare una categoria astratta chiamata "pagina", che comprenda alcuni tipi di file e ne escluda altri e che fornisca, allo stesso tempo, un parametro attendibile per la valutazione del numero di pagine viste da utenti umani. Soprattutto va tenuto presente che la comparazione delle page view registrate per due o più siti differenti può essere un´operazione dai risultati molto poco attendibili: infatti, pur ponendo come uguali gli strumenti di rilevazione del dato e i filtri impostati, la struttura dei siti - in termini di composizione delle pagine e di oggetti in esse presenti o da esse richiamati - può essere motivo sufficiente per generare, nel numero di page view rilevato, uno scarto nettamente superiore (o nettamente inferiore) alla reale differenza nella quantità di pagine viste da visitatori umani su ciascuno di essi.
è la classifica delle pagine uniche più richieste, visitate in un certo intervallo di tempo. Si tratta cioè di quelle pagine che, per motivi che i responsabili di un sito dovrebbero studiare a fondo, suscitano l´interesse degli utenti, ma allo stesso tempo non li invogliano a proseguire la visita appena iniziata. Potrebbe trattarsi di pagine con contenuti chiusi in se stessi (ad esempio una serie di collegamenti o una recensione), referenziate da altri siti. In questo caso andrebbe studiato il modo per indurre il visitatore a continuare la navigazione all´interno del sito, ad esempio inserendo nelle pagine "incriminate" dei collegamenti ad altre sezioni con contenuti affini.
è l´elenco in ordine decrescente delle directory (in genere solo quelle di primo livello) che hanno ricevuto complessivamente più richieste di accesso dagli utenti collegati. Questa classifica tende a dare un´idea dell´importanza reciproca delle sezioni in cui è suddiviso un sito. Perché questo resoconto abbia un qualche valore conoscitivo, occorre che la struttura logica del sito sia stata progettata in modo razionale, raggruppando i vari contenuti, in base alla loro omogeneità, sotto apposite directory.
è la classifica in ordine decrescente delle pagine iniziali più richieste per ciascuna visita al sito registrata in un certo arco di tempo. Normalmente al vertice di questa classifica c´è la home page. Se così non è, diventa importante identificare i motivi per cui altre pagine funzionano meglio della home page come ingressi al sito. Ciò può essere fatto, ad esempio, analizzando i referrer log, cioè i dati sulla provenienza delle visite, per capire se e da quali altri siti sono referenziate le pagine che si trovano al vertice della classifica delle top entry.
è la classifica in ordine decrescente delle pagine più richieste in un certo arco di tempo come pagine finali di una visita ad un sito. è, in altre parole, l´elenco delle pagine che sembrano più di tutte invogliare l´utente ad interrompere una visita in corso. Anche qui è importante uno studio approfondito, allo scopo di capire cosa c´è in quelle pagine che spinge i visitatori a lasciare il sito. Molto spesso la causa è da ricercarsi in una serie di collegamenti diretti ad altri siti; altre volte può trattarsi di un cattivo sviluppo dell´albero di navigazione, che finisce con il condurre gli utenti verso pagine-imbuto prive sia di informazioni utili sia di collegamenti verso altre sezioni del sito.
è la classifica dei più comuni percorsi di navigazione seguiti dagli utenti nel corso delle loro visite ad un sito. Per ogni elemento della classifica vengono forniti di solito:
è la classifica in ordine decrescente delle singole pagine che hanno reindirizzato degli utenti verso un sito. è utile che il servizio di rilevazione statistica adoperato permetta di aggregare i reindirizzamenti, in modo tale da separare quelli provenienti dall´interno del dominio di appartenenza del sito da quelli provenienti dall´esterno.
è la classifica in ordine decrescente dei siti che hanno reindirizzato il maggior numero di contatti a file presenti su un sito. Spesso un´elevata percentuale di contatti è accoppiata in questa classifica all´etichetta "no referrer": ciò significa che un utente si è collegato direttamente ad una risorsa su un sito, senza esserci arrivato per via di collegamenti. Questo caso si verifica, ad esempio, quando un visitatore, conoscendo l´indirizzo della pagina richiesta sul sito di destinazione, inserisce manualmente la URL nella barra degli indirizzi del proprio browser.
è l´elenco in ordine decrescente dei motori di ricerca che hanno generato più contatti al sito. Se il numero complessivo di contatti generato da motori di ricerca è basso rispetto al numero complessivo di contatti registrato per un sito, allora se ne può dedurre che le pagine e i contenuti di questo sito non sono sufficientemente indicizzati dai motori di ricerca. Occorrerebbe in questo caso effettuare le apposite procedure - spesso a pagamento e ottenibili in blocco rivolgendosi a società specializzate - per migliorare l´indicizzazione dei contenuti messi in linea. Essere ai vertici delle classifiche generate dai principali motori di ricerca può essere, infatti, un formidabile strumento per incrementare il numero di visite ricevute.
è l´elenco in ordine decrescente delle parole chiave con più frequenza utilizzate dai visitatori di un sito nell´interrogare i motori di ricerca; parole chiave che hanno prodotto, come risultato dell´interrogazione, dei collegamenti e delle conseguenti visite al sito. è importante che un sistema di rilevazione del traffico sia in grado di fornire la classifica delle parole chiave più utilizzate dagli utenti. Studiare con attenzione questa classifica è infatti molto utile al fine di comprendere che tipo di contenuti gli utenti riescono a trovare sul proprio sito grazie ai motori di ricerca. Per via di esclusione si può poi cercare di definire quali altri contenuti, pur presenti sul sito, non generano contatti tramite i motori di ricerca, e perché.
è il visitatore, identificato per mezzo dell´indirizzo IP, che effettua una o più visite al sito nel periodo di tempo per cui si vogliono elaborare i report statistici. Se, nell´arco di tempo considerato, il visitatore effettua più visite viene contato una sola volta. La rilevazione del numero di visitatori unici, nel caso di assegnazione di IP dinamici da parte di server DHCP, è soggetta a due limitazioni che vanno tenute presenti nell´interpretazione dei dati ottenuti.
Può infatti accadere che:
I report di elaborazione statistica riguardanti i visitatori unici di un sito forniscono, oltre al totale, anche il numero di quelli che vi accedono una sola volta e di quelli che si collegano più volte. La percentuale di questi ultimi sul totale dei visitatori e il numero medio di visite per visitatore nell´arco di tempo considerato, rappresentano una stima del grado di fidelizzazione degli utenti.
Tutte le richieste ricevute in successione ininterrotta da un server web, provenienti da un medesimo indirizzo IP. Si considera terminata una visita da parte di un utente identificato se tra due successive richieste di pagina intercorre un tempo superiore al timeout di sessione impostato: se questo, ad esempio, è impostato su 30 minuti, una richiesta di pagina da parte dello stesso utente che arrivi oltre 30 minuti dopo la precedente richiesta, sarà considerata come la prima pagina vista di una nuova visita al sito. Il totale delle visite che si ricava in tal modo dall´analisi dei file di log per un dato periodo di tempo rappresenta evidentemente un´approssimazione statistica, il cui indice di affidabilità rimane imprecisato, dal momento che non esistono mezzi per sapere - tramite la sola analisi dei log - né quanto siano durate in realtà le singole visite ricevute né se con un medesimo indirizzo IP si sia collegata sempre la stessa persona oppure una serie di persone differenti.
Se si rende necessaria l´elaborazione statistica per rilevare gli accessi di una sezione di sito occorre che la struttura logica del sito sia stata progettata in modo razionale, raggruppando i vari contenuti, in base alla loro omogeneità, sotto apposite directory. In questo modo è possibile impostare il programma di elaborazione, attraverso l´utilizzo di filtri, in modo da ottenere un resoconto specifico di una singola directory.
Occorre inoltre, tenere presente l´attività di caching che può contribuire a falsare in notevole misura la veridicità dei dati di traffico rilevati dai log file di un server web.
E' possibile però prevenire questa perdita di traffico, inserendo nel codice delle pagine del sito sottoposto a rilevazione statistica un comando che, definendo la scadenza immediata della validità di ogni pagina, costringa l´utente interessato a collegarsi effettivamente alla risorsa richiesta, non potendola più recuperare dalla cache. Questa soluzione ha però degli svantaggi: in primo luogo una maggiore occupazione di banda, in secondo luogo un´attesa più lunga per il caricamento delle pagine (rispetto all´attesa per quelle recuperate direttamente dalla memoria del proxy) da parte dell´utente, il quale potrebbe essere negativamente influenzato - per quanto riguarda future visite - da un simile inconveniente.
Il sistema attuale gestisce in modo automatico la generazione dei file di log ed il loro spostamento giornaliero in cartelle predefinite.
Il programma di elaborazione è Web Trends Log Analyzer Advanced installato su un server regionale; l´amministrazione del programma è effettuata dal Servizio Sistema informativo - informatico regionale.
Tale programma periodicamente preleva i file di log ed esegue l´elaborazione restituendo un report che può essere visualizzato collegandosi via web all´indirizzo https://statistiche.regione.emilia-romagna.it, accessibile anche dall'esterno della rete regionale, se opportunamente abilitati. Per ciascun sito web per il quale è stato creato un profilo di interrogazione degli accessi, i referenti abilitati al software potranno elaborare autonomanente i report statistici. Gli utenti potranno ottenere i dati di traffico consultando report giornalieri, settimanali, mensili, trimestrali o annuali, oppure specificando il periodo desiderato. È inoltre, possibile l´esportazione dell´elaborato in formato Word, Excel o Pdf per poter effettuare modifiche ed eventualmente per diffonderlo sul proprio sito web. Per maggiori dettagli sulla visualizzazione dei report si rimanda agli approfondimenti.
Il Web 2.0 è un locuzione utilizzata per indicare genericamente uno stato di evoluzione di Internet (e in particolare del World Wide Web), rispetto alla condizione precedente. Si tende ad indicare come Web 2.0 l'insieme di tutte quelle applicazioni online che permettono uno spiccato livello di interazione sito-utente (blog, forum, chat, sistemi quali Wikipedia, Youtube, Facebook, Myspace, Gmail, ecc.).
La locuzione pone l'accento sulle differenze rispetto al cosiddetto Web 1.0, diffuso fino agli anni '90, e composto prevalentemente da siti web statici, senza alcuna possibilità di interazione con l'utente eccetto la normale navigazione tra le pagine, l'uso delle email e l'uso dei motori di ricerca
Ecco come viene definito da Tim O’Reilly in "What is Web 2.0", da Paul Graham nel suo "Web 2.0" e da Jason Fried nel libro "User Survey":
Il Web 2.0 è la Rete, fatta di persone, che partecipano collaborano e condividono grazie all’assenza di limiti, che li pone tutti sullo stesso piano, nello stesso posto, nello stesso momento.In sintesi:
L’accessibilità è quella qualità del software che permette a tutti di utilizzarlo, indipendentemente dai limiti che hanno nel farlo.
Il Web 2.0 e l’accessibilità portano nella stessa direzione: elevare la partecipazione annullando i limiti. L’accessibilità è quindi una componente fondamentale del Web 2.0 inteso nella sua massima espressione.
Innanzitutto il Web 2.0 non è “applicazioni fortemente interattive”, il Web 2.0 è condivisione, partecipazione e collaborazione, anche attraverso applicazioni fortemente interattive. Il falso mito di cui soffre il Web 2.0 è che sia tutto fatto con AJAX, che è un insieme di tecnologie che permette alle pagine di comportarsi come i programmi del computer, con finestre che si possono spostare, dati che si aggiornano sulle pagine in tempo reale, ecc.
L’altro falso mito è che ciò che è fatto in AJAX non possa essere accessibile: è accessibile a patto che lo si realizzi nel modo giusto.