News dal mondo di Google Analyitcs

Creare profili con i filtri avanzati

Le espressioni regolari in Google Analytics

Il 12 ottobre 2012, sotto Articoli, scritto da Angelo Artuso
0

Tra le varie caratteristiche di Google Analytics sicuramente una delle più sconosciute ma paradossalmente più potenti è quella del supporto delle espressioni regolari .

Ecco dove inserire i filtri avanzati al profilo di Google Analytics precedentemente selezionato dal TAB Amministrazione

Le espressioni regolari non sono altro che delle combinazioni di testo con dei caratteri speciali.  Tali combinazioni ,  se utilizzate in modo appropriato, permettono di creare filtri  che includono o l’escludono pagine o altri elementi in modo molto preciso.

La funzione principale delle espressioni regolari è quella di ampliare o restringere il campo di applicazione di una regola su un insieme di elementi. Facciamo un esempio: se io dovessi realizzare un filtro su un profilo che esclude un range di  indirizzi IP potrei procedere in due modi:

  • scrivere uno per uno gli indirizzi ip;
  • creare una regular expression che mi identifica (tramite una sola stringa di testo) l’insieme degli indirizzi ip da filtrare. Ad esempio se scriviamo questa espressione:
    ^163\.202\.161\.([1-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-4]))$
    Filtrerò tutto il range di indirizzi IP che vanno dal 163.202.161.1 al 163.202.161.224

Vediamo adesso grazie anche al supporto di Google Analytics quali sono e come funzionano le variabili.

Caratteri jolly

CarattereSpiegazioneEsempio
.Corrisponde a qualsiasi carattere singolo (lettera, numero o simbolo)pia.to corrisponde a tanto apianto che a piatto
*Corrisponde a zero o più caratteri dell'elemento che lo precedeL'elemento predefinito precedente è il carattere precedente. car*o corrisponde a caro, carro, carrro
?Corrisponde a zero o a uno dell'elemento che lo precedeamore? corrisponde sia a amor che a amore
+Come l'asterisco, ad eccezione del fatto che un segno più deve corrispondere almeno a un elemento precedentepia+to corrisponde a piatto, ma mai a piato.
|Consente di creare una corrispondenza "or"a|b corrisponde ad a o b

Delimitatori

CarattereSpiegazioneEsempio
^Richiede che i dati siano all'inizio del relativo campo^sito corrisponde a sito ma non a miosito
$Richiede che i dati siano alla fine del relativo camposito$ corrisponde a sito ma non a sitocheck

Raggruppamento

CarattereSpiegazioneEsempio
()Utilizza le parentesi per creare un elemento, anziché accettare quello predefinitoRicerc(a|he) corrisponde sia a Ricerca che a Ricerche
[ ]Utilizza le parentesi quadre per creare un elenco di elementi con cui creare corrispondenze[abc] crea un elenco contenente a, b e c
-Utilizza i trattini con le parentesi quadre per estendere l'elenco[A-Z] crea un elenco per l'alfabeto inglese maiuscolo

Suggerimenti utili

Il carattere \ è un carattere cosiddetto di escape ossia converte un carattere di espressione regolare in un carattere standard.  Quindi se devo cercare una stringa che contiene un asterisco (es. testo*conasterisco)  dovrò usare il \ in questo modo testo\*conasterisco.

Come funziona il campionamento in Google Analytics

Come funziona il campionamento in Google Analitycs

Il 10 agosto 2012, sotto Articoli, scritto da Angelo Artuso
0
Google Analytics (versione free)  come molti software di Web Analytics effettua, in alcuni casi, dei campionamenti sui dati. Il motivo dell’utilizzo di dati campionati è dovuto al fatto che query o analisi specifiche richiedono sforzo computazionale e tempi di analisi proporzionali al quantitativo di dati da analizzare.
I software di Web Analytics quindi sono generalmente settati e ottimizzati per popolare dei report predefiniti.
Quando si effettuano delle query aggiuntive o diverse da quelle definite nei report standard Google Analytics è costretto a analizzare e riorganizzare i dati che ha immagazinato. Tutto questo costa in termini di tempo di elaborazione dati  e di potenza di calcolo necessaria per effetuare l’analisi e quindi Google Analytics (versione free) campiona i dati per poter dare una interpretazione statisticamente attendibile in tempi brevi.
Come avete notato quando parlo di campionamento su Google Analytics metto sempre tra parentesi il tipo di versione a cui mi riferisco, in particolare infatti nella versione Premium di Google Analytics il campionamento non esiste (visto anche il costo del servizio ;) ).
La domanda che però ci sorge spontanea è, quando Google Analytics (versione free) inizia a campionare?
Diciamo subito che Google Analytics non campiona nei cosiddetti rapporti standard, campiona quando:
  • applichiamo un segmento avanzato;
  • creiamo un custom report;
  • effettuiamo una analisi multicanale;
  • effettuiamo una analisi del flusso di navigazione.
  • abbiamo una dimensione (es. keyword) o un aggregato di dimensioni (es.  ad group e  campagne) superiore ai 50.000 valori distinti giornalieri.
Nell’ultimo caso non si effettua un vero e proprio campionamento ma bensi un cut-off ossia la 50.001 keword viene inserita in un basket chiamato [other]. Se però stiamo effettuando un analisi su più giorni il numero massimo delle righe della tabella è di 1.000.000, questo significa che ad esempio se prensiamo 30 giorni il numero massimo di granularità in termini di quella dimensione è di 1.000.000/30 ossia verranno lette solo le prime 33.333 righe della tabella “giornaliera”.
Tanto per capire facciamo un esempio, se per caso io voglio visualizzare il report mensile standard  “Ricerca>Risultati organici” e ipotizziamo che ho per 30 giorni consecutivi la keyword “spaghetto” posizionata  alla 34.000 posizione come keyword di traffico io non la troverò mai nel report,  ma sarà genericamente contrassegnata come [other].
Tornando sul tema campionamento la domanda è quando Google Analytics (versione free)  campiona?

Leggendo sul forum di supporto di Google troviamo :

“Il campionamento avviene quando i dati del rapporto si basano su più di 250.000 visite e consente a Google Analytics di generare rapporti più velocemente nel caso di set di dati così ampi”.
Quindi ogni qual volta analizziamo più di  250.000 visits  per una singola Web property il nostro Google Analytics (versione free) campiona.
Nella frase di sopra c’è una precisazione importante ossia e anche una piccola inesattezza:
  1. il campionamento avviene per Web properties e non per profilo;
  2. in realtà Google permette di ampliare il valore di 250.000 visite a 500.000 in modo manuale attraverso uno slider (vedi successivamente);
  3. il numero di visits è fisso indipendentemente dal periodo di tempo analizzato.

L’ultima considerazione mette in evidenza una realtà un pò scomoda ma su cui è bene fare i conti ossia che tanto maggiore sarà il periodo di tempo analizzato tanto minore sarà l’accuratezza del dato.

Ma come faccio ad accorgermi se Google sta campionando il dato?
E’ molto semplice si vede una specie di scacchiera e cliccandoci sopra si apre una finestra in cui è presente uno slider che permette di aumentare o diminuire  la quantità di dati campionati  (fino ad un massimo di 500.000 visits)  e quindi aumentare o diminuire la precisione statistica del dato.
Google Analytics rispetto ad altri software è abbastanza correttoin termini di chiarezza verso l’utente finale infatti evidenzia il numero di dati su cui è stato effettuato il campionamento e il valore percentuale in valore assoluto di visite.

Quindi ricapitolando quando si analizzano i dati di strumenti di Web Analytics bisogna mettere in conto che abbiamo a che fare con strumenti molto potenti ma anche con molti limiti.
Posto che i limiti giornalieri di dati in tabella non sono un problema, a meno che non si abbia un sito con contenuti estremamente polverizzati e di cui si vuole un analisi fin troppo approfondita della long tail. Il vero problema per chi utilizza Google Analytics (versione free) sono in effetti i campionamenti sui segmenti avanzati e sui custom report che sono in realtà il motivo vero per cui poi uno sceglie il software statistico.
Google Analytics versione free si per i siti di piccole o medie dimensioni, direi quelli che hanno un numero di visite annuale non superiore a 2.000.000 di visits in modo da poter effettuare delle misure e prendere delle decisioni per lo meno analizzando dati non campionati per quarter.

Benvenuti su analytics guru,

questo blog vuole essere un punto di incontro per tutti coloro che ricercano informazioni e desiderano essere aggiornati su tutto ciò che il mondo di Google Analytics rappresenta e può rappresentare.

L’obiettivo del sito è quello di dare informazioni sulle funzionalità di Google Analytics free e del suo alter ego a pagamento Google Analytics Premium.

Purtroppo in italia la cultura delle metriche web e ancor più della misurazione delle performance di campagne e attività sull’online ha ancora molto da imparare dai colleghi d’oltre oceano o d’oltre manica.

Capire la differenza tra utente unico, visitatore, pagina visitata o hits magari per molti sembrerà scontato ma in realtà non lo è affatto.

Ho deciso di provare a scrivere le mie esperienze di implementazione di Google Analytics perchè facendolo mi sono accorto che molti concetti che negli altri software di statistica sono cristallini in GA sono molto sfumati e possono dare informazioni non corrette se non ben definite e instrumentate.

 

 

tag: