Il progetto di analisi dei flussi turistici utilizza i dati della regione Piemonte per realizzare un processo completo di Business Intelligence.
I dataset utilizzati come base di dati, sono i seguenti:
- flussi turistici per territorio, dettaglio mesi anni 2006-2008;
- flussi turistici per territorio, dettaglio mesi per l'anno 2009.
I dati rappresentano un caso reale, cioè il numero di arrivi e presenze sul territorio piemontese, con la seguente classificazione: provincia di riferimento e nazionalità degli ospiti (italiani/stranieri).
I dati forniti sono riferiti al quadriennio 2006-2009 e sono dettagliati in base al mese in cui si è registrato l’arrivo/presenza.
Arrivi, indica il numero di nuovi clienti che si presenta in un albergo o altra attività ricettiva.
Presenze, indica il numero di notti trascorse sul territorio (nel nostro caso per territorio s’intende la regione Piemonte).
Nei documenti allegati sono descritte le fasi del processo di Business Intelligence:
- ETL (Extract Transform and Loading)
Si sono caricati, predisposti e trasformati i dati affinché fossero utilizzabili in maniera proficua dal sistema. Abbiamo creato un datawarehouse ad hoc utilizzando MySQL come DBMS.
- Analisi OLAP (On-Line Analytical Processing)
Abbiamo realizzato una tabella navigabile (un cubo OLAP) che visualizza gli arrivi e le presenze relativamente all'anno (e il mese), la nazionalità di provenienza e la provincia.
- Creazione di report
Abbiamo generato un report personalizzabile in grado di visualizzare presenze e arrivi in base alla nazionalità.
- Analisi di Data Mining
Abbiamo generato due modelli, basati sui dati degli anni precedenti, in grado di prevedere gli arrivi e le presenze sul territorio.
Tutto il sistema è basato su tecnologie open source e anche i dati utilizzati sono liberamente fruibili da sito http://dati.piemonte.it
Relazione Tecnica dell'esperienza
Nel documento, illustriamo passo-passo l’esperienza riguardante la realizzazione del processo di Business Intelligence, utilizzato in un progetto di Tesi di Laurea specialistica in Ingegneria Informatica presso l'Università di Ferrara.
Cosa contiene la relazione:
- motivazioni che hanno portato a scegliere il dataset, oltre che alla sua descrizione;
- scelta della piattaforma (riferita al sistema operativo), del DBMS, della JVM;
Definizione della Data Warehouse; - implementazione delle fasi del processo di Business Intelligence, spiegando per ogni fase quali scelte sono state adottate e cosa si è voluto sviluppare.
E' possibile scaricare la presentazione e il documento di Tesi di Laurea:
- Breve presentazione della Tesi
- Tesi: "PENTAHO: Analisi e valutazione dei una piattaforma open source per la Business Intelligence"
E' disponibile inoltre il materiale utilizzato nell'esperienza di laboratorio, comprensivo di sorgenti e dataset. Nel file Leggimi.html (contenuto nel file .zip) è possibile trovare un riepilogo dei materiali disponibili. (per richiederla scrivere a denis@i-ware.it)
Per contatti e informazioni e per richiedere il materiale scrivere a denis@i-ware.it
| Allegato | Dimensione |
|---|---|
| Relazione di Laboratorio.pdf | 3.86 MB |
| PresentazioneTesi_ManueleMagri.pdf | 790.98 KB |

