UNIVERSITÀ DEGLI STUDI LA SAPIENZA DI ROMA
FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA
Modellistica e analisi dei consumi energetici in ambito domestico per l’identificazione dell’utenza e la rivelazione di anomalie
Relatore:
Laureanda:
Ch. mo Prof. Roberto Cusani
Anno Accademico 2007/2008
Manuela Marzotti
INDICE 1
PREFAZIONE ..........................................................................................................................4
2
L ‘ENERGIA ELETTRICA ....................................................................................................5 2.1 2.2 2.3 2.4 2.5
FORME E FONTI DI ENERGIA.................................................................................................5 EFFICIENZA ENERGETICA ....................................................................................................6 IL CONSUMO DI ENERGIA ELETTRICA ...................................................................................8 ALCUNE SOLUZIONI PER TUTELARE IL CLIMA DEL PIANETA ...............................................11 LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DI ENERGIA ELETTRICA ...............................13
3 MODELLISTICA E SIMULAZIONE DEI CONSUMI ENERGETICI NELL’AMBITO DOMESTICO .....................................................................................................15 3.1 3.2 3.3
INTRODUZIONE..................................................................................................................15 CARATTERISTICHE DI CONSUMO DEI PRINCIPALI ELETTRODOMESTICI ...............................16 MODELLI PER LA SIMULAZIONE DI CONSUMO ELETTRICO ..................................................18
3.3.1 3.3.2 3.3.3
4
ANALISI STATISTICA DEI CONSUMI DOMESTICI....................................................35 4.1 4.2
MEDIE E VARIANZE DELLA CURVA DI CONSUMO ...............................................................35 STATISTICHE DI CONSUMO ................................................................................................36
4.2.1 4.2.2
4.3 5
Giorni singoli........................................................................................................................ 36 Giorni multipli ...................................................................................................................... 38
RIVELAZIONE DI ANOMALIE NEI CONSUMI BASATA SUI PARAMETRI STATISTICI ................40 IDENTIFICAZIONE PROFILI UTENTE ..........................................................................41
5.1 5.2
STRATEGIE PER L’IDENTIFICAZIONE DI PROFILI UTENTE ....................................................41 APPLICAZIONE DELLA METODOLOGIA SVILUPPATA ...........................................................47
5.2.1 5.2.2
5.3
5.4 6
Prima prova: famiglia-campione senza profili..................................................................... 47 Seconda prova: famiglia-campione con profili .................................................................... 49
LA SOLUZIONE PROPOSTA .................................................................................................51
5.3.1 5.3.2
Matlab................................................................................................................................... 51 Identificazione profili utente................................................................................................. 53
RISULTATI .........................................................................................................................53 RIVELAZIONE DI ANOMALIE NEL CONSUMO DOMESTICO ................................58
6.1 6.2 7
Tipologie di famiglie............................................................................................................. 18 Modello semplice.................................................................................................................. 19 Modello di Markov per i consumi domestici ........................................................................ 23
STRATEGIA PER LA RIVELAZIONE DI ANOMALIE ................................................................58 I RISULTATI .......................................................................................................................59 CONCLUSIONI......................................................................................................................62
APPENDICE A:
RIVELAZIONE DI ANOMALIE NEL TRAFFICO SU INTERNET.......64
2
APPENDICE B: SOFTWARE MATLAB PER LA MODELLISTICA E L’ANALISI DEI CONSUMI DOMESTICI ........................................................................................................73 APPENDICE C: SOFTWARE MATLAB PER LA IDENTIFICAZIONE E LA RIVELAZIONE DI ANOMALIE NEI CONSUMI DOMESTICI..............................................79 BIBLIOGRAFIA..............................................................................................................................83 INDICE DELLE FIGURE ..............................................................................................................85 RINGRAZIAMENTI .......................................................................................................................87
3
1 PREFAZIONE
Il lavoro di Tesi ha riguardato lo sviluppo di un software per ottenere la rivelazione di anomalie nel consumo di energia elettrica in ambito domestico. Al fine di formulare degli scenari di consumo energetico, sono state raccolte informazioni riguardanti alcune famiglie tipo ed elaborate in relazione a varie fasce orarie. Successivamente sono stati creati dei grafici in cui sono riportati i dati relativi ai consumi, monitorati in un determinato periodo, in modo da permettere l’individuare di eventuali anomalie nel “sistema energia” e favorire la gestione dei consumi, ottimizzandone l’utilizzo. Di seguito sono descritte le metodologie adottate per produrre delle analisi sulle principali fonti energetiche ed i risultati ottenuti. La tesi ha la seguente struttura: il capitolo 1 comprende una premessa sul contesto della tesi di laurea e una breve sintesi degli obiettivi preposti. il capitolo 2 tratta dell’energia elettrica soprattutto in ambito domestico, dell’importanza del risparmio energetico e delle normative che la riguardano. il capitolo 3 descrive i modelli sviluppati per la simulazione dei consumi energetici in ambito domestico. il capitolo 4 analizza i consumi simulati con i modelli descritti nel capitolo precedente per mezzo di parametri statistici. il capitolo 5 descrive le soluzioni proposte per l’identificazione di profili di utenze nel consumo energetico in ambito domestico e riporta i risultati ottenuti. il capitolo 6 descrive le soluzioni proposte per la rivelazione di anomalie di consumo energetico in ambito domestico e riporta i risultati ottenuti.
4
2 L ‘ENERGIA ELETTRICA
La società attuale è molto sensibile al tema dell’energia elettrica in quanto la sua disponibilità ed il suo consumo costituiscono aspetti fondamentali per indicare il livello di sviluppo economico ed industriale di un paese; è però anche di grande importanza il suo monitoraggio e l’ottimizzazione dei consumi per ottenere un vero e proprio risparmio di energia, simbolo di un’adeguata organizzazione energetica, che interessa sia l’utente finale, che pagherà una bolletta meno cara, sia la comunità perché vuol dire ridurre il consumo di combustibili fossili e quindi l’inquinamento globale.
2.1 Forme e fonti di energia La parola energia deriva dal tardo latino energīa, a sua volta dal greco energheia, parola usata da Aristotele nel senso di azione efficace, composta da en, particella intensiva, ed ergon, capacità di agire. Fu durante l'epoca del Rinascimento che, ispirandosi alla poesia aristotelica, il termine fu associato all'idea di forza espressiva. Ma fu solo nel 1619 che Keplero usò il termine nell'accezione moderna di energia fisica [12.], che indica un sistema o un corpo che compie lavoro e per cui l’unità di misura è quella del lavoro (joule): 1 joule esprime l'energia usata (o il lavoro effettuato) per esercitare una forza di un newton per una distanza di un metro. Vi sono varie forme, o modi di manifestarsi, di energia in natura. Per esempio l’energia meccanica per cui si intende la somma di energia cinetica, cioè quella che un corpo possiede in virtù del suo movimento, e di energia potenziale, cioè quella che un corpo possiede in virtù della sua posizione all'interno di un campo di forze conservative, attinenti allo stesso sistema. Oppure l’energia chimica, che varia a causa della formazione o rottura di legami chimici di qualsiasi tipo, immagazzinata dai combustibili fossili che poi sono bruciati producendo energia termica, un’altra forma di energia posseduta da qualsiasi corpo che abbia una temperatura superiore allo zero assoluto. Nell’art.1 comma 3 della legge 10/91, che titola “Norme per l’attuazione del Piano energetico nazionale in materia di uso razionale dell’energia, di risparmio energetico e di sviluppo delle fonti rinnovabili” si classificano le fonti di energia nel seguente modo:
5
•
fonti di energia rinnovabili il sole (che per esempio viene trasformato in energia termica e fotovoltaica), il vento, l’energia idraulica, l’energia geotermica (prodotta dal calore accumulato all’interno della terra), le maree (causate dall’attrazione lunare sulle acque degli oceani), il moto ondoso e la trasformazione dei rifiuti organici ed inorganici o di prodotti vegetali; hanno la peculiarità di non avere limiti temporali al loro sfruttamento.
•
fonti di energia assimilate a quelle rinnovabili la cogenerazione, intesa come produzione combinata di energia elettrica e calore, se soddisfa la condizione tecnica per l’assimilabilità definita nel CIP n.6/92; il calore di risulta, fumi di scarico ed altre forme di energia recuperabile in processi ed impianti; gli scarti di lavorazione e/o di processi; le fonti fossili prodotte esclusivamente da giacimenti minerari isolati.
•
fonti di energia esauribili, definite anche fonti convenzionali, combustibili fossili commerciali ed altri non rientranti nelle definizioni precedenti; sono denominati fossili perché sono stati generati da materiale biologico di natura vegetale e/o animale che, decomponendosi nel tempo, ha dato loro vita, come per esempio il carbone ed il petrolio, risorse che prima o poi sono destinate ad esaurirsi.
Per l’energia elettrica, una forma di energia legata a forze e campi di origine elettrica e quindi che coinvolge il movimento di cariche elettriche, si può fare un discorso a parte in quanto perché, pur non essendo una forma primaria di energia, è generata da tutte le fonti energetiche in quanto in essa vengono trasformate molte fonti di energia [13.]: combustibili fossili, nucleare, idroelettrico, geotermico ed altre rinnovabili. “L’energia elettrica, cioè la forma di energia sotto la cui azione si muovono cariche elettriche, non è disponibile direttamente in natura. Viene ottenuta prevalentemente per conversione dell’energia potenziale (chimica o cinetica) di fonti fossili o rinnovabili in energia meccanica, a sua volta trasformata in energia elettrica mediante gruppi turbo-generativi. Si tratta dunque di una forma di energia “secondaria”, che ha però l’enorme pregio di poter essere con facilità distribuita capillarmente, nonché trasformata in altre forme di energia. Attualmente la maggior parte dell’energia elettrica utilizzata nel mondo viene generata a partire da fonti primarie di origine fossile (petrolio, gas naturale, carbone)” [2.].
2.2 Efficienza energetica “Conseguire la massima efficienza nella produzione, conversione, trasporto, distribuzione e impiego dell’energia, per accrescere la sicurezza e ridurre al minimo i problemi dell’ambiente” è 6
uno degli obiettivi primari della Carta Europea dell’Energia adottata nel 1991 dai rappresentanti dei governi degli Stati e dai rappresentanti della Comunità Europea. L'efficienza e il risparmio energetico hanno un ruolo fondamentale nella lotta alla protezione dell’ambiente ed ai cambiamenti climatici ed è questo il motivo per cui risulta necessario investire significativamente, anche e soprattutto per l'educazione delle nuove generazioni e per la costruzione di un futuro migliore. Il Bilancio Energetico Regionale (B.E.R.) è lo strumento che consente di ottenere una visione globale del sistema energetico di una regione; esso svolge un'importante funzione conoscitiva esprimendo, in un quadro riepilogativo, quanta e che tipo di energia è stata consumata in un dato periodo di tempo, ad esempio un anno, e come essa è stata prodotta, reperita sui mercati, trasformata e consumata all'interno della regione, offrendo un'immagine immediata e sintetica del settore energetico dell'area considerata. All’aumento costante della popolazione è legato l’aumento del fabbisogno energetico mondiale e per cercare di contenere le emissioni in atmosfera di sostanze inquinanti e di gas ad effetto serra, si cerca di emanare normative per i grandi impianti termoelettrici, promuovendo l’efficienza energetica e la conservazione di energia nell’uso del calore, dell’elettricità e dei mezzi di trasporto, tramite l’adozione di nuove tecnologie ad alto rendimento per la generazione di energia elettrica [11.]. Al fine di prevenire gravi ed irreversibili mutamenti climatici, nel giugno del 1992 è stata stipulata e sottoscritta da 166 Paesi, tra cui l’Italia, la Dichiarazione di Rio per tentare di contenere le emissioni di CO2 anche grazie alla riduzione dei consumi di carburante e combustibili fossili tramite il miglioramento dell’efficienza nelle attività di produzione, distribuzione e consumo dell’energia. Con i decreti ministeriali 24 aprile 2001, successivamente sostituiti dai decreti ministeriali 20 luglio 2004, è stato introdotto nel nostro Paese il meccanismo dei “titoli commercializzabili di efficienza energetica” (o “certificati bianchi”). Ai sensi dell’articolo 7, comma 3, dei decreti ministeriali 20 luglio 2004, l'Autorità per l'energia elettrica e il gas predispone e pubblica annualmente un rapporto sull'attività eseguita in attuazione dei decreti stessi e sui progetti che sono stati realizzati nel loro ambito includendo eventuali proposte sulle modalità di conseguimento degli obiettivi, di realizzazione ed esecuzione dei progetti per gli anni successivi [10.]. Il protocollo di Kyoto, sottoscritto nella città giapponese di Kyoto l'11 dicembre 1997 da più di 160 paesi ma entrato in vigore il 16 febbraio 2005 dopo la ratifica anche da parte della Russia, è lo strumento più importante per combattere i cambiamenti climatici. Per l’ambiente è necessario un ridimensionamento delle emissioni di gas serra, non solo per far fronte all’aumento termico globale ma anche per offrire una migliore vivibilità alle città di tutto il mondo. Il trattato riguarda il riscaldamento globale e, premesso che l'atmosfera terrestre contiene 3 milioni di 7
megatonnellate (Mt) di CO2, prevede che i paesi industrializzati riducano del 5% le proprie emissioni di elementi inquinanti (biossido di carbonio ed altri cinque gas serra, ovvero metano, ossido di diazoto, idrofluorocarburi, perfluorocarburi ed esafluoruro di zolfo) rispetto alle emissioni registrate nel 1990, considerato come anno base, nel periodo 2008-2012. Il mondo immette 6.000 Mt di CO2, di cui 3.000 dai paesi industrializzati e 3.000 da quelli in via di sviluppo; per cui, con il protocollo di Kyoto, se ne dovrebbero immettere 5.850 anziché 6.000, su un totale di 3 milioni. Ad oggi, gli obiettivi del Protocollo di Kyoto sono sempre più distanti per l'Italia [16.]. Il nostro Paese prende voti scarsi nella lotta al surriscaldamento globale e, quel che è peggio, la soglia della sufficienza si allontana di anno in anno. A dare un giudizio negativo sulla performance italiana in quanto a misure per la riduzione dei gas serra è il rapporto internazionale Climate change performance index del German Watch, che mette l'Italia al 44esimo posto nella classifica dei 57 Stati a maggiori emissioni di CO2, cioè quelli che producono il 90% dei gas serra a livello mondiale [15.]. Efficienza energetica vuol dire risparmiare energia nei processi produttivi e negli usi finali e sfruttare le fonti energetiche rinnovabili, migliorando la sicurezza energetica del Paese anche in un'ottica di sostenibilità ambientale. E’ questo l’obiettivo del bando Efficienza energetica di Industria 2015, nome sintetico del disegno di legge sulla nuova politica industriale varato dal governo italiano il 22 settembre 2006 le cui previsioni sono state recepite dalla Legge Finanziaria 2007, che mostra un’Italia che non si arrende alle difficoltà del momento, ma anzi vuole utilizzare questa fase per creare nuove opportunità di sviluppo e di crescita, per far fare un salto di qualità al nostro sistema produttivo in aree cruciali come quelle legate all’energia, all’ambiente, alla lotta al cambiamento climatico. Lunedì 21 gennaio 2009 sono stati definiti i 30 progetti di ricerca e innovazione nel settore dell’Efficienza energetica ammessi ai 200 milioni di euro di incentivi che coinvolgeranno 234 imprese e 160 enti di ricerca e riguarderanno la bioenergia e la produzione di energia da rifiuti, il fotovoltaico, il solare termico e termodinamico, l’eolico, gli elettrodomestici ad elevata efficienza energetica, i materiali per l’edilizia e la bioarchitettura, le tecniche avanzate per l’illuminazione, motori industriali elettrici a basso consumo. Iniziative di questo tipo sono strategiche per accrescere la competitività nazionale su mercati in espansione come quelli dell’efficienza energetica e delle rinnovabili.
2.3 Il consumo di energia elettrica Secondo il Protocollo di Kyoto, L’Italia dovrebbe ridurre entro il 2010 le emissioni del 6,5% rispetto ai valori registrati nel 1990 poiché ogni anno si consumano complessivamente circa 180 8
milioni di tonnellate equivalenti di petrolio (tep), cioè ciascun italiano, in termini energetici, costa circa 10 litri di petrolio al giorno.
Fig.1:
Emissioni di CO (milioni di tonnellate) [17.] 2
Dalla ricerca svolta dal WWF insieme al Politecnico di Milano emerge che per il superamento delle barriere più ostiche nella penetrazione dell'efficienza energetica è necessario intervenire anche nelle singole abitazioni. La stessa Eni ha lanciato una campagna nazionale per l’efficienza energetica, dando consigli per ridurre gli sprechi ed individuando una serie di misure a costo zero facilmente adottabili dalle famiglie italiane, sia in casa che durante il lavoro. I suggerimenti riguardano le piccole azioni quotidiane (come usare le lampadine a basso consumo, non tenere gli elettrodomestici in stand-by, usare le lavatrici a temperature basse e le lavastoviglie solo a pieno carico), l’acquisto di elettrodomestici efficienti (come sostituire gli apparecchi vecchi, o cambiare lo scaldabagno elettrico con uno a gas), la regolazione della temperatura nelle abitazioni (d’inverso tenere in casa una temperatura di 20° C, d’estate ridurre l’uso del condizionatore), l’utilizzo intelligente dell’autovettura (mantenere una velocità moderata in autostrada ed un’andatura regolare in città, usare le marce alte, controllare la pressione dei pneumatici almeno una volta al mese, evitare di riscaldare il motore a veicolo fermo). Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti. Ridurre i consumi irrazionali sin da oggi significa pensare al futuro. Il consumo casalingo di un solo chilowattora (kWh), corrispondente a circa mezz’ora d’accensione di uno scaldabagno o di una stufetta elettrici, richiede, nelle centrali dell’ENEL, la combustione di circa 250 g d’olio combustibile (un quarto di chilo di petrolio!) e l’immissione in atmosfera di 750 g di anidride carbonica. Ma di chilowattora, nelle famiglie, se ne consumiamo, in media, circa 7 al giorno,
9
bruciando quasi 2 kg di petrolio e scaricando 5 kg di CO2. Nel primo trimestre del 2008 la domanda complessiva di energia è aumentata del 2,8% in termini tendenziali, avendo avuto temperature mediamente più rigide rispetto al mite inverno registrato a inizio 2007 che hanno influenzato pesantemente i consumi, in particolare di gas naturale.
Fig.2:
Consumi di energia in fonti primarie (gennaio-marzo) [17.]
Gli interventi per un risparmio energetico in ambito domestico sono numerosi ed a volte è sufficiente fare un po’di attenzione perché oltre a prevenire l’inquinamento globale evitando lo spreco di energia, si può ottenere un vero e proprio vantaggio economico; sono sempre di più le famiglie che si accorgono che, ad incidere sul bilancio non è solo il costo dell’affitto o del mutuo, ma la spesa per il riscaldamento d’inverno ed il raffreddamento d’estate. Tutti gli edifici dovrebbero rispettare la normativa sul risparmio energetico (legge 10/91 e DPR 412/93) e quella sulla sicurezza (legge 46/90 – norme UNI-CIG) verificando ad esempio i limiti previsti per l’isolamento delle pareti esterne, per le distanze dei camini da finestre, balconi, tetti, per il rendimento degli impianti termici, le emissioni d’inquinanti, la termoregolazione degli ambienti. Per ottenere però dei veri e propri risultati si deve esercitare un efficace lavoro di informazione dei cittadini e formazione di tecnici, nonché una seria attività di monitoraggio e verifica degli standard richiesti, a partire da semplici prescrizioni; prevedere la presenza di energy manager nei condomini più grandi, ricostruire il ruolo dell'Amministratore di condominio, ed in modo particolare dell'amministratore professionista, introducendo un meccanismo che premi i miglioramenti nell'efficienza. Va spezzato il nesso tra la convenienza dei fornitori a vendere più combustibile, l'indifferenza dell'amministrazione, la difficoltà di intervento dei condomini che pagano la bolletta [9.]. E’ per questo che sta nascendo la figura del Certificatore Energetico, il cui intervento è rivolto al risparmio per i lavori di ristrutturazione in senso energetico, che dovrà 10
preoccuparsi di rilasciare la documentazione per la produzione della certificazione energetica degli edifici. Tale documentazione, in seguito alle detrazioni del 55% sul Reddito Irpef, per cambiare gli infissi, installare doppi vetri, pannelli solari e caldaie ad alto rendimento, implica l’inserimento degli edifici in una classificazione che premia gli immobili più efficienti innalzando il loro valore sul mercato immobiliare: meno energia consuma la casa e più vale nel caso la si voglia vendere oppure affittare.
2.4 Alcune soluzioni per tutelare il clima del pianeta Ridurre il consumo energetico per migliorare la qualità della vita è l’obiettivo comune. Durante la conferenza internazionale sul clima, nel dicembre del 2008, “grandi della Terra” si sono riuniti a Poznan ed il ministro dell'Ambiente polacco Maciej Nowicki ha presentato “la più grande mostra di tecnologie per salvare il clima realizzata finora”, la cosiddetta “Disneyland del cambiamento climatico” ed ha detto: “con questa mostra vogliamo avvicinare la gente a tecnologie sostenibili che sono già alla portata di tutti. Far capire che non sono solo i grandi decisori politici che devono impegnarsi con scelte per promuovere risparmio e efficienza energetica, ma tutti, ciascuno secondo le proprie possibilità”. Sono stati presentati 120 installazioni che mostrano tutte le possibili soluzioni per risparmiare come per esempio: mp3 alimentati da zollette di zucchero attraverso la scissione del glucosio da parte di enzimi organici, asse da stiro realizzato con un sottile strato di granito che consente di risparmiare il 50% di energia, contenitori che trasformano l'umidità in acqua, scaldabagno solare a specchio concavo che permette di riscaldare l’acqua senza utilizzare energia elettrica, pompa di calore in grado di estrarre grandi quantità di acqua dall’aria funzionando come un mulino a vento, auto ad idrogeno e generatori di biogas da prodotti di scarto [33.]. Un paesino arroccato sui monti del Cilento, Torraca, è divenuto sede di un corso di laurea sul rapporto tra ambiente ed energia e si è trasformato in un laboratorio per i progetti avanzati. E’ stato il primo paese al mondo a sostituire le vecchie lampadine ad incandescenza di tutti i lampioni con i led, light emitting diode che rappresentano la tecnologia più avanzata nel campo dell’illuminazione ad alta efficienza, per fornire luce con meno emissioni serra, meno inquinamento luminoso e risparmiando anche sulla bolletta; sta per costruire la più lunga monorotaia elettrica, un binario di 5,5 chilometri che ridurrà al minimo l’impatto ambientale del trasporto sia dal punto di vista delle emissioni inquinanti che da quello della realizzazione dell’opera; a breve inaugurerà a breve una fabbrica per produrre pannelli fotovoltaici, che forniscono cioè energia pulita dal sole; ha la prima piscina autosufficiente dal punto di vista energetico che utilizza i led per l’illuminazione, i pannelli fotovoltaici per l’alimentazione elettrica, un impianto solare termico per scaldare l’acqua e un 11
telo isotermico per ridurre la dispersione termica [34.]. Sono molte le capitali europee e non solo sempre alla ricerca di nuove soluzioni a basso impatto ambientale. Friburgo tenta di ridurre del 25% entro il 2010 la quantità di biossido di azoto immessa nell'atmosfera puntando molto sulla bioenergia prodotta dal vento, dall'acqua e soprattutto dal sole, con pannelli fotovoltaici e a biomassa. Sostenibilità ambientale e risparmio energetico sono presi molto sul serio in Svezia; qui si ha infatti come obiettivo quello di diventare entro il 2020 il primo paese al mondo basato su un sistema economico petrol free. Malmo, definita “città del futuro”, è un’altra eco city nota per il suo quartiere Porto Ovest, che produce il 100% della propria energia da fonti rinnovabili e alimenta i veicoli con biogas provenienti dai rifiuti urbani; sotto ciascun edificio è stata creata una sorta di intercapedine ad acqua per mantenere il calore d’inverno e rinfrescare d’estate; i tetti delle case sono coperti da manto erboso con funzione isolante e pannelli fotovoltaici. Un po’ più a nord Stoccolma, altra città modello per l’alta qualità della vita, risponde con un immenso giardino cittadino, l’Ecoparken. A Barcellona il Consiglio Comunale e l’Agenzia energetica cittadina hanno stilato il “Plan de mejora energética de Barcelona”: si punta al 20% di emissioni nocive in meno entro il 2010 e meno 4,2% di consumi energetici. A Los Angeles esiste una stazione di servizio ecologica chiamata Helios House costituita da 1653 pannelli riciclabili di acciaio inossidabile e 90 pannelli solari per produrre energia rinnovabile. Copenaghen è la prima città ciclabile d’Europa: viene infatti utilizzata dal 36% degli abitanti, numero destinato in tempi brevi ad incrementarsi fino al 50%. E l’Italia? Le statistiche evidenziano che il bel Paese produce il 20% del totale energetico nazionale da fonte rinnovabile. Basta percorrere l'autostrada A4 in prossimità di Brescia per vedere uno dei più grandi termovalorizzatori europei.
Fig.3:
Termovalorizzatore di Brescia (vista dalla A4)
12
Imponente e colorato è simbolo di un impegno costante contro gli sprechi energetici e il surriscaldamento terrestre.
2.5 La rivelazione di anomalie nei consumi di energia elettrica Dalle considerazione fatte nei paragrafi precedenti si deduce l’importanza di avere un consumo di energia elettrica razionale cercando di evitare inutili sprechi sia per limitare il surriscaldamento globale sia per veri e proprio motivi economici. Uno studio americano ha rivelato che in Canada ogni anno si hanno furti di energia elettrica per un costo di 500 milioni di dollari causati principalmente da coltivazioni illecite di marijuana. In Italia si hanno molteplici casi di furti e frodi di energia elettrica; sono stati arrestati nomadi che avevano allacciato numerosi cavi di fortuna ad alcune centraline della società “Acea”, utilizzando illecitamente l’energia elettrica per l’illuminazione dei campi abusivi. Dopo vari controlli a campione sulle utenze di fornitura elettrica, sono state scoperte situazioni di illegalità, connesse a furti o frodi di energia elettrica mediante allacci abusivi ai fili dell’illuminazione pubblica o modifiche del sistema di lettura del contatore con interruttori nascosti che consentono di regolare il consumo di energia elettrica. Il furto di energia, oltre ad essere dispendioso, è molto più grave e pericoloso di quello che sembra, può causare incendi o scosse elettriche; i criminali sono molto furbi e le tecniche usate a tal fine molto difficili da individuare. Nel diritto penale italiano il furto è un reato previsto dall'art. 624 ai sensi del quale: “chiunque si impossessa della cosa mobile altrui, sottraendola a chi la detiene, al fine di trarne profitto per sé e per altri, è punito con la reclusione da sei mesi a tre anni e con la multa da euro 154 a 526. Agli effetti della legge penale, si considera cosa mobile anche l'energia elettrica e ogni altra energia che abbia un valore economico. (art. 624 comma 2 c.p.)”. Il reato di furto di energia elettrica ha spedito in carcere molte persone che con allacciamenti abusivi alla rete dell'Enel o mediante manomissioni dei contatori, tali da consentire l'alterazione della normale registrazione dei consumi, garantivano in maniera gratuita ad abitazioni ed ai negozi la fornitura di energia elettrica. Da qui nasce l’esigenza di uno strumento che riconosca e rilevi situazioni di anomalie nei sistemi elettrici che possono essere causate da malfunzionamenti o manomissioni dei contatori; solo utilizzando apparecchiature specifiche si può identificare chi, quanto, e quando ha contribuito a superare la potenza di energia elettrica standard appropriandosene illegalmente. Per poter rivelare i vari casi di anomalie si inizia con la costruzione di un profilo utente 13
rappresentante il normale uso di energia elettrica per poi passare all’identificazione di deviazioni da tale profilo come possibili situazioni anomale. Le anomalie in tale ambito sono infatti definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica appartenenti ad uno specifico profilo utente.
14
3 MODELLISTICA E SIMULAZIONE DEI CONSUMI ENERGETICI NELL’AMBITO DOMESTICO
3.1 Introduzione La prima fase di questo lavoro consiste nel generare un consumo energetico in ambito domestico per diverse tipologie di famiglie. I modelli sviluppati per tale scopo consentono di produrre vari grafici per rappresentare i livelli di consumo di energia elettrica e di analizzare i dati monitorati in un determinato periodo. A tale scopo si è cercato di simulare il consumo di energia elettrica per tre differenti esemplari di nuclei familiari composti da 2, 3 e 4 persone. Utilizzando un misuratore di consumo elettrico, il quale applicato alla presa della corrente calcola il consumo di ogni elettrodomestico presente in casa e con le bollette degli anni 2006 e 2007, è stato possibile avere dei dati veritieri riguardanti il consumo di corrente di una famigliacampione, composta da 3 persone.
Bimestre
kWh/2006
euro/2006
kWh/2007
euro/2007
I° (½ dic - ½ feb)
502,00
80,76
573,00
107,88
II° (½ feb - ½ apr)
516,00
84,92
555,00
103,83
III° (½ apr - ½giu)
539,00
90,59
699,00
149,44
IV° (½ giu - ½ ago)
671,00
139,89
562,00
110,30
V° (½ ago - ½ ott)
592,00
112,73
608,00
118,54
VI° (½ ott - ½ dic)
519,00
98,04
599,00
116,61
3339,00
606,93
3596,00
706,60
Totali Fig.4:
Consumo energetico 2006/2007 in una famiglia-campione
Con l’aiuto di tabelle presenti in Internet [1.], è stato possibile risalire al consumo medio annuo delle altre due tipologie di famiglie. Tale procedura è stata messa a punto riportando i consumi stimati in un file di lavoro Excel per simulare il comportamento di diverse utenze caratterizzanti alcune famiglie prese in esame. I dati ottenuti sono stati poi lavorati permettendo
15
così di individuare eventuali anomalie o malfunzionamenti allo scopo di ottimizzare l’utilizzo e la gestione dei consumi.
3.2 Caratteristiche elettrodomestici
di
consumo
dei
principali
Ogni elettrodomestico conforme alle norme europee è dotato di un’etichetta indicante il consumo diviso in classi che vanno dalla lettera A alla lettera G; quelli di classe A consumano meno. Su ogni targhetta è riportata la tensione (220v per l’Italia) e la corrente assorbita indicata in Ampere; per ottenere il consumo in watt (unità di misura della potenza), è sufficiente moltiplicare i volt (unità di misura della tensione) per gli ampere (unità di misura della corrente), per avere i kWh si divide ulteriormente per mille. Inoltre sono indicati i kWh/anno che l’elettrodomestico consuma, stimati in base a prove di laboratorio standard. Con l’invecchiamento di un elettrodomestico il consumo può aumentare e non rientrare più negli standard; è però possibile utilizzare un misuratore di consumo elettrico che, inserito tra la presa e la spina dell’oggetto che si desidera monitorare, permette di visualizzare informazioni come: la potenza in ampere, il consumo di corrente elettrica in watt, i tempi di misurazione in minuti e ore, i kWh del consumo complessivo di corrente durante il tempo misurato, la tariffa locale precedentemente impostata per ogni kWh, i costi complessivi del consumo, la tensione presente. L'energia richiesta da un apparecchio acceso 24 ore al giorno per 365 giorni l'anno ed il costo necessario per tale energia si possono calcolare facilmente tramite la formula:
Nelle famiglie prese in considerazione, è stato ipotizzato l’uso di alcuni elettrodomestici e calcolata una media di consumo per ognuno di essi. Si è preferito supporre l’utilizzo di un microonde invece del forno tradizionale per semplicità di calcolo e per poterne prevedere un impiego più frequente; il suo consumo è stato stabilito essere di 1000 watt. Come computer si è ipotizzato un notebook il cui consumo dipende da diversi fattori come il disco fisso, il chip 16
grafico, il processore, e soprattutto dalle dimensioni del display, un pannello LCD retroilluminato da lampade, che più è grande e più avrà lampade estese, che di conseguenza consumeranno di più. Per sapere quanto consumano i componenti interni di un portatile è sufficiente l’etichetta sull’alimentatore: in genere si va da un minimo di 12 volt a un massimo di 19 volt in uscita e da 3,5 a 7 ampere. E’ stata calcolata una media e stabilito un consumo pari a 65 watt, 18,5 volt e 3,5 ampere. I nuovi modelli di lavastoviglie consumano, per il ciclo più lungo, tra 1,4 e 1,8 kWh rispetto ai 2,5 kWh delle lavastoviglie tradizionali. Infatti le nuove tecnologie permettono di diminuire l’acqua per un ciclo di lavaggio, riducendo l’energia necessaria per portarla alla giusta temperatura, dando la possibilità di effettuare cicli ridotti o “rapidi” [4.]. La lavatrice, da sola, è responsabile di una quota cospicua dei consumi elettrici delle nostre abitazioni; questo consumo è dovuto soprattutto al riscaldamento dell’acqua per il lavaggio, mentre solo una piccola percentuale serve ad azionare il motore [4.]. I nuovi modelli di lavatrici consumano tra i 1,5 e 2,1 kWh rispetto ai 2,8 kWh delle lavatrici tradizionali. Per la luce sono state prese in considerazioni lampadine da 60 watt, e ipotizzata la presenza di una lampadina in ogni stanza; quindi i consumi sono stati calcolati in base al numero di stanze presenti in un appartamento. Lo scaldabagno (o boiler) è stato ipotizzato di circa 5 litri quindi di piccole dimensioni. I consumi della televisione cambiano in base al modello: se è un LCD il consumo è 100, se è un plasma consuma 150, se è a tubo catodico (CRT) 50 ed è quest’ultimo quello preso in considerazione per la simulazione. Esistono diversi modelli di ferri da stiro, a vapore e non, il cui consumo dipende dalla temperatura di funzionamento che nei modelli più tecnologici può essere variata grazie ad un termostato e la potenza è generalmente compresa tra 700 e 1500 W. Il consumo dell’asciugacapelli e dell’aspirapolvere sono stati calcolati in base al modello considerato: il primo è un Severin HH 6320, un phon con cuffia asciugacapelli, con 2 livelli di temperatura e colpo d’aria fredda, il secondo un IMETEC 8601, una scopa elettrica con sacchetto, senza potenza variabile. Il consumo della radio è stato preso dalle tabelle trovate in Internet [1.]. Il frigorifero per cui è stato preso in considerazione solo il consumo medio annuo, essendo un apparecchio acceso tutto il giorno, è di tipo A+.
Elettrodomestico Microonde
potenza ON (watt) 1000
PC
65
Lavastoviglie
1400
Lavatrice A
1500
Boiler
2000
Luce
60 17
TV CRT
50
Ferro da stiro
700
Asciugacapelli
400
Aspirapolvere
700
Radio 20 Fig.5: Consumo in watt degli elettrodomestici
3.3 Modelli per la simulazione di consumo elettrico Per determinare il consumo di energia elettrica in ambito domestico sono stati considerati due diversi tipi di modelli. Entrambi si basano sulla stima di accensione degli elettrodomestici sopra elencati in diversi momenti di una giornata tipo. Per avere un’analisi più dettagliata dei consumi, è stato deciso di usare un intervallo di campionamento di 30 minuti, per un totale di 48 valori nell’arco delle 24 ore. In questo modo si ottiene un grafico rappresentante l’andamento medio giornaliero della richiesta di potenza nel tempo, dalle ore 0:00 alle 23:30, di tutti gli apparecchi monitorati. Il consumo giornaliero espresso in kWh rappresenta il consumo registrato nell’arco delle 24 ore prese in considerazione; il consumo giornaliero medio è la media dei consumi giornalieri misurati nell’arco dell’anno. I modelli costruiti sono: ⇒ semplice: prevede l’uso delle probabilità di accensione degli elettrodomestici, indipendenti tra di loro; ⇒ di Markov: prevede l’uso dei processi di Markov ed ogni stato genera un evento con una certa distribuzione di probabilità che dipende solo dallo stato di sistema immediatamente precedente.
3.3.1 Tipologie di famiglie Per poter generare un consumo di energia elettrica il più possibile simili alla realtà, sono state prese in considerazione diverse tipologie di famiglie-campione tenendo presente i diversi stili di vita e abitudini di ciascuna di esse. La rivelazione di anomalie è stata effettuata in due prove distinte, che però hanno un denominatore comune: le tipologie di famiglie studiate. Infatti in entrambi i casi, le famiglie-campione sono divise innanzitutto in base ai componenti delle stesse che possono essere 2, 3 o 4 persone. La seconda prova fa però un’ulteriore distinzione all’interno delle famiglie-campione, cioè per ognuna di esse crea due differenti profili con consumi simili ma diverse abitudini giornaliere.
18
3.3.1.1 Prima prova Nella prima prova sono state prese in considerazione le tre famiglie-campione di cui sopra composte nel seguente modo: 1. due persone: un ragazzo ed una ragazza entrambi lavoratori, che vivono in un appartamento con un bagno, una cucina, una camera ed una sala da pranzo. 2. tre persone: una madre casalinga, un padre impiegato ed un figlio studente. L’appartamento ha 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una sala da pranzo. 3. quattro persone: una madre casalinga, un padre impiegato e 2 figli studenti che vivono in un appartamento con 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una sala da pranzo.
3.3.1.2 Seconda prova Per la seconda prova è stato necessario determinare due diversi profili per ciascun nucleo familiare in base al loro stile di vita. La famiglia di 2 persone che vive in un appartamento con un bagno, una cucina, una camera ed una sala da pranzo è stato differenziato in: ⇒ profilo 1: un lavoratore ed una casalinga; ⇒ profilo 2: due studenti in affitto. La famiglia di 3 persone che vive in un appartamento di 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una sala da pranzo è stato differenziato in: ⇒ profilo 1: un lavoratore, una casalinga ed uno studente; ⇒ profilo 2: due studenti ed un lavoratore. La famiglia di 4 persone che vive in un appartamento con 2 bagni, una cucina, una camera, una cameretta, un ingresso ed una sala da pranzo è stato differenziato in: ⇒ profilo 1: un lavoratore, una casalinga e due studenti; ⇒ profilo 2: due studenti e due lavoratore.
3.3.2 Modello semplice Il modello semplice è usato solo durante la prima prova per la rivelazione di anomalie e consiste nel decidere le probabilità di accensione dei vari elettrodomestici presenti nelle tabelle sopra, durante un qualsiasi giorno feriale di primavera, in cui il sole sorge alle 6 e tramonta 19
intorno alle 20. Sono state usate 48 mezze ore e 365 giorni. Le probabilità cambiano in base alla famiglia presa in considerazione e allo stile di vita. Consumi di una famiglia-campione di 2 persone Le probabilità definite per la famiglia di due persone, composta da due ragazzi entrambi lavoratori,
sono
state
ipotizzate
considerando
al
massimo
4
lampadine
accese
contemporaneamente ma solo tra le 20:00 e le 22:30, momento della giornata in cui entrambi i componenti si trovano a casa. Infatti si è pensato di far uscire i componenti della famiglia in orari di ufficio. Tra le 8:00 e le 17:00 è stata data la massima probabilità (cioè 10) al caso in cui tutte le lampadine siano spente perché a casa non si trova nessuno in quell’orario; la stessa cosa accade durante la notte che si suppone un consumo quasi nullo. E’ stato considerata la presenza di un solo notebook usato da entrambi, anche questo acceso prevalentemente nel tardo pomeriggio e durante la sera; stessa ipotesi fatta anche per gli altri elettrodomestici come la lavatrice, la lavastoviglie, il ferro, il microonde, il boiler e l’aspirapolvere. L’asciugacapelli si pensa possa essere usato al mattina prima di uscire, o la sera una volta rientrati. Sono state ipotizzate due televisioni CRT, una in camera da letto e l’altra nella sala da pranzo, usate prevalentemente di sera. Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati nella seguente tabella:
consumo Elettrodomestico annuo (kwh) 2 persone
Fig.6:
kwh al giorno
Microonde
400
1,10
PC
100
0,27
Lavastoviglie
350
0,96
Lavatrice A
200
0,55
Boiler
900
2,47
Luce
270
0,74
TV CRT
150
0,41
Ferro da stiro
80
0,22
Frigorifero A+
303
0,83
Asciugacapelli
50
0,14
Aspirapolvere
80
0,22
Radio
10
0,03
totale kwh 2893 7,93 Tabella di consumo medio giornaliero e annuo 2 persone
20
La Fig.7: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 2 persone:
Fig.7:
Consumo medio 2 persone con modello semplice
Consumi di una famiglia-campione di 3 persone La famiglia di tre persone, composta da madre casalinga, padre lavoratore e figlio studente, è stata pensata in una casa di sei stanze con al massimo 6 lampadine accese contemporaneamente. Si è ipotizzata l’uscita del padre e del figlio verso le 8:00, mentre quella della madre dalle 9:30 alle 11:30, con il rientro da scuola del ragazzo per l’ora di pranzo. Il notebook è usato prevalentemente dal figlio durante il pomeriggio e dopo cena. Sono state considerate due televisioni, accese durante il pranzo e durante la sera. L’uso di quasi tutti gli elettrodomestici è stato ipotizzato nella mattinata o nel primo pomeriggio, ad esclusione del microonde usato sia a pranzo che a cena e dello scaldabagno acceso durante la notte. Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati nella seguente tabella:
consumo Elettrodomestico annuo (kwh) 3 persone
kwh al giorno
Microonde
500
1,37
PC
120
0,33
Lavastoviglie
460
1,26
Lavatrice A
240
0,66
Boiler
1200
3,29
Luce
300
0,82
TV CRT
250
0,68
21
Ferro da stiro
120
0,33
Frigorifero A+
303
0,83
Asciugacapelli
60
0,16
Aspirapolvere
100
0,27
15
0,04
Radio Fig.8:
totale kwh 3668 10,05 Tabella di consumo medio giornaliero e annuo 3 persone
La Fig.9: mostra il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 3 persone:
Fig.9:
Consumo medio 3 persone con modello semplice
Consumi di una famiglia-campione di 4 persone La famiglia di quattro persone vive in un appartamento di sei stanze, ognuna dotata di una lampadina da 60 watt, ed è composta da madre casalinga, padre impiegato e due figli che vanno a scuola. Si è ipotizzato che i figli con il padre escano la mattina intorno alle 8:00 e la madre per le 9:30 rientrando verso le 11:30. Quindi l’uso degli elettrodomestici è concentrato nella tarda mattinata o nel primo pomeriggio. Il notebook è usato dai figli, quindi sarà acceso in un orario successivo al loro rientro previsto per l’ora di pranzo. Le due televisioni sono usate in prevalenza durante i pasti, e la sera così come la lavastoviglie ed il microonde. Lo scaldabagno viene acceso sia durante la notte sia nel primo pomeriggio perché nel caso di quattro persone si consumerà più acqua calda. Gli elettrodomestici presi in considerazione con i relativi consumi medi annui sono riportati nella seguente tabella:
22
Elettrodomestico
consumo annuo (Kwh) 4 persone
kwh al giorno
Microonde
600
1,64
PC
140
0,38
Lavastoviglie
580
1,59
Lavatrice A
320
0,88
Boiler
1700
4,66
Luce
350
0,96
TV CRT x 2
300
0,82
Ferro da stiro
160
0,44
Frigorifero A+
303
0,83
Asciugacapelli
80
0,22
Aspirapolvere
130
0,36
15
0,04
Radio
totale kwh 4678 12,82 Fig.10: Tabella di consumo medio giornaliero e annuo 4 persone
La Fig.11: mostra il grafico del consumo medio giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famiglia-campione di 4 persone:
Fig.11: Consumo medio 4 persone con modello semplice
3.3.3 Modello di Markov per i consumi domestici Il modello di Markov è usato sia nella prima sia nella seconda prova per la rivelazione di anomalie ed è un processo stocastico nel quale la probabilità di transizione che determina il passaggio ad uno stato di sistema dipende unicamente dallo stato di sistema immediatamente precedente e non dal come si è giunti a tale stato, né da tutto ciò che è successo nel passato; 23
questa è detta proprietà di Markov, o condizione di “assenza di memoria”. I processi stocastici sono modelli matematici probabilistici utilizzati nella descrizione di fenomeni casuali rappresentabili come funzioni di un parametro, che di solito ha il significato di tempo. Una catena di Markov è un processo di Markov a stati discreti, ovvero è un processo stocastico discreto per cui ad ogni istante t si estrae dal processo una variabile casuale discreta [5.]. Per questo modello i consumi relativi alla luce, al notebook e alla televisione sono stati calcolati come nel modello semplice, utilizzando cioè una distribuzione di probabilità di accensione; questa scelta è stata fatta perché se ne è ipotizzato un uso quotidiano. Il motivo per cui è stato sviluppato un secondo modello con Markov, è che per rendere la simulazione di consumo più realistica, è stato necessario considerare che in ambito domestico l’accensione di alcuni elettrodomestici non avviene tutti i giorni ma solo alcune volte a settimana. Quindi per questa tipologia di elettrodomestici, come il microonde, la lavastoviglie, la lavatrice, lo scaldabagno, il ferro da stiro, l’aspirapolvere e il phon, sono stati usati i processi di Markov per determinare i consumi delle famiglie, che modellano sistemi fisici che possono trovarsi ad ogni istante in uno tra n possibili stati e possono modificare il loro stato solo agli istanti t1, t2,..... Con questi processi è possibile determinare una distribuzione uniforme per decidere il momento della giornata (mattino, pomeriggio, sera, notte) e il giorno della settimana in cui parte l’elettrodomestico, in base alla probabilità di transizione tra uno stato e l’altro. E’ quindi possibile simulare l’accensione degli apparecchi in maniera random. Infatti si è ragionato in modo da non prevedere l’uso, per esempio, della lavatrice tutti i giorni e neanche il giorno seguente a quello in cui è stata fatta. Questo per simulare al meglio la vita quotidiana. Infatti si parte dal presupposto che se in una famiglia in media si fanno per esempio tre lavatrici a settimana, se si fa il lunedì, sarà poco probabile che si rifaccia il martedì, mentre sarà un po’ più probabile che sia fatta il mercoledì; è invece quasi sicuro, quindi molto probabile, che si accenda la lavatrice il giovedì, e così via. Lo stato iniziale è scelto a caso e viene poi moltiplicato per la matrice delle probabilità di transizione. Gli elettrodomestici potrebbero essere utilizzati contemporaneamente e per questo si è fissata una soglia di 3,0 kw come potenza contrattuale, oltre la quale “scatta” la corrente. Si sono decisi per ogni nucleo familiare, il numero di stati della catena di Markov necessari, le probabilità di transizione tra gli stati e le matrici di transizione i cui elementi rappresentano delle probabilità di transizione tra diversi stati. Più precisamente pij è la probabilità condizionata che il sistema si trovi “domani” nello stato j essendo “oggi” nello stato i. Tale matrice ha la proprietà che la somma degli elementi di ogni riga deve essere pari a 1, in quanto se il sistema si trova in uno stato, al passo successivo deve necessariamente evolvere in uno degli altri n-1 stati. 24
Una volta determinato il vettore 0 rappresentante la distribuzione iniziale di probabilità degli n stati possibili e la matrice di transizione, siamo in grado di prevedere, in termini probabilistici, l'evoluzione del sistema. Infatti, il vettore 1 è calcolato applicando la matrice di transizione al vettore iniziale 0; la distribuzione di probabilità del sistema al passo 2 è calcolata applicando la matrice al vettore 1 e così via fino all’istante di tempo desiderato. Il numero di stati della catena di Markov dipende dall’uso settimanale dell’elettrodomestico, considerando che questo può essere acceso di mattina, di pomeriggio o di sera. Lo stato iniziale, come già detto scelto a caso, è quello in cui viene usato l’elettrodomestico; rappresenta quindi la mattina, il pomeriggio o la sera di un giorno qualsiasi della settimana. Più ci si allontana dallo stato iniziale, più sarà alta la probabilità di tornarvi e quindi di accendere di nuovo l’elettrodomestico.
3.3.3.1 Prima prova Consumi di una famiglia-campione di 2 persone Nella famiglia composta da un ragazzo e da una ragazza entrambi lavoratori, l’accensione di quasi tutti gli elettrodomestici in un giorno feriale è stata ipotizzata dalle ore 17:00 in poi ad esclusione della radio e dell’asciugacapelli usati al mattino prima delle 8:00 e dello scaldabagno acceso prevalentemente durante la notte. L’uso settimanale di ciascun elettrodomestico è riportato nella tabella seguente:
Elettrodomestico
Impiego
Num. stati
Lavatrice
2 volte a sett.
7
Aspirapolvere
3 volte a sett.
5
Asciugacapelli
2 volte a sett.
7
Ferro da stiro
2 volte a sett.
7
Microonde
4 volte a sett.
4
Lavastoviglie
3 volte a sett.
5
Scaldabagno 4 volte a sett. 4 Fig.12: Markov famiglia-campione 2 persone
I consumi giornalieri sono gli stessi riportati in Fig.6: , e il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famigliacampione di 2 persone risulta essere il seguente:
25
Fig.13: Consumo medio 2 persone con modello di Markov
Consumi di una famiglia-campione di 3 persone Nella famiglia composta da 3 persone, essendo la mamma una casalinga, l’accensione degli elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio e l’asciugacapelli sono usati al mattino prima delle 8:00; lo scaldabagno è acceso sia durante la notte sia durante il pomeriggio. Il notebook viene usato nel pomeriggio dal figlio dopo l’ora di pranzo. L’uso settimanale di ciascun elettrodomestico è riportato nella tabella seguente:
Elettrodomestico
Impiego
Num. stati
Lavatrice
3 volte a sett.
5
Aspirapolvere
4 volte a sett.
4
Asciugacapelli
3 volte a sett.
5
Ferro da stiro
3 volte a sett.
5
Microonde
5 volte a sett.
3
Lavastoviglie
4 volte a sett.
4
Scaldabagno 5 volte a sett. 3 Fig.14: Markov famiglia-campione 3 persone
I consumi giornalieri sono gli stessi riportati in Fig.8: , e il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famigliacampione di 3 persone risulta essere il seguente:
26
Fig.15: Consumo medio 3 persone con modello di Markov
Consumi di una famiglia-campione di 4 persone Anche nella famiglia di 4 persone, la mamma è una casalinga e quindi l’accensione degli elettrodomestici in un giorno feriale è stata ipotizzata sia di mattina che di pomeriggio. La radio e l’asciugacapelli sono usati al mattino prima delle 8:00; la televisione usata soprattutto a pranzo e a cena. Lo scaldabagno è acceso sia durante la notte sia durante il pomeriggio. Il notebook viene usato nel pomeriggio e durante la sera dai figli. L’uso settimanale di ciascun elettrodomestico è riportato nella tabella seguente:
Elettrodomestico
Impiego
Num. stati
Lavatrice
4 volte a sett.
4
Aspirapolvere
5 volte a sett.
3
Asciugacapelli
4 volte a sett.
4
Ferro da stiro
4 volte a sett.
4
Microonde
6 volte a sett.
2
Lavastoviglie
5 volte a sett.
3
Scaldabagno 6 volte a sett. 2 Fig.16: Markov famiglia-campione 4 persone
I consumi giornalieri sono gli stessi riportati in Fig.10: , e il grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra) per una famigliacampione di 4 persone risulta essere il seguente:
27
Fig.17: Consumo medio 4 persone con modello di Markov
3.3.3.2 Seconda prova Tenendo presente tutte le considerazioni fatte in precedenza per l’uso degli elettrodomestici in ciascuna famiglia, nella seconda prova sono state distinti per ciascuna famiglia-campione due profili utente ognuno con diversi tipi di componenti familiari e di conseguenza con differenti abitudini nell’uso dell’energia elettrica. I due profili sono stati creati mantenendo valori di consumi medi annui e giornalieri simili a quelli delle famiglie-campione a cui fanno riferimento calcolati nella prima prova. Consumi dei due profili di una famiglia-campione di 2 persone I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una famiglia-campione di 2 persone, composta da un lavoratore ed una casalinga, sono riportati nella tabella seguente:
potenza Elettrodomestico ON (watt) Microonde PC
consumo annuo (kwh) profilo 1
1000
Impiego
400 4 volte a sett.
65
100
5 ore al dì
kwh al giorno 1,10 0,27
Lavastoviglie
1400
300 3 volte a sett.
0,82
Lavatrice A
1500
150 2 volte a sett.
0,41
Boiler
2000
800 4 volte a sett.
2,19
Luce
60
290
5 ore al dì
0,79
TV CRT x 2
50
170
5 ore al dì
0,47
Ferro da stiro
700
80 3 volte a sett.
Frigorifero A+
303 28
continuo
0,22 0,83
Asciugacapelli
400
40 2 volte a sett.
0,11
Aspirapolvere
700
90 3 volte a sett.
0,25
13
0,04
Radio
20
1 volte al dì
2736 totale kwh Fig.18: Profilo 1 famiglia-campione 2 persone
7,50
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 1 di una famiglia-campione di 2 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.19: Consumo medio profilo 1 per 2 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 2 di una famiglia-campione di 2 persone, composta da due studenti in affitto, sono riportati nella tabella seguente:
consumo potenza annuo Elettrodomestico ON (watt) (kwh) profilo 2 Microonde PC Lavastoviglie
1000 65 1400
Impiego
kwh al giorno
300 3 volte a sett.
0,82
150
0,41
8 ore al dì
280 3 volte a sett.
0,77
Lavatrice A
1500
170 2 volte a sett.
0,47
Boiler
2000
1000 4 volte a sett.
2,74
Luce
60
310
5 ore al dì
0,85
TV CRT x 2
50
180
5 ore al dì
0,49
Ferro da stiro
700
50 2 volte a sett. 29
0,14
Frigorifero A+
303
continuo
0,83
Asciugacapelli
400
50 2 volte a sett.
0,14
Aspirapolvere
700
50 2 volte a sett.
0,14
13
0,04
Radio
20
1 volte al dì
2856 totale kwh Fig.20: Profilo 2 famiglia-campione 2 persone
7,82
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 2 di una famiglia-campione di 2 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.21: Consumo medio profilo 2 per 2 persone
Consumi dei due profili di una famiglia-campione di 3 persone Lo stesso procedimento è stato eseguito per la famiglia-campione di 3 persone. I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una famiglia-campione di 3 persone, composta da un lavoratore, una casalinga ed uno studente, sono riportati nella tabella seguente:
consumo annuo potenza Elettrodomestico ON (watt) (kwh) profilo 1 Microonde PC Lavastoviglie
1000 65 1400
Impiego
500 5 volte a sett.
1,37
120
0,33
6 ore al dì
430 4 volte a sett. 30
kwh al giorno
1,18
Lavatrice A
1500
240 3 volte a sett.
0,66
Boiler
2000
1000 5 volte a sett.
2,74
Luce TV CRT Ferro da stiro
60
350
7 ore al dì
50
220
6 ore al dì
700
Frigorifero A+
0,96 0,60
120 4 volte a sett.
0,33
303
0,83
continuo
Asciugacapelli
400
60 3 volte a sett.
0,16
Aspirapolvere
700
110 4 volte a sett.
0,30
Radio
20
15
2 volte al dì
3468 totale kwh Fig.22: Profilo 1 famiglia-campione 3 persone
0,04 9,50
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 1 di una famiglia-campione di 3 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.23: Consumo medio profilo 1 per 3 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 2 di una famiglia-campione di 3 persone, composta da due studenti ed un lavoratore, è riportato nella tabella seguente:
consumo annuo potenza Elettrodomestico ON (watt) (kwh) profilo 2 Microonde PC
Impiego
kwh al giorno
1000
400 4 volte a sett.
1,10
65
130 6 ore e ½ al dì
0,36
31
Lavastoviglie
1400
440 4 volte a sett.
1,21
Lavatrice A
1500
280 3 volte a sett.
0,77
Boiler
2000
1200 5 volte a sett.
3,29
Luce
60
270
5 ore al dì
0,74
TV CRT
50
180
5 ore al dì
0,49
Ferro da stiro
700
Frigorifero A+
100 3 volte a sett.
0,27
303
0,83
continuo
Asciugacapelli
400
40 2 volte a sett.
0,11
Aspirapolvere
700
70 3 volte a sett.
0,19
12
0,03
Radio
20
1 volte al dì
3425 totale kwh Fig.24: Profilo 2 famiglia-campione 3 persone
9,38
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 2 di una famiglia-campione di 3 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.25: Consumo medio profilo 2 per 3 persone
Consumi dei due profili di una famiglia-campione di 4 persone Anche la famiglia-campione di 4 persone è stata suddivisa in due differenti profili. I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 1 di una famiglia-campione di 4 persone, composta da un lavoratore, una casalinga e due studenti, sono riportati nella tabella seguente:
32
consumo potenza annuo Elettrodomestico ON (watt) (kwh) profilo 1 Microonde
1000
PC
65
Impiego
kwh al giorno
600 6 volte a sett.
1,64
140
0,38
7 ore al dì
Lavastoviglie
1400
500 5 volte a sett.
1,37
Lavatrice A
1500
290 4 volte a sett.
0,79
Boiler
2000
1500 6 volte a sett.
4,11
Luce
60
350
7 ore al dì
0,96
TV CRT
50
300
7 ore al dì
0,82
Ferro da stiro
700
160 5 volte a sett.
Frigorifero A+
303
continuo
0,44 0,83
Asciugacapelli
400
80 4 volte a sett.
0,22
Aspirapolvere
700
130 5 volte a sett.
0,36
Radio
20
15
2 volte al dì
4368 totale kwh Fig.26: Profilo 1 famiglia-campione 4 persone
0,04 11,97
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 1 di una famiglia-campione di 4 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.27: Consumo medio profilo 1 per 4 persone
I consumi medi annui e giornalieri e l’uso settimanale di ciascun elettrodomestico per il profilo 2 di una famiglia-campione di 4 persone, composta da due studenti e due lavoratori, è riportato nella tabella seguente: 33
consumo annuo potenza Elettrodomestico ON (watt) (kwh) profilo 2 Microonde
1000
PC
65
Impiego
kwh al giorno
500 5 volte a sett.
1,37
120
0,33
6 ore al dì
Lavastoviglie
1400
580 6 volte a sett.
1,59
Lavatrice A
1500
320 4 volte a sett.
0,88
Boiler
2000
1700 6 volte a sett.
4,66
Luce TV CRT Ferro da stiro
60
300
6 ore al dì
50
250
6 ore al dì
700
Frigorifero A+
0,82 0,68
140 5 volte a sett.
0,38
303
0,83
continuo
Asciugacapelli
400
80 4 volte a sett.
0,22
Aspirapolvere
700
110 4 volte a sett.
0,30
Radio
20
10
1 volte al dì
4413 totale kwh Fig.28: Profilo 2 famiglia-campione 4 persone
0,03 12,09
Sulla base dei consumi medi giornalieri e annui riportati sopra, la simulazione di uso degli elettrodomestici per il profilo 2 di una famiglia-campione di 4 persone presenta il seguente grafico del consumo giornaliero tipico per alcuni giornate (sinistra) e per i 365 giorni dell’intero anno (destra):
Fig.29: Consumo medio profilo 2 per 4 persone
34
4 ANALISI STATISTICA DEI CONSUMI DOMESTICI
Il consumo annuale medio è da intendersi come una stima effettuata moltiplicando per 365 giorni il consumo giornaliero medio calcolato precedentemente. Una volta determinati i consumi annuali delle tre nuclei familiari, sono state eseguite delle statistiche su singoli giorni per determinare le medie e le varianze utili ai fini della rivelazione di anomalie. E’ stato possibile rivelare le anomalie, alterando il consumo relativo ad alcuni giorni dell’anno, o anche solo alla mattina o alla sera, e controllando che rispettassero i profili di consumo determinati attraverso l’analisi. I casi da noi modificati sono stati correttamente rivelati.
4.1 Medie e varianze della curva di consumo Una volta ottenute le informazioni relative al consumo di energia elettrica in ambito domestico, il primo passo per la rivelazione di anomalie è stato quello di cercare di misurarli e controllarli eseguendo un’analisi dettagliata al fine di individuare chi, come, quanto e quando consuma, e soprattutto di determinare delle soglie di medie e varianze oltre le quali si è deciso di classificare un comportamento anomalo. Nello studio delle distribuzioni statistiche occupa un posto di primo piano la determinazione della media e dello scarto quadratico medio non soltanto perché questi valori consentono di approfondire il fenomeno in oggetto, ma anche perché sono parametri utili nel confronto di distribuzioni diverse tra loro. Si è quindi trovare la media aritmetica Xn dei consumi giornalieri, sommando giorno per giorno il valore in ogni mezz’ora e dividendo il risultato per 365. Allo stesso modo, si è calcolata la media dei consumi durante la mattina, il pomeriggio, la sera e la notte.
Xn = ∑i=1(xi / n) I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico, tuttavia hanno il limite di non darci alcuna informazione sulla distribuzione dei dati che invece è possibile valutare mediante gli indici di variabilità come: 35
•
il campo di variazione (o range) che si ottiene come differenza tra il valore massimo e quello minimo riscontrati nel fenomeno che si sta osservando:
Campo variazione = xmax – xmin •
lo scarto semplice medio che rappresenta la media aritmetica degli scostamenti in valore assoluto dei dati dal valore medio:
S.s.m. = (∑i=1| xi – Xn | ) / n •
la varianza che corrisponde alla somma dei quadrati degli scarti degli n valori aventi la media aritmetica Xn divisa per il numero dei valori:
σ² = [∑i=1( xi – Xn)² ] / n •
lo scarto quadratico medio (o deviazione standard) che è la radice quadrata della varianza e che permette di conoscere l’intervallo, centrato sulla media, attorno al quale cade un determinato numero di osservazioni:
S.q.m = ²√{[∑i=1( xi – Xn)² ] / n} Sia la varianza sia lo scarto quadratico medio tengono conto di tutti i dati della distribuzione e più sono piccoli e più i dati sono concentrati intorno alla media; viceversa, più sono grandi più i dati sono dispersi. Quando la deviazione standard non supera il 10-15% della media, le misure possono considerarsi abbastanza omogenee; quanto più tale soglia viene superata, tanto maggiore sarà lo squilibrio tra le osservazioni.
4.2 Statistiche di consumo 4.2.1 Giorni singoli Attraverso la simulazione dei consumi di energia elettrica si ottiene una matrice composta da 365 righe, che rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una giornata; questi valori sono riportati nei grafici del consumo tipico dell’intero anno per le famiglie-campione di 2, 3 e 4 persone riportati in Fig.13: , Fig.15: , Fig.17: . Una migliore rivelazione di anomalie si ottiene solo se si hanno dei dati coerenti tra loro e il più dettagliati possibile. E’ stato per questo che, oltre all’analisi di un giorno intero composto da 24 ore, si è deciso di dividere le giornate in quattro parti, mattina (dalle 6:30 alle 12:00), pomeriggio (dalle 12:30 alle 18:00), sera (dalle 18:30 alle 23:30) e notte (dalle 0:00 alle 6:00) per poter rivelare situazioni anomale anche in determinati orari, calcolando per ognuna di queste
36
le medie, le varianze, i consumi massimi e minimi e gli indici di variabilità ottenendo i seguenti risultati:
giorno
mattina
pomeriggio
sera
notte
media
7,0926
1,8876
1,2940
3,2176
0,6933
range
14,29
8,03
6,73
9,24
4,35
varianza
7,9253
3,6934
2,1523
4,9404
1,1410
2,2227
1,0681
s.q.m
2,8151 1,9218 1,4670 Fig.30: Statistiche giorni singoli per 2 persone
La tabella relativa al nucleo familiare di 2 persone, mostra un consumo medio maggiore durante le ore della sera, pari quasi al doppio del consumo riscontrato in altre momenti della giornata. Di notte il consumo è molto basso.
giorno
mattina
pomeriggio
sera
notte
media
8,9908
2,8144
2,1032
3,2434
0,8298
range
13,43
9,55
7,65
10,38
4,36
varianza
7,3791
4,7667
2,1032
5,5160
1,3840
2,3486
1,1764
s.q.m
2,7164 2,1832 1,4502 Fig.31: Statistiche giorni singoli per 3 persone
Anche la tabella relativa alla famiglia di 3 persone, mostra un consumo medio maggiore durante le ore della sera, però molto più vicino a quelli riscontrati durante la mattina e il pomeriggio.
giorno
mattina
pomeriggio
sera
notte
media
11,8880
4,5693
3,0781
2,9514
1,2892
range
15,43
10,30
8,08
11,28
4,46
varianza
7,1947
5,6466
3,1877
4,1017
2,3206
2,0252
1,5233
s.q.m
2,6822 2,3762 1,7854 Fig.32: Statistiche giorni singoli per 4 persone
La tabella per la famiglia di 4 persone, mostra invece un consumo medio maggiore durante le ore della mattina, e uno piuttosto simile sia nel pomeriggio sia durante sera. I consumi durante la notte sono maggiori degli altri due casi.
37
4.2.2 Giorni multipli In alcuni casi può capitare che i consumi siano nella media, ma con valori alti che raggiungono quasi sempre il limite imposto dalla varianza. Per evitare queste situazioni, sono state eseguite delle analisi su giorni doppi, cioè partendo sempre dalla matrice di 365 righe e 48 colonne, si sono sommati i consumi relativi a due giornate contigue, ad esclusione del primo, che poi sono stati divisi per due. Quindi per esempio, i consumi del giorno 3 saranno la somma dei consumi del giorno 2 e del giorno 3, diviso due. Con i valori ottenuti si sono eseguiti gli stessi calcoli descritti sopra. In questo modo si ottengono valori medi molto simili, ma gli indici di variabilità risultano essere più piccoli e precisi.
4.2.2.1 Giorni doppi giorno
mattina
pomeriggio
sera
notte
media
7,0927
1,8885
1,2959
3,2149
0,6933
range
9,01
5,53
4,88
7,85
4,08
2,7556
1,4147
0,9829
2,8039
0,5446
1,6744
0,7379
varianza s.q.m
1,6600 1,1894 0,9914 Fig.33: Statistiche giorni doppi per 2 persone
giorno
mattina
pomeriggio
sera
notte
media
8,9945
2,8190
2,1029
3,2430
0,8297
range
9,85
7,19
5,49
7,57
3,24
varianza
3,052
2,0032
1,1476
2,6154
0,6696
1,6172
0,8182
s.q.m
1,7469 1,4153 1,0712 Fig.34: Statistiche giorni doppi per 3 persone
giorno
mattina
pomeriggio
sera
notte
media
11,8871
4,5682
3,0760
2,9536
1,2893
range
9,30
8,43
6,38
6,87
4,20
2,5477
2,4525
1,3377
2,1806
1,1028
1,4766
1,0501
varianza s.q.m
1,5961 1,5660 1,1565 Fig.35: Statistiche giorni doppi per 4 persone
Dai risultati ottenuti si può notare come il consumo medio nelle varie parti della giornata sia molto simile al caso precedente, giorno singolo, mentre ciò che cambia e che diminuisce notevolmente sono il campo di variazione e la varianza. In questo modo, come detto
38
precedentemente, è possibile determinare molte più situazioni anomale perché diminuisce l’intervallo entro cui mantenersi per rientrare nei consumi standard.
4.2.2.2 Giorni tripli Lo stesso procedimento viene eseguito anche sommando i consumi relativi a tre giornate consecutive, ad esclusione del primo e del secondo, per poi dividere il risultato per tre ottenendo così misure ancora più piccole. Quindi per esempio, i consumi del giorno 4 saranno la somma dei consumi del giorno 2, del giorno 3 e del giorno 4, diviso tre.
giorno
mattina
pomeriggio
sera
notte
media
7,0845
1,8881
1,2999
3,2066
0,6898
range
7,49
5,02
4,03
7,51
2,75
1,6888
0,9560
0,6113
2,1059
0,3629
1,4511
0,6024
varianza s.q.m
1,2995 0,9777 0,7818 Fig.36: Statistiche giorni tripli per 2 persone
giorno
mattina
pomeriggio
sera
notte
media
8,9974
2,8213
2,1008
3,2457
0,8296
range
7,67
6,25
5,09
6,81
2,74
1,8118
1,2547
0,7896
1,7117
0,4305
1,3083
0,6561
varianza s.q.m
1,3460 1,1201 0,8885 Fig.37: Statistiche giorni tripli per 3 persone
giorno
mattina
pomeriggio
sera
notte
media
11,8802
4,5571
3,0839
2,9500
1,2892
range
8,30
7,52
5,88
6,44
4,08
1,7611
1,6017
0,8473
1,4846
0,7514
1,2184
0,8668
varianza s.q.m
1,3270 1,2655 0,9204 Fig.38: Statistiche giorni tripli per 4 persone
Anche da questi risultati si può notare che il consumo medio nelle varie parti della giornata è molto simile ai due casi precedenti, giorno singolo e giorno doppio, mentre ciò che cambia e che diminuisce ancora di più sono il campo di variazione e la varianza potendo ottenere risultati molto più precisi.
39
4.3 Rivelazione di anomalie nei consumi basata sui parametri statistici Dopo la simulazione dei consumi di energia elettrica di un ipotetico anno solare composta da 365 giorni e l’analisi dei dati ottenuti, per poter controllare in un modo piuttosto generale la presenza di situazioni anomale, sono stati generati altri consumi ottenendo dati relativi per esempio all’anno successivo. I consumi presenti in alcune giornate scelte a caso sono stati modificati in modo da superare i limiti imposti dalle medie e varianze calcolate durante le statistiche. Quindi qualsiasi tipo di comportamento che non rientra nei parametri stabiliti, viene notificato come warning di situazione anomala o fuori media. Le rivelazioni di anomalie sono state testate in tutti e tre i casi spiegati precedentemente, ed è stato soprattutto notato che le situazioni di consumi sopra la media che rientrano però nell’intervallo definito dalla varianza nel caso dei giorni singoli, e che quindi non dovrebbero essere notificate, vengono segnalate come warning se confrontate con le soglie imposte dai giorni doppi o tripli. Questo è stato lo scopo principale delle statistiche fatte su giorni multipli perché si è pensato che un atteggiamento sopra la media, ma sempre sotto l’intervallo di tolleranza, per un periodo piuttosto lungo potrebbe essere sintomo di comportamento anomalo e quindi dovrebbe essere notificato e controllato.
40
5 IDENTIFICAZIONE PROFILI UTENTE
Una volta determinati i consumi propri di ciascun nucleo familiare, tutto ciò che risulta essere fuori da certi standard è definito irregolare e rivelato come anomalia. Le anomalie infatti sono definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica ed è per questo che per identificarle è necessario conoscere il normale comportamento di una o più famiglia-campione.
Un’accurata
identificazione
e
diagnosi
delle
anomalie
dipende
principalmente dalla robustezza delle informazioni di cui si dispone e in secondo luogo dai metodi utilizzati per isolare i segnali anomali all’interno dei consumi calcolati. Una buona tecnica per rivelare le anomalie inizia con la costruzione di un profilo per il “normale” uso di energia elettrica e poi evidenzia le deviazioni da tale profilo come possibili situazioni anomale. Le prove svolte per l’identificazione di profili di utente sono due. La prima consiste nel determinare i profili d’utenza propri per ciascuna delle tre tipologie di famiglie descritte sopra, differenti per numero di componenti e per abitudini. La seconda prova consiste nello stabilire due profili utente per ciascun nucleo familiare, sviluppando diversi stili di vita ed usi degli elettrodomestici presenti in casa.
5.1 Strategie per l’identificazione di profili utente Con la simulazione del consumo energetico si possono raccogliere tutte le misurazioni effettuate su una scala ad intervalli in una matrice di dati, composta da 365 righe, che rappresentano i giorni, e da 48 colonne, rappresentanti le mezze ore di una giornata, il cui termine generico Xij fornisce la misurazione j-esima per l’unità i. Il lavoro di tesi svolto si propone in un primo momento di ottenere delle sintesi per rappresentare le informazioni più importanti contenute nella matrice dei dati. Le analisi riguardano soprattutto le relazioni esistenti tra le unità di riga verificando la similarità, per variabili qualitative, e la distanza, per variabili quantitative, e le relazioni esistenti tra le unità di colonna determinando la correlazione. Queste informazioni permettono di confrontare i vari profili così da determinare quelli che non appartengono all’insieme che vengono etichettati come anomalie.
41
Le tecniche usate per l’implementazione di un sistema che definisca dei profili d’utenza nel consumo di energia elettrica in ambito domestico sono descritte di seguito.
5.1.1.1 Piecewice Constant Approximation Una volta ottenuto il consumo totale, si cerca di identificare delle tipologie di consumi elettrici proprie per ciascun nucleo familiare. Per fare questo per ogni famiglia si analizzano le curve di consumo giornaliero e si approssimano con un profilo costante a tratti. L’n-esimo tratto possiede una ampiezza An ed una durata Tn con n=1,2,...,N, dove N è il numero di tratti individuati per quella giornata. Questo procedimento è chiamato Approssimazione Costante a Tratti (Piecewise Constant Approximation); il termine “piecewise” è spesso usato in matematica, ed applicato alle funzioni che possono essere “spezzate” in un numero finito di tratti così che ognuno di questi soddisfi delle particolari proprietà. Questo tipo di approssimazione consiste nel trovare una sequenza di stati, intesi come differenti “regioni” caratterizzate da un valore costante che ne definisce una traiettoria media, che più probabilmente corrisponde alla curva data.
Come si può vedere dalla figura, la traiettoria media è diversa da regione in regione, ed ogni volta che la curva presa in considerazione cambia la sua direzione, assume valori differenti. La curva che ne risulterà avrà una “qualità” ridotta rispetto a quella originale e questo dipende dal fatto che l’approssimazione farà si che un andamento simile, sia rappresentato sull’istogramma con valori di ordinate quasi uguali, cioè quelli risultanti dalla media dei punti. L’algoritmo sviluppato in questo ambito prende in input la curva di consumo di un utente specifico trasformandola in un insieme finito di regioni di forma rettangolare, di base Ti e altezza Ai. Questi due parametri indicano rispettivamente la durata in termini di minuti di un evento e la rispettiva ampiezza in termini di kWh. La curva presa in considerazione risulta continua nel tempo e può essere approssimata su un intervallo T dell’asse del tempo da una costante uguale al 42
valore medio sopra tale intervallo. L’andamento originale del consumo di energia giornaliero risulta essere molto simile a quello ottenuto attraverso l’approssimazione se la grandezza degli intervalli considerati è molto piccola. L’algoritmo prende in considerazione 48 mezze ore relative ai 365 giorni presenti nella matrice dei consumi, uno per volta. Partendo dal primo giorno, setta dei valori di consumo massimo e minimo con i dati della prima mezz’ora, calcola l’intervallo ∆1 come differenza tra il massimo e il minimo, ed imposta un valore medio y1 che corrisponde all’ordinata del punto preso in considerazione, e cioè all’ampiezza A1 da cui partirà la nuova curva approssimata. Passando alla mezz’ora successiva, calcola un nuovo valore minimo se il nuovo consumo considerato è inferiore a quello precedentemente calcolato, altrimenti mantiene quello vecchio; la stessa cosa viene fatta per il valore massimo. Calcola quindi un nuovo intervallo ∆2; se questo intervallo è inferiore ad un ∆ massimo impostato all’inizio, calcola la traiettoria media tra y1 e y2 e passa alla mezz’ora successiva. Lo stesso procedimento è svolto per tutte le altre mezz’ore, ottenendo in questo modo una traiettoria approssimata del consumo di energia elettrica. Nel caso in cui un intervallo ∆i calcolato per una mezz’ora i risultasse maggiore di quello massimo, l’algoritmo delimita un rettangolo (o regione) di ampiezza A pari alla yi-1 (del punto precedente) e di durata T pari alla x
i-1
(del punto
precedente). In questo modo, ogni volta che avremo un consumo molto differente da quello precedente avremo la creazione di un nuovo rettangolo con nuova ampiezza e durata.
Fig.39: Esempio di Approssimazione costante a tratti
Alla fine del processo, risulterà per ogni utente un profilo caratterizzato da diverse regioni adiacenti ognuna con la sua durata e la sua ampiezza. Sulla base di queste informazioni, si calcola l'istogramma bidimensionale relativo ad una curva di consumo giornaliero regolarizzato come costante a tratti che viene poi usato per trovare affinità o differenze tra i vari profili definiti per ogni nucleo familiare. 43
5.1.1.2 Distanza Euclidea Data una coppia di unità statistiche, i e j, si desidera confrontare i rispettivi profili, pervenendo a misure di distanza, dij, e similarità, cij. Dette misure dipendono dalla scala di misurazione degli attributi [7.] La distanza euclidea è la tipica distanza fra due punti che si potrebbe misurare con un righello, che può essere ottenuta dall'applicazione ripetuta del teorema di Pitagora [6.]. Una misura di distanza d ( x, y ) tra coppie di elementi dello spazio deve godere delle seguenti proprietà:
1) d ( x, y ) ≥ 0 2) d ( x, y ) = d ( y, x) 3) d ( x, y ) ≤ d ( x, z ) + d ( z , y ) La 1) è detta proprietà della non negatività, la 2) della simmetria e la 3) della disuguaglianza triangolare; è ovvio anche che d(x,x) = 0. Se una misura di distanza soddisfa tutte e quattro le proprietà, si dice che lo spazio di riferimento è metrico. Il valore della distanza ottenuto durante un confronto è pari a zero nel caso in cui ci sia uguaglianza totale tra due profili, mentre assume un valore massimo nel caso di assenza di correlazione. E’ molto importante definire quale sia spazio di cui si considerano i due punti e solitamente quando si parla di distanza euclidea ci si riferisce al piano cartesiano nel quale si determina una distanza intesa come funzione che associa a due punti P1 e P2 un numero reale non negativo.
Indicando con ∆x la variazione orizzontale da P1 = (x1, x2) a P2 = (y1, y2) e con ∆y quella verticale per due punti in due dimensioni, la distanza è calcolata come:
d(P1, P2) = ( (∆x)² + (∆y)² ) = ( (x2 – x1)² + (y2 – y1)² )
44
Nel caso di due punti monodimensionali, P1= (x1) a P1= (x2), si calcola il valore assoluto poiché di norma la distanza è un numero intero positivo:
d(P1, P2) = | x1– x2 | = ²√ (x1– x2)² L’algoritmo sviluppato per il confronto basato sulla distanza Euclidea porta alla creazione di una matrice simmetrica NxN, dove N è il numero degli istogrammi da comparare, in cui i valori sulla diagonale sono nulli, considerando in tal caso un confronto tra le stesse curve di consumo, ed in cui il valore dij rappresenta la distanza tra la curva di indice riga i con la curva di indice colonna j. Più è basso questo valore, e più sarà alta la possibilità che le due curve siano simili e viceversa.
5.1.1.3 Auto- e Cross-Correlazioni Anche la correlazione è usata per mettere a confronto delle informazioni, solitamente pattern di segnali, e determinare una somiglianza non più nei valori come si è fatto con le medie, ma nella forma dei dati. Per sapere se esiste un “legame” tra due caratteri quantitativi, e cioè se uno di essi esercita un'influenza sull'altro, si utilizzano gli indici di correlazione, i quali danno anche una misura di questo “legame” e valutano la correlazione totale presente nel set di dati in esame. Se l’indice è per uguale a 1 si ha il massimo di correlazione diretta, cioè ai valori crescenti di una variabile corrispondono valori pure crescenti dell'altra variabile; se l’indice è uguale a -1 si ha il massimo di correlazione inversa, cioè ai valori crescenti di una variabile corrispondono valori decrescenti dell'altra variabile; se l’indice è uguale a 0 non si ha correlazione. Dati x = (x1,x2,…,xn) e y =(y1,y2,…,yn) la loro correlazione non-normalizzata è data da:
C = ∑i=1∑j=1(xi yj)² Lo sfasamento ∆ nello spazio fra due curve di consumo di energia elettrica permette di traslare una di esse di un certo valore t in modo tale da renderle “sovrapposte” e quindi immediatamente confrontabili. Per stimare ∆ è utile la funzione di cross-correlazione che fornisce una misura della similitudine tra le due curve. L’algoritmo sviluppato si occupa di determinare un valore t che rappresenta lo sfasamento da applicare ad una delle due curve dell’istogramma per ottenere la massima sincronizzazione possibile fra i due tratti da confrontare. Questo sfasamento che massimizza la funzione di cross45
correlazione è un indice sufficiente a determinare la sincronia delle due curve. Se infatti le due curve sono perfettamente sincronizzate, lo sfasamento ottenuto sarebbe zero, al contrario assumerebbe un valore prossimo al semiperiodo. [8.] Nel caso di N curve da confrontare, non esiste una sola funzione di cross-correlazione ma un numero pari alle coppie possibili dei profili considerati, ovvero N² (considerando anche l’auto-correlazione). Il calcolo dello sfasamento che massimizza ognuna delle possibili funzioni di cross-correlazione porta alla creazione di una matrice simmetrica NxN in cui il valore tij rappresenta lo sfasamento che rende massima la funzione di cross-correlazione definita tra la curva di indice riga i con la curva di indice colonna j. Ogni riga della matrice contiene gli sfasamenti che, applicati alle curve corrispondenti (contraddistinti dall’indice colonna), permettono di ottenere la massima sincronia possibile. I vettori riga si differenziano fra loro per la scelta della curva di consumo usata come riferimento nel calcolo delle funzioni di cross-correlazione. Quindi dall’analisi dei vettori riga è possibile capire quale profilo utente sia più “vicino” agli altri, dove per “vicino” s’intende che gli sfasamenti trovati sono i più bassi. [8.]
5.1.1.4 Auto- e Cross-Correlazioni Normalizzate Il valore tj della matrice simmetrica NxN calcolata nello step precedente, rappresenta lo sfasamento di posizione j-esima del vettore riga scelto, mentre I è il numero dei punti che costituiscono la curva di consumo presa in considerazione; quindi il rapporto tj/I è la versione normalizzata dello sfasamento. Dati x = (x1,x2,…,xn) e y =(y1,y2,…,yn) la loro correlazione normalizzata è data da:
C = [∑i=1∑j=1(xi yj)²] / [∑i=1∑j=1 (xij)²] [∑i=1∑j=1 (yij)²] La correlazione normalizzata si è dimostrata la forma di confronto più significativa applicabile al lavoro di tesi svolto. L’algoritmo sviluppato crea, come già detto una matrice simmetrica NxN con i valori sulla diagonale pari a 1, considerando in tal caso un confronto tra due curve dello stesso istogramma. Le misure che appariranno nelle altre posizioni avranno un valore inferiore ad 1 e più saranno “vicini” all’uno e maggiore sarà la possibilità che la curva di consumo con indice riga i sia uguale alla curva di consumo con indice colonna j. Una volta ottenuti tutti i valori per cui si ha o non si ha una correlazione, si determina una soglia per stabilire eventuali comportamenti anomali. Se infatti per esempio la correlazione normalizzata di una curva di consumo X per una famiglia-campione di 2 persone con la curva 46
calcolata per il profilo di una famiglia-campione di 2 persone è superiore a tale soglia, allora si potrà identificare tale curva X come un caso di anomalia di consumo di energia elettrica in un nucleo familiare di 2 persone.
5.2 Applicazione della metodologia sviluppata 5.2.1 Prima prova: famiglia-campione senza profili Prendendo in considerazione i consumi calcolati nella fase precedente, risultanti dalla simulazione dell’uso di elettrodomestici nelle famiglie di 2, 3 e 4 persone, è stata eseguita una prima prova con l’applicazione degli algoritmi specificati in precedenza, finalizzati alla rivelazione di anomalie nell’uso di energia elettrica in ambito domestico. I consumi considerati per ogni nucleo familiare sono quelli ottenuti durante la simulazione riportata nel paragrafo 3.3.3.1. Di seguito sono riportati i grafici ottenuti applicando l’algoritmo di Piecewise Constant Approximation alla curva dei consumi di ciascun nucleo familiare ricavata durante la fase di simulazione e quello per la creazione dell’istogramma bidimensionale relativo ad una curva di consumo giornaliero regolarizzato come costante a tratti. Il grafico di Fig.40: rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato come costante a tratti (destra) per una famiglia-campione di 2 persone:
Fig.40: Approssimazione a tratti e istogramma 2 persone
Gli algoritmi spiegati sopra sono stati applicati anche ai dati relativi al consumo di energia elettrica di una famiglia-campione di 3 persone. I risultati ottenuti sono riportati nel grafico di 47
Fig.41: che rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato come costante a tratti (destra) per tale famiglia-campione.
Fig.41: Approssimazione a tratti e istogramma 3 persone
Lo stesso procedimento è stato eseguito per i dati relativi al consumo di energia elettrica di una famiglia-campione di 4 persone. I risultati ottenuti sono riportati nel grafico di Fig.42: che rappresenta l’approssimazione a tratti del consumo giornaliero tipico per alcuni giornate (sinistra) e l’istogramma bidimensionale, ingrandito nella sola parte interessante ai fini dell’analisi, relativo ad una curva di consumo per i 365 giorni dell’intero anno regolarizzato come costante a tratti (destra) per tale famiglia-campione.
Fig.42: Approssimazione a tratti e istogramma 4 persone
48
I consumi annuali delle tre famiglie sono stati poi confrontati tra loro per determinare somiglianze e differenze allo scopo di rivelare anomalie nell’impiego della corrente elettrica. Come già detto, l’algoritmo sviluppato per la determinazione della correlazione normalizzata crea una matrice simmetrica NxN con i valori sulla diagonale pari a 1 e quelli nelle altre posizioni minori di 1. Più questi valori saranno “vicini” all’uno e maggiore sarà la possibilità che il profilo di consumo con indice riga i sia uguale a quello con indice colonna j e viceversa. La matrice di visibilità ottenuta è la seguente:
2 persone
3 persone
4 persone
2 persone
1
0,9671
0,8384
3 persone
0,9671
1
0,8624
4 persone
0,8384 0,8624 Fig.43: Correlazione normalizzata prima prova
1
Si può notare come le tre tipologie di famiglie-campione abbiano dei consumi di energia elettrica abbastanza differenti tra loro sia in termini numerici, considerando i kWh consumati in media durante l’anno di 365 giorni, sia in termini di forma della curva riportata nell’istogramma.
5.2.2 Seconda prova: famiglia-campione con profili Per la seconda prova sono state apportate delle modifiche alle probabilità di accensione degli elettrodomestici determinando per ciascun nucleo familiare due diversi profili, stimando differenti stili di vita ed abitudini da quelli determinati per le famiglie-campione della prima prova mantenendo però simili i valori medi propri di ciascuna tipologia di famiglia.
Famiglia
Profilo 1
Profilo 2
2 persone
1 lavoratore, 1 casalinga
2 studenti in affitto
3 persone
1 lavoratore, 1 casalinga, 1 studente
2 studenti, 1 lavoratore
4 persone
1 lavoratore, 1 casalinga, 2 studenti 2 studenti, 2 lavoratori Fig.44: Profili diversi per ogni famiglia-campione
I consumi considerati per ogni nucleo familiare sono quelli ottenuti durante la simulazione riportata nel paragrafo 00. Sono stati eseguiti gli algoritmi di Piecewice Constant Approximation per ciascun profilo appartenente alle famiglie-campione e sono stati calcolati i sei istogrammi bidimensionali relativi alle curve di consumo giornaliero regolarizzate come costante a tratti.
49
Un’altra grande differenza di questa seconda prova è che, per eseguire un confronto tra i diversi profili, oltre a calcolare le auto- e le cross-correlazioni, le distanze euclidee e le auto- e le cross-correlazioni normalizzate degli istogrammi bidimensionali, si utilizza anche la media dell’istogramma, cioè la media dei consumi della casa, calcolata in base all'istogramma tramite una formula in cui i valori dell'istogramma sono pesati con le ampiezze e le durate cui si riferiscono. Questo perché un semplice confronto eseguito solo sulla forma delle curve di consumo, per esempio tramite la correlazione normalizzata, non è sufficiente ad ottenere dei parametri di somiglianza tra i profili. Infatti, soprattutto nei casi in cui i due profili utente appartengono alla stessa famiglia-campione, per esempio il profilo 1 e il profilo 2 della famigliacampione di 4 persone, i valori su cui eseguire la correlazione o calcolare le distanze risultano differire di poco, avendo creato i due profili con un consumo totale annuo quasi uguale. E’ per questo motivo che per identificare correttamente i consumi appartenenti a determinati nuclei familiari e rivelare eventuali situazioni anomale, è stato necessario confrontare gli istogrammi di profilo utente sia attraverso la correlazione normalizzata, per avere una somiglianza nella forma della curva di consumo, sia attraverso il calcolo della media dell’istogramma, per ottenere una somiglianza anche sui valori. L’identificazione avverrà solo se tutte e due queste metodologie di confronto saranno verificate. Come nella prima prova, a fronte di qualsiasi profilo utente X, con un certo consumo di energia elettrica, si ha la possibilità di identificare la tipologia di famiglia a cui appartiene, ed in più si è in grado di stabilire a quale dei due profili utente, caratterizzanti il nucleo familiare individuato tramite il test, fa riferimento. Le medie dell’istogramma dei sei profili utente, cioè le medie dei consumi della casa, calcolate in base all'istogramma tramite i valori pesati con le ampiezze e le durate cui si riferiscono sono le seguenti:
2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2 7,7027
8,8103 8,8836 8,5445 10,4390 Fig.45: Medie degli istogrammi sul consumo giornaliero
11,4027
La matrice simmetrica NxN ottenuta calcolando la correlazione normalizzata tra tutti e sei i profili utente è la seguente:
2p profilo1 2p profilo2 3p profilo1 3p profilo2 4p profilo1 4p profilo2 2p profilo1
1
0,6480
0,9143 50
0,4715
0,5946
0,7024
2p profilo2
0,6480
1
0,7827
0,7457
0,7357
0,7937
3p profilo1
0,9143
0,7827
1
0,6780
0,8225
0,8732
3p profilo2
0,4715
0,7457
0,6780
1
0,7579
0,8253
4p profilo1
0,5946
0,7357
0,8225
0,7579
1
0,8759
4p profilo2
0,7024
0,7937 0,8732 0,8253 0,8759 Fig.46: Correlazioni normalizzate seconda prova
1
Si può notare come le medie calcolate e le curve relative ai consumi siano abbastanza differenti tra le tre tipologie di famiglie-campione, nonostante i due profili utente per ciascuna famiglia-campione siano stati creati con consumi totali annui di energia elettrica abbastanza simili.
5.3 La soluzione proposta 5.3.1 Matlab Lo sviluppo del software per la rivelazione di anomalie nel consumo energetico in ambito domestico è stato effettuato usando Matlab, che offre un ambiente di sviluppo idoneo alla simulazione di scenari utili al raggiungimento dell’obiettivo di questo lavoro di tesi. MATLAB (abbreviazione di MATrix LABoratory) è un linguaggio di programmazione scritto in C dalla The MathWorks, ossia un insieme di strumenti (come ad esempio l’editor o il debugger) necessari per lo sviluppo di sistemi software in un linguaggio di programmazione ad alto livello. MATLAB è uno dei programmi scientifici di maggior diffusione, grazie alle sue numerose applicazioni in campi quali l'elettronica, la controllistica, l'analisi dei segnali, l'elaborazione di immagini, la chimica, la statistica e numerosi altri. Viene utilizzato in molti corsi universitari e di ingegneria, e sono ormai numerose le pubblicazioni scientifiche che utilizzano l'ambiente di Matlab quale sostegno matematico della teoria. E’ molto usato in ambito ingegneristico mondiale come strumento per la simulazione di sistemi lineari e non lineari e, più in generale, per l’analisi numerica., lo sviluppo delle applicazioni e la conversione automatica di programmi MATLAB nei codici C e C++. Consente l’uso di matrici, visualizzazione di funzioni e dati, implementa algoritmi, consente la creazione di interfacce utente (le cosiddette GUI=Graphical User Interface), e funziona su diversi sistemi operativi, tra cui Windows, Mac OS, Linux e Unix. I Toolboxes forniti direttamente dal produttore MathWorks permettono l’analisi dei dati, l’esplorazione e la visualizzazione, l’elaborazione numerica e simbolica, la grafica scientifica ed ingegneristica, la modellizzazione, la simulazione, la programmazione. 51
I Toolbox sono collezioni complete di funzioni (o routine) MATLAB (dette M-files) orientate alla soluzione di problemi relativi ad uno specifico settore di ricerca matematico oppure ad uno specifico settore applicativo e ogni utente può mettere a punto un set di programmi, un toolbox, relativo ad uno specifico campo di applicazione e inglobarlo nel corpo dei comandi attivi. MATLAB è un sistema interattivo in cui l’unità base dei dati è una matrice o array per cui non è richiesto dimensionamento; non esistono dichiarazioni di tipi o di dimensioni, alloca direttamente la memoria necessaria ogni volta che si dichiara o si modifica una variabile. In questo modo consente di risparmiare tempo nel risolvere problemi tecnici evitando di dichiarare ad esempio, matrici e vettori come è solito fare in un linguaggio non interattivo, come C o Fortran. MATLAB è un ambiente di programmazione interpretato e non compilato; ciò significa che un programma MATLAB viene eseguito senza premettere la fase della compilazione semplificando lo sviluppo dei programmi e permettendo di mettere a punto le funzioni man mano che occorrono e possono essere rapidamente e semplicemente provate e corrette. I comandi possono essere digitati direttamente sulla linea di comando o letti da file testo; la “command window” dà accesso diretto all’interprete (scrittura diretta dei comandi):
Fig.47: Interfaccia Matlab
La caratteristica più importante di MATLAB è la sua semplice estensibilità che dà la possibilità a tutti di contribuire come autori di MATLAB, creando le proprie applicazioni; sono infatti molti gli scienziati, matematici e ingegneri che hanno sviluppato nuove ed interessanti 52
applicazioni, tutte senza la necessità di scrivere neppure una linea di Fortran o di altri codici a basso livello. Avendo funzioni scritte nella maggior parte dei casi come file testo, la portabilità da un sistema all'altro di funzioni specifiche scritte dall'utente è garantita praticamente al 100%.
5.3.2 Identificazione profili utente Una volta stabiliti i criteri per la misura del grado di similarità/diversità, è possibile sviluppare molteplici algoritmi per la classificazione dei casi. Per variabili di tipo quantitativo si calcolano misure di distanza. Per variabili di tipo qualitativo si calcolano misure di similarità. Utilizzando le tecniche di confronto spiegate in precedenza, è stato possibile ottenere dei valori di soglia per ciascun profilo in modo da determinare un match positivo o negativo tra i profili che si desidera analizzare e quelli campione. Per identificare un profilo utente è necessario, nella prima prova, che il profilo da individuare abbia una correlazione superiore alla soglia determinata e, nella seconda prova, abbia anche una media dell’istogramma che rientri nei parametri calcolati. Questo permette di avere una somiglianza nei valori e nella forma dei consumi di energia elettrica per poter riconoscere senza equivoci un profilo utente X qualsiasi in uno di quelli campione individuati con la simulazione. Nel caso in cui non c’è identificazione, e quindi il profilo X non rientri in nessuno dei casi, allora si rivelerà un’anomalia.
5.4 Risultati 5.4.1.1 Prima prova Identificazione di profili utente totali Questa prima prova consiste nel cercare di identificare un qualsiasi profilo utente, diverso da quelli delle famiglie-campione, attraverso i valori di correlazione ottenuti durante il confronto tra i profili. Il seguente schema mostra come il profilo X è stato identificato in una famigliacampione di 2 persone, avendo una correlazione maggiore rispetto alle altre:
Profilo X
2p
3p
4p
Profilo X
1
0,9826
0,8632
0,8766
2p
0,9826
1
0,9671
0,8384
3p
0,8632
0,9671
1
0,8624
4p
0,8766 0,8384 0,8624 Fig.48: Identificazione profilo totale 2 persone
53
1
Il caso successivo, invece mostra come il profilo Y è stato identificato nella tipologia di consumo appartenente alla famiglia-campione di 3 persone:
Profilo Y
2p
3p
4p
Profilo Y
1
0,9605
0,9745
0,8951
2p
0,9605
1
0,9671
0,8384
3p
0,9745
0,9671
1
0,8624
4p
0,8951 0,8384 0,8624 Fig.49: Identificazione profilo totale 3 persone
1
Il profilo Z è stato invece identificato nella tipologia di consumo di energia elettrica propria della famiglia-campione di 4 persone:
Profilo Z
2p
3p
4p
Profilo Z
1
0,9047
0,9400
0,9628
2p
0,9047
1
0,9671
0,8384
3p
0,9400
0,9671
1
0,8624
4p
0,9628 0,8384 0,8624 Fig.50: Identificazione profilo totale 4 persone
1
Sono stati quindi definiti dei valori soglia per ciascuna tipologia di famiglia-campione al di sotto dei quali non vi è identificazione, e quindi probabile anomalia. In questo modo, un profilo qualunque apparterrà al nucleo familiare composto da 2 persone se e solo se la correlazione tra questo profilo e quello della famiglia-campione di 2 persone è maggiore o uguale a 0,9826; potrà appartenere al nucleo composto da 3 persone se e solo se la correlazione tra questo profilo e quello della famiglia-campione di 3 persone è maggiore o uguale a 0,9745; invece potrà essere identificato come un nucleo di 4 persone se e solo se la correlazione tra questo profilo e quello della famiglia-campione di 4 persone è maggiore o uguale a 0,9628. Identificazione di profili parziali Tramite l’algoritmo di simulazione di consumo energetico, sono stati creati degli istogrammi bidimensionali, relativi alle curve di consumo giornaliero regolarizzate come costante a tratti, di soli dieci giorni a caso tra i 365 dell’intero anno calcolati in 3.3.3.1; questo procedimento è stato eseguito per tutte e tre le tipologie di famiglie-campione. Successivamente ogni istogramma rappresentante i dieci giorni è stato confrontato con quello che riproduce la situazione dell’intero anno. In questo modo sono stati ottenuti ulteriori soglie per ciascun profilo in modo da 54
determinare un match positivo o negativo anche nel caso di confronti su periodo di tempo limitati. La seguente tabella mostra come 10 giorni random di un profilo X sono stati identificati come appartenenti al profilo di consumo di una famiglia-campione di 2 persone, avendo una correlazione maggiore rispetto alle altre:
10 gg di X
2p
3p
4p
10 gg di X
1
0,8919
0,6879
0,6902
2p
0,8919
1
0,9671
0,8384
3p
0,6879
0,9671
1
0,8624
4p
0,6902 0,8384 0,8624 Fig.51: Identificazione profilo parziale 2 persone
1
La tabella successiva, invece mostra come 10 giorni random di un profilo Y sono stati identificati nella tipologia di consumo appartenente alla famiglia-campione di 3 persone:
10 gg di Y
2p
3p
4p
10 gg di Y
1
0,6736
0,8531
0,8441
2p
0,6736
1
0,9671
0,8384
3p
0,8531
0,9671
1
0,8624
4p
0,8441 0,8384 0,8624 Fig.52: Identificazione profilo parziale 3 persone
1
Di seguito è mostrato come anche 10 giorni random di un profilo Z sono stati invece identificati nella tipologia di consumo di energia elettrica propria della famiglia-campione di 4 persone:
10 gg di Z
2p
3p
4p
10 gg di Z
1
0,6615
0,7918
0,9286
2p
0,6615
1
0,9671
0,8384
3p
0,7918
0,9671
1
0,8624
4p
0,9286 0,8384 0,8624 Fig.53: Identificazione profilo parziale 4 persone
1
Sono stati quindi definiti dei valori soglia anche per l’identificazione di un periodo più breve rispetto ai 365 giorni dell’intero anno al di sotto dei quali non vi è identificazione, e quindi probabile anomalia. Scegliendo un periodo random di 10 giorni da un qualsiasi profilo, questo 55
sarà identificato appartenente al nucleo familiare composto da 2 persone se e solo se la loro correlazione è maggiore o uguale a 0,8919; potrà appartenere al nucleo composto da 3 persone se e solo se la correlazione tra questo profilo e quello della famiglia-campione di 3 persone è maggiore o uguale a 0,8531; invece sarà identificato come un nucleo di 4 persone se e solo se la loro correlazione è maggiore o uguale a 0,9286.
5.4.1.2 Seconda prova Per la secondo prova è prevista una identificazione di un qualsiasi profilo utente, diverso da quelli delle famiglie-campione determinati durante la fase di simulazione, attraverso un match sia sui valori di correlazione ottenuti durante il confronto tra i profili, sia sulle medie degli istogrammi, calcolate in base all'istogramma tramite una formula in cui i valori dell'istogramma sono pesati con le ampiezze e le durate cui si riferiscono, riportate in Fig.45: . E’ stato simulato un nuovo profilo X, che è stato correttamente identificato come appartenente al profilo 1 della famiglia-campione di 2 persone poiché ha una media pari a 7,2370 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: , deve essere compreso tra 7,7027 e 8,8103:
Profilo X
2p prof.1
2p pro.2
3p prof.1
3p prof.2
4p prof.1
4p prof.2
Profilo X
1
0,9482
0,5070
0,7996
0,2445
0,4148
0,5153
2p prof.1
0,9482
1
0,6480
0,9143
0,4715
0,5946
0,7024
2p prof.2
0,5070
0,6480
1
0,7827
0,7457
0,7357
0,7937
3p prof.1
0,7996
0,9143
0,7827
1
0,6780
0,8225
0,8732
3p prof.2
0,2445
0,4715
0,7457
0,6780
1
0,7579
0,8253
4p prof.1
0,4148
0,5946
0,7357
0,8225
0,7579
1
0,8759
4p prof.2
0,5153
0,7024
0,7937
0,8732
0,8253
0,8759
1
Fig.54: Identificazione profilo 2 persone seconda prova
Successivamente è stato simulato un altro profilo Y, che è stato correttamente identificato come appartenente al profilo 1 della famiglia-campione di 3 persone poiché ha una media pari a 8,5384 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: , deve essere compreso tra 8,8836 e 8,5445:
Profilo Y
2p prof.1
2p pro.2
3p prof.1
3p prof.2
4p prof.1
4p prof.2
Profilo Y
1
0,8899
0,7515
0,9642
0,6348
0,8688
0,8669
2p prof.1
0,8899
1
0,6480
0,9143
0,4715
0,5946
0,7024
2p prof.2
0,7515
0,6480
1
0,7827
0,7457
0,7357
0,7937
3p prof.1
0,9642
0,9143
0,7827
1
0,6780
0,8225
0,8732
56
3p prof.2
0,6348
0,4715
0,7457
0,6780
1
0,7579
0,8253
4p prof.1
0,8688
0,5946
0,7357
0,8225
0,7579
1
0,8759
4p prof.2
0,8669
0,7024
0,7937
0,8732
0,8253
0,8759
1
Fig.55: Identificazione profilo 3 persone seconda prova
Infine è stato simulato un altro profilo Z, che è stato correttamente identificato come appartenente al profilo 2 della famiglia-campione di 4 persone poiché ha una media pari a 10,6068 kWh al giorno, quindi dentro l’intervallo consentito che, come mostrato in Fig.45: , deve essere compreso tra 10,4390 e 11,4027:
Profilo Z
2p prof.1
2p pro.2
3p prof.1
3p prof.2
4p prof.1
4p prof.2
Profilo Z
1
0,8720
0,7417
0,9290
0,6544
0,7603
0,9102
2p prof.1
0,8720
1
0,6480
0,9143
0,4715
0,5946
0,7024
2p prof.2
0,7417
0,6480
1
0,7827
0,7457
0,7357
0,7937
3p prof.1
0,9290
0,9143
0,7827
1
0,6780
0,8225
0,8732
3p prof.2
0,6544
0,4715
0,7457
0,6780
1
0,7579
0,8253
4p prof.1
0,7603
0,5946
0,7357
0,8225
0,7579
1
0,8759
4p prof.2
0,9102
0,7024
0,7937
0,8732
0,8253
0,8759
1
Fig.56: Identificazione profilo 4 persone seconda prova
Con questo ultimo test si può notare come sia importante considerare anche un confronto sui valori delle medie degli istogrammi al fine di determinare una corretta identificazione dei profili di consumo di energia elettrica. Infatti se non fosse stata considerata anche un’uguaglianza dal punto di vista dei valori, ma solo quella sulla forma della curva, quest’ultimo profilo sarebbe dovuto essere identificato come appartenente al profilo 1 della famiglia-campione composta da 3 persone, commettendo un errore.
57
6 RIVELAZIONE DI ANOMALIE NEL CONSUMO DOMESTICO
Una volta determinati i consumi propri di ciascun nucleo familiare ed aver definito dei profili d’utenza, tutto ciò che risulta essere fuori da certi standard è definito irregolare e rivelato come anomalia. Le anomalie infatti sono definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica ed è per questo che per identificarle è necessario conoscere il normale comportamento di una o più famiglia-campione. Il diagnosticare anomalie è un problema sia per l’azienda fornitrice di energia elettrica sia per l’utente finale perché significa interpretare un comportamento anomalo in una grande quantità di profili di consumo e perché possono essere di varie forme e provenire da infinite cause. Risulta però fondamentale rivelarle perché possono creare inutili sprechi di energia elettrica ed avere un drammatico impatto sull’utente finale. Le anomalie sono solitamente caratterizzate da cambiamenti transitori ed improvvisi nei dati misurati che avvengono prima o durante un evento anomalo. La durata di questi cambiamenti varia con la natura della causa che ha dato il via all’evento. Il più delle volte le anomalie in questo ambito rimangono sconosciute perché una loro corretta identificazione richiederebbe delle strutture di monitoraggio sofisticate o perché non si hanno gli strumenti per processarle in tempo reale o, e soprattutto perché, il consumo di energia elettrica è talmente alto che rende difficile l’estrazione di informazioni significative.
6.1 Strategia per la rivelazione di anomalie Definiti i profili per il normale uso di energia elettrica in ciascun nucleo familiare si passa ad evidenziare le deviazioni da tale profilo come possibili situazioni anomale. Una volta ottenuti tutti i valori per cui si ha o non si ha una correlazione, si determina una soglia per stabilire eventuali comportamenti anomali. Se infatti per esempio la correlazione normalizzata di una curva di consumo X per una famiglia-campione di 2 persone con la curva calcolata per il profilo di una famiglia-campione di 2 persone è superiore a tale soglia, allora si potrà identificare tale curva X come un caso di anomalia di consumo di energia elettrica in un nucleo familiare di 2 persone. 58
Per rivelare eventuali situazioni anomale, è stato necessario confrontare gli istogrammi di profilo d'utente generati nella fase precedente. I confronti sono stati eseguiti con le tecniche descritte nel capitolo 5.1 di auto- e le cross-correlazioni, le distanze euclidee, le auto- e le crosscorrelazioni normalizzate, le medie per valutare contemporaneamente tutti i valori di distanza, o di similarità, tra gli istogrammi; queste tecniche permettono di determinare una somiglianza nei valori e nella forma dei dati. La prima prova consiste nel rivelare le anomalie delle tre tipologie di famiglie descritte sopra, differenti per numero di componenti e per abitudini. Nella seconda prova una volta determinate le tipologie di consumi proprie dei due profili per famiglia, si cerca di individuare le situazioni anomale, cioè quei consumi che risultino diversi nei valori e nella forma dai profili definiti.
6.2 I risultati Come detto in precedenza, nel caso in cui non si riesca ad ottenere l’identificazione di un qualsiasi profilo X in nessuna tipologia di famiglia-campione, si può parlare di un’anomalia di consumo di energia elettrica in ambito domestico.
6.2.1.1 Prima prova Anomalie per profili utente totali Dai risultati dei test riportati nelle tabelle Fig.48: , Fig.49: , Fig.50: si deduce che è stato possibile rivelare come anomalie tutti i casi di test in cui la correlazione tra un profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore a tutte le soglie calcolate, cioè non è stato identificato con nessuno dei tre profili. I seguenti valori di correlazione mostrano le soglie da rispettare per poter identificare correttamente un profilo qualsiasi di consumo di energia elettrica in una delle tre tipologie prese in esame:
2p
3p
4p
Profilo X
0,9826
0,8632
0,8766
Profilo Y
0,9605
0,9745
0,8951
Profilo Z 0,9047 0,9400 0,9628 Fig.57: Soglie di identificazione profili totali prima prova
Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia composta da 2 persone se la loro correlazione sarà minore di 0,9826; non apparterrà mai ad un nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,9745; non apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9628. Nell’ipotesi in cui non 59
sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di anomalia. Anomalie per profili utente parziali Dai risultati dei test riportati nelle tabelle Fig.51: , Fig.52: , Fig.53: si deduce che è stato possibile rivelare come anomalie tutti i casi di test in cui la correlazione di 10 giorni di consumo di un profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore a tutte le soglie calcolate, cioè non è stato identificato con nessuno dei tre profili. I seguenti valori di correlazione mostrano le soglie da rispettare per poter identificare correttamente un profilo qualsiasi di consumo di energia elettrica in una delle tre tipologie prese in esame:
2p
3p
4p
10 gg di X
0,8919
0,6879
0,6902
10 gg di Y
0,6736
0,8531
0,8441
10 gg di Z 0,6615 0,7918 0,9286 Fig.58: Soglie di identificazione profili parziali prima prova
Si può quindi concludere che un profilo qualsiasi non sarà mai riconosciuto appartenente ad una famiglia composta da 2 persone se la loro correlazione sarà minore di 0,8919; non apparterrà mai ad un nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,8531; non apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9286. Nell’ipotesi in cui non sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di anomalia.
6.2.1.2 Seconda prova I risultati dei test riportati nelle Fig.45: , Fig.54: , Fig.55: ,Fig.56: definiscono delle soglie che se non rispettate rivelano situazioni di anomalie. Tutti i casi di test in cui la correlazione tra un profilo utente da identificare con una tipologia di famiglia-campione è risultata inferiore alle soglie calcolate e la media dell’istogramma non è rientrata nell’intervallo stabilito, hanno portato a definire il profilo come caso anomalo. I seguenti valori di correlazione mostrano le soglie da rispettare per poter identificare correttamente un profilo qualsiasi di consumo di energia elettrica in una delle tre tipologie prese in esame:
Profilo X
2p
3p
4p
0,9482
0,7996
0,5153
60
Profilo Y
0,8899
0,9642
0,8669
Profilo Z
0,8720 0,9290 0,9102 Fig.59: Soglie di identificazione profili totali seconda prova
Si può quindi concludere che un profilo qualsiasi non apparterrà mai ad una famiglia composta da 2 persone se la loro correlazione sarà minore di 0,9482 e la media dell’istogramma non compresa tra 7,7027 e 8,8103; non apparterrà mai ad un nucleo familiare di 3 persone se la loro correlazione sarà minore di 0,9642 e la media dell’istogramma non compresa tra 8,8836 e 8,5445; non apparterrà mai ad una famiglia di 4 persone se la loro correlazione sarà minore di 0,9102 e la media dell’istogramma non compresa tra 10,4390 e 11,4027. Nell’ipotesi in cui non sia riconosciuto in nessuno delle tre tipologie di famiglie-campione, risulta essere un caso di anomalia.
61
7 CONCLUSIONI
Il lavoro presentato in questa tesi è molto lontano dall’essere considerato un prodotto finito; può essere visto come il punto di partenza per lo sviluppo di dispositivi che individuino i furti e le frodi nel settore energetico. E’ stato calcolato che negli Stati Uniti i furti di energia elettrica costano più di un milione di dollari l’anno alle compagnie erogatrici. Prendendo spunto dalle tecniche e strategie utilizzate per la rivelazione di anomalie nel traffico su Internet, in questo elaborato si è voluto dare l’idea per lo sviluppo di un modello che permettesse la rivelazione di anomalie nel consumo di energia elettrica in ambito domestico. Ultimamente la società attuale è sempre più sensibile al tema del risparmio energetico che rappresenta un ruolo fondamentale nella protezione dell’ambiente e dei cambiamenti climatici. Le possibilità di risparmiare energia, sono tante e spesso sono sotto gli occhi di tutti, soprattutto in ambito domestico. Tutti gli immobili dovrebbero rispettare la normativa sul risparmio energetico e quella sulla sicurezza; nell’effettuare la diagnosi di un edificio si cerca di individuare, attraverso i rilievi delle strutture e dei componenti, calcoli, misure, eventuali anomalie che possono interessare la stabilità, il consumo energetico, la sicurezza o l’igiene ambientale. L’obiettivo del lavoro di tesi è stato quello di progettare e testare uno strumento per riconoscere situazioni di anomalie nei sistemi elettrici che possono essere causate da malfunzionamenti o manomissioni dei contatori per tentare di ridurre al minimo gli eventuali sprechi e furti che ne derivano; a tal fine è stato sviluppato ed utilizzato un algoritmo in grado di distinguere le anomalie, definite come inusuali e significanti cambiamenti nei livelli di consumo di energia elettrica standard propri di ciascun nucleo familiare. Una volta definito un profilo per il “normale” uso di energia elettrica, sono state evidenziate le deviazioni da tale profilo come possibili situazioni anomale. La fase realizzativa è stata caratterizzata dalla scrittura del codice in Matlab e si articola nelle seguenti fasi: (1) raccolta dei dati di consumo di energia elettrica relativi ad alcune famigliecampione, (2) elaborazione dei dati per calcolare il fabbisogno energetico di ciascuna famigliacampione e definire dei valori “normali”, cioè quelli che esprimono le caratteristiche energetiche di un sistema “in buona salute”, (3) identificazione di profili utente campione per mezzo dei dati 62
“normali” ottenuti, (4) individuazione di anomalie basata sul confronto tra alcune curve di consumo random e quelle relative al consumo “normale”. Proprio come nel traffico su Internet, l’anomaly detection e la correlazione di eventi di anomalia è un problema estremamente difficile da risolvere. Durante questo lavoro è stato possibile esaminare il funzionamento e le prestazioni di strumenti che implementano algoritmi per la rivelazione di anomalie: nonostante si tratti di prototipi di ricerca con possibilità di miglioramento effettivo i modelli sviluppati in questo ambito hanno mostrato buoni risultati anche presentando volutamente un’architettura molto semplice. Da questo emerge la conclusione che, in base all’analisi effettuata, la realizzazione di un sistema del genere riesce ad individuare in modo corretto la presenza di anomalie nel consumo energetico.
63
APPENDICE A:
Rivelazione di anomalie nel
traffico su Internet Il lavori di tesi descritto in questo elaborato prende spunto dalle tecniche e strategie utilizzate per la rivelazione di anomalie nel traffico su Internet. A tale scopo è di fondamentale importanza una corretta analisi che determini come il traffico di pacchetti si muove attraverso la rete, Traffic Engineering, e quali sono i links sui quali si riscontra un traffico inusuale, Anomaly Detection, che devono essere modificati [18.]; si potrebbero implementare delle politiche reattive tali da bloccare subito il traffico sospetto non appena si rilevino delle discrepanze fra il profilo concordato con il cliente e il suo effettivo utilizzo della rete [19.]. Le anomalie che si riscontrano nel traffico sono caratterizzate da rilevanti cambiamenti nel normale comportamento della rete, che possono essere maliziosi, come quelli causati da attacchi, dall’ uso abusivo della rete, dalla propagazione di worms o virus, oppure involontari, causati per esempio da fallimenti, da flash crowds, da una configurazione errata dei routers [20.]. Un’accurata classificazione del traffico è di fondamentale importanza per numerose attività della rete, dal monitoraggio alla sicurezza, dalla Quality of Service all’Intrusion Detection, e può essere basata sull’analisi del numero di porta al quale il client accede per richiedere il servizio oppure sfruttando le caratteristiche che distinguono le applicazioni quando comunicano sulla rete. Un buon classificatore dovrebbe avere uno schema che definisca le categorie in cui si vuole classificare il traffico e che aiuti a raggruppare le applicazioni che svolgono lo stesso compito in classi e dovrebbe “individuare quali sono le caratteristiche che permettono di discriminare le classi l’una dall’altra” [19.]. Anomaly detection è una grande e complessa area di ricerca, alla quale ancora non si riesce a dare un unico approccio con il quale affrontare e risolvere il problema. [21.] Le anomalie sono definite come inusuali e significanti cambiamenti nei livelli di traffico della rete ed è per questo che per identificarle è necessario conoscere il normale comportamento di una rete. Il diagnosticare anomalie è un problema sia per gli operatori della rete sia per l’utente finale perché significa interpretare un comportamento anomalo in una grande quantità di dati high-dimensional e rumorosi e perché possono essere di varie forme e provenire da una infinite cause. Risulta però fondamentale analizzare le anomalie perché possono creare congestioni nella rete e avere un drammatico impatto sull’utente finale. Gli approcci usati per scoprire le anomalie dipendono dalla natura dei dati disponibili per l’analisi ottenuti a vari livelli di granulosità e che possono essere [21.]: 64
1. end-user-based information : si riferiscono ai protocolli TCP e UDP relativi ai dati che contengono informazioni specifiche per l’applicazione finale; 2. network-based data : sono pertinenti alla funzionalità dei dispositivi della rete e includono informazioni raccolte dalle interfacce fisiche dei routers. NETWORK ANOMALIES Alle anomalie presenti nella rete ci si riferisce solitamente nelle circostanze in cui le operazioni della rete si discostano dal comportamento normale. Le cause per cui si presentano queste anomalie sono molteplici come il malfunzionamento dei dispositivi di rete, sovraccarico, attacchi DoS, intrusioni che interrompono la normale distribuzione di un servizio. Le anomalie della rete sono caratterizzate da transitori ed improvvisi cambiamenti nei dati misurati della rete che avvengono prima o durante un evento anomalo. La durata di questi cambiamenti varia con la natura della causa che ha dato il via all’evento. Un tipo di anomalia è relativa ai fallimenti della rete e ai problemi di prestazioni, come per esempio fallimenti dei file server (computer responsabili dell’immagazzinamento e della gestione dei files di dati così che altri computer nella stessa rete possano accedervi) nel caso di un elevato numero di richieste FTP, operazioni di paging (usate in caso di memoria virtuale, consiste nel trasferimento di pagine dentro e fuori la memoria in modo che l’informazione che si desidera sia reperibile il più velocemente possibile) attraverso la rete, congestioni transitorie.. Un altro tipo di anomalia è relativa al problema della sicurezza come nel caso di attacchi DoS che avvengono quando i servizi offerti da una rete sono “rubati” da entità maliziose o nel caso di intrusioni nella rete durante le quali le entità maliziose “rubano” larghezza di banda inondando la rete con traffico inutile [21.]. NETWORK DATA I tipi di anomalia che possono essere scoperti dipendono dalla natura dei dati che circolano sulla rete che, a tal proposito, sono analizzati in vari modi: − Network probes: strumento come ping o traceroute che può essere usato per ottenere parametri specifici (end-to-end delay o packet loss) e fornisce misure istantanee sul comportamento di una rete. − Packet filtering: i flussi di pacchetti sono campionati catturando l’intestazione IP di un certo numero di pacchetti in differenti punti della rete. Un flusso è identificato dall’indirizzo sorgente-destinazione e dal numero di porta sorgente-destinazione. 65
− Routing protocol: informazioni riguardanti gli eventi sulla rete possono essere ottenute analizzando le tabelle di indirizzamento inviate attraverso i router e i dati in esse possono essere usati per costruire la topologia della rete e fornire lo stato dei link tra i nodi. − Network management protocol: fornisce statistiche riguardanti il traffico della rete monitorando le informazioni che circolano attraverso i router. Queste informazioni non forniscono direttamente una metrica di prestazioni del traffico ma possono essere usate per caratterizzare il comportamento della rete INTRUSION DETECTION SYSTEM (IDS) Le persone possono comunicare tra loro attraverso la rete senza nessun problema reale dovuto alla distanza. E’ però risaputo che l’intrusione di un utente malizioso e non autorizzato può recare gravi danni ad un intero sistema. La sicurezza delle reti di computer è un vero e proprio problema ed è importante sviluppare meccanismi per difendersi contro le intrusioni. Secondo Heady [22.] un’intrusione può essere definita come “un qualsiasi insieme di azioni che tentano di compromettere l’integrità, la confidenzialità o la disponibilità di risorse di informazioni”. L’identificazione di questo insieme di azioni maliziose è chiamata intrusion detection e i sistemi usati in questo ambito aiutano a mantenere sicure le reti che oltre ad essere minacciate da attacchi esterni, devono difendersi spesso anche da quelli interni. Queste reti spesso includono computer vulnerabili e offrono una grande larghezza di banda; questi sono i motivi per cui risultano essere interessanti agli occhi di chi intende attaccarle. L’obiettivo dell’attaccante non è la singola macchina, che il più delle volte contiene informazioni non importanti, ma sa che attraverso quella è possibile fare una scansione dell’intera rete ed iniziare, ad esempio, un attacco Denial of Service. Un sistema di Intrusion Detection conosciuto è il GrIDS [23.] che cerca di identificare worms costruendo i così detti activity graphs che rappresentano le connessioni di rete tra hosts e che sono usati per ricercare modelli predefiniti [24.]. Per intrusion detection si intende un insieme di tecniche che sono usate per identificare attacchi contro computer e reti [25.]. La valutazione dei sistemi usati in questo campo è un compito arduo per diverse ragioni: − è problematico usare dati di alta qualità per valutare le prestazioni a causa di problemi inerenti la privacy e la competitività, perché molte organizzazioni non sono disponibili a condividere le loro informazioni con altre istituzioni; 66
− anche se sono disponibili dati della vita reale, la classificazione delle connessioni di rete in normale e non, richiede una grande quantità di tempo; − il cambiamento costante nel traffico di rete non può introdurre solo nuovi tipi di intrusioni, ma può anche cambiare gli aspetti di un comportamento “normale”; − nella misurazione delle prestazioni di un IDS, vanno tenute in considerazione il detection rate (calcolato come la frazione tra il numero di attacchi scoperti correttamente e il numero totale di attacchi), il false alarm rate (calcolato come la frazione tra il numero di connessioni normali che sono classificate erroneamente come attacchi e il numero totale di connessioni normali), e il costo della classificazione; − alcuni attacchi, come Dos, possono usare centinaia di pacchetti di rete e connessioni. Generalmente sono previsti due tipi di attacchi: quello che riguarda una connessione singola per cui viene applicata un’analisi di attacco single-connection e quello che riguarda una connessione multipla (bursts of connections) per cui viene applicata un’analisi di attacco multiple-connection.
Fig.60: Passi eseguiti per valutare un intrusione [25.]
Entrambe le metodologie di analisi per prima cosa calcolano un valore di score necessario per associare una particolare connessione ad una intrusione. Per un dato traffico di rete in alcuni intervalli di tempo, è assegnato un valore di score, come mostrato in figura:
67
Fig.61: Assegnamento del valore di score [25.]
La linea rossa tratteggiata rappresenta la real attack curve che vale zero nel caso di connessioni di rete normali e vale uno per una connessione non normale. La linea verde continua corrisponde ad un predicted attack curve e per ogni connessione vale il valore dello score che le è stato assegnato. Queste due curve ci permettono di calcolare l’errore per ogni connessione come la differenza tra il valore reale della connessione (1 per connessioni con attacchi e 0 per connessioni normali) e lo score assegnato alla connessione. Questo approccio permette la valutazione di metriche aggiuntive come per esempio la superficie tra la curva del real attack e quella del predicted attack; più piccola sarà la superficie tra queste due curve e migliore sarà l’algoritmo di intrusion detection. [25.] Un dispositivo atto a rilevare attività anomale sulle reti o sui sistemi informatici può agire o sulla base di conoscenze acquisite durante attacchi precedenti (signatures) o in base all’osservazione dei comportamenti di sistemi o di utenti che risultano essere differenti da quelli abituali. I metodi esistenti di intrusion detection si possono quindi suddividere in due categorie principali [26.]: 1. signature recognition techniques o misuse detection systems : le signature di eventi conosciuti sono immagazzinati e gli eventi sono monitorati al fine di trovare una correlazione con le signature conservate. Queste tecniche segnalano un attacco quando si trova una corrispondenza. Naturalmente in questi casi è richiesta una signature per ogni attacco e non è possibile trovare nuovi attacchi al di fuori di quelli già conosciuti. La loro efficacia dipende dall’attendibilità del database. 2. anomaly detection systems (ADS) : costruisce modelli di dati “normali” e identifica nei dati osservati qualsiasi tipo di scostamento dal modello normale. Gli algoritmi usati in questo campo hanno il vantaggio di poter scoprire nuovi tipi di intrusioni grazie agli scostamenti dal normale comportamento che si manifestano [10]. Dato 68
quindi un insieme di dati “normali” e un dato usato per il test, l’obiettivo è quello di determinare se il dato di test appartiene o no ad un comportamento normale. Gli schemi usati però soffrono di un alto false alarms rate. Un IDS può rilevare un attacco sia quando è ancora in corso (real time), generando immediatamente degli alert, sia quando è già avvenuta un’intrusione (off-line), analizzando periodicamente dei log in cui sono registrati gli eventi passati, ma in questo caso il risultato non è istantaneo. Gli elementi architetturali che accomunano i diversi tipi di IDS consistono nelle loro tre componenti fondamentali: − i sensori (event generator): raccolgono i dati provenienti dai vari sistemi e li inoltrano all’analizzatore; − l’analizzatore (analysis engine): decide se i dati ricevuti corrispondono effettivamente ad un attacco, e può indicare gli eventuali provvedimenti da prendere; − l’interfaccia utente (response unit): permette il controllo dello stato del sistema da parte dell’amministratore.
Fig.62: Componenti fondamentali di un IDS [57]
Gli IDS, anche se tutti caratterizzati dalle tre componenti fondamentali viste, possono variare molto fra loro a seconda dei dati da essi esaminati e generati. E’ possibile infatti suddividerli nelle seguenti categorie [57]: − application-based IDS: analizzano il comportamento di un programma applicativo;
69
− host-based IDS (HIDS): analizzano dati provenienti da application-based IDS relativi ad un host, dal quale dipendono strettamente, soprattutto in relazione al sistema operativo. Lavorano fuori linea in modalità anomaly detection; − network-based IDS (NIDS): analizzano il traffico di rete alla ricerca di tracce di attacchi nei pacchetti IP, accedendo anche ai dati generati dagli host-based IDS e dagli application-based IDS appartenenti alla rete da essi monitorata. Lavorano in tempo reale in modalità misuse detection, comportano perciò l’incapacità di reagire ad attacchi non ancora conosciuti, ed è inoltre facilmente aggirabile dal traffico criptato, del quale non può in alcun modo rilevare l’eventuale nocività; − multi-network-based IDS: si tratta, in realtà, di Incident Response Team (IRT), che ricevono dati da diversi siti di loro competenza e sono in grado di coordinarne la gestione. ANOMALY DETECTION SYSTEMS (ADS) La scoperta delle anomalie è un elemento chiave di intrusion detection nella quale le perturbazioni che avvengono durante il normale comportamento suggeriscono la presenza di intenzionali o non attacchi, fallimenti, difetti.. [25.] Ci sono molte tecniche che appartengono alla categoria dell’anomaly detection, alcune delle quali sono tecniche machine learning e altre statistical-based. Queste ultime usano proprietà statistiche di normali attività per costruire un profilo standard ed applicano test statistici per determinare se le attività osservate sono molto diverse dalla norma [26.]. Emran eYe [27.] hanno sviluppato un metodo di anomaly detection chiamata Canberra; il loro esperimento mostra che la loro tecnica ha buone prestazioni solo nel caso di attacchi che hanno luogo tutti insieme. Un’altra tecnica basata sul test di Hotelling [28.] è una metodoligia di controllo di qualità multivariate che costruisce un long-term profile di attività normali nei sistemi informativi e lo usa per scoprire anomalie. Ci sono anche tecniche basate sul concetto di outliers; Aggarwal e Yu discutono di una tecnica che trova questi outliers studiando il comportamento dei dataset [29.]. Molti dataset contengono una o più osservazioni inusuali che non sembrano appartenere allo schema di variabilità prodotto da altre osservazioni. Quando un’osservazione è differente dalla maggior parte dei dati o non è simile al modello di dati assunto, è considerato un outlier [26.]. Assumendo una distribuzione normale, ogni osservazione che risulta avere un valore standardizzato più grande di un valore assoluto è spesso identificato come outlier di un dataset. 70
Sviluppo di un ADS Nell’articolo [30.] si cerca di sviluppare uno strumento per l’anomaly detection in grado di identificare gli attacchi senza mantenere informazioni riguardanti lo stato del flusso o della connessione su un determinato nodo o link, come invece viene fatto nella maggior parte delle tecniche in circolazione. Questo strumento non tenta di identificare differenti tipi di attacchi o le loro derivazioni, ma verrà usato per indicare quando deve iniziare una più sofisticata tecnica di intrusion detection. L’ASD sviluppato usando l’ambiente MATLAB deriva dallo schema [26.] basato su dati SNMP ed è stato usato per l’identificazioni delle anomalie nella rete TNUN (Tunisian National University Network) in un periodo di 45 giorni. Tutte le tecniche di anomaly detection iniziano con la costruzione di un profilo per il “normale” comportamento della rete e poi evidenzia le deviazioni da tale profilo come possibili attacchi. Per valutare lo strumento sviluppato è necessario mantenere una traccia di dove le anomalie del traffico sono state identificate. E’ stata quindi realizzata una rete sperimentale consistente di due reti locali connesse da un router:
Fig.63: Rete sperimentale per la valutazione dello strumento ADS [30.]
Per la simulazione di un traffico normale, si è usato un genitore di traffico LANTRAFFIC [31.] che mantiene 16 connessioni bidirezionali TCP e UDP tra il computer “victim” e quello che genera il traffico. Sono stati inseriti altre due macchine per lanciare gli attacchi DoS usando tecniche di flooding e una ADS station per processare i dati SNMP provenienti dal router centrale. La valutazione dello strumento sviluppato segue le metriche generali e di per-attack presentate in [32.] da Lazarevic: 71
Real false alarm rate
Numero di false alarms diviso il numero totale delle osservazioni
Detection rate Precision
Numero di truthful alarms diviso il numero totale di osservazioni anomale reali. Numero di truthful alarms diviso il numero totale di alarms Fig.64: Metriche generali [32.]
Burst Detection Rate (bdr) Response Time (Trep)
Rapporto tra il numero totale delle osservazioni intrusive che hanno un valore di score più alto di una soglia e il numero totale di osservazioni intrusive reali Tempo trascorso tra l’inizio dell’attacco fino al momento in cui il valore di score raggiunge la soglia Fig.65: Metriche per-attack [32.]
72
APPENDICE B:
Software
Matlab
per
la
modellistica e l’analisi dei consumi domestici Il programma carica un file txt contenente le potenze degli elettrodomestici e una matrice con le probabilità di accensione. L’algoritmo legge e verifica le assegnazioni delle probabilità di tutti gli apparecchi e generando un grafico che rappresenta i livelli di consumo di energia elettrica di ogni elettrodomestico. Di seguito il codice esempio per determinare il consumo di alcuni elettrodomestici in una famiglia di 2 persone con il modello semplice: % Program UserProfile_2p clear n_ore=48; pot = textread('p1UserProfile_2p.txt','%d',11,'headerlines',1); pot = pot/1000; pot_luce=
pot(1);
pot_pc=
pot(3);
pot_tv=
pot(7);
…… % Luci-assegnazione probabilità for i=1:48, pr_luci(i,1:5)= textread('p1UserProfile_2p.txt','%d',5,'headerlines',i+3); end pr_luci=pr_luci/10; % verifica delle probabilità assegnate for i1=1:n_ore, a=0; for i2=1:5, a=a+pr_luci(floor((i1+1)/2),i2); end for i2=1:5, pr_luci(floor((i1+1)/2),i2)=pr_luci(floor((i1+1)/2),i2)/a; end end % Tv-assegnazione probabilità for i=1:48, pr_tv(i,1:3)= textread('p1UserProfile_2p.txt','%d',3,'headerlines',i+53); end pr_tv=pr_tv/10; 73
% verifica delle probabilità assegnate for i1=1:n_ore, a=0; for i2=1:3, a=a+pr_tv(floor((i1+1)/2),i2); end for i2=1:3, pr_tv(floor((i1+1)/2),i2)=pr_tv(floor((i1+1)/2),i2)/a; end end % Pc-assegnazione probabilità for i=1:48, pr_pc(i,1:2)= textread('p1UserProfile_2p.txt','%d',2,'headerlines',i+103); end pr_pc=pr_pc/10; % verifica delle probabilità assegnate for i1=1:n_ore, a=0; for i2=1:2, a=a+pr_pc(floor((i1+1)/2),i2); end for i2=1:2, pr_pc(floor((i1+1)/2),i2)=pr_pc(floor((i1+1)/2),i2)/a; end end ………
Un ciclo di 365 giorni crea un vettore di consumi energetici per ogni elettrodomestico e il relativo grafico: % UserConsumption_2p clear hold off load d1UserProfile_2p n_giorni = 365; luce_av
=zeros(1,n_ore);
pc_av
=zeros(1,n_ore);
tv_av
=zeros(1,n_ore);
……… tot
=zeros(n_giorni,n_ore);
% calcolo dei consumi for ii=1:n_giorni; luce=zeros(1,n_ore); pc=zeros(1,n_ore); tv=zeros(1,n_ore); 74
……… totale=zeros(1,n_ore); for i1=1:n_ore, % Luci a=rand; pr=0; for i2=1:5, pr=pr_luci(floor((i1+1)/2),i2)+pr; if a
75
% Luci luce=luce_av/n_giorni;
% kwatt
luce_kWh_giorno=sum(luce); luce_kWh_anno=luce_kWh_giorno*365; luce_kWh_anno' 'attesa kWh/anno, luce: 270' % Televisione tv=tv_av/n_giorni;
% kwatt
tv_kWh_giorno=sum(tv); tv_kWh_anno=tv_kWh_giorno*365; tv_kWh_anno' 'attesa kWh/anno, due tv: 150' % Personal Computer pc=pc_av/n_giorni;
% kwatt
pc_kWh_giorno=sum(pc); pc_kWh_anno=pc_kWh_giorno*365; pc_kWh_anno' 'attesa kWh/anno, un pc: 100' ………
Di seguito il codice esempio per determinare il consumo del ferro da stiro in una famiglia di 2 persone con il modello di Markov: % Programma Markov per consumo ferro n_stati
= 7;
n_giorni = 365; n_ore
= 24;
totale
=zeros(n_giorni,n_ore);
ferro_av =zeros(1,n_ore); pr_ferro= 0; pot_ferro = 700/1000; P= [ 0.1 0.9 0
0
0
0
0
0.2 0
0.8 0
0
0
0
0.3 0
0
0.7 0
0
0
0.4 0
0
0
0.6 0
0
0.5 0
0
0
0
0.5 0
0.6 0
0
0
0
0
0.4
0.8 0
0
0
0
0
0.2
];
76
% si parte da uno stato qualsiasi w0=[0 0 0 1 0 0 0]; % determini la percentuale di passaggio negli stati for i=1:15, w=w*P; end wr=w; % determino stato iniziale r=rand; a=0; for i=1:n_stati a=a+wr(i); if r<=a, break; end end s=i % calcolo stato al passo generico matt/pom for k=1:n_giorni, ferro=zeros(1,n_ore); r=rand; a=0; for i=1:n_stati a=a+P(s,i); if r<=a, break; end end pr_ferro = P(s,i); s=i; if s==1, 'faccio ferro' r2=rand; ora_inizio_mattina=floor(rand*3*2)+20; %dalle 10.00 alle 13.00 ora_inizio_pomeriggio=floor(rand*3*2)+34; %dalle 17.00 alle 20.00 i2=0; pr=0; for i2=1:n_ore, pr=pr+pr_ferro; if r2<=pr, break, end end ferro(i2)=pot_ferro; % durata della ferro if r2>0.3, ferro(i2+1)=pot_ferro; 77
end totale(k,1:n_ore)=ferro; else 'riposo' end ferro_av=ferro_av+ferro; end % consumi ferro ferro=ferro_av/n_giorni; % kwatt ferro_kWh_giorno=sum(ferro) ferro_kWh_anno=ferro_kWh_giorno*365;
78
APPENDICE C:
Software
Matlab
per
la
identificazione e la rivelazione di anomalie nei consumi domestici Il programma carica un file txt contenente i consumi annuali degli elettrodomestici. L’algoritmo analizza la curva di consumo giorno per giorno e l’approssima con un profilo costante a tratti. Di seguito il codice esempio per determinare l’approssimazione in una famiglia di 2 persone: % Program p1PieceConstApprox2p - (Piecewise Constant Approximation) clear load d0ConsumoTotale2p
%carica i consumi annuali rilevati
eps=0.4; n_giorno1=1; n_giorno2=364; for i_giorno=n_giorno1:n_giorno2, % prende curva consumo di un giorno specifico prof=tot_anno(i_giorno,1:n_ore); i_region=1; av_reg=prof(1); min_reg=prof(1); max_reg=prof(1); d_reg=max_reg-min_reg; l_reg=1; n_reg=1; for i=2:n_ore, min_reg1=min(min_reg,prof(i)); max_reg1=max(max_reg,prof(i)); d_reg1=max_reg1-min_reg1; if d_reg1
l_regv(n_reg)=l_reg; for i1=i-1:-1:i-l_reg, prof_av(i1)=av_reg; end av_reg=prof(i); min_reg=prof(i); max_reg=prof(i); d_reg=max_reg-min_reg; l_reg=1; n_reg=n_reg+1; end if i==n_ore, av_regv(n_reg)=av_reg; l_regv(n_reg)=l_reg; prof_av(i)=av_reg; end end i1=1; for k=1:n_reg, for i=i1:i1+l_regv(k), prof_rec(i)=av_regv(k); end i1=i; end plot(prof,'k') hold on axis([0 n_ore-1 0 5]) plot(prof_av,'r:') plot(prof_rec+0.05,'b') hold off for k=1:n_reg, la_regv(k)=l_regv(k).*av_regv(k); end [la_sort,i_la_sort]=sort(la_regv,'descend'); n_reg_max=10; nn=min(n_reg,n_reg_max); la(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_reg_max); l(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_reg_max); av(i_giorno-n_giorno1+1,1:n_reg_max)=zeros(1,n_reg_max); for i=1:nn, la(i_giorno-n_giorno1+1,i)=la_regv(i_la_sort(i)); 80
l(i_giorno-n_giorno1+1,i)=l_regv(i_la_sort(i)); av(i_giorno-n_giorno1+1,i)=av_regv(i_la_sort(i)); end end % fine loop sui giorni save d1PCA2p
Il file txt salvato è caricato dal programma successivo che calcola l’istogramma bidimensionale relativo ad un profilo di consumo giornaliero regolarizzato come costante a tratti. Di seguito il codice esempio per determinare l’istogramma annuale in una famiglia di 2 persone: % Program p2PCAistog2p load d1PCA2p istog_l_av=zeros(50,40); av_step = 4; for i1=1:n_user2-n_user1+1, for i2=1:nn, l_q=round(l(i1,i2))+1; av_q=round(av_step*av(i1,i2)+1); if l_q>48, l_q=48, end if av_q>40, av_q=40, end istog_l_av(l_q,av_q)=istog_l_av(l_q,av_q)+1; end end sum(sum(istog_l_av)); plot(sum(istog_l_av)+10,'k') hold on %figura totale figure mesh(istog_l_av) view(150,80) % figura zoomata della zona interessante figure mesh(istog_l_av(1:8,1:8)) view(150,80) save d2PCAistog2p
Gli istogramma creati per ciascuna famiglia o profilo sono caricati dal programma successivo e confrontati calcolando le auto- e le cross-correlazioni, le distanze euclidee, le auto- e le crosscorrelazioni normalizzate e le medie per rivelare le anomalie. Di seguito il codice esempio per determinare l’istogramma annuale in una famiglia di 2 persone: 81
% Program p3PCAistoMatch clear isto_l_av=zeros(2,50,40); corr_l_av=zeros(2,2); load d2PCAistog2p_01 for i1=1:50, for i2=1:40,isto_l_av(1,i1,i2)=istog_l_av(i1,i2); end end load d2PCAistog2p_02 for i1=1:50, for i2=1:40, isto_l_av(2,i1,i2)=istog_l_av(i1,i2); end end n1=50; n2=40; for ii=1:2, a=0; for i1=1:n1, for i2=1:n2, a=a+(i1-1)*(i2-1)/4*isto_l_av(ii,i1,i2); end end c_medio_istog(ii)=a/365; end c_medio_istog for i1=1:3, for i2=1:3, corr_l_av(i1,i2)= sum(sum(isto_l_av(i1,1:50,1:40).*isto_l_av(i2,1:50,1:40)))/50/40; ed_l_av(i1,i2)= sum(sum((isto_l_av(i1,1:50,1:40)-isto_l_av(i2,1:50,1:40)).^2))/50/40; end end for i1=1:3, for i2=1:3, ncorr_l_av(i1,i2)= corr_l_av(i1,i2)/sqrt(corr_l_av(i1,i1))/sqrt(corr_l_av(i2,i2)); end end corr_l_av ed_l_av ncorr_l_av
82
BIBLIOGRAFIA
[1.] www.pubbliservizi.it/content.asp?Subc=446&L=1&idMen=201, consumielettrici.altervista.org/tabelle.php [2.] http://www.enel.it/attivita/ambiente/energiaelettrica/ [3.] Progetto MICENE, Politecnico di Milano “Misure dei consumi di energia elettrica nel settore domestico” [4.] Enea Risparmio Lavatrice e Lavastoviglie. [5.] Wikipedia, Il Processo Markoviano, http://it.wikipedia.org/wiki/Processo_markoviano [6.] Wikipedia, Distanza Euclidea, http://it.wikipedia.org/wiki/Distanza_euclidea [7.] L. Grassetti, Dipartimento di Scienze Statistiche, Università di Udine, “L’analisi statistica multivariata applicata alle ricerche di mercato”
[8.] S.Calzoni, Calcolo dell’indice di sincronicità, “Indice di sincronizzazione di segnali numerici” [9.] http://ilcorrieredelweb.blogspot.com/search/label/ambiente, “Le proposte del WWF per abbattere le 'barriere' all'efficienza energetica”
[10.]
Rapporto annuale sul meccanismo dei titoli di efficienza energetica dell’ Autorità per l’energia elettrica e il gas.
[11.]
Maurizio Parenzan, Metodologie di analisi energetica ed exergetica per la predisposizione dei Piani Energetici Comunali.
[12.]
Wikipedia, Energia, http://it.wikipedia.org/wiki/Energia
[13.]
Gianvito Dongiovanni, Bilancio energetico della regione Puglia: luci ed ombre
[14.]
Wikipedia, Matlab, http://it.wikipedia.org/wiki/MATLAB
[15.]
http://www.repubblica.it/2008/10/sezioni/ambiente/clima-vertice-ue-2/italia-classifica/italia-classifica.html
[16.]
Wikipedia, Il Protocollo di Kyoto, http://it.wikipedia.org/wiki/Protocollo_di_Ky%C5%8Dto
[17.]
La domanda di energia in Italia nel primo trimestre 2008
[18.]
A. Lakhina, K. Papagiannaki, M. Crovella, C. Diot, E. D. Kolaczyk, and N. Taft. Structural Analysis of Network Traffic Flows. In ACM SIGMETRICS, New York, June 2004.
[19.]
V. Veglianti, Classificazione statistica del traffico IP a livello applicativo tramite Cluster Analysis, tesi di laurea, Università di Roma La Sapienza, Italia, 2006.
[20.]
K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of Manouba, Tunisia, 2004.
[21.]
M. Thottan, C. Ji, Anomaly Detection in IP Networks, IEEE Transaction on Signal Processing, Vol.51, n°8, August 2003
[22.]
R. Heady, G. Luger, A. Maccabe, and M. Servilla, The architecture of a network level intrusion detection system, Technical report, Computer Science Department, University of New Mexico, August 1990. 83
[23.]
Karl Levitt, Matt Bishop GrIDS design http://seclab.cs.ucdavis.edu/arpa/grids/design.html
[24.]
T. Toth and C. Kruegel. Connection-history based anomaly detection. In IEEE Workshop on Information Assurance and Security, 2002.
[25.]
A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava; A Comparative Study of Anomaly Detection Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data Mining; San Francisco; 2003.
[26.]
Mei-Ling Shyu, Shu-Ching Chen, K. Sarinnapakorn, and L. Chang: A Novel Anomaly Detection Scheme Based on Principal Component Classifier. In Proceedings of the IEEE Foundations and New Directions of Data Mining Workshop, in conjunction with the Third IEEE International Conference on Data Mining (ICDM’03), pp. 172-179, Melbourne, Florida, USA, 2003.
[27.]
S.M. Emran and N. Ye, Robustness of Canberra Metric in Computer Intrusion Detection, Proceedings of the 2001 IEEE Workshop on Information Assurance and Security, United States Military Academy, West Point, New York, June 5-6, 2001.
[28.]
N. Ye, S. M. Emran, Q. Chen, and S. Vilbert, Multivariate Statistical Analysis of Audit Trails for HostBased Intrusion Detection, IEEE Transactions on Computers, Vol. 51, No. 7, July 2002.
[29.]
C.C. Aggarwal and P.S. Yu, Outlier Detection for High Dimensional Data, Proceedings of the ACM SIGMOD Conference, Santa Barbara, California, May 21-24, 2001.
[30.]
K. Ramah, H. Ayari, F. Kamoun. Traffic Anomaly Detection and Characterization in the Tunisian National University Network. CRISTAL laboratory, École Nationale des Sciences de l’Informatique, University of Manouba, Tunisia, 2004.
[31.]
LANTRAFFIC : http://www.zti-telecom.com/
[32.]
A. Lazarevic, L. Eroz, V. Kumar, A. Ozgur and J. Srivastava. A Comparative Study of Anomaly Detection Schemes. In Network Intrusion Detection; Proceeding of Third SIAM International Conference on Data Mining; San Francisco; 2003.
[33.]
http://magazine.excite.it/news/14263/Poznan-conferenza-ed-esposizione-per-salvare-il-clima
[34.]
La Repubblica di Lunedì 15 settembre 2008
84
INDICE DELLE FIGURE Fig.1:
Emissioni di CO2 (milioni di tonnellate) [17.]...............................................................9
Fig.2: Fig.3: Fig.4: Fig.5: Fig.6: Fig.7: Fig.8: Fig.9: Fig.10: Fig.11: Fig.12: Fig.13: Fig.14: Fig.15: Fig.16: Fig.17: Fig.18: Fig.19: Fig.20: Fig.21: Fig.22: Fig.23: Fig.24: Fig.25: Fig.26: Fig.27: Fig.28: Fig.29: Fig.30: Fig.31: Fig.32: Fig.33: Fig.34: Fig.35: Fig.36: Fig.37: Fig.38: Fig.39: Fig.40: Fig.41: Fig.42: Fig.43: Fig.44: Fig.45: Fig.46: Fig.47: Fig.48:
Consumi di energia in fonti primarie (gennaio-marzo) [17.] .....................................10 Termovalorizzatore di Brescia (vista dalla A4) ...........................................................12 Consumo energetico 2006/2007 in una famiglia-campione.........................................15 Consumo in watt degli elettrodomestici .......................................................................18 Tabella di consumo medio giornaliero e annuo 2 persone ..........................................20 Consumo medio 2 persone con modello semplice ........................................................21 Tabella di consumo medio giornaliero e annuo 3 persone ..........................................22 Consumo medio 3 persone con modello semplice ........................................................22 Tabella di consumo medio giornaliero e annuo 4 persone ..........................................23 Consumo medio 4 persone con modello semplice ........................................................23 Markov famiglia-campione 2 persone..........................................................................25 Consumo medio 2 persone con modello di Markov .....................................................26 Markov famiglia-campione 3 persone..........................................................................26 Consumo medio 3 persone con modello di Markov .....................................................27 Markov famiglia-campione 4 persone..........................................................................27 Consumo medio 4 persone con modello di Markov .....................................................28 Profilo 1 famiglia-campione 2 persone ........................................................................29 Consumo medio profilo 1 per 2 persone ......................................................................29 Profilo 2 famiglia-campione 2 persone ........................................................................30 Consumo medio profilo 2 per 2 persone ......................................................................30 Profilo 1 famiglia-campione 3 persone ........................................................................31 Consumo medio profilo 1 per 3 persone ......................................................................31 Profilo 2 famiglia-campione 3 persone ........................................................................32 Consumo medio profilo 2 per 3 persone ......................................................................32 Profilo 1 famiglia-campione 4 persone ........................................................................33 Consumo medio profilo 1 per 4 persone ......................................................................33 Profilo 2 famiglia-campione 4 persone ........................................................................34 Consumo medio profilo 2 per 4 persone ......................................................................34 Statistiche giorni singoli per 2 persone........................................................................37 Statistiche giorni singoli per 3 persone........................................................................37 Statistiche giorni singoli per 4 persone........................................................................37 Statistiche giorni doppi per 2 persone..........................................................................38 Statistiche giorni doppi per 3 persone..........................................................................38 Statistiche giorni doppi per 4 persone..........................................................................38 Statistiche giorni tripli per 2 persone...........................................................................39 Statistiche giorni tripli per 3 persone...........................................................................39 Statistiche giorni tripli per 4 persone...........................................................................39 Esempio di Approssimazione costante a tratti .............................................................43 Approssimazione a tratti e istogramma 2 persone .......................................................47 Approssimazione a tratti e istogramma 3 persone .......................................................48 Approssimazione a tratti e istogramma 4 persone .......................................................48 Correlazione normalizzata prima prova ......................................................................49 Profili diversi per ogni famiglia-campione ..................................................................49 Medie degli istogrammi sul consumo giornaliero........................................................50 Correlazioni normalizzate seconda prova....................................................................51 Interfaccia Matlab ........................................................................................................52 Identificazione profilo totale 2 persone........................................................................53 85
Fig.49: Fig.50: Fig.51: Fig.52: Fig.53: Fig.54: Fig.55: Fig.56: Fig.57: Fig.58: Fig.59: Fig.60: Fig.61: Fig.62: Fig.63: Fig.64: Fig.65:
Identificazione profilo totale 3 persone........................................................................54 Identificazione profilo totale 4 persone........................................................................54 Identificazione profilo parziale 2 persone....................................................................55 Identificazione profilo parziale 3 persone....................................................................55 Identificazione profilo parziale 4 persone....................................................................55 Identificazione profilo 2 persone seconda prova .........................................................56 Identificazione profilo 3 persone seconda prova .........................................................57 Identificazione profilo 4 persone seconda prova .........................................................57 Soglie di identificazione profili totali prima prova ......................................................59 Soglie di identificazione profili parziali prima prova ..................................................60 Soglie di identificazione profili totali seconda prova...................................................61 Passi eseguiti per valutare un intrusione [25.] ............................................................67 Assegnamento del valore di score [25.] .......................................................................68 Componenti fondamentali di un IDS [57] ....................................................................69 Rete sperimentale per la valutazione dello strumento ADS [30.] ................................71 Metriche generali [32.] ................................................................................................72 Metriche per-attack [32.] .............................................................................................72
86
RINGRAZIAMENTI Ringrazio il Prof. Roberto Cusani per la fiducia, per la disponibilità e i consigli che mi ha dato riguardo l’organizzazione e la stesura della tesi, per la pazienza e la cura con cui mi ha guidata nelle varie fasi di sviluppo del progetto, trasmettendomi le sue conoscenze e fornendomi un ottimo esempio di serietà e di professionalità. I miei più sentiti ringraziamenti vanno alle persone che ho avuto modo di conoscere in questo importante periodo della mia vita e che mi hanno aiutato a crescere sia dal punto di vista intellettuale sia dal punto di vista umano. Ringrazio tutti i miei colleghi ed amici per l’appoggio e la comprensione dimostrati in tutti questi anni. Ringrazio Cristina, Davide e Valerio, i miei compagni di studio, per avermi costantemente incoraggiato e perché è grazie a voi e al tempo passato insieme a studiare durante questi anni che ho sempre trovato la forza di non arrendermi; vi ringrazio per la vostra amicizia. Ringrazio mia madre e la mia famiglia per avermi insegnato cosa significhi il sacrificio, per aver creduto sempre in me e per essermi stata vicina, soprattutto nei brutti periodi; per ultimo ma non per ordine di importanza, vorrei ringraziare Umberto che ha contribuito alla realizzazione di questo mio grande sogno standomi sempre accanto e credendo in me anche nei momenti di difficoltà. Ringrazio i membri di questa commissione d’esame per l’attenzione prestata all’elaborato.
87