giovedì 29 ottobre 2009

LA VALENZA SCIENTIFICA DELLA STATISTICA

In riferimento all’attendibilità dei dati statistici (da adesso in poi d.s.) e quindi della valenza scientifica della statistica, va rilevato che questa scienza, questa disciplina, questo strumento di ricerca, questo metodo di lavoro, ancora oggi rappresenta quanto di più appropriato ci possa essere per misurare, per rilevare, per elaborare, per interpretare e per rappresentare, i fenomeni oggetto di una qualsiasi osservazione in ambito sociale, economico e della ricerca scientifica in generale.

La principale motivazione di ciò è data dall’importanza dei d.s. in sé, che per la sua capacità di misurare, stimare e qualificare ciò che si sta osservando, viene riconosciuto universalmente valido; di conseguenza, la valenza scientifica della statistica poggia proprio sui d.s. che nel momento stesso in cui vengono rilevati, oltre ad esprimere una certezza di tipo empirico, offrono almeno altri due validi riferimenti scientifici che sono il riferimento temporale, ovvero il momento in cui è stato rilevato, ed il riferimento spaziale, ovvero il contesto, il luogo, in cui i d.s. sono stati rilevati.

Ciò malgrado, però, occorre tener presente che questo doppio riferimento spaziale e temporale dei d.s., nel momento in cui rappresentano il massimo della scientificità, al tempo stesso ne rappresentano anche il loro limite scientifico, e questo per almeno due aspetti:
- il primo, è dato dal fatto che i d.s. per definizione sono fermi, legati, a questo doppio riferimento temporale e spaziale, che li rendono statici rispetto alla quasi totalità dei fenomeni osservati che, per definizione, non sono statici, ma dinamici, evolutivi, e cioè che tendono a muoversi, e quindi a variare, sia nel tempo, sia nello spazio;
- il secondo aspetto, o per meglio dire il secondo limite dei d.s., sta nel fatto che un singolo dato, per effetto della sua caratteristica di staticità contrapposta alla caratteristica della dinamicità e della variabilità dei fenomeni osservati, quasi mai riesce a rappresentare i fenomeni oggetto di osservazione.

Di questi aspetti/limiti ne sono ben consapevoli anche gli stessi studiosi ed esperti di statistica, che tentano di ovviare a questi inconvenienti in diversi modi, e cioè:
- utilizzare più d.s., in maniera da rappresentare al meglio l’evoluzione di un fenomeno, così come accade nelle serie statistiche temporali e spaziali;
- affiancare ai d.s. quantitativi i d.s. qualitativi, anche sotto forma di serie statistiche temporali e spaziali;
- rappresentare i fenomeni oggetto di osservazione attraverso più serie statistiche riferite a più variabili, cioè a più aspetti dello stesso fenomeno, per meglio individuare possibili relazioni di dipendenza, indipendenza ed interdipendenza tra queste variabili, e quindi per scoprire i possibili fattori che determinano un certo andamento o una certa evoluzione dei fenomeni nel tempo e nello spazio.

Un terzo aspetto, ovvero, un terzo limite rappresentato dai d.s. sarebbe l’enorme quantità di dati che servirebbero per analizzare i fenomeni oggetto di osservazione. Di questo aspetto, però, possiamo dire che tale problema appartiene per lo più al passato della statistica, perché oggi, grazie anche allo sviluppo dell’informatica, è possibile ovviare a questo inconveniente, ricorrendo al “data mining”, che è una scienza a metà tra l’informatica e la statistica, che oltre ad offrire una migliore gestione dei d.s. soprattutto in presenza di elevate quantità di dati, consente attraverso la rilevazione automatica e diretta dei dati in un grosso database chiamato datawarehouse, sia un maggior grado di precisione dei d.s., sia la possibilità che tutti i tipi di utenti, anche i non esperti di statistica, possano interrogare questo database ed ottenere non solo i dati statistici ma anche le elaborazioni e le informazioni di cui si può aver bisogno per analizzare e/o studiare un fenomeno.

Ciononostante, però, occorre rilevare che malgrado i progressi dell’informatica e delle ICT i d.s., sono fortemente condizionati nella loro rilevazione, elaborazione, interpretazione e rappresentazione, da fattori culturali come la sensibilità di chi rileva i dati, la sensibilità le conoscenze e le competenze di chi predispone gli strumenti e le metodologie di rilevazione, dalla tipologia degli strumenti scelti soprattutto per la rilevazione e l’elaborazione dei dati, dal background culturale degli operatori, analisti e studiosi, ed infine, dagli scopi e dalle finalità dalle organizzazioni che utilizzano i dati statistici.

Per questo, al fine di rendere universalmente validi i d.s. e la statistica in generale, è necessario non solo che i dati siano rilevati con precisione, che si evidenzi la metodologia di rilevazione, elaborazione, interpretazione e rappresentazione, che vengano posti in relazione con gli obiettivi della ricerca in sé e con gli obiettivi dell’organizzazione che se ne sta servendo, ma è altresì necessario che dati e statistiche vengano divulgati, che vengano discussi, che vengano anche confutati, e che in ultima istanza vengano condivisi da tutti.

Per questo, quindi, oggi la valenza scientifica di dati e statistiche in generale, non dipendono più soltanto dalla loro intrinseca scientificità, ma dipendono sempre più dal fatto che questi siano da tutti riconosciuti come validi a rappresentare un fenomeno.

Pietro Perrucci