📊

Statistica Descrittiva

Jun 23, 2024

Statistica Descrittiva

Introduzione

  • Video dedicato alla statistica descrittiva, fondamentale per tecniche di analisi dei dati e organizzazione nelle aziende.
  • Playlist esplorativa della statistica, utile per chi lavora nel campo tecnologico e dell'intelligenza artificiale.
  • Focus sul ramo descrittivo della statistica, essenziale per raccogliere, organizzare e visualizzare i dati.

Tecniche di campionamento

  • Campionamento casuale semplice

    • Ogni unità ha la stessa probabilità di essere inclusa.
    • Pro: Rappresentativo, facile da implementare.
    • Contro: Difficile da realizzare porta a porta, rischio di bassa rappresentatività per certe zone.
  • Campionamento sistematico

    • Seleziona ogni k-esima unità in una lista ordinata della popolazione.
    • Pro: Distribuzione uniforme rispetto ad una variabile.
    • Contro: Rischio di bias se c'è una periodicità nella lista.
    • Esempio: Misurazione inquinamento aria ogni 6 ore.
  • Campionamento stratificato

    • Popolazione divisa in strati omogenei, campionamento all'interno di ciascuno strato.
    • Pro: Aumenta la precisione delle stime statistiche.
    • Contro: Richiede conoscenza preliminare della popolazione.
    • Esempio: Abitudini di acquisto suddivise per fasce di età.
  • Campionamento a grappolo

    • Divide la popolazione in gruppi (es. quartieri, scuole), campionamento interi gruppi.
    • Pro: Efficace in termini di tempo e costi.
    • Contro: Rischio di bias se i grappoli non sono rappresentativi.

Tabelle di frequenza

  • Riassumono dati categoriali e numerici mostrando quante volte ogni valore o categoria appare.
  • Frequenze assolute: Numero di volte che una categoria o valore si verifica.
  • Frequenze relative: Proporzione di ciascuna categoria rispetto al totale.
  • Frequenze cumulative: Somma delle frequenze assolute fino a una certa categoria.
  • Utili per riassumere i dati, individuare tendenze, creare visualizzazioni (istogrammi, grafici a barre, boxplot).

Definizioni statistiche fondamentali

  • Media: Somma dei valori divisa per il numero totale.
  • Mediana: Valore centrale di un insieme ordinato di dati.
  • Moda: Valore che appare più frequentemente.
  • Deviazione standard: Misura la dispersione dei dati rispetto alla media.
  • Varianza: Media delle deviazioni al quadrato dei valori dalla loro media.
  • Percentili: Valori sotto i quali cade una certa percentuale di osservazioni.
  • Outlier: Valori anomali che si discostano significativamente dalla media.

Principali grafici e diagrammi

  • Istogrammi
    • Visualizzano distribuzione di dati quantitativi, ogni barra rappresenta frequenza delle osservazioni.
  • Grafici a barre
    • Confrontano dati categoriali, possono essere verticali o orizzontali.
  • Grafici a torta
    • Rappresentano percentuali, non adatti se le categorie sono molte.
  • Diagrammi a dispersione (scatter plot)
    • Analizzano relazione tra due variabili quantitative, rappresentati da punti su un grafico.
  • Boxplot (diagramma scatola)
    • Riassumono la distribuzione di dati quantitativi, mostrano mediana, quartili e valori anomali.
    • Utili per visualizzare la dispersione e individuare outlier.