Scienza dei dati

Obiettivo: Nella società post-moderna siamo immersi in una costante e copiosa pioggia digitale di dati. Il valore di questi dati è nullo se essi non vengono efficacemente trattati al fine di trasformali in conoscenza. Il corso propone metodologie di rappresentazione, archiviazione, interrogazione, analisi e visualizzazioni di dati complessi, in particolare dati gerarchici e dati reticolari, senza tralasciare l'importanza delle corrispondenti strutture di dati nel contesto storico e umanistico.

Modalità didattica: Le lezioni saranno frontali più una parte di laboratorio. La parte di laboratorio è mirata all'acquisizione dei linguaggi e strumenti software mediante casi di studio.

Pre-requisiti: I pre-requisiti sono (tra parentesi i livelli richiesti):

Programma: Tra parentesi quadre i riferimenti bibliografici, tra parentesi tonde i riferimenti agli strumenti software:

  1. Introduzione all'infografica [T01]
  2. Dati gerarchici
    1. Storia [L14]
    2. Rappresentazione: XML [MS06]
    3. Archiviazione: basi di dati native per XML (BaseX)
    4. Interrogazione: XPath, XQuery e XQuery Full-Text [MS06] (BaseX)
    5. Visualizzazione [L14, BGLL13] (BaseX, igraph, Processing)
  3. Dati reticolari
    1. Storia [L11]
    2. Archiviazione: basi di dati native per grafi (Neo4J)
    3. Analisi: [N10] (R, igraph)
      1. misure di centralità
      2. misure di similarità
      3. rivelazione di comunità
      4. proprietà strutturali
    4. Visualizzazione [L11, BGLL13] (igraph, Processing)

Libri:

Software:

Materiale:

Dataset

Modalità di esame: L'esame consiste in una progetto e in una prova orale.