Architetture dati su scala
Strutture di storage distribuite, formati efficienti per dataset volumosi, scelte tra data lake e data warehouse in funzione del caso d'uso.
Analisi di big data e AI applicata: dal flusso grezzo alla decisione basata su evidenza. Un percorso costruito su problemi concreti, non su esempi accademici.
Il programma si sviluppa in 4 moduli progressivi. Ogni modulo affronta un aspetto specifico della catena di analisi — dall'acquisizione dei dati grezzi alla validazione dei risultati del modello.
Le sessioni si tengono via videochiamata, con frequenza settimanale. Tra una sessione e l'altra vengono assegnati esercizi su dataset reali forniti dal cliente.
Strutture di storage distribuite, formati efficienti per dataset volumosi, scelte tra data lake e data warehouse in funzione del caso d'uso.
Pulizia, normalizzazione e trasformazione dei dati con strumenti come Apache Spark e dbt. Gestione delle anomalie e delle lacune nei dati storici.
Selezione del modello in funzione del problema: regressione, classificazione, clustering. Focus sull'interpretabilità e sul controllo degli errori sistematici.
Integrazione del modello in ambienti di produzione, gestione del drift dei dati nel tempo, strategie di re-training e alerting automatico.
Iscrivendoti ricevi via email le date dei nuovi cicli, le offerte riservate e una guida PDF sulla selezione degli strumenti di analisi per big data — inviata direttamente dopo la registrazione.
La guida copre 12 strumenti open source con tabella comparativa per volume dati, latenza e complessità di setup.
Nessuno spam. Disiscrizione in qualsiasi momento.
È necessaria una familiarità di base con strumenti di analisi dati come SQL o Python. Il programma non è pensato per chi parte da zero, ma per chi già lavora con i dati e vuole strutturare meglio il proprio approccio all'AI.
Ogni sessione si svolge da remoto tramite videochiamata. Il formato è adattato al caso specifico del cliente: analisi del problema, discussione di approcci tecnici e revisione di pipeline o modelli esistenti.
Sì, è possibile selezionare singoli moduli in base alle proprie esigenze. I moduli 3 e 4 richiedono tuttavia una base comune con i contenuti dei moduli 1 e 2, che può essere verificata con una sessione iniziale di assessment.
Gli esercizi vengono costruiti preferibilmente sui dati del cliente stesso, opportunamente anonimizzati. In alternativa vengono forniti dataset pubblici rappresentativi del settore di riferimento, scelti per complessità e volume adeguati agli obiettivi del modulo.