Episodio

Semplificazione dell'analisi e della visualizzazione dei dati con strumenti di sviluppo e intelligenza artificiale | Giorno dell'analisi scientifica dei dati Python

con Nitya Narasimhan

Avere competenze di analisi e visualizzazione dei dati è sempre più importante nella nuova era dei modelli linguistici di grandi dimensioni e dell'intelligenza artificiale generativa. Ma in che modo uno sviluppatore non Python si occupa rapidamente degli strumenti e delle procedure consigliate necessarie per raggiungere gli obiettivi del progetto, senza avere il vantaggio di anni di esperienza python o di data science? Questo è il posto in cui gli strumenti di sviluppo giusti, con un po' di assistenza per l'intelligenza artificiale, possono essere utili.

In questo discorso si passerà dall'identificazione di un set di dati open source, all'analisi di informazioni dettagliate e alla visualizzazione dei risultati pertinenti, in 25 minuti, con solo un account GitHub e un endpoint OpenAI. Lungo il percorso, verrà illustrata una serie di strumenti di sviluppo che semplificano il percorso:

  • Aprire il set di dati: per ""analyze"" - da Kaggle, Hugging Face o Azure
  • Data Wrangler: to ""sanitize"" data - extension from Visual Studio Code
  • Jupyter Notebook: da "record"" al processo - per l'apprendimento trasferiscibile
  • GitHub Codespaces: per l'ambiente "pre-compilazione"- per un riutilizzo coerente
  • GitHub Copilot: per ""spiegare/correggere"" il codice - per l'apprendimento mirato con la Guida all'intelligenza artificiale
  • Microsoft LIDA: per "suggerire/creare"" obiettivi di visualizzazione- per creare un'intuizione con l'aiuto per l'intelligenza artificiale

La discussione include un repository associato che è possibile creare tramite fork, quindi sostituire con il proprio set di dati per estendere o sperimentare in un secondo momento. Al termine del discorso si dovrebbe avere un'idea di come è possibile passare dall'individuazione di un set di dati per ottenere alcune informazioni visive su di esso, usando gli strumenti esistenti con una piccola assistenza per l'intelligenza artificiale.

Capitoli

  • 00:00 - Semplificare l'analisi e la visualizzazione dei dati con strumenti di sviluppo e intelligenza artificiale
  • 00:29 - Segui
  • 00:54 - Introduzione - Sfide e obiettivi dell'analisi dei dati
  • 04:44 - GitHub Codespaces - Ambienti riutilizzabili
  • 08:32 - Jupyter Notebooks - Renderlo riproducibile
  • 11:18 - GitHub Copilot - Apprendimento assistito dall'intelligenza artificiale
  • 14:43 - Visual Studio Code - Estensioni per la produttività
  • 15:39 - Aprire set di dati - Data Wrangler
  • 19:15 - Resonsible AI Toolkit - Debug del modello per l'equità
  • 21:13 - Progetto LIDA - Intuizione e visualizzazione assistita dall'intelligenza artificiale
  • 25:24 - Azure AI Studio - Passaggio del paradigma alle operazioni LLM
  • 25:47 - Riepilogo - Domande e passaggi successivi

Connessione

  • Nitya Narasimhan | Twitter/X: @nitya

Sviluppatore
Python