Finora abbiamo utilizzato modelli generativi che, in risposta a una specifica richiesta dell’utente (prompt), offrono un output: un testo, un’immagine, una traccia audio e così via. Open Interpreter è un’implementazione open source, eseguita localmente, dell’interprete di codice di OpenAI. Abbiamo già visto cos’è ChatGPT Code Interpreter, una funzionalità riservata agli utenti paganti di OpenAI che consente all’intelligenza artificiale di eseguire codice sul cloud e di svolgere una vasta gamma di compiti, tra cui la generazione di grafici e mappe, la risoluzione di problemi matematici, l’editing di file e molto altro.
Open Interpreter, invece, consente di eseguire il codice di programmazione generato dall’intelligenza artificiale, direttamente su un normale PC, una workstation o un server. Questo tipo di approccio si annuncia davvero rivoluzionario perché l’utente può chiedere al modello generativo, usando istruzioni in linguaggio naturale, di automatizzare attività, creare contenuti e svolgere operazioni che di norma richiederebbero molti passaggi e l’utilizzo di tanti strumenti.
L’obiettivo di Open Interpreter, come spiegato anche sul sito ufficiale, è quello di consentire ai modelli LLM (Large Language Model) di eseguire codice direttamente sul sistema dell’utente.
Mentre Code Interpreter, attualmente basato sul modello generativo GPT-4, offre l’opportunità di svolgere i compiti richiesti poggiando sull’infrastruttura di OpenAI e senza la possibilità di attingere ai dati memorizzati su sistemi locali, Open Interpreter è in grado di eseguire il codice nell’ambiente dell’utente, con accesso completo a Internet e nessuna restrizione in tempi di tempo e dimensioni dei file.
Viceversa, Code Interpreter è ospitato sui server di OpenAI, è chiuso e fortemente limitato: non ha accesso a Internet, dispone di un set limitato di pacchetti preinstallati e non permette di caricare ed elaborare file di dimensioni superiori a 100 MB. Il codice eseguito a runtime non può impiegare oltre 120 secondi per concludere tutte le sue elaborazioni: diversamente si otterrà un messaggio di errore.
A coloro che fossero scettici nel lasciare eseguire codice sul sistema locale, diciamo subito che Open Interpreter risponde esattamente alle richieste (prompt) degli utenti. Inoltre, prima di eseguire il codice, l’utente deve approvarlo specificamente. Inoltre, esiste una modalità sicura, per adesso in fase sperimentale, che consente di mitigare qualunque rischio. Al momento lo fa solamente dalla finestra del terminale ma, nel prossimo futuro, sarà possibile usare un’applicazione dedicata.
L’utente può ad esempio ordinare l’esecuzione dei comandi usando il linguaggio naturale in modo da sfruttare le capacità computazionali della macchina in uso. Open Interpreter può quindi creare e modificare foto, video, PDF, controllare un browser, analizzare grandi insiemi di dati e così via. Può anche generare applicazioni vere e proprie utilizzando linguaggi come Python, JavaScript, PHP e così via.
In questo video dimostrativo, si vede come Open Interpreter possa modificare le impostazioni del sistema, creare in pochi secondi un’applicazione che funga da timer, riassumere il contenuto di un documento, interagire con le app installate (come posta elettronica e calendario) per raccogliere informazioni e condividerle con altri utenti, trasformare tutti i documenti contenuti in una cartella in PDF e così via. Non c’è veramente limite a ciò che si può fare.
L’installazione di Open Interpreter avviene semplicemente tramite il comando seguente:
pip install open-interpreter
Ad installazione completata, è possibile interagire con Open Interpreter attraverso un’interfaccia simile a ChatGPT che fa perno sulla finestra del terminale: basta digitare interpreter
e impartire la propria richiesta, meglio se con una descrizione il più chiara e dettagliata possibile.
Per eseguire entrambi i comandi, è necessario avere Python e il gestore dei pacchetti pip installati sul sistema.
Il comportamento di Open Interpreter può essere attualmente personalizzato intervenendo sul file di configurazione config.yaml
. Utilizzando più configurazioni, è possibile fare in modo che Open Interpreter passi dall’una all’altra.
Oltre che dalla finestra del terminale, gli utenti possono sviluppare semplici app che acquisiscono in input il prompt da passare ad Open Interpreter. Ad esempio le seguenti semplici righe di codice Python, permettono di ottenere un grafico contenente le informazioni richieste e poi di avviare una chat interattiva:
import interpreter
interpreter.chat("Crea un grafico con l'andamento dei valori azionari di Apple e Meta") # Esegue il singolo comando indicato
interpreter.chat() # Avvia una chat interattiva
Tutte le informazioni sulla sintassi avanzata che Open Interpreter supporta, sono disponibili sul repository GitHub ufficiale.