Hermes porta gli agenti AI direttamente sul desktop del computer

Hermes è un agente AI desktop che automatizza attività sul sistema operativo tramite comandi in linguaggio naturale.
Hermes porta gli agenti AI direttamente sul desktop del computer

La nuova frontiera degli assistenti AI non è nel cloud ma sul desktop.

Un progetto sperimentale chiamato Hermes introduce un approccio che sposta l’automazione direttamente sul computer dell’utente, con accesso a finestre, applicazioni e flussi di lavoro locali. Si inserisce nella fase più recente dell’evoluzione degli strumenti AI generalisti: tra il 2023 e il 2026 la diffusione dei modelli linguistici ha accelerato l’integrazione tra interfacce conversazionali e operazioni reali sui sistemi informatici.

Secondo analisi di settore, oltre il 60% degli strumenti AI emergenti nel 2026 include funzioni di automazione operativa oltre alla semplice generazione di testo.

Come funziona Ermes

Hermes è un desktop agent progettato per eseguire azioni direttamente sul sistema operativo, riducendo la necessità di intervento manuale. A differenza dei chatbot tradizionali, che operano in ambienti isolati e producono solo risposte testuali, questo tipo di agente interagisce con elementi grafici, applicazioni installate e processi in esecuzione.

L’interfaccia si basa su comandi in linguaggio naturale, tradotti in istruzioni operative tramite modelli linguistici integrati con moduli di controllo del sistema. Il funzionamento si fonda su un approccio basato su tool use: il modello non agisce direttamente sul sistema ma richiama funzioni specifiche come apertura di applicazioni, scrittura di file, navigazione tra directory e interazione con interfacce grafiche tramite automazione degli eventi di input. Un livello intermedio verifica la fattibilità dei comandi e gestisce l’accesso alle risorse del computer.

Uno degli aspetti più rilevanti riguarda la capacità di interagire con l’interfaccia grafica simulando azioni come clic, digitazione e navigazione tra finestre. Questo consente di estendere l’automazione anche a software legacy, dove non esistono API dedicate. In scenari complessi, l’agente può concatenare più operazioni: recupero di informazioni da un documento, trasferimento in un foglio di calcolo e successiva esportazione in un formato strutturato, gestendo ogni passaggio come parte di una sequenza logica costruita dinamicamente.

La presenza di un agente locale riduce la dipendenza da server remoti per alcune operazioni, ma introduce requisiti più elevati in termini di sicurezza e isolamento dei processi. L’accesso diretto al sistema operativo implica che l’agente possa potenzialmente modificare file, avviare programmi o interagire con dati sensibili. Per questo le implementazioni di questo tipo prevedono livelli di autorizzazione granulari e sistemi di conferma per le azioni critiche, con modalità di esecuzione controllata in cui l’agente propone un’azione e attende la conferma dell’utente prima di procedere.

Perché gli agenti desktop cambiano il software

Hermes si colloca in una fase in cui la distinzione tra software tradizionale e assistente intelligente diventa sempre meno netta.

L’emergere di strumenti di questo tipo si inserisce nella transizione verso modelli software in cui l’interazione non avviene più esclusivamente tramite interfacce statiche, ma attraverso richieste in linguaggio naturale. Questo cambia il modo in cui vengono progettate le applicazioni, che devono diventare interpretabili da sistemi esterni capaci di orchestrare operazioni complesse.

La tendenza osservata negli ultimi anni mostra una convergenza tra assistenti personali, automazione dei processi e strumenti di produttività. Gli agenti desktop rappresentano uno dei punti più avanzati di questa evoluzione: l’interfaccia non è più solo uno strumento di input, ma un punto di negoziazione tra intenzione umana ed esecuzione automatica.

Ti consigliamo anche

Link copiato negli appunti