← Torna al blog
AI

Sfida tra AI per creare Expert Advisor: chi scrive il miglior EA su GOLD?

Sfida tra modelli AI per creare Expert Advisor su GOLD

Quando si parla di intelligenza artificiale applicata al trading automatico, prima o poi arriva sempre la stessa domanda: quale AI e' davvero piu' brava a creare un Expert Advisor?

Non intendo quale modello scrive la risposta piu' elegante, o quale spiega meglio una strategia in teoria. Intendo una cosa molto piu' concreta: quale modello riesce a partire da un prompt, proporre una logica di trading, scrivere codice MQL4 completo, farlo compilare e produrre un primo backtest leggibile.

Per rispondere in modo pratico ho fatto un esperimento: ho preso lo stesso prompt e l'ho dato a piu' modelli AI, chiedendo a ciascuno di creare un Expert Advisor trend following su XAUUSD, quindi GOLD. Poi ho compilato il codice, l'ho testato e ho confrontato i risultati.

L'obiettivo non era trovare il robot perfetto. Quello e' proprio il punto: non esiste una AI magica che prende un prompt generico e ti consegna una strategia da usare senza ragionare. L'obiettivo era capire come si comportano i diversi modelli quando vengono messi davanti a un compito tecnico reale.

Come ho impostato la sfida

Per rendere il confronto piu' pulito possibile ho usato una multichat, cosi' da inviare lo stesso prompt a piu' modelli e osservare le risposte una accanto all'altra. I modelli coinvolti erano tra quelli piu' citati quando si parla di codice e intelligenza artificiale: ChatGPT/Codex, Claude Opus, Gemini, Grok e DeepSeek.

La richiesta era chiara: comportarsi come quantitative trading system designer e programmatore MQL4 esperto, creare una strategia trend following su GOLD e scrivere il codice completo dell'Expert Advisor. Non una descrizione generica, non pseudocodice, non un esempio da finire a mano. Codice vero, da incollare in MetaEditor, compilare e backtestare.

Questo dettaglio e' importante. Se chiedi all'AI una strategia in modo vago, la stai gia' autorizzando a inventare troppo. Il modello riempira' i vuoti con assunzioni plausibili: magari scegliera' indicatori, parametri, stop loss e filtri senza dirtelo davvero. Alla fine potresti ritrovarti con un codice che sembra convincente, ma che non rappresenta una logica che hai deciso tu.

Nel prompt della sfida ho inserito vincoli precisi: GOLD, MQL4, strategia meccanica, long e short, codice completo, adatto al backtest. Ho anche specificato che il codice che non compila viene penalizzato. E nel trading automatico questo e' un criterio minimo: se un Expert Advisor non compila, non siamo ancora nemmeno arrivati al test.

La prima cosa interessante: molte risposte si assomigliano

Una delle prime cose che emerge guardando le risposte e' che diversi modelli propongono idee molto simili. In particolare, quasi tutti finiscono nella stessa famiglia: medie mobili, filtro di trend, ADX, ATR, breakout o trailing stop.

Da un lato non e' strano. Se chiedi una strategia trend following su GOLD, e' abbastanza naturale che un modello pensi a EMA veloci e lente, filtro direzionale, stop basato sulla volatilita' e uscita quando il trend si indebolisce.

Dall'altro lato, pero', questa somiglianza ci dice una cosa utile: l'AI tende spesso a produrre una risposta media, plausibile, vicina a quello che statisticamente ha visto piu' spesso associato a quel tipo di richiesta.

Plausibile, pero', non significa valida.

Una strategia puo' sembrare sensata sulla carta e poi comportarsi male nel backtest. Puo' compilare perfettamente e avere una logica troppo debole. Puo' usare indicatori giusti ma parametri poco adatti. Oppure puo' avere una gestione dell'uscita che rovina completamente il comportamento del sistema.

Per questo il test e' fondamentale. Non basta leggere il codice e dire "sembra buono". Bisogna compilarlo, provarlo, misurarlo e soprattutto capire cosa sta facendo.

Codice che compila non significa strategia buona

Alcuni modelli hanno prodotto codice che compilava subito. Questo e' gia' un punto a favore, perche' almeno la parte tecnica di base e' stata rispettata. Ma non bisogna confondere il codice compilabile con una strategia valida.

ChatGPT/Codex, ad esempio, ha proposto una logica abbastanza completa: EMA, canale di breakout, filtro ADX e gestione con ATR. Il codice compilava senza errori. Il problema e' che il backtest non ha mostrato un comportamento particolarmente interessante. C'era una partenza discreta, ma poi il finale non era convincente.

Claude Opus ha prodotto una logica simile, sempre dentro il mondo trend following, ma con una gestione piu' ordinata. Anche qui non parliamo di un risultato spettacolare, pero' nel confronto complessivo e' stato il modello piu' equilibrato.

Gemini ha proposto una strategia ancora piu' semplice: media mobile a 200 periodi, incrocio tra EMA e regole di uscita speculari. Anche in questo caso il codice compilava e il risultato era vicino agli altri, senza pero' creare una distanza enorme.

Il punto e' questo: la compilazione e' solo il primo filtro. Dopo devi guardare profit factor, drawdown, numero di trade, distribuzione delle operazioni, coerenza delle entrate e logica delle uscite. Se non fai questo passaggio, rischi di fermarti alla parte piu' superficiale del lavoro.

Perche' gli stop fissi possono diventare un problema

Una delle risposte meno convincenti e' stata quella basata su stop loss e take profit fissi. Su un mercato come GOLD questa scelta puo' essere fragile.

GOLD cambia molto regime di volatilita'. Un valore fisso in punti puo' avere senso in una fase e diventare totalmente inadatto in un'altra. Per una logica trend following, spesso e' piu' ragionevole ragionare con ATR, trailing stop o meccanismi che almeno provano ad adattarsi alla volatilita' corrente.

Questo non vuol dire che uno stop fisso sia sempre sbagliato. Vuol dire che va giustificato, testato e capito. Se un modello propone una soluzione troppo rigida, devi fermarti e chiederti se quella scelta ha davvero senso per il mercato e per il tipo di strategia.

Nel test, la strategia con stop e target fissi si e' comportata male. La curva era debole e il risultato non dava motivi per approfondire. Questo e' un ottimo esempio di come una soluzione possa sembrare ordinata nel codice, ma povera dal punto di vista della logica.

Il rischio di mescolare MQL4 e MQL5

La parte piu' problematica e' arrivata con DeepSeek. La strategia proposta aveva anche qualche spunto interessante, come l'uso di una deviazione dalla media mobile e il suggerimento di un timeframe. Il problema e' che il codice non compilava.

E non era solo un errore piccolo da correggere in due secondi. Il modello ha mescolato logiche e strutture piu' vicine a MQL5 dentro una richiesta esplicita per MQL4. Questo e' uno degli errori piu' comuni quando si usa l'AI per generare Expert Advisor.

MQL4 e MQL5 non sono la stessa cosa. Hanno differenze nella gestione degli ordini, delle posizioni, delle funzioni e degli indicatori. Se il modello li tratta come intercambiabili, puoi ottenere codice che sembra professionale ma che non funziona nel contesto corretto.

Ho chiesto una correzione, ma anche il secondo tentativo non era pulito. Alla fine e' servito intervenire a mano. In una sfida in cui il requisito e' creare codice completo e compilabile, questo pesa tantissimo.

Questa e' anche una lezione pratica: non basta scrivere nel prompt "crea un Expert Advisor". Devi specificare chiaramente se vuoi MQL4 o MQL5, e devi controllare che il codice generato rispetti davvero quella piattaforma.

La classifica finale va letta con intelligenza

Alla fine dell'esperimento, il modello piu' convincente e' stato Claude Opus, seguito da Gemini, poi ChatGPT/Codex, Grok e DeepSeek.

Pero' bisogna stare attenti a non trasformare questa classifica in una verita' assoluta. Questo e' un test su un prompt, un mercato, una famiglia di strategia e una piattaforma. Cambiando richiesta, tipo di logica o linguaggio, il risultato potrebbe cambiare.

La classifica e' utile per capire una tendenza, non per dichiarare un vincitore eterno.

Quello che emerge e' che alcuni modelli sono piu' affidabili nel produrre codice ordinato, altri sono piu' fragili, altri ancora possono spiegare bene ma inciampare sulla sintassi. E quando lavori sul trading automatico, questa differenza conta.

Perche' non stai chiedendo all'AI solo di scrivere un testo. Le stai chiedendo di produrre qualcosa che poi dovra' essere compilato, testato e interpretato. Se il codice e' fragile, tutto il lavoro successivo parte male.

L'AI non sostituisce la ricerca della strategia

La conclusione piu' importante dell'esperimento e' semplice: l'AI non e' autonoma. Non basta dirle "creami una strategia trend following su GOLD" e aspettarsi un sistema solido.

Allo stesso tempo, ignorarla sarebbe un errore. Mai come oggi puoi trasformare ore di lavoro tecnico in pochi minuti: scheletro dell'EA, input configurabili, funzioni, gestione ordini, log, correzioni, varianti. Tutto questo puo' essere accelerato molto.

Ma accelerare non significa delegare.

La ricerca resta tua. Il criterio resta tuo. La decisione su cosa testare, cosa scartare e cosa approfondire resta tua. L'AI puo' aiutarti a generare codice piu' velocemente, ma non puo' decidere al posto tuo se una logica ha davvero senso.

Se vuoi usarla bene, devi inserirla dentro un processo: idea, regole, prompt, codice, compilazione, backtest, lettura dei dati e revisione. Non e' spettacolare come dire "l'AI mi ha creato un bot", ma e' molto piu' vicino al lavoro reale.

Cosa imparare da questa sfida

La lezione non e' "usa sempre questo modello" o "non usare mai quell'altro". La lezione e' che il modello conta, ma conta ancora di piu' il modo in cui lo guidi.

Un buon prompt deve essere specifico. Deve dire mercato, timeframe, piattaforma, tipo di strategia, direzione operativa, gestione rischio e requisiti tecnici. Se chiedi MQL4, devi pretendere codice MQL4. Se chiedi MQL5, devi pretendere MQL5. E se il modello mescola le due cose, devi accorgertene.

Poi devi fare il lavoro che nessuna AI puo' eliminare: compilare, testare e leggere i risultati. Un backtest negativo non e' un fallimento se ti fa capire che la logica non merita tempo. Un codice che non compila non e' una tragedia se ti insegna a migliorare il prompt o a scegliere meglio il modello.

Il vantaggio vero dell'AI non e' creare strategie vincenti con un click. Il vantaggio e' aumentare la velocita' con cui puoi trasformare idee in prototipi testabili.

E nel trading automatico, questa differenza e' enorme. Perche' piu' velocemente riesci a passare da idea a test, piu' velocemente puoi capire cosa ha senso e cosa no.

L'AI puo' creare un Expert Advisor. Ma sei tu che devi capire se quell'Expert Advisor merita di essere portato avanti.