Microsoft MDASH: nuovo aggiornamento dal benchmark CyberGym
Microsoft MDASH: nuovo aggiornamento dal benchmark CyberGym
CyberGym, il benchmark di sicurezza AI su larga scala supportato dal Center for Responsible, Decentralized Intelligence della UC Berkeley, ha annunciato che MDASH di Microsoft è ora in cima alla classifica del settore, superando Mythos. L’aspetto più interessante riguarda l’approccio: MDASH è il primo servizio multi-modello incluso da CyberGym nel benchmark e si è subito posizionato al primo posto, davanti ai sistemi basati su un singolo modello.
Ecco perché è importante: il vecchio approccio alla sicurezza era una questione di numeri, più bug trovati, più CVE registrate, più rumore generato. Nell’era dell’AI, la vera domanda non è quanto si riesce a trovare, ma cosa si può dimostrare di davvero rilevante. MDASH è stato progettato proprio attorno a questo cambiamento.
Invece di affidare un singolo compito a un solo modello, MDASH utilizza oltre 100 agenti AI specializzati che si confrontano e mettono in discussione a vicenda. Alcuni cercano vulnerabilità. Altri discutono se le falle siano reali o effettivamente sfruttabili. Un ultimo gruppo prova attivamente a compromettere il sistema, costruendo gli input necessari a dimostrare che il bug esiste davvero. Nulla arriva agli ingegneri umani finché non supera questo processo di verifica. Il sistema si comporta meno come un software e più come una stanza piena dei migliori ricercatori di sicurezza al mondo che discutono in tempo reale alla velocità delle macchine.
Nel suo primo test su Windows, MDASH ha individuato 16 vulnerabilità precedentemente sconosciute — incluse quattro falle critiche che permettevano il controllo remoto del sistema — corrette nel Patch Tuesday di questo mese.
