Frontier AI-modeller visar mänsklig nivå av kapabilitet i smarta kontraktsutnyttjanden

AI-agenter och smarta kontraktsutnyttjanden

AI-agenter har uppnått en prestation som matchar skickliga mänskliga angripare i mer än hälften av de smarta kontraktsutnyttjanden som registrerades på stora blockkedjor under de senaste fem åren, enligt nya data som släpptes i måndags av Anthropic. Företaget utvärderade tio frontier-modeller, inklusive Llama 3, Sonnet 3.7, Opus 4, GPT-5 och DeepSeek V3, på en datamängd av 405 historiska smarta kontraktsutnyttjanden. Agenterna lyckades producera fungerande attacker mot 207 av dessa, vilket resulterade i totalt 550 miljoner dollar i simulerade stulna medel.

Automatiserade system och sårbarheter

Resultaten visar hur snabbt automatiserade system kan utnyttja sårbarheter och identifiera nya som utvecklare ännu inte har åtgärdat. Denna nya information är det senaste från utvecklaren av Claude AI. Förra månaden beskrev Anthropic hur kinesiska hackare använde Claude Code för att genomföra vad de kallade den första AI-drivna cyberattacken.

”AI används redan i ASPM-verktyg som Wiz Code och Apiiro, samt i standard SAST- och DAST-skannrar,” sa David Schwed, COO för SovereignAI, till Decrypt.

Schwed förklarade att de modellbaserade attackerna som beskrivs i rapporten skulle vara lätta att skala, eftersom många sårbarheter redan är offentligt kända genom Common Vulnerabilities and Exposures eller revisionsrapporter, vilket gör dem lärbara av AI-system och lätta att testa mot befintliga smarta kontrakt.

Kapabiliteter och testresultat

För att mäta nuvarande kapabiliteter plottade Anthropic varje modells totala utnyttjandeintäkter mot dess releasedatum, med fokus på de 34 kontrakt som utnyttjades efter mars 2025. ”Även om totala utnyttjandeintäkter är en ofullkomlig måttstock – eftersom några avvikande utnyttjanden dominerar den totala intäkten – framhäver vi det över attackframgångsgraden, eftersom angripare bryr sig om hur mycket pengar AI-agenter kan extrahera, inte antalet eller svårighetsgraden av de buggar de hittar,” skrev företaget.

Anthropic svarade inte omedelbart på förfrågningar om kommentar från Decrypt. Företaget uppgav att de testade agenterna på en zero-day datamängd av 2,849 kontrakt dragna från mer än 9,4 miljoner på Binance Smart Chain. De rapporterade att Claude Sonnet 4.5 och GPT-5 vardera upptäckte två oavslöjade brister som genererade 3,694 dollar i simulerat värde, med GPT-5 som uppnådde sitt resultat till en API-kostnad av 3,476 dollar.

Framsteg och säkerhetsåtgärder

Anthropic noterade att alla tester genomfördes i sandlådemiljöer som replikerade blockkedjor och inte på verkliga nätverk. Deras starkaste modell, Claude Opus 4.5, utnyttjade 17 av sårbarheterna efter mars 2025 och stod för 4,5 miljoner dollar av det totala simulerade värdet. Företaget kopplade förbättringar över modeller till framsteg inom verktygsanvändning, felåterställning och långsiktig uppgiftsutförande.

”AI kan också upptäcka dem givet en förståelse för hur ett smart kontrakt bör fungera och med detaljerade uppmaningar om hur man försöker kringgå logikkontroller i processen,” sa Schwed.

Anthropic framhöll att de kapabiliteter som möjliggör för agenter att utnyttja smarta kontrakt också gäller för andra typer av mjukvara, och att fallande kostnader kommer att krympa fönstret mellan distribution och utnyttjande. Företaget uppmanade utvecklare att integrera automatiserade verktyg i sina säkerhetsarbetsflöden så att defensiv användning kan avancera i samma takt som offensiv användning.

Slutsats

Trots Anthropics varning sa Schwed att utsikterna inte är helt negativa. ”Jag trycker alltid tillbaka mot domedagsprofetior och säger att med rätt kontroller, rigorös intern testning, tillsammans med realtidsövervakning och kretsbrytare, är de flesta av dessa undvikbara,” sa han. ”De goda aktörerna har samma tillgång till samma agenter. Så om de dåliga aktörerna kan hitta det, så kan de goda aktörerna också. Vi måste tänka och agera annorlunda.”

Relaterade inlägg

Senaste från Blog

Standard Chartered-stödda Anchorpoint planerar att lansera HKDAP-stablecoin: rapport

Lansering av HKDAP Anchorpoint, som stöds av Standard Chartered, förbereder sig för att lansera sin Hong Kong dollar-stablecoin, HKDAP. Enligt lokala medier förväntas ett gemensamt tillkännagivande innan slutet av juli. Rapporterna, som

Kryptovaluta kan erkännas i bolåneansökningar – U.Today

Förändring av kryptovaluta i bolåneansökningar Representanten Nancy Mace förnyar sin strävan att förändra hur amerikaners kryptovalutaformue behandlas i bolåneansökningar. I ett inlägg den 19 juli på Elon Musks sociala medienätverk X, hävdade

Kryptovaluta-svindlare använder falska polissamtal och Snapchat för att stjäla 5 miljoner pund – U.Today

Kryptovaluta-svindelring avslöjad En sofistikerad kryptovaluta-svindelring har avslöjats efter att ha stulit hela 5 miljoner pund i kryptovaluta över hela Storbritannien. Tre brottslingar, Anthony Ikenwe, Hamza Bashir och Kevin Nwamma, har dömts till

’90% chans’: Ripple CTO Emeritus varnar för imitationer på Instagram – U.Today

Varning från Ripple CTO Emeritus David Schwartz, Ripple CTO Emeritus, har utfärdat en ny varning till kryptosamhället angående den ökande förekomsten av bedrägerier genom imitation på sociala medier. Han varnade en användare

Ethereum-utvecklaren ConsenSys förnekar att användardata har komprometterats – U.Today

ConsenSys Bekräftar Säkerhetsåtgärder efter IT-incident Det ledande Ethereum-programvaruföretaget ConsenSys har bestämt förnekat rykten om att användardata eller medel har komprometterats efter att en IT-arbetare kopplad till Nordkorea tillfälligt fick tillgång till kärnkoden

US-domstol beslagtar XRP och Bitcoin-portföljer värda 8,3 miljoner dollar från cyberförhandlare – U.Today

Cybersäkerhetsindustrin i kris Cybersäkerhetsindustrin har ställts inför ett anmärkningsvärt fall där den professionella förhandlaren Angelo Martino, istället för att skydda företagsplånböcker, själv blev en arkitekt av hacker-lösenscheman. Den amerikanska distriktsdomstolen för södra

Sydkorea rapporterar 40 fall av manipulation på kryptomarknaden sedan 2024

Sydkoreanska Finansmyndigheters Utredningar av Kryptohandel Sydkoreanska finansmyndigheter har undersökt mer än 40 fall av orättvis kryptohandel under de första två åren av lagen om skydd för användare av virtuella tillgångar, enligt ordförande

Sydkorea riktar in sig på Dunamu efter Upbit-hacket när juridiska luckor framträder

Sydkoreas Finansinspektion inleder sanktionsprocess mot Dunamu Sydkoreas Finansinspektion har inlett en formell sanktionsprocess mot Dunamu, operatören av kryptovalutabörsen Upbit, på grund av det stora plånbrevsbrott som rapporterades i november 2025. Åtgärden följer

DOG Mode öppnar en ny front i Bitcoins styrkekamp

Introduktion av DOG Mode Bitcoin Ordinals-förespråkaren Leonidas har introducerat DOG Mode, en alternativ öppen källkod Bitcoin-klient som förändrar hur noder vidarebefordrar vissa giltiga transaktioner utan att ändra Bitcoins konsensusregler. Projektet lägger till

US-reglerare missar nyckeldatum för GENIUS Act när regler för stablecoin står stilla

Missad Deadline för GENIUS Act Amerikanska finansiella reglerare har missat deadline för GENIUS Act:s ettårsperiod för att slutföra viktiga regler för landets federala stablecoin-ramverk. Flera regler förblev på förslagstadiet när deadline den