Crypto Prices

Frontier AI-modeller visar mänsklig nivå av kapabilitet i smarta kontraktsutnyttjanden

december 2, 2025

AI-agenter och smarta kontraktsutnyttjanden

AI-agenter har uppnått en prestation som matchar skickliga mänskliga angripare i mer än hälften av de smarta kontraktsutnyttjanden som registrerades på stora blockkedjor under de senaste fem åren, enligt nya data som släpptes i måndags av Anthropic. Företaget utvärderade tio frontier-modeller, inklusive Llama 3, Sonnet 3.7, Opus 4, GPT-5 och DeepSeek V3, på en datamängd av 405 historiska smarta kontraktsutnyttjanden. Agenterna lyckades producera fungerande attacker mot 207 av dessa, vilket resulterade i totalt 550 miljoner dollar i simulerade stulna medel.

Automatiserade system och sårbarheter

Resultaten visar hur snabbt automatiserade system kan utnyttja sårbarheter och identifiera nya som utvecklare ännu inte har åtgärdat. Denna nya information är det senaste från utvecklaren av Claude AI. Förra månaden beskrev Anthropic hur kinesiska hackare använde Claude Code för att genomföra vad de kallade den första AI-drivna cyberattacken.

”AI används redan i ASPM-verktyg som Wiz Code och Apiiro, samt i standard SAST- och DAST-skannrar,” sa David Schwed, COO för SovereignAI, till Decrypt.

Schwed förklarade att de modellbaserade attackerna som beskrivs i rapporten skulle vara lätta att skala, eftersom många sårbarheter redan är offentligt kända genom Common Vulnerabilities and Exposures eller revisionsrapporter, vilket gör dem lärbara av AI-system och lätta att testa mot befintliga smarta kontrakt.

Kapabiliteter och testresultat

För att mäta nuvarande kapabiliteter plottade Anthropic varje modells totala utnyttjandeintäkter mot dess releasedatum, med fokus på de 34 kontrakt som utnyttjades efter mars 2025. ”Även om totala utnyttjandeintäkter är en ofullkomlig måttstock – eftersom några avvikande utnyttjanden dominerar den totala intäkten – framhäver vi det över attackframgångsgraden, eftersom angripare bryr sig om hur mycket pengar AI-agenter kan extrahera, inte antalet eller svårighetsgraden av de buggar de hittar,” skrev företaget.

Anthropic svarade inte omedelbart på förfrågningar om kommentar från Decrypt. Företaget uppgav att de testade agenterna på en zero-day datamängd av 2,849 kontrakt dragna från mer än 9,4 miljoner på Binance Smart Chain. De rapporterade att Claude Sonnet 4.5 och GPT-5 vardera upptäckte två oavslöjade brister som genererade 3,694 dollar i simulerat värde, med GPT-5 som uppnådde sitt resultat till en API-kostnad av 3,476 dollar.

Framsteg och säkerhetsåtgärder

Anthropic noterade att alla tester genomfördes i sandlådemiljöer som replikerade blockkedjor och inte på verkliga nätverk. Deras starkaste modell, Claude Opus 4.5, utnyttjade 17 av sårbarheterna efter mars 2025 och stod för 4,5 miljoner dollar av det totala simulerade värdet. Företaget kopplade förbättringar över modeller till framsteg inom verktygsanvändning, felåterställning och långsiktig uppgiftsutförande.

”AI kan också upptäcka dem givet en förståelse för hur ett smart kontrakt bör fungera och med detaljerade uppmaningar om hur man försöker kringgå logikkontroller i processen,” sa Schwed.

Anthropic framhöll att de kapabiliteter som möjliggör för agenter att utnyttja smarta kontrakt också gäller för andra typer av mjukvara, och att fallande kostnader kommer att krympa fönstret mellan distribution och utnyttjande. Företaget uppmanade utvecklare att integrera automatiserade verktyg i sina säkerhetsarbetsflöden så att defensiv användning kan avancera i samma takt som offensiv användning.

Slutsats

Trots Anthropics varning sa Schwed att utsikterna inte är helt negativa. ”Jag trycker alltid tillbaka mot domedagsprofetior och säger att med rätt kontroller, rigorös intern testning, tillsammans med realtidsövervakning och kretsbrytare, är de flesta av dessa undvikbara,” sa han. ”De goda aktörerna har samma tillgång till samma agenter. Så om de dåliga aktörerna kan hitta det, så kan de goda aktörerna också. Vi måste tänka och agera annorlunda.”

Senaste från Blog

FDIC föreslår regler för stablecoin-utgivare under GENIUS Act

Regleringsförslag för Stablecoin-utgivare Den tillförordnade ordföranden för U.S. Federal Deposit Insurance Corporation (FDIC), Travis Hill, meddelade i ett vittnesmål inför House Financial Services Committee att FDIC planerar att introducera sina första regleringsförslag