AI-Assisted Fuzzing & Automated Vulnerability Discovery

Reading time: 6 minutes

tip

Leer en oefen AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Leer en oefen GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE) Leer en oefen Azure Hacking: HackTricks Training Azure Red Team Expert (AzRTE)

Ondersteun HackTricks

Kyk na die subskripsie planne!
Sluit aan by die 💬 Discord groep of die telegram groep of volg ons op Twitter 🐦 @hacktricks_live.
Deel hacking truuks deur PRs in te dien na die HackTricks en HackTricks Cloud github repos.

Oorsig

Groot-taalmodelle (LLMs) kan tradisionele kwesbaarheid-navorsingspype superlaai deur semanties ryk insette te genereer, grammatika's te ontwikkel, oor crash-data te redeneer, en selfs multi-fout patches voor te stel. Hierdie bladsy versamel die mees effektiewe patrone wat waargeneem is tydens DARPA se AI Cyber Challenge (AIxCC) eindronde en ander openbare navorsing.

Wat volg is nie 'n beskrywing van een spesifieke kompetisiestelsel nie, maar 'n abstraksie van die tegnieke sodat jy dit in jou eie werksvloei kan herproduseer.

1. LLM-gegenereerde Saad Insette

Tradisionele dekking-geleide fuzzers (AFL++, libFuzzer, Honggfuzz…) begin met 'n klein korpus van sade en muteer bytes blindelings. Wanneer die teikeninsetformaat kompleks is (SQL, URL's, persoonlike binêre protokolle) breek ewekansige mutasies gewoonlik die sintaksis voordat interessante takke bereik word.

LLMs kan hierdie bootstrap-probleem oplos deur saadgenerators uit te saai – kort skrifte wat sintaksis-korrekte maar sekuriteits-relevante insette lewer. Byvoorbeeld:

prompt

SYSTEM: You are a helpful security engineer.
USER:
Write a Python3 program that prints 200 unique SQL injection strings targeting common anti-pattern mistakes (missing quotes, numeric context, stacked queries).  Ensure length ≤ 256 bytes / string so they survive common length limits.

python

# gen_sqli_seeds.py (truncated)
PAYLOADS = [
"1 OR 1=1 -- ",
"' UNION SELECT NULL,NULL--",
"0; DROP TABLE users;--",
...
]
for p in PAYLOADS:
print(p)

Voer een keer uit en voer die uitvoer direk in die fuzzer se aanvanklike korpus in:

bash

python3 gen_sqli_seeds.py > seeds.txt
afl-fuzz -i seeds.txt -o findings/ -- ./target @@

Voordele:

Semantiese geldigheid → dieper dekking vroeg.
Her-genererbaar: pas die prompt aan om op XSS, pad traversering, binêre blobs, ens. te fokus.
Goedkoop (< 1 ¢ met GPT-3.5).

Wenke

Instrueer die model om te diversifiseer payload lengte en kodering (UTF-8, URL-gecodeer, UTF-16-LE) om oppervlakkige filters te omseil.
Vra vir 'n enkele self-onderhoudende skrip – vermy JSON-formatering probleme.

2. Grammatika-Evolusie Fuzzing

'n Meer kragtige variasie is om die LLM 'n grammatika te laat evolueer in plaas van konkrete sade. Die werksvloei (“Grammatika Ou” patroon) is:

Genereer 'n aanvanklike ANTLR/Peach/LibFuzzer grammatika via prompt.
Fuzz vir N minute en versamel dekking metrieke (kante / blokke getref).
Som onbedekte programareas op en voer die opsomming terug in die model:

prompt

Die vorige grammatika het 12 % van die programkante geaktiveer. Funksies wat nie bereik is nie: parse_auth, handle_upload. Voeg / wysig reëls om hierdie te dek.

Voeg die nuwe reëls saam, her-fuzz, herhaal.

Pseudo-kode skelet:

python

for epoch in range(MAX_EPOCHS):
grammar = llm.refine(grammar, feedback=coverage_stats)
save(grammar, f"grammar_{epoch}.txt")
coverage_stats = run_fuzzer(grammar)

Key points:

Hou 'n begroting – elke verfyning gebruik tokens.
Gebruik diff + patch instruksies sodat die model redigeer eerder as om te herskryf.
Stop wanneer Δcoverage < ε.

3. Agent-gebaseerde PoV (Exploit) Generasie

Nadat 'n crash gevind is, benodig jy steeds 'n bewys van kwesbaarheid (PoV) wat dit deterministies aktiveer.

'n Skaalbare benadering is om duisende liggewig agente (<process/thread/container/prisoner>) te genereer, elk wat 'n ander LLM (GPT-4, Claude, Mixtral) of temperatuurinstelling uitvoer.

Pyplyn:

Statiese/dinamiese analise produseer foutkandidatte (struktuur met crash PC, invoerskyf, sanitiser boodskap).
Orkestrator versprei kandidatte na agente.
Agent redeneerstappe: a. Reproduseer fout plaaslik met gdb + invoer. b. Stel minimale exploit payload voor. c. Valideer exploit in sandbox. As sukses → dien in.
Mislukte pogings word her-gekwoteer as nuwe sade vir dekking fuzzing (terugvoer lus).

Voordele:

Parallelisering verberg enkel-agent onbetroubaarheid.
Outomatiese afstemming van temperatuur / modelgrootte gebaseer op waargenome sukseskoers.

4. Gereguleerde Fuzzing met Fyn-afgestemde Kode Modelle

Fyn-afstem 'n oop-gewig model (bv. Llama-7B) op C/C++ bron gemerk met kwesbaarheidspatrone (heelgetal oorgang, buffer kopie, formaat string). Dan:

Voer statiese analise uit om funksielys + AST te verkry.
Stimuleer model: “Gee mutasiediktionêre inskrywings wat waarskynlik geheueveiligheid in funksie X sal breek”.
Voeg daardie tokens in 'n pasgemaakte AFL_CUSTOM_MUTATOR in.

Voorbeelduitset vir 'n sprintf wrapper:

{"pattern":"%99999999s"}
{"pattern":"AAAAAAAA....<1024>....%n"}

Empiries verkort dit die tyd tot 'n ineenstorting met >2× op werklike teikens.

5. AI-Geleide Patching Strategieë

5.1 Super Patches

Vra die model om te groepeer ineenstorting handtekeninge en 'n enkele patch voor te stel wat die algemene oorsaak verwyder. Dien een keer in, herstel verskeie foute → minder akkuraatheidstraffies in omgewings waar elke verkeerde patch punte kos.

Prompt skets:

Here are 10 stack traces + file snippets.  Identify the shared mistake and generate a unified diff fixing all occurrences.

5.2 Spekulatiewe Patchesverhouding

Implementeer 'n wagwoord waar bevestigde PoV-gesertifiseerde patches en spekulatiewe patches (geen PoV) op 'n 1:N verhouding tussenin geplaas word wat aangepas is volgens punte reëls (bv. 2 spekulatiewe : 1 bevestig). 'n Koste-model monitor straf teenoor punte en pas N self aan.

Om Dit Alles Saam Te Sit

'n Eind-tot-eind CRS (Cyber Reasoning System) kan die komponente soos volg verbind:

mermaid

graph TD
subgraph Discovery
A[LLM Seed/Grammar Gen] --> B[Fuzzer]
C[Fine-Tuned Model Dicts] --> B
end
B --> D[Crash DB]
D --> E[Agent PoV Gen]
E -->|valid PoV| PatchQueue
D -->|cluster| F[LLM Super-Patch]
PatchQueue --> G[Patch Submitter]

Verwysings

tip

Ondersteun HackTricks

Kyk na die subskripsie planne!
Sluit aan by die 💬 Discord groep of die telegram groep of volg ons op Twitter 🐦 @hacktricks_live.
Deel hacking truuks deur PRs in te dien na die HackTricks en HackTricks Cloud github repos.