macOS Universal binaries & Mach-O Format
Reading time: 13 minutes
tip
Učite i vežbajte AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Učite i vežbajte GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Podržite HackTricks
- Proverite planove pretplate!
- Pridružite se 💬 Discord grupi ili telegram grupi ili pratite nas na Twitteru 🐦 @hacktricks_live.
- Podelite hakerske trikove slanjem PR-ova na HackTricks i HackTricks Cloud github repozitorijume.
Osnovne informacije
Mac OS binarni fajlovi obično se kompajliraju kao univerzalni binarni fajlovi. Univerzalni binarni fajl može podržavati više arhitektura u istom fajlu.
Ovi binarni fajlovi prate Mach-O strukturu koja se u osnovi sastoji od:
- Header
- Load Commands
- Data
Fat Header
Pretražujte fajl sa: mdfind fat.h | grep -i mach-o | grep -E "fat.h$"
#define FAT_MAGIC 0xcafebabe
#define FAT_CIGAM 0xbebafeca /* NXSwapLong(FAT_MAGIC) */
struct fat_header {
uint32_t magic; /* FAT_MAGIC ili FAT_MAGIC_64 */
uint32_t nfat_arch; /* broj struktura koje slede */
};
struct fat_arch {
cpu_type_t cputype; /* specifikator cpu (int) */
cpu_subtype_t cpusubtype; /* specifikator mašine (int) */
uint32_t offset; /* pomeraj fajla do ovog objektnog fajla */
uint32_t size; /* veličina ovog objektnog fajla */
uint32_t align; /* poravnanje kao stepen od 2 */
};
Header ima magic bajtove praćene brojem arhitektura koje fajl sadrži (nfat_arch
) i svaka arhitektura će imati fat_arch
strukturu.
Proverite to sa:
% file /bin/ls
/bin/ls: Mach-O univerzalni binarni fajl sa 2 arhitekture: [x86_64:Mach-O 64-bit izvršni fajl x86_64] [arm64e:Mach-O 64-bit izvršni fajl arm64e]
/bin/ls (za arhitekturu x86_64): Mach-O 64-bit izvršni fajl x86_64
/bin/ls (za arhitekturu arm64e): Mach-O 64-bit izvršni fajl arm64e
% otool -f -v /bin/ls
Fat headers
fat_magic FAT_MAGIC
nfat_arch 2
arhitektura x86_64
cputype CPU_TYPE_X86_64
cpusubtype CPU_SUBTYPE_X86_64_ALL
capabilities 0x0
offset 16384
size 72896
align 2^14 (16384)
arhitektura arm64e
cputype CPU_TYPE_ARM64
cpusubtype CPU_SUBTYPE_ARM64E
capabilities PTR_AUTH_VERSION USERSPACE 0
offset 98304
size 88816
align 2^14 (16384)
ili koristeći Mach-O View alat:
.png)
Kao što možda mislite, obično univerzalni binarni fajl kompajliran za 2 arhitekture udvostručuje veličinu jednog kompajliranog za samo 1 arhitekturu.
Mach-O Header
Header sadrži osnovne informacije o fajlu, kao što su magic bajtovi koji ga identifikuju kao Mach-O fajl i informacije o ciljnoj arhitekturi. Možete ga pronaći u: mdfind loader.h | grep -i mach-o | grep -E "loader.h$"
#define MH_MAGIC 0xfeedface /* the mach magic number */
#define MH_CIGAM 0xcefaedfe /* NXSwapInt(MH_MAGIC) */
struct mach_header {
uint32_t magic; /* mach magic number identifier */
cpu_type_t cputype; /* cpu specifier (e.g. I386) */
cpu_subtype_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file (usage and alignment for the file) */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
};
#define MH_MAGIC_64 0xfeedfacf /* the 64-bit mach magic number */
#define MH_CIGAM_64 0xcffaedfe /* NXSwapInt(MH_MAGIC_64) */
struct mach_header_64 {
uint32_t magic; /* mach magic number identifier */
int32_t cputype; /* cpu specifier */
int32_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
uint32_t reserved; /* reserved */
};
Mach-O Tipovi Fajlova
Postoje različiti tipovi fajlova, možete ih pronaći definisane u izvoru koda, na primer ovde. Najvažniji su:
MH_OBJECT
: Relokabilni objekat fajl (intermedijarni proizvodi kompajlacije, još nisu izvršni).MH_EXECUTE
: Izvršni fajlovi.MH_FVMLIB
: Fiksni VM bibliotečki fajl.MH_CORE
: Dumpovi kodaMH_PRELOAD
: Preučitani izvršni fajl (više nije podržan u XNU)MH_DYLIB
: Dinamičke bibliotekeMH_DYLINKER
: Dinamički linkerMH_BUNDLE
: "Plugin fajlovi". Generisani korišćenjem -bundle u gcc i eksplicitno učitani od straneNSBundle
ilidlopen
.MH_DYSM
: Prateći.dSym
fajl (fajl sa simbolima za debagovanje).MH_KEXT_BUNDLE
: Ekstenzije jezgra.
# Checking the mac header of a binary
otool -arch arm64e -hv /bin/ls
Mach header
magic cputype cpusubtype caps filetype ncmds sizeofcmds flags
MH_MAGIC_64 ARM64 E USR00 EXECUTE 19 1728 NOUNDEFS DYLDLINK TWOLEVEL PIE
Ili korišćenjem Mach-O View:
.png)
Mach-O Zastavice
Izvorni kod takođe definiše nekoliko zastavica korisnih za učitavanje biblioteka:
MH_NOUNDEFS
: Nema neodređenih referenci (potpuno povezano)MH_DYLDLINK
: Dyld povezivanjeMH_PREBOUND
: Dinamičke reference su unapred povezane.MH_SPLIT_SEGS
: Datoteka deli r/o i r/w segmente.MH_WEAK_DEFINES
: Binarni fajl ima slabo definisane simboleMH_BINDS_TO_WEAK
: Binarni fajl koristi slabe simboleMH_ALLOW_STACK_EXECUTION
: Omogućava izvršavanje stekaMH_NO_REEXPORTED_DYLIBS
: Biblioteka nema LC_REEXPORT komandeMH_PIE
: Nezavisni izvršni fajlMH_HAS_TLV_DESCRIPTORS
: Postoji sekcija sa lokalnim promenljivama nitiMH_NO_HEAP_EXECUTION
: Nema izvršavanja za heap/podatkovne straniceMH_HAS_OBJC
: Binarni fajl ima oBject-C sekcijeMH_SIM_SUPPORT
: Podrška za simulatorMH_DYLIB_IN_CACHE
: Koristi se za dylibs/frameworks u kešu deljenih biblioteka.
Mach-O Učitavanje komandi
Raspored datoteke u memoriji je ovde specificiran, detaljno opisuje lokaciju tabele simbola, kontekst glavne niti na početku izvršavanja i potrebne deljene biblioteke. Uputstva su data dinamičkom učitaču (dyld) o procesu učitavanja binarnog fajla u memoriju.
Koristi load_command strukturu, definisanu u pomenutom loader.h
:
struct load_command {
uint32_t cmd; /* type of load command */
uint32_t cmdsize; /* total size of command in bytes */
};
Postoji oko 50 različitih tipova komandi za učitavanje koje sistem obrađuje na različite načine. Najčešći su: LC_SEGMENT_64
, LC_LOAD_DYLINKER
, LC_MAIN
, LC_LOAD_DYLIB
i LC_CODE_SIGNATURE
.
LC_SEGMENT/LC_SEGMENT_64
tip
U suštini, ovaj tip komande za učitavanje definiše kako učitati __TEXT (izvršni kod) i __DATA (podaci za proces) segmente prema offsetima navedenim u Data sekciji kada se binarni fajl izvršava.
Ove komande definišu segmente koji su mapirani u virtuelni memorijski prostor procesa kada se izvršava.
Postoje različiti tipovi segmenata, kao što je __TEXT segment, koji sadrži izvršni kod programa, i __DATA segment, koji sadrži podatke koje koristi proces. Ovi segmenti se nalaze u data sekciji Mach-O fajla.
Svaki segment može biti dalje podeljen na više sekcija. Struktura komande za učitavanje sadrži informacije o tim sekcijama unutar odgovarajućeg segmenta.
U zaglavlju prvo nalazite zaglavlje segmenta:
struct segment_command_64 { /* za 64-bitne arhitekture */
uint32_t cmd; /* LC_SEGMENT_64 */
uint32_t cmdsize; /* uključuje sizeof section_64 strukture */
char segname[16]; /* ime segmenta */
uint64_t vmaddr; /* memorijska adresa ovog segmenta */
uint64_t vmsize; /* memorijska veličina ovog segmenta */
uint64_t fileoff; /* offset u fajlu ovog segmenta */
uint64_t filesize; /* količina za mapiranje iz fajla */
int32_t maxprot; /* maksimalna VM zaštita */
int32_t initprot; /* inicijalna VM zaštita */
uint32_t nsects; /* broj sekcija u segmentu */
uint32_t flags; /* zastavice */
};
Primer zaglavlja segmenta:
.png)
Ovo zaglavlje definiše broj sekcija čija se zaglavlja pojavljuju nakon njega:
struct section_64 { /* for 64-bit architectures */
char sectname[16]; /* name of this section */
char segname[16]; /* segment this section goes in */
uint64_t addr; /* memory address of this section */
uint64_t size; /* size in bytes of this section */
uint32_t offset; /* file offset of this section */
uint32_t align; /* section alignment (power of 2) */
uint32_t reloff; /* file offset of relocation entries */
uint32_t nreloc; /* number of relocation entries */
uint32_t flags; /* flags (section type and attributes)*/
uint32_t reserved1; /* reserved (for offset or index) */
uint32_t reserved2; /* reserved (for count or sizeof) */
uint32_t reserved3; /* reserved */
};
Primer naslova sekcije:
.png)
Ako dodate offset sekcije (0x37DC) + offset gde arch počinje, u ovom slučaju 0x18000
--> 0x37DC + 0x18000 = 0x1B7DC
.png)
Takođe je moguće dobiti informacije o header-ima iz komandne linije sa:
otool -lv /bin/ls
Uobičajeni segmenti učitani ovim cmd:
__PAGEZERO
: Upravlja kernelom da mapira adresu nula tako da ne može biti čitana, pisana ili izvršena. Varijable maxprot i minprot u strukturi su postavljene na nulu da označe da nema prava za čitanje-pisanje-izvršavanje na ovoj stranici.- Ova alokacija je važna za ublažavanje ranjivosti dereferenciranja NULL pokazivača. To je zato što XNU primenjuje strogu stranicu nula koja osigurava da je prva stranica (samo prva) memorije nedostupna (osim u i386). Binarni fajl može ispuniti ove zahteve kreiranjem male __PAGEZERO (koristeći
-pagezero_size
) da pokrije prvih 4k i da ostatak 32-bitne memorije bude dostupan u korisničkom i kernel modu. __TEXT
: Sadrži izvršni kod sa pravima za čitanje i izvršavanje (bez mogućnosti pisanja). Uobičajeni delovi ovog segmenta:__text
: Kompajlirani binarni kod__const
: Konstantni podaci (samo za čitanje)__[c/u/os_log]string
: C, Unicode ili os log string konstante__stubs
i__stubs_helper
: Uključeni tokom procesa učitavanja dinamičke biblioteke__unwind_info
: Podaci o vraćanju steka.- Imajte na umu da je sav ovaj sadržaj potpisan, ali takođe označen kao izvršan (stvarajući više opcija za eksploataciju delova koji ne moraju nužno imati ovo pravo, poput delova posvećenih stringovima).
__DATA
: Sadrži podatke koji su čitljivi i pisljivi (bez izvršavanja).__got:
Globalna tabela ofseta__nl_symbol_ptr
: Nepasivan (vezan pri učitavanju) pokazivač simbola__la_symbol_ptr
: Pasivan (vezan pri korišćenju) pokazivač simbola__const
: Trebalo bi da budu podaci samo za čitanje (ne baš)__cfstring
: CoreFoundation stringovi__data
: Globalne promenljive (koje su inicijalizovane)__bss
: Staticke promenljive (koje nisu inicijalizovane)__objc_*
(__objc_classlist, __objc_protolist, itd): Informacije koje koristi Objective-C runtime__DATA_CONST
: __DATA.__const nije garantovano da bude konstantno (prava za pisanje), niti su drugi pokazivači i GOT. Ovaj segment čini__const
, neke inicijalizatore i GOT tabelu (jednom kada je rešena) samo za čitanje koristećimprotect
.__LINKEDIT
: Sadrži informacije za linker (dyld) kao što su, simbol, string i unosi tabele relokacije. To je generički kontejner za sadržaje koji nisu ni u__TEXT
ni u__DATA
, a njegov sadržaj je opisan u drugim komandama učitavanja.- dyld informacije: Rebase, Nepasivni/pasivni/slabi binding opkodi i informacije o izvozu
- Funkcije počinju: Tabela start adresa funkcija
- Podaci u kodu: Podaci ostrva u __text
- Tabela simbola: Simboli u binarnom
- Indirektna tabela simbola: Pokazivači/stub simboli
- Tabela stringova
- Potpis koda
__OBJC
: Sadrži informacije koje koristi Objective-C runtime. Iako se ove informacije mogu naći i u __DATA segmentu, unutar raznih __objc_* sekcija.__RESTRICT
: Segment bez sadržaja sa jednom sekcijom nazvanom__restrict
(takođe prazna) koja osigurava da kada se izvršava binarni fajl, ignoriše DYLD promenljive okruženja.
Kao što je bilo moguće videti u kodu, segmenti takođe podržavaju zastavice (iako se ne koriste često):
SG_HIGHVM
: Samo core (nije korišćeno)SG_FVMLIB
: Nije korišćenoSG_NORELOC
: Segment nema relokacijuSG_PROTECTED_VERSION_1
: Enkripcija. Koristi se na primer od strane Findera za enkripciju teksta__TEXT
segmenta.
LC_UNIXTHREAD/LC_MAIN
LC_MAIN
sadrži ulaznu tačku u atributu entryoff. Pri učitavanju, dyld jednostavno dodaje ovu vrednost na (u memoriji) bazu binarnog fajla, a zatim skače na ovu instrukciju da započne izvršavanje koda binarnog fajla.
LC_UNIXTHREAD
sadrži vrednosti koje registri moraju imati prilikom pokretanja glavne niti. Ovo je već zastarelo, ali dyld
ga i dalje koristi. Moguće je videti vrednosti registara postavljene ovim:
otool -l /usr/lib/dyld
[...]
Load command 13
cmd LC_UNIXTHREAD
cmdsize 288
flavor ARM_THREAD_STATE64
count ARM_THREAD_STATE64_COUNT
x0 0x0000000000000000 x1 0x0000000000000000 x2 0x0000000000000000
x3 0x0000000000000000 x4 0x0000000000000000 x5 0x0000000000000000
x6 0x0000000000000000 x7 0x0000000000000000 x8 0x0000000000000000
x9 0x0000000000000000 x10 0x0000000000000000 x11 0x0000000000000000
x12 0x0000000000000000 x13 0x0000000000000000 x14 0x0000000000000000
x15 0x0000000000000000 x16 0x0000000000000000 x17 0x0000000000000000
x18 0x0000000000000000 x19 0x0000000000000000 x20 0x0000000000000000
x21 0x0000000000000000 x22 0x0000000000000000 x23 0x0000000000000000
x24 0x0000000000000000 x25 0x0000000000000000 x26 0x0000000000000000
x27 0x0000000000000000 x28 0x0000000000000000 fp 0x0000000000000000
lr 0x0000000000000000 sp 0x0000000000000000 pc 0x0000000000004b70
cpsr 0x00000000
[...]
LC_CODE_SIGNATURE
Sadrži informacije o digitalnom potpisu Macho-O datoteke. Sadrži samo offset koji pokazuje na blob potpisa. Ovo je obično na samom kraju datoteke.
Međutim, možete pronaći neke informacije o ovoj sekciji u ovom blog postu i u ovom gistu.
LC_ENCRYPTION_INFO[_64]
Podrška za enkripciju binarnih datoteka. Međutim, naravno, ako napadač uspe da kompromituje proces, moći će da isprazni memoriju neenkriptovanu.
LC_LOAD_DYLINKER
Sadrži putanju do izvršne datoteke dinamičkog linkera koja mapira deljene biblioteke u adresni prostor procesa. Vrednost je uvek postavljena na /usr/lib/dyld
. Važno je napomenuti da se u macOS-u, dylib mapiranje dešava u korisničkom režimu, a ne u režimu jezgra.
LC_IDENT
Zastarjela, ali kada je konfigurisana da generiše dump-ove na paniku, Mach-O core dump se kreira i verzija jezgra se postavlja u LC_IDENT
komandi.
LC_UUID
Nasumični UUID. Koristan je za bilo šta direktno, ali XNU ga kešira sa ostatkom informacija o procesu. Može se koristiti u izveštajima o padu.
LC_DYLD_ENVIRONMENT
Omogućava da se navedu promenljive okruženja za dyld pre nego što se proces izvrši. Ovo može biti veoma opasno jer može omogućiti izvršavanje proizvoljnog koda unutar procesa, tako da se ova komanda učitavanja koristi samo u dyld build-u sa #define SUPPORT_LC_DYLD_ENVIRONMENT
i dodatno ograničava obradu samo na promenljive oblika DYLD_..._PATH
koje specificiraju putanje učitavanja.
LC_LOAD_DYLIB
Ova komanda učitavanja opisuje dinamičku biblioteku zavisnost koja naredjuje učitaču (dyld) da učita i poveže navedenu biblioteku. Postoji LC_LOAD_DYLIB
komanda učitavanja za svaku biblioteku koja je potrebna Mach-O binarnoj datoteci.
- Ova komanda učitavanja je struktura tipa
dylib_command
(koja sadrži strukturu dylib, opisujući stvarnu zavisnu dinamičku biblioteku):
struct dylib_command {
uint32_t cmd; /* LC_LOAD_{,WEAK_}DYLIB */
uint32_t cmdsize; /* includes pathname string */
struct dylib dylib; /* the library identification */
};
struct dylib {
union lc_str name; /* library's path name */
uint32_t timestamp; /* library's build time stamp */
uint32_t current_version; /* library's current version number */
uint32_t compatibility_version; /* library's compatibility vers number*/
};
Takođe možete dobiti ove informacije iz cli-a sa:
otool -L /bin/ls
/bin/ls:
/usr/lib/libutil.dylib (compatibility version 1.0.0, current version 1.0.0)
/usr/lib/libncurses.5.4.dylib (compatibility version 5.4.0, current version 5.4.0)
/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1319.0.0)
Neke potencijalne biblioteke povezane sa malverom su:
- DiskArbitration: Praćenje USB drajvova
- AVFoundation: Snimanje zvuka i videa
- CoreWLAN: Wifi skeniranja.
note
Mach-O binarni fajl može sadržati jednog ili više konstruktora, koji će biti izvršeni pre adrese navedene u LC_MAIN.
Offseti svih konstruktora se čuvaju u __mod_init_func sekciji __DATA_CONST segmenta.
Mach-O Podaci
U srži fajla se nalazi region podataka, koji se sastoji od nekoliko segmenata kako je definisano u regionu komandi za učitavanje. Različite sekcije podataka mogu biti smeštene unutar svakog segmenta, pri čemu svaka sekcija sadrži kod ili podatke specifične za tip.
tip
Podaci su u suštini deo koji sadrži sve informacije koje se učitavaju komandom za učitavanje LC_SEGMENTS_64
To uključuje:
- Tabela funkcija: Koja sadrži informacije o funkcijama programa.
- Tabela simbola: Koja sadrži informacije o spoljnim funkcijama koje koristi binarni fajl
- Takođe može sadržati interne funkcije, imena varijabli i još mnogo toga.
Da biste to proverili, možete koristiti Mach-O View alat:
.png)
Ili iz cli:
size -m /bin/ls
Objetive-C Zajedničke Sekcije
U __TEXT
segmentu (r-x):
__objc_classname
: Imena klasa (stringovi)__objc_methname
: Imena metoda (stringovi)__objc_methtype
: Tipovi metoda (stringovi)
U __DATA
segmentu (rw-):
__objc_classlist
: Pokazivači na sve Objetive-C klase__objc_nlclslist
: Pokazivači na Non-Lazy Objective-C klase__objc_catlist
: Pokazivač na Kategorije__objc_nlcatlist
: Pokazivač na Non-Lazy Kategorije__objc_protolist
: Lista protokola__objc_const
: Konstantni podaci__objc_imageinfo
,__objc_selrefs
,objc__protorefs
...
Swift
_swift_typeref
,_swift3_capture
,_swift3_assocty
,_swift3_types, _swift3_proto
,_swift3_fieldmd
,_swift3_builtin
,_swift3_reflstr
tip
Učite i vežbajte AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Učite i vežbajte GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Podržite HackTricks
- Proverite planove pretplate!
- Pridružite se 💬 Discord grupi ili telegram grupi ili pratite nas na Twitteru 🐦 @hacktricks_live.
- Podelite hakerske trikove slanjem PR-ova na HackTricks i HackTricks Cloud github repozitorijume.