macOS Universal binaries & Mach-O Format
Reading time: 14 minutes
tip
Jifunze na fanya mazoezi ya AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Jifunze na fanya mazoezi ya GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Support HackTricks
- Angalia mpango wa usajili!
- Jiunge na 💬 kikundi cha Discord au kikundi cha telegram au tufuatilie kwenye Twitter 🐦 @hacktricks_live.
- Shiriki mbinu za udukuzi kwa kuwasilisha PRs kwa HackTricks na HackTricks Cloud repos za github.
Basic Information
Mac OS binaries kawaida huandaliwa kama universal binaries. Universal binary inaweza kuunga mkono usanifu nyingi katika faili moja.
Binaries hizi zinafuata Mach-O structure ambayo kimsingi inajumuisha:
- Header
- Load Commands
- Data
Fat Header
Tafuta faili kwa: mdfind fat.h | grep -i mach-o | grep -E "fat.h$"
#define FAT_MAGIC 0xcafebabe
#define FAT_CIGAM 0xbebafeca /* NXSwapLong(FAT_MAGIC) */
struct fat_header {
uint32_t magic; /* FAT_MAGIC au FAT_MAGIC_64 */
uint32_t nfat_arch; /* idadi ya structs zinazofuata */
};
struct fat_arch {
cpu_type_t cputype; /* mwelekeo wa cpu (int) */
cpu_subtype_t cpusubtype; /* mwelekeo wa mashine (int) */
uint32_t offset; /* ofisi ya faili kwa faili hii ya kitu */
uint32_t size; /* ukubwa wa faili hii ya kitu */
uint32_t align; /* usawa kama nguvu ya 2 */
};
Header ina magic bytes ikifuatiwa na idadi ya archs faili inayo (nfat_arch
) na kila arch itakuwa na fat_arch
struct.
Angalia kwa:
% file /bin/ls
/bin/ls: Mach-O universal binary with 2 architectures: [x86_64:Mach-O 64-bit executable x86_64] [arm64e:Mach-O 64-bit executable arm64e]
/bin/ls (kwa usanifu x86_64): Mach-O 64-bit executable x86_64
/bin/ls (kwa usanifu arm64e): Mach-O 64-bit executable arm64e
% otool -f -v /bin/ls
Fat headers
fat_magic FAT_MAGIC
nfat_arch 2
architecture x86_64
cputype CPU_TYPE_X86_64
cpusubtype CPU_SUBTYPE_X86_64_ALL
capabilities 0x0
offset 16384
size 72896
align 2^14 (16384)
architecture arm64e
cputype CPU_TYPE_ARM64
cpusubtype CPU_SUBTYPE_ARM64E
capabilities PTR_AUTH_VERSION USERSPACE 0
offset 98304
size 88816
align 2^14 (16384)
au kwa kutumia zana ya Mach-O View:
Kama unavyoweza kufikiria, kawaida universal binary iliyoundwa kwa usanifu 2 inaongeza ukubwa wa moja iliyoundwa kwa usanifu 1 tu.
Mach-O Header
Header ina taarifa za msingi kuhusu faili, kama vile magic bytes kutambua kama faili ya Mach-O na taarifa kuhusu usanifu wa lengo. Unaweza kuipata katika: mdfind loader.h | grep -i mach-o | grep -E "loader.h$"
#define MH_MAGIC 0xfeedface /* the mach magic number */
#define MH_CIGAM 0xcefaedfe /* NXSwapInt(MH_MAGIC) */
struct mach_header {
uint32_t magic; /* mach magic number identifier */
cpu_type_t cputype; /* cpu specifier (e.g. I386) */
cpu_subtype_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file (usage and alignment for the file) */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
};
#define MH_MAGIC_64 0xfeedfacf /* the 64-bit mach magic number */
#define MH_CIGAM_64 0xcffaedfe /* NXSwapInt(MH_MAGIC_64) */
struct mach_header_64 {
uint32_t magic; /* mach magic number identifier */
int32_t cputype; /* cpu specifier */
int32_t cpusubtype; /* machine specifier */
uint32_t filetype; /* type of file */
uint32_t ncmds; /* number of load commands */
uint32_t sizeofcmds; /* the size of all the load commands */
uint32_t flags; /* flags */
uint32_t reserved; /* reserved */
};
Aina za Faili za Mach-O
Kuna aina tofauti za faili, unaweza kuziona zikifafanuliwa katika kanuni ya chanzo kwa mfano hapa. Aina muhimu zaidi ni:
MH_OBJECT
: Faili ya kitu inayoweza kuhamishwa (bidhaa za kati za uundaji, bado si executable).MH_EXECUTE
: Faili zinazoweza kutekelezwa.MH_FVMLIB
: Faili ya maktaba ya VM iliyowekwa.MH_CORE
: Mifumo ya KanuniMH_PRELOAD
: Faili ya executable iliyopakiwa mapema (haipati tena msaada katika XNU)MH_DYLIB
: Maktaba za KijadiMH_DYLINKER
: Kiunganishi KijadiMH_BUNDLE
: "Faili za Plugin". Zilizozalishwa kwa kutumia -bundle katika gcc na kupakiwa wazi naNSBundle
audlopen
.MH_DYSM
: Faili ya mshirika.dSym
(faili yenye alama za kutatua matatizo).MH_KEXT_BUNDLE
: Nyongeza za Kernel.
# Checking the mac header of a binary
otool -arch arm64e -hv /bin/ls
Mach header
magic cputype cpusubtype caps filetype ncmds sizeofcmds flags
MH_MAGIC_64 ARM64 E USR00 EXECUTE 19 1728 NOUNDEFS DYLDLINK TWOLEVEL PIE
Au kutumia Mach-O View:
Mach-O Flags
Msimbo wa chanzo pia unafafanua bendera kadhaa muhimu kwa ajili ya kupakia maktaba:
MH_NOUNDEFS
: Hakuna marejeo yasiyo na ufafanuzi (imeunganishwa kikamilifu)MH_DYLDLINK
: Kuunganisha DyldMH_PREBOUND
: Marejeo ya dinamik yanayofungwa mapema.MH_SPLIT_SEGS
: Faili inagawanya sehemu r/o na r/w.MH_WEAK_DEFINES
: Binary ina alama dhaifu zilizofafanuliwaMH_BINDS_TO_WEAK
: Binary inatumia alama dhaifuMH_ALLOW_STACK_EXECUTION
: Fanya stack iweze kutekelezwaMH_NO_REEXPORTED_DYLIBS
: Maktaba haina amri za LC_REEXPORTMH_PIE
: Mtendaji Huru wa NafasiMH_HAS_TLV_DESCRIPTORS
: Kuna sehemu yenye mabadiliko ya nyuzi za ndaniMH_NO_HEAP_EXECUTION
: Hakuna utekelezaji kwa kurasa za heap/dataMH_HAS_OBJC
: Binary ina sehemu za oBject-CMH_SIM_SUPPORT
: Msaada wa simulatorMH_DYLIB_IN_CACHE
: Inatumika kwenye dylibs/frameworks katika cache ya maktaba ya pamoja.
Mach-O Load commands
Muundo wa faili katika kumbukumbu umeelezwa hapa, ukifafanua mahali pa jedwali la alama, muktadha wa nyuzi kuu wakati wa kuanza utekelezaji, na maktaba zinazohitajika. Maagizo yanatolewa kwa mzigo wa dinamik (dyld) kuhusu mchakato wa kupakia binary katika kumbukumbu.
Inatumia muundo wa load_command, uliofafanuliwa katika loader.h
:
struct load_command {
uint32_t cmd; /* type of load command */
uint32_t cmdsize; /* total size of command in bytes */
};
Kuna aina aina 50 tofauti za amri za kupakia ambazo mfumo unashughulikia kwa njia tofauti. Aina za kawaida ni: LC_SEGMENT_64
, LC_LOAD_DYLINKER
, LC_MAIN
, LC_LOAD_DYLIB
, na LC_CODE_SIGNATURE
.
LC_SEGMENT/LC_SEGMENT_64
tip
Kimsingi, aina hii ya Amri ya Kupakia inaelezea jinsi ya kupakia __TEXT (kanuni inayotekelezeka) na __DATA (data kwa ajili ya mchakato) sehemu kulingana na offsets zilizoonyeshwa katika sehemu ya Data wakati binary inatekelezwa.
Amri hizi zinaelezea sehemu ambazo zinapangwa katika nafasi ya kumbukumbu ya virtual ya mchakato wakati inatekelezwa.
Kuna aina tofauti za sehemu, kama vile __TEXT sehemu, ambayo ina kanuni inayotekelezeka ya programu, na __DATA sehemu, ambayo ina data inayotumiwa na mchakato. Sehemu hizi ziko katika sehemu ya data ya faili la Mach-O.
Kila sehemu inaweza kugawanywa zaidi katika sehemu nyingi. Muundo wa amri ya kupakia una taarifa kuhusu sehemu hizi ndani ya sehemu husika.
Katika kichwa kwanza unapata kichwa cha sehemu:
struct segment_command_64 { /* for 64-bit architectures */
uint32_t cmd; /* LC_SEGMENT_64 */
uint32_t cmdsize; /* includes sizeof section_64 structs */
char segname[16]; /* segment name */
uint64_t vmaddr; /* memory address of this segment */
uint64_t vmsize; /* memory size of this segment */
uint64_t fileoff; /* file offset of this segment */
uint64_t filesize; /* amount to map from the file */
int32_t maxprot; /* maximum VM protection */
int32_t initprot; /* initial VM protection */
uint32_t nsects; /* number of sections in segment */
uint32_t flags; /* flags */
};
Mfano wa kichwa cha sehemu:
Kichwa hiki kinaelezea idadi ya sehemu ambazo vichwa vyao vinatokea baada yake:
struct section_64 { /* for 64-bit architectures */
char sectname[16]; /* name of this section */
char segname[16]; /* segment this section goes in */
uint64_t addr; /* memory address of this section */
uint64_t size; /* size in bytes of this section */
uint32_t offset; /* file offset of this section */
uint32_t align; /* section alignment (power of 2) */
uint32_t reloff; /* file offset of relocation entries */
uint32_t nreloc; /* number of relocation entries */
uint32_t flags; /* flags (section type and attributes)*/
uint32_t reserved1; /* reserved (for offset or index) */
uint32_t reserved2; /* reserved (for count or sizeof) */
uint32_t reserved3; /* reserved */
};
Mfano wa kichwa cha sehemu:
Ikiwa un ongeza sehemu ya ofseti (0x37DC) + ofseti ambapo arch inaanza, katika kesi hii 0x18000
--> 0x37DC + 0x18000 = 0x1B7DC
Pia inawezekana kupata habari za vichwa kutoka kwa mistari ya amri na:
otool -lv /bin/ls
Sehemu za kawaida zinazopakiwa na cmd hii:
__PAGEZERO
: Inamwambia kernel kuweka anwani sifuri ili haiwezi kusomwa, kuandikwa, au kutekelezwa. Vigezo vya maxprot na minprot katika muundo vimewekwa kuwa sifuri kuonyesha kuwa hakuna haki za kusoma-kuandika-kutekeleza kwenye ukurasa huu.- Usambazaji huu ni muhimu ili kupunguza hatari za dereference ya pointer ya NULL. Hii ni kwa sababu XNU inatekeleza ukurasa sifuri mgumu ambao unahakikisha ukurasa wa kwanza (tu wa kwanza) wa kumbukumbu haupatikani (isipokuwa katika i386). Binafsi inaweza kutimiza mahitaji haya kwa kutengeneza kidogo __PAGEZERO (kwa kutumia
-pagezero_size
) kufunika 4k za kwanza na kuwa na kumbukumbu ya 32bit iliyobaki inapatikana katika hali ya mtumiaji na kernel. __TEXT
: Inashikilia kanuni zinazotekelezwa zikiwa na ruhusa za kusoma na kutekeleza (hakuna ya kuandika). Sehemu za kawaida za segment hii:__text
: Kanuni ya binary iliyokusanywa__const
: Takwimu za kudumu (kusoma tu)__[c/u/os_log]string
: C, Unicode au os logs string constants__stubs
na__stubs_helper
: Zina ushirika wakati wa mchakato wa upakiaji wa maktaba ya dynamic__unwind_info
: Takwimu za kuondoa stack.- Kumbuka kwamba maudhui haya yote yameandikwa lakini pia yamewekwa kama yanayotekelezwa (kuunda chaguzi zaidi za unyakuzi wa sehemu ambazo hazihitaji ruhusa hii, kama sehemu za maandiko).
__DATA
: Inashikilia data ambayo ni inasomwa na inaandikwa (hakuna inayotekelezwa).__got:
Meza ya Uhamisho wa Kimataifa__nl_symbol_ptr
: Pointer ya alama isiyo lazi (bind wakati wa upakiaji)__la_symbol_ptr
: Pointer ya alama ya lazi (bind wakati wa matumizi)__const
: Inapaswa kuwa data ya kusoma tu (siyo kweli)__cfstring
: Mifumo ya CoreFoundation__data
: Vigezo vya kimataifa (ambavyo vimeanzishwa)__bss
: Vigezo vya kudumu (ambavyo havijaanzishwa)__objc_*
(__objc_classlist, __objc_protolist, nk): Taarifa inayotumiwa na wakati wa Objective-C__DATA_CONST
: __DATA.__const haikuhakikishiwa kuwa ya kudumu (ruhusa za kuandika), wala pointers nyingine na GOT. Sehemu hii inafanya__const
, baadhi ya waanzilishi na meza ya GOT (mara tu inapohakikishwa) kuwa ya kusoma tu kwa kutumiamprotect
.__LINKEDIT
: Inashikilia taarifa kwa linker (dyld) kama vile, alama, maandiko, na entries za meza ya uhamisho. Ni chombo cha jumla kwa maudhui ambayo hayapo katika__TEXT
au__DATA
na maudhui yake yanaelezewa katika amri nyingine za upakiaji.- taarifa za dyld: Rebase, Non-lazy/lazy/weak binding opcodes na taarifa za usafirishaji
- Kazi za kuanza: Meza ya anwani za kuanza za kazi
- Data Katika Kanuni: Visiwa vya data katika __text
- Meza ya Alama: Alama katika binary
- Meza ya Alama ya Kando: Pointer/stub symbols
- Meza ya Mwandiko
- Saini ya Kanuni
__OBJC
: Inashikilia taarifa inayotumiwa na wakati wa Objective-C. Ingawa taarifa hii inaweza pia kupatikana katika segment ya __DATA, ndani ya sehemu mbalimbali za __objc_*.__RESTRICT
: Sehemu isiyo na maudhui yenye sehemu moja inayoitwa__restrict
(pia tupu) ambayo inahakikisha kwamba wakati wa kuendesha binary, itapuuzilia mbali mabadiliko ya mazingira ya DYLD.
Kama ilivyokuwa inawezekana kuona katika kanuni, sehemu pia zinaunga mkono bendera (ingawa hazitumiki sana):
SG_HIGHVM
: Core tu (haijatumiwa)SG_FVMLIB
: HaijatumiwaSG_NORELOC
: Sehemu haina uhamishoSG_PROTECTED_VERSION_1
: Usimbuaji. Inatumika kwa mfano na Finder kusimbua sehemu ya maandiko__TEXT
.
LC_UNIXTHREAD/LC_MAIN
LC_MAIN
ina kiingilio katika sifa ya entryoff. Wakati wa upakiaji, dyld kwa urahisi inaongeza thamani hii kwenye (katika kumbukumbu) msingi wa binary, kisha inaenda kwenye maagizo haya kuanza kutekeleza kanuni ya binary.
LC_UNIXTHREAD
ina thamani ambazo register lazima iwe nazo wakati wa kuanzisha thread kuu. Hii tayari imeondolewa lakini dyld
bado inaitumia. Inawezekana kuona thamani za register zilizowekwa na hii kwa:
otool -l /usr/lib/dyld
[...]
Load command 13
cmd LC_UNIXTHREAD
cmdsize 288
flavor ARM_THREAD_STATE64
count ARM_THREAD_STATE64_COUNT
x0 0x0000000000000000 x1 0x0000000000000000 x2 0x0000000000000000
x3 0x0000000000000000 x4 0x0000000000000000 x5 0x0000000000000000
x6 0x0000000000000000 x7 0x0000000000000000 x8 0x0000000000000000
x9 0x0000000000000000 x10 0x0000000000000000 x11 0x0000000000000000
x12 0x0000000000000000 x13 0x0000000000000000 x14 0x0000000000000000
x15 0x0000000000000000 x16 0x0000000000000000 x17 0x0000000000000000
x18 0x0000000000000000 x19 0x0000000000000000 x20 0x0000000000000000
x21 0x0000000000000000 x22 0x0000000000000000 x23 0x0000000000000000
x24 0x0000000000000000 x25 0x0000000000000000 x26 0x0000000000000000
x27 0x0000000000000000 x28 0x0000000000000000 fp 0x0000000000000000
lr 0x0000000000000000 sp 0x0000000000000000 pc 0x0000000000004b70
cpsr 0x00000000
[...]
LC_CODE_SIGNATURE
Inashikilia taarifa kuhusu sahihi ya msimbo wa faili ya Macho-O. Inashikilia tu offset inayopointia signature blob. Hii kwa kawaida iko mwishoni mwa faili.
Hata hivyo, unaweza kupata taarifa fulani kuhusu sehemu hii katika hiki blogu na hii gists.
LC_ENCRYPTION_INFO[_64]
Msaada wa usimbaji wa binary. Hata hivyo, bila shaka, ikiwa mshambuliaji atafanikiwa kuathiri mchakato, ataweza kutoa kumbukumbu bila usimbaji.
LC_LOAD_DYLINKER
Inashikilia njia ya executable ya dynamic linker inayopanga maktaba za pamoja katika nafasi ya anwani ya mchakato. Thamani kila wakati imewekwa kwenye /usr/lib/dyld
. Ni muhimu kutambua kwamba katika macOS, uhamasishaji wa dylib unafanyika katika mode ya mtumiaji, si katika mode ya kernel.
LC_IDENT
Imepitwa na wakati lakini wakati imewekwa ili kuunda dumps wakati wa panic, dump ya Mach-O core inaundwa na toleo la kernel linawekwa katika amri ya LC_IDENT
.
LC_UUID
UUID ya nasibu. Ni muhimu kwa chochote moja kwa moja lakini XNU inahifadhi pamoja na taarifa nyingine za mchakato. Inaweza kutumika katika ripoti za ajali.
LC_DYLD_ENVIRONMENT
Inaruhusu kuashiria mabadiliko ya mazingira kwa dyld kabla ya mchakato kutekelezwa. Hii inaweza kuwa hatari sana kwani inaweza kuruhusu kutekeleza msimbo usio na mpangilio ndani ya mchakato hivyo amri hii ya kupakia inatumika tu katika ujenzi wa dyld na #define SUPPORT_LC_DYLD_ENVIRONMENT
na inazidisha mchakato tu kwa mabadiliko ya aina DYLD_..._PATH
yanayoelezea njia za kupakia.
LC_LOAD_DYLIB
Amri hii ya kupakia inaelezea utegemezi wa maktaba dynamiki ambayo inaelekeza loader (dyld) kupakia na kuunganisha maktaba hiyo. Kuna amri ya kupakia LC_LOAD_DYLIB
kwa kila maktaba ambayo binary ya Mach-O inahitaji.
- Amri hii ya kupakia ni muundo wa aina
dylib_command
(ambayo ina muundo wa dylib, unaelezea maktaba halisi ya kutegemea):
struct dylib_command {
uint32_t cmd; /* LC_LOAD_{,WEAK_}DYLIB */
uint32_t cmdsize; /* includes pathname string */
struct dylib dylib; /* the library identification */
};
struct dylib {
union lc_str name; /* library's path name */
uint32_t timestamp; /* library's build time stamp */
uint32_t current_version; /* library's current version number */
uint32_t compatibility_version; /* library's compatibility vers number*/
};
Unaweza pia kupata habari hii kutoka kwa cli kwa:
otool -L /bin/ls
/bin/ls:
/usr/lib/libutil.dylib (compatibility version 1.0.0, current version 1.0.0)
/usr/lib/libncurses.5.4.dylib (compatibility version 5.4.0, current version 5.4.0)
/usr/lib/libSystem.B.dylib (compatibility version 1.0.0, current version 1319.0.0)
Baadhi ya maktaba zinazohusiana na malware ni:
- DiskArbitration: Kufuata diski za USB
- AVFoundation: Kukamata sauti na video
- CoreWLAN: Skana za Wifi.
note
Mach-O binary inaweza kuwa na moja au zaidi ya constructors, ambazo zita tekelezwa kabla ya anwani iliyoainishwa katika LC_MAIN.
Offsets za constructors yoyote zinashikiliwa katika sehemu ya __mod_init_func ya segment ya __DATA_CONST.
Data ya Mach-O
Katika msingi wa faili kuna eneo la data, ambalo linajumuisha segment kadhaa kama ilivyoainishwa katika eneo la amri za kupakia. Aina mbalimbali za sehemu za data zinaweza kuhifadhiwa ndani ya kila segment, huku kila sehemu ikiweka msimbo au data maalum kwa aina fulani.
tip
Data kimsingi ni sehemu inayoshikilia taarifa zote zinazopakiwa na amri za kupakia LC_SEGMENTS_64
Hii inajumuisha:
- Jedwali la kazi: Ambalo linashikilia taarifa kuhusu kazi za programu.
- Jedwali la alama: Ambalo lina taarifa kuhusu kazi za nje zinazotumiwa na binary
- Pia inaweza kuwa na kazi za ndani, majina ya mabadiliko na zaidi.
Ili kuangalia unaweza kutumia zana ya Mach-O View:
Au kutoka kwa cli:
size -m /bin/ls
Sehemu za Kawaida za Objetive-C
Katika segmenti ya __TEXT
(r-x):
__objc_classname
: Majina ya darasa (nyuzi)__objc_methname
: Majina ya mbinu (nyuzi)__objc_methtype
: Aina za mbinu (nyuzi)
Katika segmenti ya __DATA
(rw-):
__objc_classlist
: Viashiria kwa madarasa yote ya Objetive-C__objc_nlclslist
: Viashiria kwa madarasa ya Objective-C yasiyo na uvivu__objc_catlist
: Kiashiria kwa Kategoria__objc_nlcatlist
: Kiashiria kwa Kategoria zisizo na uvivu__objc_protolist
: Orodha ya protokali__objc_const
: Takwimu za kudumu__objc_imageinfo
,__objc_selrefs
,objc__protorefs
...
Swift
_swift_typeref
,_swift3_capture
,_swift3_assocty
,_swift3_types, _swift3_proto
,_swift3_fieldmd
,_swift3_builtin
,_swift3_reflstr
tip
Jifunze na fanya mazoezi ya AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Jifunze na fanya mazoezi ya GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Support HackTricks
- Angalia mpango wa usajili!
- Jiunge na 💬 kikundi cha Discord au kikundi cha telegram au tufuatilie kwenye Twitter 🐦 @hacktricks_live.
- Shiriki mbinu za udukuzi kwa kuwasilisha PRs kwa HackTricks na HackTricks Cloud repos za github.