Podstawowe protokoły VoIP
Reading time: 9 minutes
tip
Ucz się i ćwicz AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Ucz się i ćwicz GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Wsparcie HackTricks
- Sprawdź plany subskrypcyjne!
- Dołącz do 💬 grupy Discord lub grupy telegram lub śledź nas na Twitterze 🐦 @hacktricks_live.
- Dziel się trikami hackingowymi, przesyłając PR-y do HackTricks i HackTricks Cloud repozytoriów github.
Protokoły sygnalizacyjne
SIP (Session Initiation Protocol)
To standard branżowy, aby uzyskać więcej informacji, sprawdź:
{{#ref}} sip-session-initiation-protocol.md {{#endref}}
MGCP (Media Gateway Control Protocol)
MGCP (Media Gateway Control Protocol) to protokół sygnalizacyjny i kontroli połączeń opisany w RFC 3435. Działa w architekturze scentralizowanej, która składa się z trzech głównych komponentów:
- Agent połączeń lub Kontroler bramy multimedialnej (MGC): Główna brama w architekturze MGCP jest odpowiedzialna za zarządzanie i kontrolowanie bram multimedialnych. Obsługuje procesy zestawiania, modyfikacji i zakończenia połączeń. MGC komunikuje się z bramami multimedialnymi za pomocą protokołu MGCP.
- Bramy multimedialne (MG) lub bramy podrzędne: Te urządzenia konwertują cyfrowe strumienie multimedialne między różnymi sieciami, takimi jak tradycyjna telefonia z przełączaniem obwodowym i sieci IP z przełączaniem pakietów. Są zarządzane przez MGC i wykonują polecenia otrzymane od niego. Bramki multimedialne mogą zawierać funkcje takie jak transkodowanie, pakietowanie i eliminacja echa.
- Bramy sygnalizacyjne (SG): Te bramy są odpowiedzialne za konwersję wiadomości sygnalizacyjnych między różnymi sieciami, umożliwiając płynną komunikację między tradycyjnymi systemami telefonicznymi (np. SS7) a sieciami opartymi na IP (np. SIP lub H.323). Bramy sygnalizacyjne są kluczowe dla interoperacyjności i zapewnienia, że informacje o kontroli połączeń są prawidłowo komunikowane między różnymi sieciami.
Podsumowując, MGCP centralizuje logikę kontroli połączeń w agencie połączeń, co upraszcza zarządzanie bramami multimedialnymi i sygnalizacyjnymi, zapewniając lepszą skalowalność, niezawodność i wydajność w sieciach telekomunikacyjnych.
SCCP (Skinny Client Control Protocol)
Skinny Client Control Protocol (SCCP) to proprietarny protokół sygnalizacyjny i kontroli połączeń należący do Cisco Systems. Jest głównie używany do komunikacji między Cisco Unified Communications Manager (wcześniej znanym jako CallManager) a telefonami IP Cisco lub innymi punktami końcowymi głosowymi i wideo Cisco.
SCCP to lekki protokół, który upraszcza komunikację między serwerem kontroli połączeń a urządzeniami końcowymi. Nazywa się go "Skinny" ze względu na jego minimalistyczny design i zmniejszone wymagania dotyczące pasma w porównaniu do innych protokołów VoIP, takich jak H.323 czy SIP.
Główne komponenty systemu opartego na SCCP to:
- Serwer kontroli połączeń: Ten serwer, zazwyczaj Cisco Unified Communications Manager, zarządza procesami zestawiania, modyfikacji i zakończenia połączeń, a także innymi funkcjami telekomunikacyjnymi, takimi jak przekazywanie połączeń, transfer połączeń i wstrzymywanie połączeń.
- Punkty końcowe SCCP: To urządzenia takie jak telefony IP, jednostki wideokonferencyjne lub inne punkty końcowe głosowe i wideo Cisco, które używają SCCP do komunikacji z serwerem kontroli połączeń. Rejestrują się w serwerze, wysyłają i odbierają wiadomości sygnalizacyjne oraz wykonują instrukcje dostarczone przez serwer kontroli połączeń w celu obsługi połączeń.
- Bramy: Te urządzenia, takie jak bramy głosowe lub bramy multimedialne, są odpowiedzialne za konwersję strumieni multimedialnych między różnymi sieciami, takimi jak tradycyjna telefonia z przełączaniem obwodowym i sieci IP z przełączaniem pakietów. Mogą również zawierać dodatkowe funkcje, takie jak transkodowanie lub eliminacja echa.
SCCP oferuje prostą i wydajną metodę komunikacji między serwerami kontroli połączeń Cisco a urządzeniami końcowymi. Warto jednak zauważyć, że SCCP jest protokołem proprietarnym, co może ograniczać interoperacyjność z systemami nie-Cisco. W takich przypadkach inne standardowe protokoły VoIP, takie jak SIP, mogą być bardziej odpowiednie.
H.323
H.323 to zestaw protokołów do komunikacji multimedialnej, w tym głosu, wideo i konferencji danych w sieciach z przełączaniem pakietów, takich jak sieci oparte na IP. Został opracowany przez Międzynarodową Unię Telekomunikacyjną (ITU-T) i zapewnia kompleksowy framework do zarządzania sesjami komunikacji multimedialnej.
Niektóre kluczowe komponenty zestawu H.323 obejmują:
- Terminale: To urządzenia końcowe, takie jak telefony IP, systemy wideokonferencyjne lub aplikacje programowe, które obsługują H.323 i mogą uczestniczyć w sesjach komunikacji multimedialnej.
- Bramy: Te urządzenia konwertują strumienie multimedialne między różnymi sieciami, takimi jak tradycyjna telefonia z przełączaniem obwodowym i sieci IP z przełączaniem pakietów, umożliwiając interoperacyjność między H.323 a innymi systemami komunikacyjnymi. Mogą również zawierać dodatkowe funkcje, takie jak transkodowanie lub eliminacja echa.
- Gatekeeperzy: To opcjonalne komponenty, które zapewniają usługi kontroli i zarządzania połączeniami w sieci H.323. Wykonują funkcje takie jak tłumaczenie adresów, zarządzanie pasmem i kontrola dostępu, pomagając w zarządzaniu i optymalizacji zasobów sieciowych.
- Jednostki kontroli multipoint (MCU): Te urządzenia ułatwiają konferencje multipoint, zarządzając i miksując strumienie multimedialne z wielu punktów końcowych. MCU umożliwiają funkcje takie jak kontrola układu wideo, przełączanie aktywowane głosem i ciągła obecność, co umożliwia organizowanie konferencji na dużą skalę z wieloma uczestnikami.
H.323 obsługuje szereg kodeków audio i wideo, a także inne usługi dodatkowe, takie jak przekazywanie połączeń, transfer połączeń, wstrzymywanie połączeń i oczekiwanie na połączenie. Pomimo szerokiego zastosowania w początkowych dniach VoIP, H.323 stopniowo został zastąpiony przez nowocześniejsze i bardziej elastyczne protokoły, takie jak Session Initiation Protocol (SIP), które oferują lepszą interoperacyjność i łatwiejszą implementację. Niemniej jednak H.323 pozostaje w użyciu w wielu systemach dziedzictwa i nadal jest wspierany przez różnych dostawców sprzętu.
IAX (Inter Asterisk eXchange)
IAX (Inter-Asterisk eXchange) to protokół sygnalizacyjny i kontroli połączeń głównie używany do komunikacji między serwerami Asterisk PBX (Private Branch Exchange) a innymi urządzeniami VoIP. Został opracowany przez Marka Spencera, twórcę oprogramowania PBX Asterisk open-source, jako alternatywa dla innych protokołów VoIP, takich jak SIP i H.323.
IAX jest znany ze swojej prostoty, wydajności i łatwości implementacji. Niektóre kluczowe cechy IAX obejmują:
- Pojedynczy port UDP: IAX używa pojedynczego portu UDP (4569) zarówno do sygnalizacji, jak i ruchu multimedialnego, co upraszcza przechodzenie przez zapory i NAT, ułatwiając wdrażanie w różnych środowiskach sieciowych.
- Protokół binarny: W przeciwieństwie do protokołów opartych na tekście, takich jak SIP, IAX jest protokołem binarnym, co zmniejsza jego zużycie pasma i czyni go bardziej wydajnym w przesyłaniu danych sygnalizacyjnych i multimedialnych.
- Trunking: IAX obsługuje trunking, co pozwala na łączenie wielu połączeń w jeden kanał sieciowy, zmniejszając narzuty i poprawiając wykorzystanie pasma.
- Natywne szyfrowanie: IAX ma wbudowane wsparcie dla szyfrowania, używając metod takich jak RSA do wymiany kluczy i AES do szyfrowania mediów, zapewniając bezpieczną komunikację między punktami końcowymi.
- Komunikacja peer-to-peer: IAX może być używany do bezpośredniej komunikacji między punktami końcowymi bez potrzeby centralnego serwera, co umożliwia prostsze i bardziej wydajne routowanie połączeń.
Pomimo swoich zalet, IAX ma pewne ograniczenia, takie jak główny nacisk na ekosystem Asterisk i mniejsze rozpowszechnienie w porównaniu do bardziej ustalonych protokołów, takich jak SIP. W związku z tym IAX może nie być najlepszym wyborem do interoperacyjności z systemami lub urządzeniami nie-Asterisk. Jednak dla tych, którzy pracują w środowisku Asterisk, IAX oferuje solidne i wydajne rozwiązanie do komunikacji VoIP.
Protokoły transmisji i transportu
SDP (Session Description Protocol)
SDP (Session Description Protocol) to format oparty na tekście używany do opisywania cech sesji multimedialnych, takich jak głos, wideo lub konferencje danych, w sieciach IP. Został opracowany przez Internet Engineering Task Force (IETF) i jest zdefiniowany w RFC 4566. SDP nie obsługuje rzeczywistej transmisji mediów ani ustanawiania sesji, ale jest używany w połączeniu z innymi protokołami sygnalizacyjnymi, takimi jak SIP (Session Initiation Protocol), do negocjowania i wymiany informacji o strumieniach mediów i ich atrybutach.
Niektóre kluczowe elementy SDP obejmują:
- Informacje o sesji: SDP opisuje szczegóły sesji multimedialnej, w tym nazwę sesji, opis sesji, czas rozpoczęcia i czas zakończenia.
- Strumienie multimedialne: SDP definiuje cechy strumieni multimedialnych, takie jak typ mediów (audio, wideo lub tekst), protokół transportowy (np. RTP lub SRTP) oraz format mediów (np. informacje o kodeku).
- Informacje o połączeniu: SDP dostarcza informacji o adresie sieciowym (adres IP) i numerze portu, na który media powinny być wysyłane lub odbierane.
- Atrybuty: SDP wspiera użycie atrybutów do dostarczania dodatkowych, opcjonalnych informacji o sesji lub strumieniu mediów. Atrybuty mogą być używane do określania różnych funkcji, takich jak klucze szyfrowania, wymagania dotyczące pasma lub mechanizmy kontroli mediów.
SDP jest zazwyczaj używane w następującym procesie:
- Inicjująca strona tworzy opis SDP proponowanej sesji multimedialnej, w tym szczegóły strumieni mediów i ich atrybuty.
- Opis SDP jest wysyłany do strony odbierającej, zazwyczaj osadzony w wiadomości protokołu sygnalizacyjnego, takiej jak SIP lub RTSP.
- Strona odbierająca przetwarza opis SDP, a w zależności od swoich możliwości, może zaakceptować, odrzucić lub zmodyfikować proponowaną sesję.
- Ostateczny opis SDP jest wysyłany z powrotem do inicjującej strony jako część wiadomości protokołu sygnalizacyjnego, kończąc proces negocjacji.
Prostota i elastyczność SDP sprawiają, że jest to szeroko przyjęty standard do opisywania sesji multimedialnych w różnych systemach komunikacyjnych, odgrywając kluczową rolę w ustanawianiu i zarządzaniu rzeczywistymi sesjami multimedialnymi w sieciach IP.
RTP / RTCP / SRTP / ZRTP
- RTP (Real-time Transport Protocol): RTP to protokół sieciowy zaprojektowany do dostarczania danych audio i wideo lub innych mediów w czasie rzeczywistym w sieciach IP. Opracowany przez IETF i zdefiniowany w RFC 3550, RTP jest powszechnie używany z protokołami sygnalizacyjnymi, takimi jak SIP i H.323, aby umożliwić komunikację multimedialną. RTP zapewnia mechanizmy do synchronizacji, sekwencjonowania i znacznikowania czasowego strumieni mediów, pomagając zapewnić płynne i terminowe odtwarzanie mediów.
- RTCP (Real-time Transport Control Protocol): RTCP to protokół towarzyszący RTP, używany do monitorowania jakości usług (QoS) i dostarczania informacji zwrotnej na temat transmisji strumieni mediów. Zdefiniowany w tym samym RFC 3550 co RTP, RTCP okresowo wymienia pakiety kontrolne między uczestnikami sesji RTP. Dzieli się informacjami takimi jak utrata pakietów, jitter i czas okrążenia, co pomaga w diagnozowaniu i dostosowywaniu się do warunków sieciowych, poprawiając ogólną jakość mediów.
- SRTP (Secure Real-time Transport Protocol): SRTP to rozszerzenie RTP, które zapewnia szyfrowanie, uwierzytelnianie wiadomości i ochronę przed powtórkami dla strumieni mediów, zapewniając bezpieczną transmisję wrażliwych danych audio i wideo. Zdefiniowany w RFC 3711, SRTP używa algorytmów kryptograficznych, takich jak AES do szyfrowania i HMAC-SHA1 do uwierzytelniania wiadomości. SRTP jest często używane w połączeniu z bezpiecznymi protokołami sygnalizacyjnymi, takimi jak SIP przez TLS, aby zapewnić bezpieczeństwo end-to-end w komunikacji multimedialnej.
- ZRTP (Zimmermann Real-time Transport Protocol): ZRTP to protokół uzgadniania kluczy kryptograficznych, który zapewnia szyfrowanie end-to-end dla strumieni mediów RTP. Opracowany przez Phila Zimmermanna, twórcę PGP, ZRTP jest opisany w RFC 6189. W przeciwieństwie do SRTP, który polega na protokołach sygnalizacyjnych do wymiany kluczy, ZRTP jest zaprojektowany do pracy niezależnie od protokołu sygnalizacyjnego. Używa wymiany kluczy Diffiego-Hellmana do ustanowienia wspólnego sekretu między komunikującymi się stronami, bez potrzeby wcześniejszego zaufania lub infrastruktury kluczy publicznych (PKI). ZRTP zawiera również funkcje takie jak Krótkie Ciągi Uwierzytelniające (SAS), aby chronić przed atakami typu man-in-the-middle.
Te protokoły odgrywają istotną rolę w dostarczaniu i zabezpieczaniu komunikacji multimedialnej w czasie rzeczywistym w sieciach IP. Podczas gdy RTP i RTCP obsługują rzeczywistą transmisję mediów i monitorowanie jakości, SRTP i ZRTP zapewniają, że przesyłane media są chronione przed podsłuchiwaniem, manipulacją i atakami powtórkowymi.
tip
Ucz się i ćwicz AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE)
Ucz się i ćwicz GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
Wsparcie HackTricks
- Sprawdź plany subskrypcyjne!
- Dołącz do 💬 grupy Discord lub grupy telegram lub śledź nas na Twitterze 🐦 @hacktricks_live.
- Dziel się trikami hackingowymi, przesyłając PR-y do HackTricks i HackTricks Cloud repozytoriów github.