Conceptos básicos del flujo de llamadas

En la sección siguiente se ofrece información general sobre los flujos de llamadas en Azure Communication Services. Los flujos de señalización y multimedia dependen de los tipos de llamadas que realizan los usuarios. Algunos ejemplos de tipos de llamadas son VoIP de uno a uno, RTC de uno a uno y llamadas de grupo que contienen una combinación de participantes de VoIP y conectados a RTC. Revise Tipos de llamada.

Acerca de los protocolos de señalización y multimedia

Cuando se establece una llamada de punto a punto o de grupo, se usan dos protocolos en segundo plano: HTTPS (REST) para señalización y el SRTP para los flujos multimedia.

La señalización entre los distintos SDK o entre los SDK y los controladores de señalización de Communication Services se controla con REST HTTPS (TLS). Azure Communication Services usa TLS 1.2. Para el tráfico multimedia en tiempo real (RTP), se prefiere el Protocolo de datagramas de usuario (UDP). Si el firewall impide el uso de UDP, el SDK usará el Protocolo de control de transmisión (TCP) para los elementos multimedia.

Vamos a revisar los protocolos de señalización y multimedia en varios escenarios.

Casos de flujo de llamadas

Caso 1: VoIP, donde se puede establecer una conexión directa entre dos dispositivos

En las videollamadas o las llamadas VoIP de uno a uno, el tráfico prefiere la ruta de acceso más directa. "Ruta directa" significa que si dos SDK pueden conectarse entre sí directamente, se establecerá una conexión directa. Normalmente, esto es posible cuando los dos SDK están en la misma subred (por ejemplo, en una subred 192.168.1.0/24) o cuando los dispositivos están activos en subredes que se pueden ver entre sí (los SDK de las subredes 10.10.0.0/16 y 192.168.1.0/24 pueden comunicarse entre sí).

Diagram showing a Direct VOIP call between users and Communication Services.

Caso 2: VoIP donde no es posible una conexión directa entre dispositivos, pero sí una conexión entre dispositivos NAT

Si hay dos dispositivos ubicados en subredes que no se pueden comunicar entre sí (por ejemplo, Alice trabaja desde una cafetería y Roberto trabaja desde su oficina doméstica), pero la conexión entre dispositivos NAT es posible, los SDK de cliente establecerán la conectividad mediante dispositivos NAT.

En el caso de Alice, será el dispositivo NAT de la cafetería y, para Bob, será el de la oficina doméstica. El dispositivo de Alice enviará la dirección externa de su dispositivo NAT y Bob hará lo mismo. Los SDK aprenden las direcciones externas de un servicio STUN (Session Traversal Utilities for NAT) que Azure Communication Services proporciona de forma gratuita. La lógica que controla el protocolo de enlace entre Alice y Bob está insertada en los SDK que proporciona Azure Communication Services. (No se requiere ninguna configuración adicional)

Diagram showing a VOIP call which utilizes a STUN connection.

Caso 3: VoIP sin posibilidad de una conexión directa ni NAT

Si uno o ambos dispositivos cliente están detrás de un dispositivo NAT simétrico, se requiere un servicio en la nube independiente para retransmitir contenido multimedia entre los dos SDK. Este servicio se denomina TURN (Traversal Use Relays around NAT) y también lo proporciona Communication Services. El SDK de llamadas de Communication Services usa automáticamente los servicios TURN en función de las condiciones de red detectadas. Los cargos TURN se incluyen en el precio de la llamada.

Diagram showing a VOIP call which utilizes a TURN connection.

Caso 4: Llamadas de grupo con RTC

Tanto la señalización como los flujos multimedia para llamadas RTC usan el recurso de telefonía de Azure Communication Services. Este recurso está interconectado con otros operadores.

El tráfico multimedia de RTC fluye a través de un componente denominado procesador de multimedia.

Diagram showing a PSTN Group Call with Communication Services.

Nota:

Para aquellas personas familiarizadas con el procesamiento multimedia, nuestro procesador de multimedia también es un agente de usuario inverso, tal como se define en RFC 3261 SIP: Protocolo de inicio de sesión, lo que significa que puede traducir códecs al controlar las llamadas entre redes de Microsoft y Carrier. El controlador de señalización de Azure Communication Services es la implementación de Microsoft de un proxy SIP por la misma RFC.

En el caso de las llamadas de grupo, los flujos de señalización y multimedia siempre son a través del back-end de Azure Communication Services. El audio o el vídeo de todos los participantes se mezcla en el componente procesador de multimedia. Todos los miembros de una llamada de grupo envían sus secuencias de audio o vídeo al procesador de multimedia, que devuelve transmisiones multimedia combinadas.

El Protocolo en tiempo real (RTP) predeterminado para las llamadas de grupo es el Protocolo de datagramas de usuario (UDP).

Nota:

El procesador de multimedia puede actuar como una unidad de control multipunto (MCU) o una unidad de reenvío selectivo (SFU).

Diagram showing UDP media process flow within Communication Services.

Si el SDK no puede usar UDP para los elementos multimedia debido a restricciones del firewall, se intentará usar el Protocolo de control de transmisión (TCP). Tenga en cuenta que el componente procesador de multimedia requiere UDP, de modo que, si se da este caso, el servicio TURN de Communication Services se agregará a la llamada de grupo para trasladar TCP a UDP. Los cargos TURN se incluyen en el precio de la llamada.

Diagram showing TCP media process flow within Communication Services.

Caso 5: SDK de Communication Services y Microsoft Teams en una reunión de Teams programada

Señalización de flujos a través del controlador de señalización. Los elementos multimedia fluyen a través del procesador de multimedia. El controlador de señalización y el procesador de multimedia se comparten entre Communication Services y Microsoft Teams.

Diagram showing Communication Services SDK and Teams Client in a scheduled Teams meeting.

Caso 6: Elementos multimedia tempranos

Hace referencia a elementos multimedia (por ejemplo, audio y vídeo) que se intercambian antes de que el usuario llamado acepte una sesión determinada. Si hay un flujo de elementos multimedia tempranos, el SBC debe conectarse al primer punto de conexión que inicia el streaming multimedia; el flujo de elementos multimedia puede empezar antes de que se designen candidatos. El SBC debe tener compatibilidad con el envío de DTMF durante esta fase para habilitar escenarios de correo de voz o IVR. El SBC debe usar la ruta con la prioridad más alta en la que ha recibido comprobaciones en caso de que no se hayan completado las designaciones.

Pasos siguientes

Puede que los siguientes documentos le resulten interesantes: