Elección de una tecnología de servicios cognitivos de Microsoft
Azure Cognitive Services es un conjunto de API basadas en la nube que puede utilizar en aplicaciones de IA y flujos de datos. Proporciona modelos preentrenados listos para usar en sus aplicaciones, que no requieren datos ni entrenamiento del modelo por su parte. Los servicios se desarrollan por el equipo de Microsoft AI and Research y exponen los últimos algoritmos de aprendizaje profundo. Se consumen a través de las interfaces de REST de HTTP. Además, hay disponibles SDK para muchos marcos de desarrollo de aplicaciones comunes.
Ventajas principales:
- Con un esfuerzo mínimo de desarrollo se logran servicios de AI de última generación. Utilice algoritmos predefinidos o cree algoritmos personalizados sobre bibliotecas predefinidas.
- Fácil integración en aplicaciones a través de interfaces de REST de HTTP.
- Los desarrolladores y científicos de datos de todos los niveles pueden agregar fácilmente capacidades de IA a las aplicaciones.
Consideraciones:
- Estos servicios solo están disponibles a través de la web. Por lo general se requiere conectividad a Internet. Una excepción es Custom Vision Service, cuyo modelo entrenado se puede exportar para la predicción en dispositivos y en el borde de IoT.
- Aunque se admite una personalización considerable, es posible que los servicios disponibles no se ajusten a todos los requisitos de análisis predictivo.
Categorías de servicios cognitivos de Azure
Hay docenas de servicios cognitivos disponibles en Azure. Aquí hay una lista, categorizada por el área funcional que admiten:
Servicio | Vínculo a la guía de decisiones | Descripción |
---|---|---|
Lenguaje | Elección de un servicio de lenguaje | Los servicios cognitivos de lenguaje son servicios que proporcionan funciones de Procesamiento del Lenguaje Natural (PLN) para comprender y analizar texto. |
Voz | Elección de un servicio de voz | Los servicios cognitivos de voz son servicios que proporcionan funciones de voz como conversión de voz a texto, de texto a voz, traducción de voz y reconocimiento del hablante. |
Visión | Elección de un servicio de visión | Los servicios cognitivos de visión son servicios que proporcionan funciones de reconocimiento de imágenes y vídeo. |
Servicios de decisión Applied AI Services |
Elección de un servicio de API de decisión o de IA aplicada | Los servicios cognitivos de decisión son servicios que proporcionan funciones NLP para producir recomendaciones para una toma de decisiones informada y eficiente. |
Azure OpenAI Service | N/D | Azure OpenAI Service proporciona acceso a API de REST potentes modelos de lenguaje OpenAI. |
Casos de uso comunes
Los siguientes son algunos casos de uso comunes para Azure Cognitive Services.
Caso de uso | Categoría |
---|---|
Transcribir la voz audible en texto legible que permita realizar búsquedas. | Voz |
Convertir texto en voz real para conseguir interfaces más naturales. | Voz |
Integrar fácilmente la traducción de voz en tiempo real en su aplicación | Voz |
Identificar y verificar a la persona que habla mediante las características de la voz. | Voz |
Identificar términos de uso común y específicos de un dominio. | Lenguaje |
Detectar automáticamente sentimientos y opiniones en el texto. | Lenguaje |
Extraer la información en preguntas y respuestas fáciles de navegar. | Lenguaje |
Permitir que sus aplicaciones interactúen con los usuarios a través del lenguaje natural. | Lenguaje |
Traducir más de 100 idiomas y dialectos. | Lenguaje |
Identificar y analizar contenidos en imágenes y vídeo. | Visión |
Personalizar el reconocimiento de imágenes para adaptarlo a las necesidades de su empresa. | Visión |
Identificar problemas potenciales en una fase temprana. | Servicios de decisión / Detector de anomalías |
Detectar contenidos potencialmente ofensivos o no deseados. | Servicios de decisión / Content Moderator |
Cree experiencias ricas y personalizadas para cada usuario. | Servicios de decisión / Personalizer |
Aplique modelos avanzados de codificación y lenguaje a diversos casos de uso. | Azure OpenAI |
Principales criterios de selección
Para reducir las opciones, empiece por responder a estas preguntas:
¿Está procesando algo relacionado con el lenguaje hablado, o está procesando texto, imágenes o documentos?
¿Tiene los datos necesarios para entrenar un modelo? En caso afirmativo, considere la posibilidad de utilizar los servicios personalizados que le permiten entrenar sus modelos subyacentes con los datos que usted les proporcione. Si lo hace, puede mejorar la precisión y el rendimiento.
Este diagrama de flujo puede ayudarle a elegir el mejor servicio API para su caso de uso.
- Si su caso de uso requiere voz a texto, texto a voz o voz a voz, utilice una API de voz.
- Si su caso de uso requiere análisis de lenguaje, evaluación de texto o texto a texto, utilice una API de lenguaje.
- Si necesita analizar imágenes, vídeo o texto, utilice una API de visión.
- Si necesita tomar una decisión, utilice una API de decisión o Applied AI Services.
Implementación de servicios
Cuando se implementa Cognitive Services, se pueden implementar servicios de forma independiente o utilizar el recurso multiservicio de Servicios Cognitivos. El recurso multiservicio implementa servicios de decisión, lenguaje, voz, visión e IA aplicada.
- Implemente un servicio individual si no necesita otros servicios o si desea administrar el acceso y la facturación por servicio.
- Implemente el recurso multiservicio si utiliza varios servicios y desea administrar el acceso y la facturación de todos los servicios a la vez.
Nota
Las categorías de recursos de estos servicios API cambian con frecuencia. Asegúrese de consultar la documentación más reciente para conocer las nuevas categorías.
Colaboradores
Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.
Creadores de entidad de seguridad:
- Ashish Chahuan | Arquitecto sénior de soluciones en la nube
- Kruti Mehta | Ingeniero sénior de Fast-Track de Azure
- Zoiner Tejada | Director ejecutivo y arquitecto
Otros colaboradores:
- Mick Alberts | Escritor técnico
- Brandon Cowen | Arquitecto de soluciones en la nube sénior
- Oscar Shimabukuro | Arquitecto de soluciones en la nube sénior
- Manjit Singh | Ingeniero de software
- Christina Skarpathiotaki | Arquitecto de soluciones en la nube sénior
- Nathan Widdup | Ingeniero sénior de Fast-Track de Azure
Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.
Pasos siguientes
- Ruta de aprendizaje: Aprovisionamiento y administración de Azure Cognitive Services
- Documentación de Azure Cognitive Services
- ¿Qué es Azure Cognitive Services?
- Entrada de blog: ¿Qué IA soy yo?
Recursos relacionados
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente las Cuestiones de GitHub como mecanismo de retroalimentación para el contenido y lo sustituiremos por un nuevo sistema de retroalimentación. Para más información, consulta:Enviar y ver comentarios de