Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Site Reliability Engineering (SRE) richt zich op het maken van betrouwbare, schaalbare systemen via automatisering en proactief beheer. Azure SRE Agent brengt deze principes naar uw door Azure gehoste toepassingen door een ai-hulpprogramma te bieden waarmee productiecloudomgevingen kunnen worden ondersteund. Met SRE Agent kunt u snel en effectief reageren op incidenten, waardoor de toil van het handmatig beheren van productieomgevingen wordt voorkomen. De agent maakt gebruik van de redeneringsmogelijkheden van LLM's (Large Language Models) om de logboeken en metrische gegevens te identificeren die nodig zijn voor snelle hoofdoorzaakanalyse en probleembeperking. Azure SRE Agent biedt u een betere uptime van de service en lagere operationele kosten.
Agents hebben toegang tot elke resource in de resourcegroepen die aan de agent zijn gekoppeld. Daarom, agenten:
Continu resourceactiviteit evalueren en actieve resources bewaken
Proactieve meldingen verzenden over niet-goed functionerende of instabiele apps
Azure SRE Agent kan ook worden geïntegreerd met Azure Monitor-waarschuwingen en PagerDuty ter ondersteuning van geavanceerde meldingsoplossingen.
Opmerking
De functie SRE Agent is beschikbaar als openbare preview. Als u zich wilt registreren voor de wachtlijst, vult u de SRE Agent-toepassing in.
Met behulp van een SRE-agent stemt u in met de productspecifieke aanvullende gebruiksvoorwaarden voor Microsoft Azure Previews.
Belangrijkste kenmerken
Azure SRE Agent biedt verschillende belangrijke functies die de betrouwbaarheid en prestaties van uw Azure-resources verbeteren:
Welkomstthread: Wanneer u uw agent voor het eerst maakt, wordt er een nieuwe thread gemaakt die de eerste analyse van uw services biedt. De omgevingsanalyse maakt een momentopname van alle resources die worden beheerd door de agent. Daarnaast genereert de agent een lijst met toepassingen die zijn gevonden in de beheerde resourcegroepen.
Dagelijkse threads: Elke dag maakt de agent een resourcerapport met een overzicht van de toestand en status van de services in uw beheerde resource groepen.
Hulpprogramma's: Ondersteuning voor query's en bewerkingen via Azure CLI en Kubectl.
Gegevensbronnen: toegang tot Azure Resource Manager-API's en metrische gegevensbronnen van Azure Monitor.
Incidentbeheer: stel incidenten vast door rechtstreeks met de agent te chatten of door een platform voor incidentbeheer te verbinden met de agent. Reageer automatisch op Azure Monitor-waarschuwingen of PagerDuty-incidenten met initiële analyse.
Proactieve bewaking: Continue 24x7-resourcebewaking met realtime waarschuwingen voor potentiële problemen.
Geautomatiseerde risicobeperking: Automatische detectie en beperking van veelvoorkomende problemen, het verminderen van downtime en het verbeteren van de resourcestatus. Terwijl agents namens u proberen te werken, is voor alle automatisering uw goedkeuring vereist.
Best practices voor infrastructuur: Identificeer en herstel resources die niet de aanbevolen beveiligingsprocedures volgen en ondersteun updates.
Versnelt de hoofdoorzaakanalyse: De hoofdoorzaken van app-problemen vaststellen door metrische gegevens en logboeken te analyseren en oplossingen voor te stellen.
Resourcevisualisatie: Uitgebreide weergaven van uw resourceafhankelijkheden en status.
Ondersteuning voor risicobeperking: SRE Agent kan toepassingsconfiguratie en afhankelijke services herstellen. Voor codeproblemen biedt de agent stacktraces en kan hij een GitHub-issue aanmaken om de problemen te helpen oplossen. In de volgende items worden servicespecifieke functies van de agent beschreven:
Azure App Service: Implementatie terugdraaien, resources omhoog/omlaag schalen, opnieuw opstarten van de toepassing.
Azure Container Apps: Implementatie terugdraaien, resources omhoog/omlaag schalen en toepassingen opnieuw opstarten.
Azure Kubernetes Service: pods/implementaties opnieuw opstarten, implementaties terugdraaien naar eerdere revisies, resources omhoog/omlaag schalen en resourcedefinities patchen.
Rapporten
Een SRE-agent werkt om uw Azure-services proactief te bewaken en te onderhouden. Elke dag maakt uw agent dagelijkse resourcerapporten die inzicht bieden in de gezondheid en status van uw applicaties.
Rapporten zijn onder andere:
Samenvatting van incidenten: Genereert informatie over incidenten die op de vorige dag door de SRE-agent zijn gegenereerd. Categorieën zijn onder andere: actief, beperkt of opgelost.
Prestaties en status van toepassingsgroep: Belangrijke metrische gegevens voor elke toepassingsgroep om de stabiliteit en prestaties van het systeem te beoordelen. Metrische gegevens zijn: beschikbaarheid, CPU-gebruik en geheugengebruik.
Samenvatting van actie: Samenvattingen van belangrijke details en inzichten die relevant zijn voor de status en het onderhoud van uw Azure-resources.
Scenariën
Scenariobeschrijving | Mogelijke oorzaak | Agentensubstantie vermindering |
---|---|---|
Toepassing niet beschikbaar | ▪ Problemen met toepassingscode: fouten of fouten in de toepassingscode kunnen leiden tot crashes of niet-reageren. ▪ Ongeldige implementatie: onjuiste configuraties of mislukte implementaties kunnen ertoe leiden dat de toepassing uitvalt. ▪ Problemen met hoog CPU/geheugen/thread: resourceuitputting vanwege een hoog CPU-, geheugen- of threadgebruik kan van invloed zijn op de prestaties van de toepassing. |
De SRE-agent kan deze problemen detecteren en bruikbare inzichten of oplossingen bieden. Het kan bijvoorbeeld een afname van de beschikbaarheid van web-applicaties identificeren die samenvalt met een recente sleutelwisseling en aanbevelen om de slots terug te wisselen als eerste stap van de-escalatie. |
Fouten bij het ophalen van containerimages | ▪ Beschikbaarheid van installatiekopieën: de aangevraagde installatiekopieën zijn mogelijk niet beschikbaar of ontbreken. ▪ Netwerkverbinding: netwerkproblemen kunnen de verbinding met de container-app verstoren. ▪ Problemen met de connectiviteit van het register: Problemen met het maken van verbinding met het containerregister kunnen voorkomen dat images worden opgehaald. |
De SRE-agent kan fouten bij het ophalen van containeraafbeeldingen detecteren en gedetailleerde diagnostiek geven. Het kan oplossingen aanbevelen, zoals het terugdraaien naar de laatst bekende gezonde revisie en het bijwerken van de afbeeldingsreferentie. |
Een agent kan gedetailleerde informatie geven over verschillende aspecten van uw apps en resources. In de volgende voorbeelden ziet u de typen vragen die u voor uw agent kunt stellen:
- Waar kan je me mee helpen?
- Waarom werkt mijn toepassing niet?
- Met welke services is mijn resource verbonden?
- Kunt u best practices voor mijn resource opgeven?
- Wat is het CPU- en geheugengebruik van mijn app?
Hier volgen enkele aanwijzingen die u kunt gebruiken om u te helpen met uw agent te communiceren:
- Welke apps hebben Dapr ingeschakeld?
- Replica's weergeven voor mijn container-app
- Welke apps hebben diagnostische logboekregistratie ingeschakeld?
- Geef me een afzonderlijke heatmap voor elk opslagaccount.
- Welke revisie van mijn container-app is momenteel actief?
- Wat zijn enkele aanbevolen procedures die mijn app moet volgen?
- Wat is de configuratie voor inkomend verkeer voor mijn container-app?
- Zijn er staging-slots geconfigureerd voor deze webapp?
- Welke containerafbeeldingen worden door elk van mijn Container-apps gebruikt?
- Vermeld alle resourcegroepen die u beheert voor alle abonnementen.
- Teken de heatmap van opslaglatenties gedurende de afgelopen 14 dagen voor opslagaccounts.
- Toon een visualisatie van reactietijden voor Container Apps voor vorige week.
- Lijst [Container Apps/Web Apps/etc.] dat u beheert voor alle abonnementen.
- Visualiseer de splitsing van Container Apps versus Web Apps versus AKS-clusters die worden beheerd in alle abonnementen als cirkeldiagram.
Ondersteunde services
Hoewel Azure SRE Agent u kan helpen bij het beheren en rapporteren van alle Azure-services, beschikt de agent over gespecialiseerde hulpprogramma's voor het beheren van de volgende services:
- Azure API Management
- Azure App Service
- Azure Cache voor Redis
- Azure Container Apps - een dienst van Microsoft waarmee je containers kunt uitvoeren en beheren in de cloud.
- Azure Cosmos DB
- Azure-database voor PostgreSQL
- Azure Functions (serverloze computerdiensten van Azure)
- Azure Kubernetes Service
- Azure SQL
- Azure-opslag
- Azure Virtual Machines
Als u de meest recente lijst met services met aangepaste agenthulpprogramma's wilt ophalen, kunt u de volgende prompt indienen bij de agent:
Which Azure services do you have specialized tooling available for?
Resourcegroepen identificeren
Terwijl u een agent maakt, geeft de resourcegroepkiezer groepen aan met exemplaren van services met gespecialiseerde hulpprogramma's. In de resourcegroepkiezer ziet u een vinkje ( ) naast de groepsnaam die aangeeft dat de groep services bevat met gespecialiseerde ondersteuning.
Preview-toegang
Toegang tot een SRE-agent is alleen beschikbaar in de preview. Als u zich wilt registreren voor toegang, vult u de SRE Agent-toepassing in.