Verbesserung der Beweglichkeit von DevOps und Schutz der Einsatz-Pipeline:

Mit Business-Assurance-Lösungen für das digitale Zeitalter

Das große Ganze

Im digitalen Zeitalter stehen digitale Dienste im Mittelpunkt der disruptiven Innovation. Die Beweglichkeit der kontinuierlichen Planung, Lieferung, Integration, Erprobung und der Einsatz von Anwendungen und Services markieren den Unterschied zwischen Gewinnern und Verlierern in diesem hart umkämpften Geschäftsumfeld. Während die Automatisierung dieser Prozesse enorme Vorteile für die kontinuierliche Auslieferung bietet, verlagert sie den Zwang in die Produktionsumgebung, die nun den Gesamtfluss des Wertestroms zum Kunden steuert. Leider ist die Telemetrie auf Anwendungsebene, die von DevOps-Teams für die Feedback-Schleife verwendet wird, ineffizient, da viele der Einschränkungen auf Systemebene erfolgen. Dazu gehören alle architektonischen Subsysteme, die mit der Service-Bereitstellung und der Anwendung verbunden sind. Die Sichtbarkeit auf Systemlevel, Telemetrie und Triage-Fähigkeiten von NETSCOUT, die auf kontinuierlicher Überwachung und Analyse des IP-Verkehrs basieren, ermöglichen es den DevOps-Organisationen, agiler und effizienter zu werden und ihren Unternehmen zu helfen, einen Wettbewerbsvorteil im digitalen Schlachtfeld zu erringen.

Die wichtigsten Herausforderungen, vor denen DevOps steht, und die entsprechende NETSCOUT-Lösung, die auf dieser Seite beschrieben wird, sind unten in Tabelle 1 zusammengefasst.

Tabelle 1: die Herausforderungen von DevOps angehen

Herausforderungen von DevOps

Leistungsversprechen von NETSCOUT

Werden Sie produktiver und agiler, indem Sie Services schneller und mit weniger Ressourcen erbringen Ermöglichen Sie es DevOps, mehr mit weniger Ressourcen mit Service-Level-Telemetrie-Plattform und gemeinsamem Situationsbewusstsein zu erreichen
Die Auswirkungen von Störung minimieren Die mittleren Reparaturzeiten (MTTR) verringern
Die globale IT-Ressourcenkapazität und die Bereitschaft, neue Services zu implementieren, kontinuierlich analysieren Effektive Feedback-Schleife auf der Basis von Echtzeit- und kontinuierlicher Überwachung und Analyse der globalen Service-Bereitstellungs Ressourcen-Kapazität
Servicequalität, Sicherheit und Verfügbarkeit gewährleisten Business Assurance-Lösungen zur Eindämmung von Risiken im Zusammenhang mit Servicequalität, Sicherheit und Verfügbarkeit

 

Das Rätsel der DevOps-Beweglichkeit


Die DevOps ist das Epizentrum dieser disruptiven Innovation und ihre Leistung steht in direktem Zusammenhang mit den Ergebnissen des Unternehmens. Leider erfährt die Pipeline an Bereitstellungen umso mehr Widerstand, je stärker sie beschleunigt, wenn sie auf das wachsende „Chaos“ stößt, das durch die erhöhte Geschwindigkeit im Betrieb entsteht. Während die Automatisierung und die Einführung agiler Führungsprinzipien dazu beitragen, dieses Chaos für eine kontinuierliche Lieferung zu kontrollieren, steigert dies auch das Chaos in der Produktionsumgebung. Dadurch können Betriebs-Teams Gefahr laufen, der nächste Engpass zu werden, der den Gesamtfluss des Wertestroms zum Kunden einschränkt. Der erste Schritt, den das Betriebs-Team unternehmen muss, um diese Herausforderung anzugehen, ist, eine kontinuierliche und Echtzeit-Sichtbarkeit auf der Basis der System-Level-Telemetrie zu erlangen. Das Ops-Team muss diese Einblicke nutzen, um die MTTR zu reduzieren und eine effektive Feedback-Schleife mit Dev, QA, SEC und Ops zu etablieren. Dieses Ziel ist mit herkömmlichen Application Performance Management (APM)-Technologien wie Agenten und Bytecode-Instrumentierung äußerst schwierig, wenn nicht gar unmöglich zu erreichen. Der Grund dafür ist, dass das, was APM-Werkzeuge enthüllen, nur die halbe Miete ist, also nur Telemetrie auf Anwendungsebene, im Gegensatz zu der durchgängigen Telemetrie auf der gesamten Systemebene. Die Business Assurance (BA)-Lösungen von NETSCOUT nutzen IP-Verkehr-basierte Technologien, um dieser Herausforderung zu begegnen und DevOps dabei zu helfen, die Sichtbarkeit auf Systemebene zu erhalten, um die Bereitstellungs-Pipeline bei erhöhter Geschwindigkeit des Betriebs zu schützen. Wie unten in Abbildung 1 dargestellt, ist dieser Ansatz agiler und effizienter, da jeder Instrumentierungs-Punkt des IP-Verkehrs einen Einblick in alle Anwendungen und ihre jeweiligen Parameter bietet, ohne dass eine Bytecode-Instrumentierung jeder einzelnen Anwendung erforderlich ist.

DevOps-Einsatz sicherstellen
Abbildung 1: Sicherung der Einsatz-Pipeline mit Sichtbarkeit auf System-Ebene

„Den ganzen Mond“ sehen 1


Business Assurance-Lösungen von NETSCOUT ermächtigen die DevOps-Organisationen, „den gesamten Mond“ zu sehen, indem sie den IP-Verkehr kontinuierlich überwachen, der die Service-Bereitstellungsinfrastruktur durchquert, proaktiv Service-Degradierungen erkennt und umsetzbare Einblicke in alle Services-Abhängigkeiten bietet, die notwendig sind, um die MTTR zu reduzieren und Probleme zu lösen, bevor Nutzer betroffen sind.

Diese durchgängige Sichtbarkeit auf Systemebene umfasst die Telemetrie von Last-, Latenz- und Ausfall-Parametern für alle Service-Bereitstellungssysteme und Abhängigkeiten zwischen Netzwerk, Server, Service-Enablern, Datenbanken und Anwendungen. Diese Erkenntnisse tragen nicht nur dazu bei, die Geschwindigkeit der kontinuierlichen Planung, Lieferung, Integration, Prüfung und Bereitstellung zu verbessern, sondern optimieren auch die Effizienz der DevOps und bieteen einen Wettbewerbsvorteil im digitalen Schlachtfeld.

Optimierung der betrieblichen Effizienz von DevOps


Obwohl eine nahtlose Kommunikation zwischen Dev- und Ops-Teams eine Voraussetzung für die Steigerung der DevOps-Produktivität ist, reicht das nicht aus. Auch wenn das DevOps-Team hypothetisch gesehen ein vollständig transparentes gemeinsames Situationsbewusstsein über die Dev- und Ops-Teams hinweg erreichen könnte, wird eine genaue Analyse der „Situation“ die Effizienz dieses gemeinsamen Bewusstseins beeinflussen. Wenn die Situationsanalyse die Grundursache auf Systemebene in allen relevanten IT-Systemen und der Anwendung schnell identifizieren könnte, würde dies nicht nur die MTTR drastisch reduzieren, sondern auch als Kraft-Multiplikator dienen, der es DevOps ermöglicht, mehr Arbeit mit weniger Ressourcen auszuführen. Darüber hinaus wäre es viel effizienter, diese MTTR-Reduktion zu erreichen, ohne dass das Dev-Team für jede einzelne Anwendung Bytecode-Instrumentierung ausführen muss.

Da zum Beispiel nur ein Teil der Service-Bereitstellungsprobleme mit einer bestimmten Anwendung zusammenhängt, wird die Produktivität der Entwickler optimiert, wenn sie nur dann beansprucht werden, wenn die Grundursache mit ihrer spezifischen Anwendung zusammenhängt. Mit der Sichtbarkeit auf Anwendungsebene hingegen wüsste das Entwicklerteam nicht, ob die Grundursache für ein Anwendungs-Leistungsproblem mit Ihrem Anwendungscode oder einem anderen IT-System zusammenhängt. Dies wird zu einer Verschwendung von wertvoller Zeit durch das Dev-Team führen, das helfen muss, nicht-anwendungsbezogene Fehler zu suchen. Das Ops-Team würde am Ende auch mehr Zeit damit verbringen, die Grundursache zu suchen, weil es keine Sichtbarkeit in die Abhängigkeiten in den IT-Systemen und Anwendungen gibt. Dies führt zur Schaffung von „Ineffizienz-Zonen“ sowohl für Dev als auch für Ops aufgrund der verschwendeten Zeit und Anstrengung, wie unten in Abbildung 2 dargestellt.

APM inszeniert Telemetrie
Abbildung 2: Die Vorteile der Migration auf die Telemetrie auf System-Ebene: hohe Beweglichkeit und höhere Effizienz

Der Telemetrie-Ansatz auf Systemebene nutzt eine effektive System-Triage, die auf durchgängiger Sichtbarkeit über alle Abhängigkeiten von Service-Bereitstellungssystemen basiert, um die Grundursache von Service-Problemen schnell zu identifizieren. Die mittlere Zeit, die eine IT-Organisation braucht, um den Triage-Prozess abzuschließen, nennt man Mean Time to Knowledge (MTTK – mittlere Erkenntniszeit) und laut ZK Research entfällt auf MTTK 90% der gesamten mittleren Reparaturzeit (MTTR) bei einem Problem mit der Serviceleistung.

Der Telemetrie-Ansatz auf Systemebene setzt auf Leistungsparameter über die gesamte Service-Bereitstellungsinfrastruktur, die sich über physische und virtuelle, auf vor Ort und außerhalb sowie auf private und öffentliche Clouds erstreckt. Er bietet eine einzigartige Fähigkeit, Leistung, Traffic-Indikatoren, Last und Ausfälle zu analysieren sowie kontextbezogene Arbeitsabläufe, um schnell zu triagieren und die Ursache für Probleme zu finden, die Leistungsdegradierungen in Anwendungen verursachen. Eine effektive Serviceprüfung kann MTTR um bis zu 80 % deutlich beschleunigen, was es den Entwicklungsteams ermöglicht, sich den größten Teil ihrer Zeit und Mühe produktiv auf die Bereitstellung neuer Anwendungen zu konzentrieren und den Aufwand für den Betrieb im Zusammenhang mit Reparatur-Aktivitäten zu reduzieren. Dazu gehören eine reduzierte Zeit im Einsatzraum und reduzierte Kosten und Komplexität im Betrieb und Support. Unterm Strich können die DevOps-Organisationen mit Telemetrie auf Systemebene „den ganzen Mond“ sehen, [2] die Geschwindigkeit verbessern und die Effizienz optimieren.

Telemetrie-Grundlagen auf Systemebene: Smart Data und überlegene Analytik

Smart Data


Während das Erreichen einer Sichtbarkeit auf Systemebene über alle Anwendungen und Service-Bereitstellungssysteme hinweg und deren Abhängigkeiten voneinander nach einer großen Aufgabe klingen mögen, ist es mit Smart Data und überlegener Analyse machbar. Die IP-Verkehrsdaten sind die Grundlage der Smart Data und werden verwendet, um hochskalierbare Metadaten zu generieren, die eine Echtzeit-und historische Telemetrie aller Systemkomponenten einschließlich physischer und virtueller Netzwerke, n-Tier-Anwendungen, Arbeitsbelastungen, Protokolle, Server, Datenbanken, Benutzer und Geräte bietet. Zu den wichtigsten Vorteilen der Nutzung von IP-Verkehrsdaten gehören:

  • Telemetrie auf Systemebene und in Echtzeit – Da jede Aktion und Transaktion in IP-Paketen eingekapselt ist, die die physische und virtuelle Infrastruktur durchqueren, bieten IP-Verkehrsdaten den besten Aussichtspunkt für eine durchgehende Sichtbarkeit
  • Verwertbare Informationen – IP-Verkehr enthält alle notwendigen Daten [3]  , um ein tiefgreifendes Verständnis von Anwendungs- und System-Leistungsmanagement-Fragen zu gewinnen
  • Anwendungsunabhängige Erkenntnisse – IP-Verkehrsdaten können verwendet werden, um jede herkömmliche, mobile, benutzerdefinierte oder Standard-Anwendung unabhängig vom Quellcode zu überwachen, ohne dass Agenten oder Bytecode-Instrumentierung benötigt werden.
  • Höchste Skalierbarkeit – Die auf Standards basierende IP-Technologie ist gut strukturiert und daher am besten für skalierbare Systemprüfung geeignet, die es erfordert, große Datenmengen im Systemkontext kontinuierlich zu erfassen, zu normalisieren, zu korrelieren, zu organisieren und zu analysieren.

Smart Data mit überlegener Analytik kombinieren


Abbildung 3: Telemetrie-Grundlage auf Systemebene: Smart Data mit überlegener Analytik kombinieren

 

Überlegene Analytik


Wenn Smart Data mit überlegener Analytik kombiniert werden, können sie wichtige Einblicke in Anwendungen und Service-Leistungsparameter wie Anwendungs-Verkehrsvolumina, Anwendungsserver-Reaktionszeiten, Server-Durchsatz, aggregierte Fehlerzahlen und Fehlercodes aufzeigen, die speziell auf Anwendungsserver und Domäne zugeschnitten sind. Darüber hinaus können Smart Data alle Anwendungsabhängigkeiten aufdecken und den kontextbezogenen Übergang über mehrere Analyse-Schichten hinweg unterstützen, was eine effiziente Aufteilung von Vorfallsreaktionen in den verschiedenen IT-Funktionsgruppen im gesamten Triage-Prozess der Grundursache fördert. So wird die Aufteilung an das jeweilige Entwicklungsteam nur dann notwendig, wenn die Grundursache mit der von ihnen gelieferten spezifischen Anwendung verbunden ist.

Die letzte Phase der DevOps-Optimierung kann mit einer vorausschauenden Analyse durchgeführt werden, die die Degradierungen von Diensten proaktiv erkennt, bevor mehrere Benutzer betroffen sind. Durch die automatische Etablierung von Leistungsreferenzwerten können Alarme entweder auf der Basis vordefinierter Schwellen oder Abweichungen von den Referenzwerten generiert werden. Zu den Abweichungen gehören die steigende und sinkende Link-Nutzung, die Ausfallraten von Anwendungstransaktionen und die Reaktionsfähigkeit. Der Analytik-Engine muss die Referenzwerte auch im Laufe der Zeit automatisch anpassen, um sich an allmähliche Veränderungen in der Servicenutzung anzupassen und gleichzeitig zeitnahe Warnungen vor Leistungsanomalien zu liefern. Durch die Nutzung dieser vorausschauenden Analytik können die DevOps-Organisationen die Sichtbarkeit in aufkommende Probleme der Service-Leistung erhalten, bevor sie sich auf mehrere Benutzer auswirken, und die Alarmnachweise und die zugrunde liegenden Ursachen kontextbezogen triagieren und analysieren. Das Gesamtergebnis der Verwendung von Smart Data und überlegener Analytik ist eine drastische Reduktion von MTTK und MTTR, wie unten in Abbildung dargestellt 4.

MTTR reduzieren
Abbildung 4: Effektive System-Triage mit Telemetrie auf Systemebene und überlegener Analytik

Zu den weiteren Vorteilen der Telemetrie und Triage auf Systemebene gehören eine bessere Serviceverfügbarkeit und Benutzererfahrung sowie die Fähigkeit, Dienstleistungen zur Unterstützung von Millionen von Anwendern in der Produktionsumgebung zu nutzen.

NETSCOUT-Lösungen für die Bedürfnisse von DevOps

Lösungen für die Betriebseffizienz
Die Service-Gewährleistungs-Plattform nGeniusONE von NETSCOUT reduziert MTTR und MTTK drastisch und dient als Kraft-Multiplikator, der es Ops ermöglicht, mit weniger Ressourcen mehr zu erreichen, indem außerplanmäßige Arbeiten auf ein Minimum reduziert werden. Diese Kapazität maximiert auch die Produktivität der Entwickler, indem sie den Aufwand für den Umgang mit Problemen im Zusammenhang mit anderen IT-Systemen reduziert. Die Kern-Effizienz erzielt man mit nGeniusONE durch:

  • Proaktive Erkennung von Service-Degradierung entweder auf der Grundlage von Abweichungen von Leistungsreferenzwerten oder vordefinierten Schwellenwerten
  • Unterstützung intuitiver Top-Down-System-Triage-Arbeitsabläufe, die die MTTK effektiv reduzieren, indem sie die Ursache über alle Systeme hinweg erkennen, einschließlich der Vielzahl von n-Tier-Anwendungen, IT-Infrastruktursystemen und all ihren jeweiligen Abhängigkeiten
  • Überwachung von Altlasten, neuen Anwendungen und Infrastruktursystemen

Agile Lösungen für den kontinuierlichen Einsatz
Die nGeniusONE-Plattform von NETSCOUT bietet Echtzeit- und Trendanalyse-bezogene Telemetrie [4]  und Analytik, um eine Feedbackschleife zu bieten, die die Einsatz-Pipeline schützt und die Beweglichkeit der DevOps erhöht. Diese Fähigkeiten sind unter anderem:

  • Granulare Einblicke in alle Service-Bereitstellungssysteme und Grundursachen-Analyse, die alle Abhängigkeiten in Anwendungen vor Ort und in der Cloud-basierte Infrastruktur berücksichtigen.
    • Die Adaptive Service Intelligence (ASI)-Plus-Technologie, die auf InfiniStreamNG-Geräten läuft, bietet Echtzeit-Sichtbarkeit in DevOps-Systeme und Abhängigkeiten, einschließlich physischer und virtueller Netzwerke, n-Tier-Anwendungen, Arbeitsbelastungen, Protokolle, Server, Datenbanken, Benutzer und Geräte
    • Die ASI Plus-Technologie nutzt den IP-Verkehr als Quelle für Smart Data, die sich ideal für die Überwachung von Mikro-Services und komplexen vor Ort- oder Cloud-Umgebungen eignen.
    • ASI eXtender (ASI-X) ermöglicht es, jede kundenspezifische Anwendung schnell zu instrumentieren und zu überwachen
  • Anpassbare Dashboards, Berichte und Service-Abhängigkeits-Abbildungen helfen, ein gemeinsames Situationsbewusstsein über Dev, QA und Ops-Teams zu etablieren und die Feedback-Schleife zu optimieren
  • Die nGeniusPULSE ergänzt die nGeniusONE-Fähigkeiten mit Sichtbarkeit für die Anwendungs-Service-Gewährleistung in den verschiedenen Kombinationen von Privat-, Hybrid-, SaaS- und öffentlichen Cloud-Architekturen, die Unternehmen heute einsetzen und die daher entscheidend für die Einsatz-Pipeline sind

DevOps-Planung
Die nGeniusONE-Plattform ermächtigt die Ops-Teams, das mit dem kontinuierlichen Einsatz verbundene Zuverlässigkeits-Risiko für die Service-Bereitstellungsinfrastruktur zu reduzieren:

  • Echtzeit- und kontinuierliche Analyse der Kapazität der globalen Service-Bereitstellungs-Ressourcen, bevor das Ops-Team die Arbeit von Dev annimmt.
  • Dazu gehört eine automatisierte Service-Abhängigkeits-Abbildung, die Einblicke in Last, Latenz und Ausfälle über die gesamte Service-Bereitstellungsinfrastruktur sowie Infrastrukturkapazitäten auf Netz-, Link-und Server-Ebenen bietet.
  • Die Ergänzung mit nGeniusPULSE mit seiner Fähigkeit, Cloud-basierte Dienste auf Verfügbarkeit, Reaktionsfähigkeit und Einhaltung von Serviceniveaus zu testen, gibt DevOps den Einblick in das Zuverlässigkeits-Risiko, das mit einem kontinuierlichen Einsatz verbunden ist.

Geschäftsrisikenminderung
Business-Assurance-Lösungen von NETSCOUT helfen, Geschäftsrisiken zu verringern und wünschenswerte Ergebnisse zu erzielen. Dies wird erreicht mit:

  • Einer Suite von nGeniusONE und ASI-basierten Service-Gewährleistungs-Lösungen, die helfen, die MTTR zu reduzieren sowie Servicequalität und Verfügbarkeit zu erhöhen
  • Arbor Networks, die Sicherheitssparte von NETSCOUT, trägt dazu bei, die Integrität und Verfügbarkeit von Diensten mit verteiltem Denial-of-Service (DDoS) und Advanced Persistent Threat (APT) zu schützen.

Zusammenfassung

Im digitalen Zeitalter kann die DevOps-Organisation den Unterschied zwischen Unternehmenserfolg und Misserfolg ausmachen. Die wichtigsten Erfolgsfaktoren von devops sind Beweglichkeit, betriebliche Effizienz und die Fähigkeit, Geschäftsrisiken zu verringern, die das Unternehmen daran hindern könnten, die wünschenswerten Geschäftsergebnisse zu erzielen. Während die Automatisierung und Umsetzung agiler Prinzipien durch DevOps dazu beitrug, die Geschwindigkeit und Effizienz der kontinuierlichen Lieferung zu verbessern, ist die Produktionsumgebung zu einer neuen Einschränkung des Wertestroms zum Kunden geworden. Diese Einschränkung kann nicht effektiv von Betriebs-Teams gelockert werden, die auf Sichtbarkeit auf Anwendungsebene setzen und Entwicklungsteams, die für jede Anwendung Bytecode-Instrumentierung ausführen müssen. Die Sichtbarkeit auf Systemlevel, Telemetrie und Triage-Fähigkeiten von NETSCOUT, die auf kontinuierlicher Überwachung und Analyse des IP-Verkehrs basieren, ermöglichen es den DevOps-Organisationen, agiler und effizienter zu werden und ihren Unternehmen zu helfen, einen Wettbewerbsvorteil im digitalen Schlachtfeld zu erringen.

RESSOURCEN

Kundenzitate -

Datenblätter
Kurzübersicht

[1]Aus dem Text The Whole of the Moon - The Waterboys
[2]Aus dem Text The Whole of the Moon - The Waterboys
[3]Open Systems Interconnection (OSI)-Modell-Schichten 2 Durch 7
[4]Telemetrie ist die von DevOps verwendete Terminologie und umfasst Geschäfts-, Anwendungs-und Infrastruktur-Parameter, die zur Überwachung der Funktionsweise von Systemen in Produktionsumgebungen erforderlich sind.