Verfügbarkeit von Diensten und Fehlerbehebung

Die Verfügbarkeit eines Dienstes ergibt sich aus der Summe der geplanten jährlichen und der geschätzten, ungeplanten jährlichen Ausfallzeiten.

Hinter den einzelnen Diensten stehen mehr oder weniger komplexe Systemarchitekturen. Je komplexer ein Dienst aufgebaut ist und je mehr Komponenten für sein Funktionieren nötig sind, desto tiefer ist seine Soll-Verfügbarkeit. Die Soll-Verfügbarkeiten der einzelnen Dienste ergeben sich daher aus den Soll-Verfügbarkeiten der verschiedenen Komponenten. Beispiel: Anwendung X (erwartete Ausfallzeit: 160 Stunden pro Jahr) wird auf einem Server (erwartete Ausfallzeit: 20 Stunden pro Jahr) betrieben, der seinerseits am Netzwerk (erwartete Ausfallzeit: 10 Stunden pro Jahr) hängt. Die erwartete Ausfallzeit von Anwendung X beträgt in diesem vereinfachten Modell also 190 Stunden pro Jahr. Wenn diese Anwendung während der offiziellen Bürozeiten verfügbar sein muss, dann wird die erwartete Ausfallzeit dem Total der Bürozeiten während eines Kalenderjahres (2088 Stunden) gegenübergestellt. Anwendung X hat in diesem Beispiel also eine erwartete Ausfallwahrscheinlichkeit von 9% (190 Stunden/2088 Stunden) und damit eine Soll-Verfügbarkeit von 91%.

Unter Reaktionszeit versteht man die Zeit bis zur Zuweisung eines Spezialisten zu einem Problem sowie der Kontaktaufnahme mit dem Kunden.

Unter Erledigungszeit versteht man die Zeit bis zur Lösung des Problems. Die Reaktionszeit ist in der Erledigungszeit enthalten. Für Störungen wird keine maximale Erledigungszeit vereinbart, sie werden nach dem Prinzip „Best Effort“ behoben.

Dienste Typ A

Verfügbarkeit

Nur Mängel der Klasse 1 ("betriebsverhindernd") gelten als Ausfälle

Betrieb auch ausserhalb Bürozeiten, Support während Büro- und Pikettzeiten / geschäftskritisch

Name des Dienstes Maximale Downtime 
(h/Jahr)
Soll-Uptime in % (7x24) Gemessene
Uptime in % (7x24)
Datennetz Core 6 99.9
Datennetz Data Center 6 99.9
Zentrale Firewalls 6 99.9
Internet-Zugang 6 99.9
WLAN-Controller 6 99.9
Telefonie Festnetz (Zentrale Systeme) 48 99.5
Telefonie VoIP (Zentrale Systeme) 66 99.3
ACE Loadbalancer 6 99.9
NetApp File Server 22 99.8
SAN Storage 12 99.9
VMWare 27 99.7
DNS 22 99.8
DHCP 43 99.5
Radius (Authentifizierung) 39 99.6
LDAP (Verzeichnisdienste, Authentifizierung) 34 99.6
AAI/IDP (Authentifizierung) 57 99.4
Proxy-Server 66 99.3
Zentrale Webserver www.uzh.ch 71 99.2
Oracle-Datenbanken 49 99.4
Oracle-Application Server 37 99.6
mySQL-Datenbanken 41 99.5
SAP-Online-Services für Studierende 308 96.5
Web-Vorlesungsverzeichnis 150 98.3
OLAT 113 98.7
UniCMS Websites 58 99.3
IBM Notes (Messung: E-Mail) 67 99.2
Mail-Umsysteme (inkl. Spam, Viren, Mailgate) 94 98.9
ZORA 93 98.9
Animal Management System (iRats) 650 92.6

 

Fehlerbehebung

Reaktionszeit Supportzeiten
Mangel Klasse 1 („betriebsverhindernd“) 30 Min. Bürozeiten, Pikett
Mangel Klasse 2 („betriebsbehindernd“) 0.5 Tag Bürozeiten
Mangel Klasse 3 („geringe Abweichung vom Sollzustand“) 1 Tag Bürozeiten

Dienste Typ B

Verfügbarkeit

Nur Mängel der Klasse 1 ("betriebsverhindernd") gelten als Ausfälle

Betrieb auch ausserhalb Bürozeiten, Support während Bürozeiten / geschäftskritisch

Name des Dienstes Maximale Downtime 
(h/Jahr)
Geschätzte Uptime in % (Bürozeiten)
Dezentrale Firewalls (Sonic Walls) 24 99.7
Remote Access VPN 6 99.9
Datennetz Distribution 16 99.8
Datennetz Access 24 99.7
MPP (PWLAN) 18 99.8
Telefonie VoIP (Dezentrale Systeme) 57 97.3
Voicemail / Call Center Applikation 34 98.4
Telefonie Mobil (CMN) 0 100.0
e-Alarm (Alarmübermittlung) 22 99.0
Kabelmanagement-System (KMS) 42 99.5
Aladin (Accounting Telefonie) 141 93.3
Tivoli Storage Manager (TSM) Backup/Archiv 58 97.2
Fileserver UZH/ID/ZDU 76 96.4
Citrix-Farm 27 98.7
Server Housing 58 97.2
Windows Print Server 70 96.7
Technische Dienstserver 46 97.8
Log-Server 75 96.4
Arbeitsplätze ZDU (Totalausfall) 48 97.7
Öffentliche Arbeits- und Kursräume 171 91.8
Public Printing UZH 70 96.7
Tivoli Identity Manager (ITIM) 62 97.0
Active Directory (AD) Verzeichnisdienst 35 98.3
Certificate Authority 55 97.4
Dropfiles 61 97.1
SAP-Geschäftsapplikationen (Produktion) 159 98.2
SAP-Geschäftsapplikationen (Entwicklung) 144 93.1
SAP-Router 55 97.4
IMC Datawarehouse 155 92.6
SAP-Archiv 135 93.5
Escriba 117 94.4
Kreditorenworkflow Scan-Server 132 93.7
SAP Solution Manager 116 94.4
Centera Archivplattform 58 97.2
OLAT Zusatzmaschinen (z.B. www.olat.org) 117 94.4
UniCMS Autorenserver 107 94.9
Gehostete CMS-Anwendungen (z.B. KiSpi) 79 96.2
Metalib SFX 54 97.4
Kursdatenbank 67 96.8
TOPdesk (Service Management System) 57 97.3
Planon 81 96.1
UZH-Karte 46 97.8
Konsul 81 96.1
Zentrale Leitsysteme (ZLS) 58 97.2

 

Fehlerbehebung

  Reaktionszeit Supportzeiten
Mangel Klasse 1 („betriebsverhindernd“) 2 Stunden Bürozeiten
Mangel Klasse 2 („betriebsbehindernd“) 1 Tag Bürozeiten
Mangel Klasse 3 („geringe Abweichung vom Sollzustand“) 2 Tage Bürozeiten

Dienste Typ C

Verfügbarkeit

Nur Mängel der Klasse 1 ("betriebsverhindernd") gelten als Ausfälle

Betrieb auch ausserhalb Bürozeiten, Support während Bürozeiten / nicht geschäftskritisch

Name des Dienstes Maximale Downtime 
(h/Jahr)
Geschätzte Uptime in % (Bürozeiten)
Datennetz: Einzelne Anschlüsse 72 99.2
Datennetz WLAN: Einzelne Acess Points 24 99.7
Telefonie: Einzelne Apparate 4 99.8
Arbeitsplätze ZDU (Weiterarbeit möglich) 50 97.6
Öffentliche Arbeitsräume (Einzelne Rechner) 53 97.5
Spezialarbeitsräume 74 96.5
Active Directory (AD) (Einzelne Domain Controller) 40 98.1
McAfee Repository 51 97.6
SAP-Geschäftsapplikationen (Schulung, QS) 144 93.1
SAP Business Warehouse 137 93.4
Adressgesuche für Versände und Umfragen 37 98.2
Plattform Info Screens / VisiWeb 22 99.0
Voll redundant ausgelegte Systeme 38 98.2
Nicht betriebsnotwendige, interne Dienste 18 99.1

 

Fehlerbehebung

Reaktionszeit Supportzeiten
Mangel Klasse 1 („betriebsverhindernd“) 1 Tag Bürozeiten
Mangel Klasse 2 („betriebsbehindernd“) 2 Tage Bürozeiten
Mangel Klasse 3 („geringe Abweichung vom Sollzustand“) 2 Tage Bürozeiten