Hieronder een onderzoeksverslagje bij een klant van ons die een voledige onbeschibare Vmware esx omgeving had.



Vergelijkbare documenten
Hyper-V vs ESX in het datacenter

VMware HA and DRS Question & Answer

Viktor van den Berg. Xpert Training Group VMware Authorized Training Center Citrix Authorized Learning Center Microsoft CPLS Eigen datacenter

Onverwachte voordelen van Server Virtualisatie

VMware vsphere 5. What s New! Bram de Laat, Marek Zdrojewski, Jan van Leuken

Virtualisatie & Storage. VMware ESX en uw Storage Frederik Vos

Monitoring as a Service

De VMware Metashell (vimsh) Nader Bekeken

Vmware presentatie NGN virtualisatiedag Bouke Groenescheij. Notities door Kees Stravers

Virtual Desktop Infrastructure Een alternatief SBC concept? Jacco Bezemer

REFERENCE CASE PZ GLM: VIRTUALISATIE ADMINISTRATIEF NETWERK

Hyper-V vsesx in het datacenter

De virtualisatie Grand Prix

vcloud Networking in de praktijk Gabrie van Zanten Open Line

Symantec Backup Exec System Recovery to VMware ESX Machine

Conversie en migratie

CONTINUÏTEIT NA CALAMITEIT. Steven Adema Manuel Speksnijder

Ubuntu Release Party XTG 11/23/12 1

Praktijk opdrachten VMware

De Service Console als NFS en iscsi server

Microsoft Clustering Service op VMware

vsphere Healthcheck Gabrie van Zanten Open Line GabesVirtualWorld.com

TSMS Lite, Professional and Enterprise vergelijking

Backup en Recovery oplossing voor VMware omgevingen

Ictivity Een vreemde eend in de bijt

PGGM. Inkomensverzorger voor de sector zorg en welzijn. Hans de Harde Sr. ICT Architect Fysieke Infrastructuur

Automated computing-model geen toekomstmuziek meer

Distributed Virtual Switch Drill Down. Viktor van den Berg (Xpert Training Group)

Managing VI3 with PowerShell. Eric Sloof NTPRO.NL

TIPS & TRICKS PASSIVE FALLBACK

DHCP Scope overzetten van Windows Server 2003 R2 naar Windows Server 2012

Eddy Piedfort BACKUPS

Handleiding Installatie ADS

Onder de motorkap van Microsoft Azure Web Sites. Eelco Koster Software architect ORDINA

Welkom bij IT-Workz. Etten-Leur, 16 november Altijd en overal werken en leren. Applicatie en Desktop Delivery met Quest vworkspace

Virtualisatie met SAN 12/10/2010

Virtualisatie. en KVM. Oscar Buse 14 februari 2017 NLUG

Extreme Virtualisatie

IBM Tivoli Storage Manager Licentie structuur

Dynamic VM Memory Allocation using Cache Hit Ratio

Functionele beschrijving: scannen naar UNIT4 DocumentManager

Handleiding Installatie Windows Server 2008 in een VM-omgeving (VM Workstation 7)

HMI s ontsluiten machines naar het WEB

Virtualizatie bij SIN

COMIT 25 november 05

23/06/2011. Tijdslijn

Functionele beschrijving: scannen naar Exact Globe.

System Center Update (Products and Licensing)

VMWORLD 2011 US WRAP

OUTDOOR HD DOME IP CAMERA PRODUCT MANUAL GB - NL

Ontdek de mogelijkheden van VMware vcenter Lab Manager 4. Joep Piscaer VirtualLifestyle.nl

High Availability en DRS Virtueel beheer met VMware deel 2

IK BEN NIET VERANTWOORDELIJK VOOR DE GEVOLGEN VAN DEZE INSTRUCTIE EN/OF WEBSITE!

Activant Prophet 21. Prophet 21 Version 12.0 Upgrade Information

NL VMUG UserCon March

Functionele beschrijving: scannen naar UNIT4 Cura Documentmanagement.

[ EXAMEN LINUX UBUNTU SERVER ]

Remote maintenance 4.0

2019 SUNEXCHANGE USER GUIDE LAST UPDATED

Functionele beschrijving: Scannen naar AFAS Profit.

1. Installatie netwerklock

Converged Infrastructure & Software-defined Storage VMware Inc. All rights reserved

Windows Basics. yvan vander sanden. 22 februari 2015

Windows Azure in de praktijk

Functionele beschrijving: scannen naar van Brug software.

vcloud getting started

Release (p)review. Microsoft releases 2012

Procedure Reset tv-toestellen:

Curriculum vitae. Joep van Rijswijk

9 daagse Mindful-leSs 3 stappen plan training

Cloud Geintegreerde Backup & Storage met Microsoft Azure en Storsimple. Maarten Goet Bert Wolters

Data Protectie in een gevirtualiseerde omgeving.

Session Educa-on October 2013

How To: Setup MGE Network Shutdown Module V3 op het service console binnen VMware ESX 3.0.2

Windows Configuratie. yvan vander sanden. 8 maart 2015

Functionele beschrijving: Scannen naar Pro Management

DatuX support diensten 2012

End to End Virtualisation

Functionele beschrijving: Scannen naar Fidura-oplossing

HET WAT, WAAROM EN HOE OVER HYBRID FLASH STORAGE DE GULDEN MIDDENWEG: DE BETAALBARE COMBINATIE VAN DISK EN FLASH

Installatie Domein Windows 2000

OUTDOOR HD BULLET IP CAMERA PRODUCT MANUAL

Trainingen Microsoft Curriculum VIRTUAL COURSES IN THE CLOUD

Agenda: Rotary Industry Group

Remote maintenance 4.0

Oefening 1: hardware block devices (zoals harde schijven) herkennen

Unify- SLES Linux update handleiding

Procedure om een backup te maken via VEEAM + schedule

Open Enterprise Server 2 en vsphere Best Practises. Michael Wilmsen

Taakklasse 3 ALAa installeren en onderhouden systemen Corné Tintel G GMB13B Medewerker beheer ICT

Virtual Enterprise Centralized Desktop

1 Client/Server. 2 Geschiedenis. 3 Toekomst

Mobile Devices, Applications and Data

Shipment Centre EU Quick Print Client handleiding [NL]


Netwerkprinter Dell 1320C installeren op Ubuntu LTS - Lucid Lynx

General info on using shopping carts with Ingenico epayments

Intermax backup exclusion files

Handleiding installatie VPN Nieuw authenticatiesysteem Remote Access Microdata (Versie voor de Mac)

Windows Troubleshooting

Transcriptie:

Hieronder een onderzoeksverslagje bij een klant van ons die een voledige onbeschibare Vmware esx omgeving had. 1>Als eerste een analyse van de eventlogs van de Virtueele windows servers. Op bijna alle servers verschijnen er meldingen in de logfiles op Zondag 12-07-2009 ca. 03:17 dat hun disks niet meer bereikbaar zijn "The device, DeviceScsisymmpi1, is not ready for access yet.", de F01, I01, K01 en P01 geven deze melding niet maar komen met de melding "The previous system shutdown at 3:16:03 AM on 7/12/2009 was unexpected", deze server hadden op dat moment dus ook een ernstig probleem. - Jullie bevinding was dat op zondagmorgen (12-07-2009) er geen remote mogelijkheid meer was om te werken, op locatie bleken alle server onbereikbaar. 2>Het volgende zijn de meldingen op Virtual Center. Opvallende melding: v01 Remove Snapshot P01 Doing a online commit, cannot power off 12-07-2009 3:16:22 1 / 12

v02 Create Virtual Machine Snapshot D01 A general system error occured: Protocol error from VMX (Diverse tijdstippen), lijkt te komen door vranger (daar de melding: Not Enough Space On V:Oneven-Week For backup. Free: 283243 MB, Required 291431 MB) 3> vranger melding Backup 12-07-2009 6:00 Building VirtualCenter 2 communication infrastructure. A generic exception occurred during virtualcenter operations. Unable to connect to the remote server 4> ESX V01 : Jul 12 03:16:45 v01 vmkernel: 9:11:02:01.058 cpu0:1039)warning: SCSI: 119: Failing I/O due to too many reservation conflicts WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts V02 : Jul 12 00:16:16 v02 vmkernel: 9:12:20:32.852 cpu0:1039)warning: SCSI: 2 / 12

119: Failing I/O due to too many reservation conflicts Jul 12 00:16:30 v02 vmkernel: 9:12:20:46.723 cpu3:1043)warning: FS3: 4785: Reservation error: SCSI reservation conflict Jul 12 00:16:30 v02 vmkernel: 9:12:20:46.723 cpu3:1043)warning: FS3: 4979: Reclaiming timed out heartbeat [HB state abcdef02 offset 3610624 gen 14 stamp 822041805296 uuid 4a4cae69-41c5e6bc-8696-001b78990db8 jrnl <FB 153651> drv 4.31] failed: SCSI reservation conflict WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts V03 : Jul 12 00:16:30 v03 vmkernel: 9:10:03:12.073 cpu6:1043)warning: SCSI: 119: Failing I/O due to too many reservation conflicts Jul 12 00:16:30 v03 vmkernel: 9:10:03:12.073 cpu6:1043)warning: FS3: 4785: Reservation error: SCSI reservation conflict 3 / 12

Jul 12 00:16:30 v03 vmkernel: 9:10:03:12.073 cpu6:1043)warning: FS3: 4979: Reclaiming timed out heartbeat [HB state abcdef02 offset 3315200 gen 187 stamp 813787122008 uuid 4a4cceb3-308eff88-f2f5-001a4beb4498 jrnl <FB 18147> drv 4.31] failed: SCSI reservation conflict WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts 5> GlasSwitch Switch 1> -switch2 1 jul 12 2009 22:47:05 1 4 SYS-BOOT Restart reason: Power-on Switch 2> -switch2 1 jul 12 2009 22:47:05 1 4 / 12

4 SYS-BOOT Restart reason: Power-on Dit was de reboot van de MSA1000 (Zondag avond) ======================================= =========================== De fouten die een richting geven naar de oorzaak zijn die uit de ESX logfiles VARLOGvmkwarning WARNING: SCSI: 119: Failing I/O due to too many reservation conflicts Deze meldingen komen nu (21-07-2009) niet meer voor. Een van de oorzaken van deze meldingen is een teveel aan activiteiten die de zogenoemde "Metadata" wijzigen. 5 / 12

Deze activiteiten zijn: Those things that lock the metadata in terms of VC: Deployment from Template VM power on/off/sleep, Clone, Migrate, vmotion, Mark as Template, Mark as VM, Create a VM, Create a VMDK, Snapshots and as they grow every 15MBs Voor de vreplicator applicatie worden Snapshots gebruikt, deze acties werden ook gedaan op het moment dat de esx-omgeving instortte. Dit kan een aanwijzing zijn dat vreplicator de oorzaak was. Dit kan ik echter niet onderbouwen, je zou verwachten dat je met een product - wat je omgeving juist! van een hoger beschikbaarheid moet voorzien - dit niet 6 / 12

zou verwachten. De virtuele servers staan allemaal op één LUN (sanstorage: vmhba1:0:1:1), hier kan één simultane LUN activiteit op worden gedaan. De variabele scsi.conflictretries (staat op 80), zorgen dat als er een tweede LUN activiteit is deze nogmaals wordt uitgevoerd. Ook een aanwijzing. Naar aanleiding van bovenstaande heb ik de volgende wijzigingen uitgevoerd: For best performance of replication and VMware snapshot operations, increase the memory allocation of the Service Console to 800MB and CPU Reservation to 1500 MHz. You can configure these settings through the VMware Infrastructure Client on the Configuration tab of each ESX host. The settings are under Memory and System Resource Allocation. >>>> Uitgevoerd 7 / 12

Vreplicator Limit simultaneous replications to: 10 Limit per host simultaneous replications to: 4 Limit per LUN simultaneous replications to: 4 >>>> Naar 2 gezet Verder is het zinvol om een overzicht van de replicaties te hebben (RTO/RPO) Dit zijn ze nu: D01 Sliding Hybrid replication Every 30 Minutes P01 Sliding Hybrid replication Every 25 Minutes 8 / 12

H01 Fixed Hybrid replication Every 6 hours K01 Fixed Hybrid replication Every 6 hours T01 Fixed Hybrid replication Every 4 hours T03 Fixed Hybrid replication Every 4 hours I01 Fixed Hybrid replication Every 4 hours A02 Fixed Hybrid replication Every 3 hours A01 Fixed Hybrid replication Every 3 hours 9 / 12

F02 Fixed Hybrid replication Every 2 hours F01 Fixed Hybrid replication Every 1 Days B01 Fixed Hybrid replication Every 1 Days A01 Fixed Hybrid replication Every 1 Days Wellicht moet hier ook een aanpassing in worden gedaan om de belasting van het LUN door Snap-acties te verminderen. De vreplicatie heb ik weer aangezet op de B02 (na eerste alle Snapshots (van 11-07 en 12-07) 10 / 12

te hebben verwijderd), deze is weer gaan lopen. Door de aangepaste waarde van LUN failen er nu VReplicator-jobs, dit komt uiteindelijk wel goed verwacht ik. Verder is het de komende tijd verstandig om de logfile vmkwarning dagelijks uit te - laten - lezen. Mochten er dan weer foutmeldingen verschijnen dan kan hier direct actie op worden genomen. 11 / 12

Update, mogelijke oorzaak/oplossing: http://h20000.www2.hp.com/bizsupport/techsu pport/document.jsp?lang=en&cc=us&taskid=1 10&prodSeriesId=377751&prodTypeId=12169 &prodseriesid=377751&objectid=c01646109 12 / 12