Étude de cas: Offis refond le stockage pour renforcer le service cloud IaaS

  • Oct 16, 2023

Le passage au stockage SAN augmente les IOPS du cloud Offis, réduit la latence et offre une reprise après sinistre plus rapide et un taux de compression en temps réel de 40 à 50 %.

Le cloud est reconnu à juste titre comme un moyen de réduire les coûts, d’augmenter la disponibilité informatique et d’éliminer les technologies et les processus métiers à faible valeur ajoutée. Il est également de plus en plus reconnu qu'il s'agit d'un moyen de rejeter de vilains problèmes informatiques sur quelqu'un d'autre.

Tout cela est génial lorsque c'est le service informatique qui fait le dumping. Mais que se passe-t-il lorsque vous êtes celui dont le travail consiste à gérer le désordre de quelqu'un d'autre ?

Comment assurer une reprise après sinistre en temps réel tout en maintenant les coûts de stockage à un faible niveau, tout en gérant 30 pour cent de croissance des volumes de données d'une année sur l'autre et maintenir une disponibilité proche de 100 pour cent pendant les périodes de pointe de demande ?

Offis035.jpg-FP1170649962

Craig Allen, fondateur d'Offis

Image: Offis

C’est exactement le problème auquel Offis, fournisseur australien d’infrastructure en tant que service (IaaS) et d’opérations cloud, est confronté.

Selon le directeur exécutif et fondateur de l'entreprise, Craig Allen, l'entreprise était aux prises avec une infrastructure de stockage basée sur RAID 5, et devait migrer vers un environnement de stockage SAN de niveau intermédiaire pour mieux permettre à l'entreprise de garder une longueur d'avance sur l'infrastructure cloud de ses clients. besoins.

« Avant d'utiliser les technologies SAN, Offis utilisait des serveurs rack et lames IBM System X dédiés. Ces serveurs étaient généralement configurés avec la technologie de disque RAID 1 et RAID 5 SCSI Ultra-320", a-t-il déclaré.

"Il était très difficile d'augmenter la taille des partitions de disque sans interruption et de remplacer les disques existants... Les pannes de disque auraient également un impact sur l'expérience client: lorsqu'un disque doit être remplacé dans une configuration RAID 5, les performances peuvent réellement être dégradées. »

La réponse, selon Allen, était de rechercher une solution de stockage capable de répondre à trois exigences fondamentales: Permettre à un une approche de reprise après sinistre, qui pourrait restaurer les services immédiatement et automatiquement en cas de panne des systèmes principaux; maintenir un miroir de données en temps réel pour garantir une continuité totale du service en cas de panne; et minimiser l'empreinte des données des clients pour éviter des explosions de coûts matériels.

La solution

En tant que membre d'IBM et ancien membre du personnel d'IBM, Allen d'Offis a déclaré que cela signifiait que se tourner vers l'infrastructure de stockage IBM V7000 de Big Blue était la solution. Mais pas avant d’avoir d’abord testé le marché.

Allen a déclaré que la principale considération lors de la recherche d'une infrastructure de stockage n'était pas la reconnaissance d'une grande marque, mais la fiabilité.

« La réalité est que les clients ne se soucient pas du type de matériel sur lequel ils fonctionnent, qu'il s'agisse d'IBM, HP, Apple ou n'importe quoi - la seule chose qui les intéresse, c'est que lorsqu'ils déplacent leur souris et cliquent sur un bouton, quelque chose arrive.

"C'est tout ce dont ils devraient se soucier... De nos jours, le DSI ne se soucie pas de l'équipement sur lequel [les applications] s'exécutent. Cela ne fait plus partie du débat. Tout dépend du service, des opérations et de la haute disponibilité. »

Les résultats

Selon Allen, Offis a bénéficié de plusieurs manières de son passage à la plate-forme V7000.

Plus particulièrement, Allen a déclaré que les performances du stockage d'Offis ont également reçu une amélioration majeure, au moins quatre fois supérieure à celle du système de stockage d'Offis. 4 000 à 7 000 IOPS (opérations d'entrée/sortie par seconde) que l'entreprise obtenait sur son stockage précédent Infrastructure. Cela a permis à l’entreprise de réaliser d’importantes économies sur les coûts de licence.

"La performance a explosé", a déclaré Allen. "Lorsque vous commencez à rencontrer 30 000 IOPS avec une latence très faible sur une machine, cela signifie que les processeurs attendent moins les données. Moins vous avez de temps d'attente pour les données, plus vous disposez de temps pour calculer. Plus vous disposez de temps de calcul, moins vous avez besoin de licences sur le système. »

Face à une croissance des données de 30 % par an, la possibilité d'accéder à une capacité de compression en temps réel signifie que l'entreprise a été en mesure de réduire le taux auquel elle a besoin d'acheter du stockage supplémentaire ainsi que des licences.

"Nous connaissons un taux de compression de 40 à 50 pour cent, avec seulement 2 pour cent de surcharge [de performance du système]", a déclaré Allen à propos de l'outil de compression.

"La raison pour laquelle nous utilisons la compression en temps réel est que cela représente pour nous un avantage en termes de coûts. La manière dont les licences sont attribuées sur les SAN se fait par boîtiers, et si je peux réduire le nombre de boîtiers que j'utilise grâce à la compression en temps réel, je peux réduire mes coûts de licence. »

En plus de la compression, la mise à niveau du V7000 pour ajouter plus de capacité de stockage est également beaucoup plus facile que sur l'ancienne infrastructure de stockage d'Offis, a déclaré Allen.

"Dans un environnement dédié, une fois que vous avez rempli un environnement RAID 5, il est vraiment difficile de passer à une taille de disque plus grande", a-t-il déclaré. "Mais dans un environnement SAN, vous pouvez le faire sans interruption et ajouter du stockage à l'environnement du client."

Allen a déclaré qu'en plus de bénéficier de l'interface utilisateur graphique (GUI) intuitive du V7000, la société a également bénéficié de la capacité du V7000 à prendre des instantanés :

"Le plus gros gain est la possibilité de prendre des instantanés", a-t-il déclaré. « Dans le passé, en cas de problème lors d'une modification ou d'une mise à niveau, le système devait être restauré à partir d'une bande. Il faut maintenant quelques minutes pour revenir à la version originale.

"Dans le passé, si vous appliquiez des correctifs, mettiez à niveau ou faisiez quoi que ce soit sur la boîte, il suffisait de faire une grosse sauvegarde la nuit précédente, puis de croiser les doigts.

"Maintenant, vous pouvez le prendre en photo, tout faire, le tester, en êtes-vous satisfait? Supprimez ensuite l'instantané. Nous pouvons faire tout cela en 15 minutes, alors qu'avant, c'était un processus de 12 à 24 heures selon le moment où le client voulait le faire. »

Allen a déclaré que le V7000 a également amélioré la reprise après sinistre grâce à l'acquisition d'une capacité de réplication WAN.

« La réplication WAN signifie que nous pouvons répliquer les données vers un emplacement géographique différent », a-t-il déclaré. "Même si cela était possible avec l'ancien équipement, il était extrêmement complexe et coûteux de mettre en place des rétroviseurs déportés. L'ancien stockage contenait également des points de défaillance uniques, en particulier avec les cartes RAID. »

En tant que client IBM de longue date, Offis bénéficie également du support dont il a bénéficié.

"Je dirais que dans n'importe quelle organisation, lorsque vous êtes un magasin unique, vous établissez des relations avec eux... comprendre comment fonctionnent les processus et les systèmes, et une fois que vous avez établi ces relations, elles valent beaucoup de valeur pour nos clients », a-t-il déclaré.

"Nous savons que nous pouvons faire remonter les problèmes extrêmement rapidement. Nous savons à qui s'adresser pour demander des solutions, et lorsque le proverbial frappe le fan, nous savons à qui parler, plutôt que d'appeler un numéro 1300, d'obtenir un numéro de ticket et d'attendre une réponse. »

En guise de conseils aux organisations confrontées à des défis de stockage similaires, Allen souligne la nécessité de rechercher une solution avec des IOPS élevées, mais également une faible latence.

"La voiture peut peut-être rouler à 200 milles à l'heure, mais si cela prend une heure pour atteindre cette vitesse, alors elle est inutile", a-t-il déclaré.