Réalisation : Support & MCO

Support IT International N1/N2/N3

MCO pour 2000+ collaborateurs sur 4 sites internationaux, en environnement hybride macOS/Windows et 80% en anglais.

Présentation

Le maintien en condition opérationnelle (MCO) chez Criteo couvre 2000+ collaborateurs répartis sur quatre sites internationaux. Les incidents peuvent toucher simultanément des utilisateurs sur plusieurs fuseaux horaires, dans des configurations matérielles et logicielles différentes (macOS via Jamf, Windows via Intune, accès VPN, authentification Okta).

J'ai assuré le support N1/N2/N3 sur ce périmètre dans un environnement où 80% des échanges se font en anglais, en collaboration avec les experts Systèmes et IAM pour les incidents escaladés. La mission combine résolution technique, communication utilisateur, et production de documentation pour capitaliser.

Périmètre

N1/N2/N3 pour 2000+ collaborateurs sur 4 sites internationaux, Paris, Londres, Tokyo, New York.

Stack

macOS / Windows, Active Directory, Jamf (MDM), Okta (SSO/IAM), Meraki (réseau).

Méthodologie

ITIL : Incident Management et Request Fulfillment, priorisation basée sur l'impact business et l'urgence.

Objectifs, enjeux et risques

L'objectif du support est double : rétablir le service le plus rapidement possible (résolution) et identifier les causes racines des incidents récurrents pour éviter les rechutes (problem management). Dans un contexte international, chaque incident non résolu ou mal communiqué impacte la réputation de l'équipe IT interne.

Le risque sécurité est omniprésent : un accès mal configuré ou un poste non conforme peut ouvrir une surface d'attaque. Chaque intervention sur un compte utilisateur, une politique Jamf ou une règle Okta doit être réalisée avec une vigilance particulière sur les droits accordés.

Image de la DSI

La qualité et la rapidité du support conditionne directement la perception de l'équipe IT interne par les métiers.

Sécurité des accès

Risque de fuite de données via des accès mal configurés ou des postes non conformes, chaque ticket est aussi un point de contrôle.

Continuité de production

Un poste en panne ou un accès bloqué, c'est un ingénieur non productif. Le temps de résolution a un coût business direct.

Ce que j'ai fait : Étapes et acteurs

Le travail de support suit une méthodologie ITIL : chaque incident est qualifié (impact/urgence), assigné au bon niveau, résolu avec traçabilité dans le système de ticketing, puis documenté si la résolution est non triviale. La collaboration avec les experts Systèmes (pour les incidents AD/Okta) et réseau (pour les incidents de connectivité) est quotidienne.

Les incidents les plus complexes traités : dépannage VPN (IPsec/SSL) avec des collaborateurs en déplacement, corruption de profils utilisateurs macOS nécessitant une intervention distante, dysfonctionnements matériels avec remplacement et remise en configuration, et le cas notable des latences LDAPS sur l'authentification Wi-Fi mondiale, diagnostiqué via analyse croisée des logs Kemp et Active Directory.

J'ai rédigé 15+ articles de Knowledge Base documentant les diagnostics et résolutions, pour que chaque incident significatif devienne un capital de connaissance partagé plutôt qu'une information perdue une fois le ticket fermé.

Triage ITIL

Priorisation basée sur l'impact business (nombre d'utilisateurs affectés) et l'urgence (criticité du service impacté).

Résolution multi-niveau

VPN (IPsec/SSL), corruption de profils, problèmes matériels, incidents réseau, escalade vers les experts Systèmes si besoin.

Capitalisation KB

15+ articles de base de connaissances rédigés, chaque résolution significative devient un asset pour l'équipe.

Résultats et lendemains

Le score de satisfaction utilisateur (CSAT) de l'équipe s'est amélioré sur la période d'alternance. Les articles KB rédigés ont réduit le temps de résolution sur les incidents récurrents et ont permis à d'autres membres de l'équipe de traiter des cas qu'ils n'auraient pas su résoudre seuls.

La perspective à moyen terme est une transition vers un rôle de "Problem Manager" : passer de la résolution réactive des incidents à l'identification proactive des causes racines des incidents récurrents, pour réduire le volume global de tickets et améliorer la résilience du SI.

CSAT amélioré

Amélioration du score de satisfaction utilisateur de l'équipe sur la période d'alternance.

15+ articles KB

Base de connaissances enrichie, réduction du temps de résolution sur les incidents récurrents.

Incident LDAPS résolu

Latences d'authentification Wi-Fi mondiale diagnostiquées et résolues via analyse multi-couche LB + AD.

Mon regard critique

Ce rôle m'a donné une compréhension transversale de l'infrastructure Criteo qu'aucun projet isolé n'aurait pu offrir. Intervenir sur des incidents de nature très différente, réseau, MDM, IAM, matériel, force à comprendre comment ces couches interagissent et où les points de défaillance se trouvent.

L'enseignement le plus durable : la vulgarisation technique est une compétence à part entière. Un ingénieur qui sait expliquer une panne complexe de façon simple à un utilisateur non technique rassure, maintient la productivité, et préserve la confiance dans l'équipe IT. C'est aussi important que de résoudre le problème lui-même.

Valeur ajoutée

Capacité à diagnostiquer des incidents complexes multi-couches (réseau + IAM) dans un contexte international sous pression.

Enseignement clé

La vulgarisation technique est une compétence à part entière. Expliquer une panne complexe simplement, c'est autant de la valeur que la résoudre.

Compétences mises en oeuvre

Troubleshooting Avancé

Diagnostic multi-couche, analyse de logs, Root Cause Analysis sur incidents complexes.

Documentation technique

15+ articles KB rédigés pour capitaliser les résolutions et réduire les temps de traitement futurs.

Communication

Support en anglais pour des utilisateurs de cultures et niveaux techniques variés.

Adaptabilité

Navigation quotidienne entre macOS, Windows, AD, Jamf, Okta, Meraki, sans spécialisation exclusive.