Avec cette article, je poursuis la série que j’ai commencée en novembre dernier.
L’idée est de vous proposer chaque mois une liste de questions pertinentes à poser en entretien à des profils techs. Le 1er article portait sur les profils DevOps, celui-ci vous donnera 8 questions pour un profil ingénieur Cloud.
Le Cloud, c’est un environnement technique complexe, mais il est au cœur des enjeux stratégiques des entreprises : flexibilité, scalabilité, réduction des coûts…Ça me semblait donc intéressant de parler de ce profil dans ce 2ème article.
L’idée reste la même : vous aider à construire des questions qui évaluent des compétences techniques spécifiques. Et surtout, vous aider à repérer ce qui sera une « bonne » réponse.
Evidemment, vous ne poserez pas ces 8 questions à chaque entretien. Cela dépendra de ce que vous cherchez !
Petit rappel: si vous débutez dans le recrutement IT ou si vous avez besoin de (re)faire le point sur le vocabulaire courant dans la tech, RDV ici ou ici.
A noter : de plus en plus d’entreprises qui cherchent des profils « hybrides » d’ingénieur Cloud/ DevOps. N’hésitez pas à piocher des questions dans les 2 articles en fonction des compétences que vous cherchez à évaluer.
Le mois prochain, je vous proposerai des questions pour un profil « Data Scientist ».*
Cet article s’adresse aux recruteurs IT qui veulent structurer leurs entretiens techniques sans être eux-mêmes experts du Cloud. L’objectif est de leur donner des repères concrets pour identifier les compétences des candidat·es, tout en laissant l’évaluation détaillée aux experts techniques.
1/ Pouvez-vous expliquer les différences entre IaaS, PaaS, et SaaS ?
Cette question permet de vérifier si le candidat comprend les concepts de base du Cloud et peut les expliquer clairement, sans jargon inutile.
IaaS, PaaS et SaaS sont 3 modèles de services de Cloud Computing.
- IaaS (Infrastructure as a Service) : ici, le fournisseur met à disposition des serveurs, du stockage ou des réseaux que l’entreprise gère elle-même. L’IaaS est adaptée aux entreprises qui ont besoin d’un contrôle total sur leur infrastructure, comme certaines grandes entreprises. Exemple de IaaS : AWS EC2 ou Google Compute Engine
- PaaS (Platform as a Service) : ici, l’entreprise dispose d’une plateforme prête à l’emploi pour déployer ses applications sans avoir à gérer l’infrastructure. C’est l’offre parfaite pour les entreprises/ équipes qui veulent se concentrer sur le développement, sans se soucier de la maintenance des serveurs. Exemples de PaaS : Google App Engine, Azure App Service
- SaaS (Software as a Service) : ici, tout est géré par le fournisseur. L’application est prête à l’emploi, accessible via internet sans gestion technique. C’est la solution idéale quand on veut fournir une solution « clés en mains » à ses utilisateurs (mais elle est aussi moins flexible). Exemples de SaaS :Par exemple, Gmail, Saleforce, Slack.
Pour résumer : avec l’IaaS, on loue des serveurs ; avec le PaaS, on loue une plateforme ; avec le SaaS, on utilise un logiciel prêt à l’emploi.
A noter : il existe aussi le modèle FaaS (Function as a Service) comme AWS Lambda ou Google Cloud Functions, qui permet d’exécuter du code sans gérer de serveurs. On l’associe souvent au Serverless.
Vous pouvez regarder cette vidéo de Cookie Connecté (cette chaîne est une mine d’or pour comprendre la tech quand on ne vient pas de la tech)
💡N’hésitez pas à l’aider avec les variantes suivantes
Dans quel contexte choisiriez vous l’une ou l’autre de ces solutions et pourquoi ?
Pouvez-vous me donner un exemple concret où vous avez utilisé l’une de ces solutions ?
Quelles sont les avantages et inconvénients de chacun de ces modèles selon vous ?
2/ Quels sont les critères importants pour concevoir une architecture Cloud résiliente ?
Dans le Cloud, on parle de résilience quand un système est capable de garantir que les services restent disponibles, même en cas de panne. On peut aussi parler ici de « continuité de service » ou de « haute disponibilité« . Une architecture Cloud résiliente est conçue pour prévenir les interruptions et garantir la continuité du service, en répartissant les charges et en mettant en place des systèmes de secours.
La question est pertinente pour vérifier si le candidat sait comment éviter qu’un service tombe en panne.
Toutes les entreprises n’ont pas les mêmes risques en termes de fiabilité et de stabilité. Donc il n’y a pas de réponse universelle à cette question.
Mais un « bon » candidat devrait parler de
Zones de disponibilité : le Cloud répartit les serveurs géographiquement pour éviter une panne totale. On peut utiliser par exemple AWS Availability Zones
Réplication des données : les données critiques doivent être dupliquées à plusieurs endroits. Par exemple, en faisant des sauvegardes multi-régions
Load balancing : répartir le trafic entre plusieurs serveurs pour éviter qu’un seul serveur ne sature. Des exemples d’outils pour faire ça : AWS Elastic Load Balancer, Nginx, Traefik
Auto-scaling : on augmente ou on réduit automatiquement les ressources selon la charge, en fonction de la demande. On peut faire ça avec Kubernetes HPA, AWS Auto Scaling
Monitoring et système d’alerte : On surveille les performances et on est alerté en cas de problème. Quelques outils de monitoring : Prometheus, AWS CloudWatch, Datadog
💡2 variantes qui peuvent être intéressantes
Comment gérez-vous les sauvegardes et la restauration en cas de panne ?
Pouvez-vous me parler d’un projet où une panne a été évitée grâce à une architecture bien pensée ?
3/ Quels outils ou pratiques recommandez-vous pour gérer les coûts dans le Cloud ?
Dans le Cloud, les coûts peuvent rapidement devenir incontrôlables si les ressources sont mal gérées. Il y plusieurs facteurs à prendre en compte : l’utilisation des ressources, le coût du stockage, le type d’instances utilisées (serveurs, conteneurs), les services inclus ou non dans l’abonnement …
Cette question est donc particulièrement pertinente quand vous cherchez une personne qui va devoir optimiser la gestion des coûts liés au Cloud (et c’est souvent le cas !) L’objectif : éviter une facture excessive.
Les stratégies pour réduire et optimiser les coûts sont nombreuses mais il y a quelques pratiques qui sont recommandées. Un « bon » candidat vous parlera des stratégies suivantes :
- adaptation des ressources (la taille des serveurs, les bases de données), à l’usage réel. On parle aussi de right-sizing. On va en quelque sorte faire la chasse au gaspillage et s’assurer qu’il n’y a pas de ressources inutilisées.
- planification de la demande pour ajuster les ressources en fonction de la demande. Par exemple, la mise en veille des environnements de tests la nuit.
- l’achat d’instances réservées qui permet de payer moins cher en s’engageant sur le long terme. Par exemple quand on sait que le projet va s’inscrire dans la durée. Exemple d’outils : AWS Reserved Instances, Azure Savings Plan
- mise en place d’alertes quand les coûts atteignent un seuil donné (ce qui nécessite évidemment d’avoir construit un budget). Avec des outils comme AWS Cost Explorer, Azure Cost Management, Google Cloud Billing Alerts)
💡Quelques variantes possibles pour aborder le sujet des coûts/ dépenses
Avez-vous déjà travaillé sur un projet où vous deviez réduire les coûts Cloud ? Quels ajustements avez-vous faits ?
Avez-vous déjà géré les coûts dans un environnement multi-cloud? Qu’avez-vous mis en place ?
4/ Comment préparez-vous une migration vers le Cloud ?
Migrer des systèmes vers le Cloud est souvent complexe. L’objectif ici est de voir si le candidat sait comment organiser une transition vers le Cloud.
Pour faire simple, on peut migrer soit en déplaçant tout tel quel, soit en adaptant progressivement, soit en reconstruisant à zéro.
Sur un sujet comme celui-là, tout va dépendre du niveau d’expérience que vous recherchez chez les candidats.
L’analyse de l’existant/ l’audit des applications actuelles est l’étape n°1 que tous les candidats devraient pouvoir citer.
La plupart des candidats devraient également être capables de vous donner les grandes étapes d’un projet de migration. L’analyse du besoin, la planification des actions, le choix et préparation des environnements cloud et la migration de services non-critiques en priorité. Et le candidat pourrait citer un ou deux outils comme AWS DMS, Azure Migrate ou Google Cloud VMware Engine par exemple.
Si vous cherchez une personne avec une expertise sur le sujet, alors vous pouvez attendre une réponse plus détaillée. Et dans ce cas, n’hésitez pas à le préciser.
Vous pourriez par exemple l’interroger sur les stratégies de migrations qu’il connaît. Vous pouvez lui demander de vous expliquer les « 6 R ». Ce sont 6 stratégies initialement développées par AWS pour faciliter la migration des applications vers le Cloud.
6 R pour : Rehost, Refactor, Revise Rebuild, Replace et Retain + un 7éme R plus récent pour Retire. Vous pouvez lire cet article si vous voulez comprendre en détail à quoi correspond chaque stratégie.
Un « bon » candidat parlera au moins de Rehost (ou Lift and Shift) et de Refactor (adaptation au Cloud).
💡Deux variantes possibles
Selon vous, quels sont les principaux défis à anticiper lors d’une migration ?
Pouvez-vous me décrire un projet de migration Cloud que vous avez mené ? Quelles sont les différentes étapes que vous avez suivies?
5/ Comment gérez-vous les accès et les permissions dans un environnement Cloud ?
La gestion des accès est un sujet central pour sécuriser un environnement Cloud. Une mauvaise configuration peut exposer des données sensibles ou permettre des actions non autorisées.
Cette question est intéressante quand vous recrutez pour une entreprise qui gère des données sensibles (CF question 6). Elle permet de vérifier que le candidat a une bonne connaissance des principes de sécurité et de conformité.
En fonction du besoin et du périmètre du poste, le candidat devrait vous parler d’un ou plusieurs des sujets suivants :
- Le principe du moindre privilège : chaque utilisateur n’a que les permissions strictement nécessaires à son travail, pour limiter les risques d’erreur ou de faille de sécurité
- La gestion centralisée avec IAM (Identity and Access Management) : elle permet de créer des rôles et d’attribuer des permissions précises aux utilisateurs et aux services. Exemple d’outils de gestion IAM : AWS IAM, Azure Active Directory
- L’authentification multi-facteurs (MFA) : elle ajoute une couche de sécurité supplémentaire en demandant à l’utilisateur de rentrer un code unique en plus de son mot de passe
- L’audit et surveillance des accès : on vérifie régulièrement les accès et on désactive ceux qui ne sont plus utilisés pour éviter les risques d’intrusion
Pour chaque élément de réponse, pensez à demander des exemples 👉dans quel projet/ expérience avez-vous rencontré cette problématique?
💡 Quelques variantes à tester
Quels outils utilisez-vous pour surveiller et gérer les permissions ?
Comment supprimez-vous des accès inutiles dans un environnement Cloud ?
Comment contrôlez-vous régulièrement que les permissions sont adaptées et à jour ?
6/ Comment gérez-vous les données sensibles dans un environnement Cloud ?
Cette question est pertinente quand vous recrutez pour une entreprise qui doit respecter une règlementation stricte (ex : norme PCI-DSS). Vous pourrez vérifier si le candidat comprend les enjeux de sécurité et de conformité liés aux données sensibles (personnelles, médicales, financières…)
Un « bon » candidat parlera des pratiques suivantes (au moins 2 selon son expérience) :
Le chiffrement des données
- au repos : les données stockées sont chiffrées avec une clé secrète. Les outils utilisés : AES-256, AWS S3 encryption, Azure Storage encryption)
- En transit : Les échanges entre serveurs sont protégés (HTTPS, TLS 1.2+).
La gestion des clés de chiffrement
- stockage sécurisé des clés avec des services dédiés. Outils utilisés : AWS KMS, Azure Key Vault, Google Cloud KMS).
- la rotation des clés pour éviter les fuites de sécurité
Le contrôle des accès aux données
- le principe du moindre privilège : les utilisateurs ont accès uniquement aux services nécessaires
- IAM (Identity & Access Management) pour gérer les permissions avec des outils comme AWS IAM, Azure AD, Google IAM).
Audit et surveillance des accès
- détection des comportements anormaux : on reçoit des alertes en cas d’accès suspect. Outils utilisés: SIEM, AWS GuardDuty, Azure Security Center
- journalisation des accès : on réfléchit à « qui accède à quelles données et quand ? ». Outils utilisés : AWS CloudTrail, Google Cloud Audit Logs
💡 Quelques variantes sur le même sujet
Quelles solutions avez-vous déjà mis en place pour sécuriser des données sensibles ?
Que recommandez-vous pour assurer la conformité au RGPD dans le Cloud ?
Avez-vous travaillé sur un projet nécessitant la gestion de données sensibles ? Comment avez-vous procédé ?
7/ Quels indicateurs suivez-vous pour surveiller une infrastructure Cloud ?
Vous ne poserez pas cette question à tous les profils Cloud. Ce sera pertinent surtout quand le poste pour lequel vous recrutez implique la gestion d’infrastructure à fort trafic. Dans ce cas, l’enjeu sera de garantir la performance et la disponibilité des services Cloud.
Sur ce type de poste, l’ingénieur Cloud devra suivre un certain nombre d’indicateurs pour réagir rapidement en cas de problème.
Les KPI les plus fréquents :
- La latence mesure le temps de réponse des services Cloud. Un temps de réponse élevé peut indiquer un problème de performance
- La disponibilité vérifie si le service est fonctionnel en continu. Très souvent les contrats définissent une durée maximale d’interruption du service sur l’année
- La consommation des ressources pour éviter la saturation des serveurs
- Le taux d’erreur qui permet d’analyser les erreurs pour détecter les dysfonctionnements et les résoudre rapidement
Pour monitorer (un synonyme de surveiller) l’infrastructure, les équipes peuvent utiliser des outils de surveillance automatisée comme AWS CloudWatch, Prometheus ou Datadog pour recevoir des alertes en cas d’anomalie.
💡2 variantes pour parler de monitoring
Parlez-moi d’un incident où un indicateur vous a permis de prévenir un problème avant qu’il n’affecte les utilisateurs
Quels outils utilisez-vous pour monitorer une infrastructure Cloud et quelles métriques priorisez-vous ?
8/ Comment collaborez-vous avec les différentes équipes dans un projet Cloud ?
Un ingénieur Cloud ne travaille pas seul. Il collabore avec les développeurs (qui déploient les applications), les équipes Ops (qui gèrent la production), les architectes (qui définissent l’infrastructure) et parfois même des équipes non-techniques (finance, conformité, etc.). Et ces équipes peuvent avoir des priorités différentes.
Donc la capacité à communiquer, à gérer des conflits et des tensions, à comprendre les contraintes des uns et des autres sont des qualités essentielles chez un Ingénieur Cloud.
Ici, les réponses vont énormément dépendre de ce que vous recherchez et de l’organisation en place.
Faites parler le candidat pour comprendre les différents contextes dans lesquels il a travaillé : avec des dev sur la mise en place d’un pipeline CI/CD par exemple. Ou comment il explique des décisions techniques à des équipes qui n’ont pas de connaissances techniques.
💡Quelques variantes qui pourront vous aider à creuser
Comment gérez-vous les désaccords entre les équipes dans un projet Cloud ?
Comment travaillez-vous avec les équipes de sécurité pour intégrer les bonnes pratiques Cloud sans ralentir les développements ?
Vous devez expliquer une contrainte technique liée au Cloud à une équipe non-technique. Comment faites-vous?
Conclusion
L’objectif n’est pas de remplacer l’entretien technique avec un·e spécialiste, mais de vous donner des repères pour identifier les candidats qui maîtrisent réellement leur sujet.
Aidez surtout les candidats à illustrer leurs propos en donnant des exemples concrets et en parlant de leurs expériences et projet.
Dans tous les cas : préparez vos questions AVANT l’entretien pour éviter les improvisations. Pour être crédible et gagner la confiance des candidat(e)s, vous devrez faire quelques efforts. Mais c’est aussi ce qui vous permettra de développer votre culture technique et de vous démarquer de la concurrence 😉