Un article tagués avec « programming »

Les dangers cachés du C - Décortiquer les risques liés à la gestion de la mémoire

24 mai 2025 · 6 minutes de lecture

Ingénieur Logiciel

Le langage de programmation C. Il est souvent salué comme la « mère de presque tous les langages modernes », formant la pierre angulaire de tout, des systèmes d'exploitation et compilateurs aux moteurs de jeu et outils de chiffrement. Sa puissance et son contrôle de bas niveau sont inégalés, le rendant indispensable pour les infrastructures critiques. Pourtant, cette même puissance s'accompagne d'une responsabilité exigeante : la gestion manuelle de la mémoire.

À la différence des langages dotés d'un ramasse-miettes automatique, le C oblige les développeurs à « grandir et à gérer la mémoire par eux-mêmes ». Cela signifie allouer de la mémoire avec malloc et la libérer scrupuleusement avec free une fois qu'elle n'est plus nécessaire. Ce contrat apparemment simple entre malloc et free cache un champ de mines de pièges potentiels. Une mauvaise gestion de cette responsabilité peut entraîner des vulnérabilités de sécurité catastrophiques et une instabilité du système, se manifestant souvent par un « comportement indéfini » – un cauchemar pour les programmeurs, où tout peut arriver, d'un dysfonctionnement mineur à une compromission complète du système.

Examinons quelques-unes des erreurs de gestion de la mémoire les plus courantes et les plus dangereuses en C, illustrées par des incidents historiques tristement célèbres.

Les périls du C : Risques courants liés à la gestion de la mémoire

1. Les débordements de tampon (Buffer Overflows) : Quand les données débordent

Un débordement de tampon se produit lorsqu'un programme tente d'écrire plus de données dans un tampon de taille fixe qu'il n'a été alloué pour en contenir. Le C, de par sa conception, n'effectue pas de vérification automatique des limites. Cette absence de filet de sécurité signifie que si vous écrivez au-delà de la fin d'un tableau ou d'un tampon, vous pouvez écraser des données adjacentes en mémoire, y compris des instructions de programme critiques ou des adresses de retour sur la pile.

Les conséquences sont graves : comportement indéfini, plantages du programme ou, le plus dangereusement, exécution de code arbitraire. Un exemple classique est le ver Morris de 1988. Ce fléau des débuts d'Internet exploita des débordements de tampon dans des utilitaires UNIX courants comme Fingered et Sendmail pour injecter du code malveillant, infectant environ 10 % d'Internet à l'époque. Une simple vérification conditionnelle de la taille de l'entrée aurait pu éviter ce chaos généralisé.

2. Heartbleed : Une leçon sur les vérifications de longueur manquantes

Bien qu'il s'agisse d'un type spécifique de débordement de tampon, la vulnérabilité Heartbleed (2014) dans l'extension heartbeat d'OpenSSL illustre parfaitement le danger des validations de longueur manquantes. Le serveur était conçu pour renvoyer un message de « battement de cœur » d'un client. Le client déclarait une certaine longueur de message, puis envoyait les données. La faille ? Le code du serveur ne vérifiait pas si la longueur réelle du message reçu correspondait à la longueur déclarée.

Les attaquants pouvaient envoyer un message minuscule (par exemple, « hello ») mais le déclarer d'une longueur de 64 000 octets. Le serveur, faisant confiance à la longueur déclarée, lisait et renvoyait alors 64 000 octets de sa propre mémoire, y compris le message « hello » plus 63 995 octets supplémentaires de tout ce qui se trouvait immédiatement après le message en mémoire. Cela a permis aux attaquants de divulguer passivement des données sensibles comme des clés de chiffrement privées, des noms d'utilisateur et des mots de passe, affectant de vastes pans d'Internet.

3. Le "Use-After-Free" : Accéder à une mémoire fantôme

Cette vulnérabilité apparaît lorsqu'un programme tente d'accéder à un bloc de mémoire après qu'il a été libéré à l'aide de free(). Une fois la mémoire libérée, le système d'exploitation peut la réallouer à d'autres fins. Si un pointeur pointe toujours vers cette mémoire maintenant libérée (et potentiellement réallouée), y accéder peut entraîner :

Plantages : Si la mémoire a été réallouée et son contenu modifié, y accéder peut faire planter le programme.
Corruption des données : Écrire dans une mémoire réallouée peut corrompre d'autres parties du programme, voire d'autres programmes.
Exécution de code arbitraire : Un attaquant peut intentionnellement déclencher un "use-after-free", faire en sorte que la mémoire soit réallouée avec des données malveillantes, puis exploiter l'ancien pointeur pour exécuter son propre code.

La vulnérabilité d'Internet Explorer 8 (2013) en a fait la démonstration. Elle impliquait que JavaScript supprimait des éléments HTML, mais un pointeur vers l'objet libéré persistait. Un attaquant pouvait alors créer une page web malveillante qui déclencherait le "use-after-free", menant à la compromission du système par la simple visite du site.

4. Les erreurs de décalage (Off-By-One Errors) : La petite erreur de calcul à fort impact

Les erreurs de décalage sont des erreurs subtiles de calcul, impliquant souvent les limites de boucle ou l'indexation de tableau. En C, une manifestation courante est d'oublier de tenir compte du caractère de fin de chaîne (\0) lors de l'allocation d'espace pour les chaînes. Par exemple, si vous devez stocker une chaîne de 10 caractères, vous avez en fait besoin de 11 octets (10 pour les caractères + 1 pour \0).

Ces erreurs apparemment mineures peuvent entraîner des débordements de tampon (écriture d'un octet au-delà de la fin allouée) ou d'autres accès hors limites, provoquant un comportement imprévisible ou ouvrant des portes à l'exploitation.

5. La double libération (Double Free) : Libérer ce qui a déjà été libéré

Appeler free() deux fois sur le même bloc de mémoire est une « double libération ». Cela entraîne un comportement indéfini immédiat et peut gravement corrompre les structures de données internes utilisées par l'allocateur de mémoire (comme malloc et free).

Les implications sont graves :

Plantage du programme : Le programme peut planter immédiatement en raison d'une corruption de la mémoire.
Corruption du tas (Heap Corruption) : L'état interne du gestionnaire de mémoire peut devenir incohérent, entraînant un comportement imprévisible par la suite.
Exécution de code arbitraire : Un attaquant sophistiqué peut souvent manipuler les structures du tas via une double libération pour obtenir des primitives de lecture/écriture arbitraires, conduisant finalement à l'exécution de code à distance. Lorsque votre code entre dans le territoire du comportement indéfini, « tous les paris sont ouverts ».

Conclusion : La nature imprévisible du comportement indéfini

Le fil conducteur de ces erreurs de gestion de la mémoire est le « comportement indéfini ». Lorsque votre code C présente un comportement indéfini, le compilateur et l'environnement d'exécution sont libres de faire n'importe quoi. Votre programme peut sembler fonctionner, il peut planter, ou, le plus terrifiant, il pourrait créer une vulnérabilité subtile qu'un attaquant peut exploiter méticuleusement pour prendre le contrôle de votre système.

La puissance du C est indéniable, mais elle s'accompagne d'une exigence non négociable de minutie dans la gestion de la mémoire. Les incidents historiques soulignés ici servent de rappels frappants qu'un seul oubli dans la manipulation de malloc et free peut avoir des conséquences dévastatrices et concrètes. La programmation C sécurisée ne consiste pas seulement à écrire du code correct ; il s'agit d'anticiper et de prévenir toutes les manières possibles de mal gérer la mémoire.

Les périls du C : Risques courants liés à la gestion de la mémoire​

Conclusion : La nature imprévisible du comportement indéfini​

Les périls du C : Risques courants liés à la gestion de la mémoire

Conclusion : La nature imprévisible du comportement indéfini