Besoins critiques des data centers en matière de rendement énergétique
L'essor de l'intelligence artificielle fait de la puissance de calcul des data centers une ressource extrêmement précieuse, mais énergivore. Les équipes de produits doivent garantir rendement, densité et fiabilité tout en gérant les pics de demande et en tenant compte des contraintes infrastructurelles, réglementaires et politiques. Atteindre cet équilibre implique des innovations en matière de conversion de puissance rapide et efficace, et de supervision à plusieurs niveaux à synchronisation matérielle, pour la protection tant des rails basse tension critiques que des rails auxiliaires au niveau du système.
Les data centers modernes, en particulier ceux orientés IA, sont de plus en plus conçus en fonction de la densité de puissance et de la capacité énergétique totale plutôt qu'en fonction du simple nombre de serveurs. Alors que les serveurs constituaient autrefois la principale unité de planification, les data centers modernes sont désormais organisés autour de mégawatts d'énergie et de refroidissement, dimensionnés pour des rangées entières ou des modules de racks plutôt que pour des machines individuelles.
Les racks optimisés pour l'IA consomment souvent 30 kW ou plus, soit plusieurs fois les 5-15 kW typiques des racks de serveurs traditionnels, ce qui place la consommation de crête d'un seul rack au même niveau que celle d'un petit quartier résidentiel. Le fonctionnement dans cet environnement requiert des applications capables de gérer une alimentation étroitement provisionnée tout en maintenant la stabilité des systèmes lors de pointes d'énergie soudaines. Les composants de Texas Instruments illustrent comment les conceptions modernes peuvent répondre à ces nouvelles exigences de puissance et de fiabilité.
Anticiper les contraintes
Cette évolution signifie que les concepteurs ne peuvent plus partir du principe que les fonctionnalités vont s'adapter automatiquement. Chaque interaction, calcul ou expérience à données intensives a désormais un impact tangible sur les systèmes sous-jacents. Les fonctionnalités qui déclenchent des charges de travail importantes et soudaines peuvent introduire une latence, causer un étranglement ou exiger des compromis de mise à l'échelle dans d'autres parties du système.
Les conceptions les plus efficaces anticipent les contraintes au lieu de les ignorer, offrant une valeur ajoutée tout en maintenant la réactivité sous pression et en tirant le meilleur parti de chaque bit de puissance de calcul. Les concepteurs doivent évaluer les compromis entre vitesse, fonctionnalités et rendement, en conciliant l'expérience utilisateur et les limites physiques de calcul et d'énergie.
L'intégration du rendement, de la précision et de la résilience dans le matériel est essentielle pour concevoir des applications de data centers capables d'apporter de la valeur sans surcharger les systèmes. Les applications doivent rester réactives sous pression et optimiser chaque watt de puissance de calcul. Cela commence par des composants qui gèrent l'alimentation, surveillent la tension et maintiennent les performances en cas de pointes d'énergie soudaines.
Voici comment les composants de TI peuvent optimiser ces applications.
La couche de conversion
La technologie de puissance au nitrure de gallium (GaN) est de plus en plus essentielle à l'optimisation du rendement des data centers. Les serveurs d'IA équipés de processeurs graphiques (GPU) NVIDIA consomment de grandes quantités d'énergie qui doivent être réduites rapidement et avec précision. L'intégration d'un circuit d'attaque de grille haute vitesse avec un transistor à effet de champ (FET) GaN permet des fréquences de commutation plus élevées et des pertes de commutation réduites par rapport aux solutions en silicium conventionnelles. Cela améliore le rendement de conversion de puissance au niveau de la carte et du rack, ce qui se traduit par une diminution des pertes d'énergie sous forme de chaleur, une baisse de la demande de refroidissement et une réduction de la taille des circuits de distribution d'énergie. Les data centers bénéficient d'une plus haute densité de calcul et de meilleures performances énergétiques globales.
Le LMG3100R017VBER de TI (Figure 1) est un FET GaN de 100 V avec un circuit d'attaque de grille intégré haute fréquence dans un boîtier compact. Il combine le FET GaN et le circuit d'attaque, y compris un circuit auto-élévateur et un dispositif de décalage de niveau haut potentiel internes, permettant à deux dispositifs de former un demi-pont sans nécessiter de dispositif de décalage de niveau externe.
Figure 1 : Le LMG3100R017VBER est un FET GaN de 100 V, 1,7 mΩ avec circuit d'attaque de grille intégré. (Source de l'image : Texas Instruments)
Supervision du système
Les dispositifs GaN commutent extrêmement rapidement et fonctionnent à hautes tensions. Les fluctuations rapides et importantes, fréquentes dans les serveurs de data centers haute densité, peuvent provoquer des chutes ou des pics de tension, entraînant un fonctionnement imprévisible, une sollicitation accrue des GPU et autres composants, ainsi que des temps d'arrêt potentiels. Sans une surveillance appropriée, un étage de puissance FET GaN pourrait essayer de commuter lorsque la tension est en dehors de la plage de sécurité.
Alors que les rails haute tension critiques nécessitent une supervision avec action rapide, les rails auxiliaires requièrent une surveillance plus large et un séquencement de la logique du système d'alimentation, des E/S et des circuits de refroidissement pour maintenir la stabilité globale du système.
La ligne de circuits intégrés de superviseurs TPS3760 de TI (Figure 2) permet de surveiller un seul rail haute tension avec une réponse à synchronisation matérielle et une surcharge minimale. Bien que le fabricant propose des modèles pour les applications automobiles, les concepteurs ciblant les applications de data centers peuvent choisir des versions commerciales standard comme le TPS3760A015DYYR. Ces dispositifs utilisent des comparateurs de tension internes de précision pour vérifier en permanence la tension de rail par rapport à un seuil défini, générant un signal de réinitialisation si la tension passe en dehors de la plage autorisée.
Figure 2 : Les dispositifs TPS3760 sont des superviseurs de sous-tension/surtension de 65 V avec entrée de détection, courant de repos ultrafaible et délai programmable. (Source de l'image : Texas Instruments)
La gamme TPS389006 de TI fournit une supervision rapide et précise des rails basse tension alimentant les GPU, les CPU et la mémoire. Les dispositifs TPS389006007RTER (Figure 3), par exemple, surveillent ces rails en temps réel et activent immédiatement des signaux de réinitialisation lorsque la tension s'écarte des tolérances strictes. Positionnés à proximité du point de charge, ils protègent les dispositifs à fort courant sensibles contre les défauts transitoires et garantissent un fonctionnement stable en cas de variations rapides de la charge.
Figure 3 : Les composants TPS389600 tels que le TPS389006007RTER fournissent une supervision de tension multivoie de haute précision pour les systèmes fonctionnant sur des rails d'alimentation basse tension et présentant des tolérances d'alimentation étroites. (Source de l'image : Texas Instruments)
Les deux types de circuits intégrés de superviseurs complètent les FET GaN en combinant le séquencement au niveau du système avec une protection du point de charge rapide dans un schéma de supervision à plusieurs niveaux : les dispositifs TPS3760 surveillent les rails haute tension avec une réinitialisation à synchronisation matérielle, tandis que les dispositifs TPS389006 fournissent une surveillance à faible latence des rails basse tension critiques, garantissant un fonctionnement sûr et fiable en conditions de charge dynamique.
Conclusion
Les étages de puissance GaN haute vitesse, tels que le LMG3100R017VBER de TI, permettent une conversion de puissance compacte à faibles pertes, avec une commutation haut potentiel sûre. Les circuits intégrés de superviseurs tels que le TPS389006 et le TPS3760 offrent une surveillance à synchronisation matérielle à plusieurs niveaux, depuis les rails basse tension critiques jusqu'aux rails haute tension du système, garantissant un séquencement correct et une réponse rapide aux défaillances. En combinant une conversion de puissance rapide et efficace avec une supervision à plusieurs niveaux, les concepteurs peuvent augmenter la densité du système, réduire la chaleur et le gaspillage d'énergie, et maintenir des performances stables même en cas de fluctuations de la charge de travail.
Have questions or comments? Continue the conversation on TechForum, DigiKey's online community and technical resource.
Visit TechForum
