پردازندههای سری بلکول (Blackwell) انویدیا این روزها بهعنوان یکی از محبوبترین سختافزارها برای مراکز داده شناخته میشوند. دلیل این محبوبیت، تلاش شرکتها برای آموزش مدلهای زبانی بزرگ (LLM) با تعداد پارامترهای بسیار زیاد است. پیشاز این، شایعاتی منتشر شد مبنیبر اینکه مایکروسافت زودتر از سایر شرکتها به سرورهای بلکول دست خواهد یافت. اکنون طبق اعلام مایکروسافت، این شرکت قطعات لازم برای راهاندازی رک سرور سفارشی بلکول انویدیا را تهیه و سرورها را راهاندازی و عملیاتی کرده است.
سرویس ابری مایکروسافت آژور (Microsoft Azure) اولین پلتفرم ابری جهان محسوب میشود که از سیستم بلکول انویدیا با سرورهای هوش مصنوعی مجهز به پردازندههای GB200 استفاده میکند. در توضیحات مایکروسافت آمده است: «درحال بهینهسازی تمامی لایهها برای قدرتبخشیدن به پیشرفتهترین مدلهای هوش مصنوعی جهان هستیم و از شبکهی Infiniband و سیستم خنککنندهی مایع خلاقانهای بهره میبریم. برای کسب اطلاعات بیشتر به کنفرانس MS Ignite مراجعه کنید.»
مایکروسافت آژور حداقل یک رک سرور مبتنیبر GB200 با تعداد نامشخصی از پردازندههای B200 (احتمالا ۳۲ عدد) در اختیار دارد. این سرور از سیستم خنککنندهی مایع بسیار پیشرفتهای بهره میبرد و با سرور NVL72 GB200 انویدیا تفاوت دارد. به احتمال زیاد، مایکروسافت از رک سرور سفارشی انویدیا برای آزمایش مدلهای هوش مصنوعی استفاده و در ماههای آینده سرورهای مبتنیبر بلکول را برای مشتریان تجاری مستقر خواهد کرد.
انتظار میرود یک ماشین NVL72 GB200 با ۷۲ پردازندهی گرافیکی B200، حدود ۱۲۰ کیلووات برق مصرف کند و به همین میزان نیز گرما تولید خواهد کرد. باتوجهبه این موضوع، آزمایش روش خنککنندهی مایع اختصاصی مایکروسافت قبل از استقرار سرورهای مبتنیبر بلکول، ایدهی بسیار خوبی بهنظر میرسد.
عملکرد پردازندهی گرافیکی B200 انویدیا در زمینهی اجرای محاسبات FP8/INT8 نسبتبه پردازندهی H100 تا ۲٫۵ برابر (۴۵۰۰ ترافلاپس درمقابل ۱۹۸۰ ترافلاپس) بهتر است. پردازندهی B200 انویدیا درصورت استفاده از فرمت دادهی FP4، عملکرد فوقالعادهای به میزان ۹ پتافلاپس ارائه میدهد و در واقع، شرایط را برای آموزش مدلهای LLM بسیار پیچیده فراهم میکند.
ساتیا نادلا، مدیرعامل مایکروسافت با انتشار پستی در ایکس عنوان کرد: «همکاری دیرینهی ما با انویدیا و نوآوریهای عمیقی که انجام دادهایم، همچنان به رهبری ما در صنعت و قدرتبخشیدن به پیچیدهترین نیازهای پردازشی هوش مصنوعی کمک میکند.»
انتظار میرود مایکروسافت در کنفرانس سالانهی Ignite جزئیات بیشتری دربارهی سرورهای مبتنیبر بلکول و پروژههای هوش مصنوعی خود ارائه دهد. این رویداد از ۱۸ تا ۲۲ نوامبر ۲۰۲۴ (۲۸ آبان تا ۲ آذر ۱۴۰۳) در شیکاگو برگزار خواهد شد. استقرار گستردهی سرورهای مبتنیبر بلکول احتمالاً از اواخر سال جاری یا اوایل سال ۲۰۲۵ آغاز خواهد شد.