بنابر گزارش WCCF Tech، انویدیا از مدل زبانی بزرگ و متنباز خود با نام Llama-3.1-Nemotron-70B-Instruct رونمایی کرد؛ بنابر گفتهی تیم سبز، جدیدترین مدل هوش مصنوعی آموزشدیدهی این شرکت با ۷۰ میلیارد پارامتر متنوع، بهطور محسوسی از مدلهای فعلی مانند GPT-4o و Claude 3.5 برتر است.
انویدیا این مدل را بر اساس مدل پایه Llama-3.1-70B-Instruct متا توسعه داده و یکی از ویژگیهای کلیدی این مدل، استفاده از تکنیکی بهنام «مدل پاداش رگرسیونی SteerLM» است. این تکنیک به جدیدترین هوش مصنوعی انویدیا کمک میکند تا با استفاده از مجموعهدادههای باکیفیت و الگوریتمهای پیچیده، پاسخهای دقیقتر و مرتبطتری تولید کند.
انویدیا با معرفی مدل زبانی بزرگ Llama-3.1-Nemotron-70B-Instruc، گام بزرگی در جهت توسعهی هوش مصنوعی برداشته است.
بنابر گفتهی انویدیا، در آیندهی نزدیک، جدیدترین مدل هوش مصنوعی این شرکت میتواند در حوزههای مختلفی مانند پردازش زبان طبیعی، تولید محتوا و پاسخگویی به پرسشهای متنوع کاربران، مورد استفاده قرار گیرد.
هرچند هنوز عملکرد هوش مصنوعی Llama-3.1-Nemotron-70B-Instruc انویدیا را در موقعیتهای خاص مانند وظایف پیچیدهی کدنویسی یا مسائل مبتنیبر استنتاج ندیدهایم، اما معیارهای اولیه نشان میدهند که جدیدترین مدل زبانی بزرگ این شرکت بسیار پیشرفته است.
جالب است بدانید که بر اساس اطلاعات موجود در مدل کارت Llama-3.1-Nemotron-70B-Instruct در HuggingFace، این مدل خاص توانسته مسئلهی «توتفرنگی» را حل کند که مدلهای هوش مصنوعی سنتی قادر به حل آن نبودند. این مسئله شامل شمارش صحیح تعداد حرف R در کلمهی توتفرنگی (strawberry) میشود؛ هوش مصنوعیهای مشابه تعداد R را بهخاطر ضعف شناختی، ۲ عدد تشخیص میدهند.
-
داستان برند انویدیا؛ از تحول دنیای بازیهای ویدیویی تا رهبری هوش مصنوعی
-
تقاضا برای گرافیکهای Blackwell انویدیا فراتر از تصور است
مدل زبانی بزرگ Llama-3.1-Nemotron-70B-Instruct توسعهیافته توسط انویدیا در بسیاری از معیارهای ارزیابی، بهویژه Arena Hard که ابزاری برای ارزیابی خودکار مدلهای زبانی بزرگ محسوب میشود، رتبه اول را کسب کرده است. همچنین این مدل توانسته از مدلهای زبانی بزرگ معروف صنعت مانند GPT-4 شرکت OpenAI پیشی بگیرد که باتوجهبه تأثیر قابلتوجه تنظیم دقیق انویدیا بر مدل پایهی جدیدترین هوش مصنوعی خود، یک دستاورد مهم محسوب میشود.
یکی از ویژگیهای برجستهی این مدل، متنباز بودن آن است. انویدیا باعرضهی متنباز این مدل، به توسعهدهندگان امکان میدهد تا از آن برای ساخت برنامههای جدید و پیشرفته استفاده کنند. این مدل در سایت Hugging Face و وبسایت رسمی انویدیا قابلدسترسی است که نشاندهندهی تلاش انویدیا برای مشارکت و همکاری با جامعهی توسعهدهندگان است.