هوش مصنوعی

هوش مصنوعی «3D-GPT» برای ساخت جهان‌های سه‌بعدی معرفی شد


محققان دانشگاه ملی استرالیا، دانشگاه آکسفورد و آکادمی هوش مصنوعی پکن یک سیستم هوش مصنوعی جدید به نام «3D-GPT» توسعه داده‌اند که می‌تواند مدل‌های سه بعدی را به سادگی از توضیحات متنی ایجاد کند. این هوش مصنوعی قادر است با تجزیه‌کردن پرامپت کاربر و با استفاده از سه عامل خود، مدل‌های سه‌بعدی دقیقی بسازد. هوش مصنوعی 3D-GPT می‌تواند صنایع مختلف تولید محتواهای سه بعدی را متحول کند.

براساس مقاله‌ منتشرشده در arXiv، این هوش مصنوعی در مقایسه با عملکردهای سنتی، مدل‌های سه‌بعدی را به صورت کارآمدتری می‌سازد. هوش مصنوعی 3D-GPT فرایند مدل‌سازی سه‌بعدی را به بخش‌های قابل دسترس تقسیم می‌کند؛ هر بخش نیز به‌وسیله یک عامل انجام می‌گردد. بدین ترتیب پرامپت کاربر طی سه مرحله تجزیه و تحلیل و درنهایت کد دستوری مدل سه‌بعدی تولید می‌شود.

هوش مصنوعی 3D-GPT

جزییات بیشتر درباره هوش مصنوعی 3D-GPT

هوش مصنوعی 3D-GPT برای مدل‌سازی سه عامل کلیدی دارد. «عامل ارسال تسک» که پرامپت‌های متنی را تجزیه می‌کند. «عامل مفهوم‌سازی» که جزئیات ذکرنشده را به توضیحات اولیه اضافه می‌کند و «عامل مدل‌سازی» که پارامترها را تنظیم و کد نهایی را تولید می‌کند. کد به‌دست‌آمده را می‌توان در نرم‌افزارهای سه‌بعدی مانند Blender به مدل سه‌بعدی تبدیل کرد.

محققان هوش مصنوعی 3D-GPT را با پرامپت «یک صبح مه‌آلود بهاری، جایی که گل‌های شبنم‌‌زده در علفزاری سرسبز با درختان پُرجوانه احاطه شده است» آزمایش کردند. 3D-GPT توانست صحنه‌های سه‌بعدی کاملی را با گرافیک واقعی ایجاد کند که عناصر توصیف‌شده در متن را به دقت انعکاس می‌دهد. خروجی نهایی را در پایین مشاهده می‌کنید:

هوش مصنوعی 3D-GPT

در حالی که کیفیت گرافیک نهایی هنوز به واقعیت نزدیک نیست، نتایج اولیه نشان می‌دهد که رویکرد این هوش مصنوعی (تجزیه متن و تخصیص هر کدام به یک عامل) می‌تواند محتوای سه‌بعدی بسیار خوبی تولید کند. معماری مدولار این هوش مصنوعی این امکان را فراهم می‌کند تا هر جزء هوش مصنوعی به طور مستقل بهبود یابد.

محققان این هوش مصنوعی می‌گویند: «تحقیقات تجربی ما تأیید می‌کند که 3D-GPT نه تنها پرامپت‌ها را تفسیر و اجرا می‌کند و نتایج قابل اعتمادی ارائه می‌دهد، بلکه به طور مؤثر با طراحان انسانی همکاری می‌کند». محققان به این نتیجه رسیدند که سیستم و پتانسیل «مدل‌های زبانی بزرگ» (LLM) در مدل‌سازی سه‌بعدی اهمیت برجسته‌ای دارد و یک چارچوب اساسی برای پیشرفت‌های آینده در تولید صحنه و انیمیشن ارائه می‌دهد.

این هوش مصنوعی می‌تواند صنعت مدل‌سازی سه بعدی را متحول، کارآمدتر و در دسترس‌تر کند. همان‌طور که به سمت عصر متاورس پیش می‌رویم، ایجاد محتوای سه‌بعدی به‌وسیله ابزارهایی مانند 3D-GPT برای سازندگان در طیف وسیعی از صنایع، از بازی و واقعیت مجازی تا سینما و بخش‌های چندرسانه‌ای، می‌تواند ارزشمند باشد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا