اخباراخبار NFT

#هوش مصنوعی ویواگو: انقلابی در تصاویر یا تهدیدی برای انحصاری‌ها؟

## معرفی HiDream-I1: یک مدل تولید تصویر متن‌باز قدرتمند

شرکت Vivago ai هفته گذشته از مدل HiDream-I1 رونمایی کرد، مدلی که به سرعت در میان پنج تولیدکننده برتر تصویر قرار گرفته و از مدل‌های معروفی مانند Flux، Auraflow و Stable Diffusion 3.5 و حتی برخی از مدل‌های اختصاصی مانند MidJourney v7 و Ideogram v3 پیشی گرفته است.

HiDream یک پلتفرم خلاقانه مبتنی بر هوش مصنوعی است که توسط شرکت Sparking Innovations Limited در هنگ کنگ توسعه یافته و مجموعه‌ای از ابزارها را برای تولید و ویرایش محتوای بصری ارائه می‌دهد. HiDream در سه نسخه “Full”، “Dev” و “Fast” عرضه می‌شود که نسخه Full بالاترین کیفیت خروجی را ارائه می‌دهد و برای رندر یک تصویر با کیفیت به ۵۰ مرحله نیاز دارد.

ویژگی بارز HiDream، حجم بالای پارامترهای آن (۱۷ میلیارد) است که امکان تولید تصاویر با کیفیت بالا در سبک‌های مختلف را در چند ثانیه فراهم می‌کند. این مدل تحت مجوز MIT منتشر شده و امکان استفاده نامحدود برای پروژه‌های شخصی و تجاری را فراهم می‌کند. با این حال، Vivago اشاره کرده است که داده‌های آموزشی خود را برای حذف محتوای مشکل‌دار فیلتر کرده است، اما خروجی‌ها را محدود نمی‌کند و به کاربران آزادی خلاقانه کامل می‌دهد.

برای اجرای محلی مدل‌های کامل، به ۲۷ گیگابایت VRAM نیاز است که تنها توسط پردازنده‌های گرافیکی قدرتمند با قیمت تقریبی ۲۵۰۰ دلار قابل ارائه است. با این حال، توسعه‌دهندگان در عرض چند روز پس از انتشار این ژنراتور تصویر، شروع به ایجاد نسخه‌های کوانتیزه شده برای اجرا بر روی تنظیمات “متواضع‌تر” کردند که به حداقل ۱۶ گیگابایت VRAM نیاز دارند.

برای کاربرانی که سخت‌افزار پیشرفته ندارند، Vivago دسترسی آنلاین از طریق پلتفرم خود را ارائه می‌دهد. نتایج آزمایش‌ها نشان می‌دهد که نسخه Full به طور مداوم در اکثر آزمایش‌ها از سایر مدل‌ها بهتر عمل کرده است، اگرچه مدل Dev تعادل چشمگیری بین سرعت و کیفیت ارائه می‌دهد.

این مدل‌ها را می‌توان به صورت ارزان قیمت بر روی سرورهای ابری به صورت پرداخت به ازای استفاده اجرا کرد، که آنها را به یک جایگزین قوی برای مدل‌های اختصاصی تبدیل می‌کند که برای اشتراک‌های ماهانه یا سالانه هزینه دریافت می‌کنند.

رونمایی از این مدل می‌تواند تاثیر مثبتی بر بازار مدل های تولید تصویر مبتنی بر هوش مصنوعی داشته باشد، زیرا یک گزینه متن‌باز و با کیفیت بالا را در اختیار کاربران قرار می‌دهد.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *