هوش مصنوعی, اشتراک ها

معرفی هوش مصنوعی Whisk؛ خلق تصاویر با ویسک با 4 قابلیت خاص

هوش مصنوعی Whisk

در ادامه سری مقالات معرفی بخش‌های مختلف Google Labs، به هوش مصنوعی Whisk می‌رسیم. گوگل همیشه با ایده‌پردازی‌های جالب مخصوص به خود دنیا را متحیر می‌کند و یکی از جدیدترین محصولات آن یعنی ویسک ساخت تصویر را وارد مرحله دیگری کرده است.

تصور کنید نیازی به نوشتن پرامپت‌های طولانی نداشته باشید، اما تصویر مورد نظر خود را دریافت کنید. خیلی جالب میشود نه؟ هوش مصنوعی ویسک گوگل دقیقا برای همین منظور طراحی شده است.

در این مقاله به سراغ این هوش مصنوعی می‌رویم تا در مورد تمام ویژگی‌های آن اطلاعات بیشتری به دست بیاریم و نحوه کار با آن را یاد بگیریم.

برای علاقمندان به ساخت ویدیو: معرفی هوش مصنوعی Veo 3

خلاصه قابلیت‌های هوش مصنوعی ویسک (Google Whisk)

بله، حتماً. در اینجا جدولی جامع و خلاصه از ۴ قابلیت اصلی ویسک آماده شده است که می‌توانید در ابتدای مقاله قرار دهید تا خوانندگان در یک نگاه با اهمیت این ابزار آشنا شوند:

قابلیت اصلیتوضیح خلاصه
ورودی مبتنی بر تصویر (Image-based Input)امکان تولید تصاویر جدید بدون نیاز به نوشتن متن‌های پیچیده، صرفاً با آپلود و انتخاب تصاویر مرجع به جای پرامپت متنی.
سیستم ترکیب سه‌گانه (Subject, Setting, Style)دستیار هوش مصنوعی ویسک به شما اجازه می‌دهد به صورت همزمان «موضوع»، «محیط» و «سبک» هنری را با سه تصویر مختلف تعیین کرده و آن‌ها را با هم ترکیب کند.
اتصال به گالری گوگل (Google Photos Integration)دسترسی مستقیم و سریع به آرشیو شخصی عکس‌های شما در گوگل فوتوز برای انتخاب سوژه‌ها و خاطرات جهت خلق آثار جدید.
ویرایش و ریمیکس سریع (Rapid Remixing)قابلیت تغییر فوری و جایگزینی آسان هر یک از اجزا (موضوع، محیط یا استایل) برای ساخت نسخه‌های مختلف و ایده‌پردازی سریع بدون شروع از صفر.
پیشنهاد خرید
اکانت اختصاصی دیپ سیک DeepSeekتومان190,000 تومانخرید این سرویس

هوش مصنوعی ویسک گوگل ابزاری برای خلق تصاویر از تصاویر

تا به الان هوش مصنوعی‌های زیادی برای تولید تصویر به بازار دیجیتال عرضه شده‌اند، مانند Midjourney. اما هوش مصنوعی Whisk یک ویژگی منحصر به فرد دارد و آن هم تولید تصویر از روی تصویر است. درواقع گوگل ابزاری را در اختیار کاربران خود قرار داده است که به جای توصیف تصاویر مورد نظر خود با کلمات، برای ابزار هوش مصنوعی تصویر ارسال کنند.

به عبارتی، با هوش مصنوعی Whisk دیگر نیازی به نوشتن پرامپت درست و طولانی نداریدو بلکه فقط کافی است تصاویری به عنوان مرجع برای ویسک گوگل آپلود کنید.

ابزارهای ویسک موضوع، استایل و سوژه تصاویر ارسالی را درک می‌کنند و بر اساس آن‌ها تصاویر نهایی را می‌سازند. این ویژگی هوش مصنوعی ویسک گوگل به ویژه برای کسانی که یا حوصله نوشتن پرامپت را ندارند و یا در این زمینه ضعف دارند، محبوبیت زیادی دارد.

قابلیت‌های هوش مصنوعی ویسک گوگل

قابلیت‌های اصلی هوش مصنوعی ویسک گوگل

به طور کلی تا حدی متوجه شدیم که چرا هوش مصنوعی Whisk خاص است. در ادامه تمام قابلیت‌های این ابزار پیشرفته بررسی شده است.

1. ورودی تصویر به جای پراپمت

همانطور که تا حدودی اشاره شد، برای گرفتن خروجی مناسب از هوش مصنوعی ویسک گوگل نیازی به پرامپت‌های طولانی ندارید و فقط کافی است سه دسته ورودی زیر را به گوگل بدهید:

  1. موضوع (Subject)
  2. محیط (Setting)
  3. سبک (Style)

به این ترتیب تمام جنبه‌های مهم خروجی مورد نظر شما تعیین شده است. Whisk به صورت هوشمندانه‌ای این عناصر را با هم ترکیب می‌کند.

برای مثال شاید شما به دنبال یک تصویر سلفی باشید از خودتان در محیط یک کافه در شهری مثل پاریس و این تصویر را به سبک انیمه‌های هایائو میازاکی می‌خواهید. خیلی راحت تک‌تک موارد را به ویسک بگویید و تصویر انیمه‌ای خودتان را در پاریس تحویل بگیرید.

هوش مصنوعی ویسک

2. گالری بزرگ گوگل در ویسک

یکی دیگر از نقاط قوت اصلی هوش مصنوعی Whisk، اتصال این برنامه به گالری بزرگ گوگل است. تصاویر گوگل (Google Photo) یکی دیگر از سرویس‌هایی است که توسط شرکت Google برای ذخیره صرفا تصاویر طراحی شده است.

به این ترتیب اگر تصاویر شما از قبل در Google Photo باشد، نیازی به آپلود دوباره آن در ویسک ندارید و مستقیما می‌توانید از عکس‌های شخصی خود استفاده کنید. این ویژگی به ابزار ویسک فضای صمیمانه‌تری می‌بخشد.

3. ابزارهای سریع ویرایش

برخلاف خیلی از ابزارهایی که برای تولید تصویر زمان زیادی را از کاربران می‌گیرد. زمانی که تصویری را در هوش مصنوعی ویسک گوگل ساختید و خوشتان نیامد، نیازی نیست تا وقت زیادی را برای گرفتن خروجی جدید صرف کنید.

ویسک به شما اجازه می‌دهد تا سریع تصویر را Remix کنید. استایل تصویر را تغییر دهید یا فضای دیگری را درخواست کنید، ویسک به سرعت خروجی دیگری را به شما تحویل می‌دهد. این موضوع چرخه بازخورد سریعی را برای طراحان و تولیدکنندگان محتوا به وجود می‌آورد و روند ایده‌پردازی را سریع‌تر می‌کند.

4. قدرت مدل Imagen 3

هوش مصنوعی whisk از جدیدترین مدل تولید تصویر یعنی Imagen 3 بهره می‌برد. مدلی که دقت زیادی روی جزئیات و درک بیشتری از انواع بافت‌های پیچیده و نورپردازی دارد. به همین دلیل تصاویر درست شده توسط ویسک بسیار خلاقانه و واقع‌گرایانه به نظر می‌رسند.

مزیت‌های اصلی استفاده از ویسک برای تولید تصویر

استفاده از ویسک برای تولیدکنندگان محتوای بصری از جهات زیادی کاربردی است. اولین موردی که توجه تولیدکنندگان را جلب کرده است، سرعت بالای هوش مصنوعی و در نتیجه صرفه‌جویی آن‌ها در زمان است.

با کمک ویسک نه نیازی به نوشتن پرامپت‌های طولانی دارند و نه نیازی به ادیت‌های زیاد. حتی اگر هم از نتیجه راضی نباشند راحت آن را تغییر می‌دهند. همین ویژگی روی خلاقیت تاثیر مستقیم دارد. به جای صرف زمان برای درست کردن تصویر، زمان بیشتری را صرف خلاقیت و ایده‌پردازی می‌کنند.

و در نهایت، همیشه تصاویری منحصر‌به‌فرد دریافت خواهند کرد. عکس‌های شخصی و خاطرات هر فرد حس خاصی را به هر تصویر می‌بخشند.

جدول مقایسه ویسک با سایر ابزارهای تولید تصویر

ویژگیGoogle WhiskMidjourneyDALL-E 3 (ChatGPT)
روش ورودی اصلیتصویر (Visual)
تمرکز بر روی آپلود تصویر به جای نوشتن متن.
متن (Text)
نیاز به نوشتن پرامپت‌های دقیق و پیچیده.
متن (Text)
گفتگو با چت‌بات برای تولید تصویر.
سیستم ترکیب‌بندیسه‌گانه (Subject, Setting, Style)
جدا کردن و ترکیب هوشمندانه سه عنصر اصلی تصویر.
تکی بر پرامپت
ترکیب‌بندی وابسته به مهعت کاربر در توصیف متن است.
تکی بر پرامپت
هوش مصنوعی بر اساس متن شما ترکیب‌بندی را انجام می‌دهد.
اتصال به گالری شخصیدارد (Google Photos)
دسترسی مستقیم به عکس‌های شخصی کاربر.
ندارد
فقط آپلود دستی تصاویر از طریق دیسکورد.
ندارد
فقط آپلود دستی تصاویر در پلتفرم OpenAI.
مدل زبانی و تصویریImagen 3
جدیدترین مدل اختصاصی گوگل با تمرکز بر درک بصری.
مدل‌های اختصاصی Midjourney
تمرکز بالا بر زیبایی‌شناسی و هنر.
مدل‌های OpenAI
تلفیق قدرتمند با قابلیت‌های درک متنی GPT-4.
سهولت استفاده برای مبتدیانبسیار بالا
مناسب کسانی که مهارت نوشتن پرامپت ندارند.
متوسط تا دشوار
نیاز به یادگیری دستورات و تکنیک‌های پرامپت‌نویسی دارد.
بالا
رابط کاربری گفتگو ساده است، اما هنوز هم توصیف متنی لازم است.
بهترین کاربردریمیکس عکس‌ها، ایده‌پردازی سریع و ترکیب سبک‌ها.خلق آثار هنری دیجیتال و تصاویر با کیفیت سینمایی.تولید تصاویر برای ارائه‌ها، مطالب وبلاگ و کارهای تجاری.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *