مجله کانگورو
معرفی هوش مصنوعی Whisk؛ خلق تصاویر با ویسک با 4 قابلیت خاص
در ادامه سری مقالات معرفی بخشهای مختلف Google Labs، به هوش مصنوعی Whisk میرسیم. گوگل همیشه با ایدهپردازیهای جالب مخصوص به خود دنیا را متحیر میکند و یکی از جدیدترین محصولات آن یعنی ویسک ساخت تصویر را وارد مرحله دیگری کرده است.
تصور کنید نیازی به نوشتن پرامپتهای طولانی نداشته باشید، اما تصویر مورد نظر خود را دریافت کنید. خیلی جالب میشود نه؟ هوش مصنوعی ویسک گوگل دقیقا برای همین منظور طراحی شده است.
در این مقاله به سراغ این هوش مصنوعی میرویم تا در مورد تمام ویژگیهای آن اطلاعات بیشتری به دست بیاریم و نحوه کار با آن را یاد بگیریم.
برای علاقمندان به ساخت ویدیو: معرفی هوش مصنوعی Veo 3
خلاصه قابلیتهای هوش مصنوعی ویسک (Google Whisk)
بله، حتماً. در اینجا جدولی جامع و خلاصه از ۴ قابلیت اصلی ویسک آماده شده است که میتوانید در ابتدای مقاله قرار دهید تا خوانندگان در یک نگاه با اهمیت این ابزار آشنا شوند:
| قابلیت اصلی | توضیح خلاصه |
|---|---|
| ورودی مبتنی بر تصویر (Image-based Input) | امکان تولید تصاویر جدید بدون نیاز به نوشتن متنهای پیچیده، صرفاً با آپلود و انتخاب تصاویر مرجع به جای پرامپت متنی. |
| سیستم ترکیب سهگانه (Subject, Setting, Style) | دستیار هوش مصنوعی ویسک به شما اجازه میدهد به صورت همزمان «موضوع»، «محیط» و «سبک» هنری را با سه تصویر مختلف تعیین کرده و آنها را با هم ترکیب کند. |
| اتصال به گالری گوگل (Google Photos Integration) | دسترسی مستقیم و سریع به آرشیو شخصی عکسهای شما در گوگل فوتوز برای انتخاب سوژهها و خاطرات جهت خلق آثار جدید. |
| ویرایش و ریمیکس سریع (Rapid Remixing) | قابلیت تغییر فوری و جایگزینی آسان هر یک از اجزا (موضوع، محیط یا استایل) برای ساخت نسخههای مختلف و ایدهپردازی سریع بدون شروع از صفر. |
هوش مصنوعی ویسک گوگل ابزاری برای خلق تصاویر از تصاویر
تا به الان هوش مصنوعیهای زیادی برای تولید تصویر به بازار دیجیتال عرضه شدهاند، مانند Midjourney. اما هوش مصنوعی Whisk یک ویژگی منحصر به فرد دارد و آن هم تولید تصویر از روی تصویر است. درواقع گوگل ابزاری را در اختیار کاربران خود قرار داده است که به جای توصیف تصاویر مورد نظر خود با کلمات، برای ابزار هوش مصنوعی تصویر ارسال کنند.
به عبارتی، با هوش مصنوعی Whisk دیگر نیازی به نوشتن پرامپت درست و طولانی نداریدو بلکه فقط کافی است تصاویری به عنوان مرجع برای ویسک گوگل آپلود کنید.
ابزارهای ویسک موضوع، استایل و سوژه تصاویر ارسالی را درک میکنند و بر اساس آنها تصاویر نهایی را میسازند. این ویژگی هوش مصنوعی ویسک گوگل به ویژه برای کسانی که یا حوصله نوشتن پرامپت را ندارند و یا در این زمینه ضعف دارند، محبوبیت زیادی دارد.


قابلیتهای اصلی هوش مصنوعی ویسک گوگل
به طور کلی تا حدی متوجه شدیم که چرا هوش مصنوعی Whisk خاص است. در ادامه تمام قابلیتهای این ابزار پیشرفته بررسی شده است.
1. ورودی تصویر به جای پراپمت
همانطور که تا حدودی اشاره شد، برای گرفتن خروجی مناسب از هوش مصنوعی ویسک گوگل نیازی به پرامپتهای طولانی ندارید و فقط کافی است سه دسته ورودی زیر را به گوگل بدهید:
- موضوع (Subject)
- محیط (Setting)
- سبک (Style)
به این ترتیب تمام جنبههای مهم خروجی مورد نظر شما تعیین شده است. Whisk به صورت هوشمندانهای این عناصر را با هم ترکیب میکند.
برای مثال شاید شما به دنبال یک تصویر سلفی باشید از خودتان در محیط یک کافه در شهری مثل پاریس و این تصویر را به سبک انیمههای هایائو میازاکی میخواهید. خیلی راحت تکتک موارد را به ویسک بگویید و تصویر انیمهای خودتان را در پاریس تحویل بگیرید.

2. گالری بزرگ گوگل در ویسک
یکی دیگر از نقاط قوت اصلی هوش مصنوعی Whisk، اتصال این برنامه به گالری بزرگ گوگل است. تصاویر گوگل (Google Photo) یکی دیگر از سرویسهایی است که توسط شرکت Google برای ذخیره صرفا تصاویر طراحی شده است.
به این ترتیب اگر تصاویر شما از قبل در Google Photo باشد، نیازی به آپلود دوباره آن در ویسک ندارید و مستقیما میتوانید از عکسهای شخصی خود استفاده کنید. این ویژگی به ابزار ویسک فضای صمیمانهتری میبخشد.
3. ابزارهای سریع ویرایش
برخلاف خیلی از ابزارهایی که برای تولید تصویر زمان زیادی را از کاربران میگیرد. زمانی که تصویری را در هوش مصنوعی ویسک گوگل ساختید و خوشتان نیامد، نیازی نیست تا وقت زیادی را برای گرفتن خروجی جدید صرف کنید.
ویسک به شما اجازه میدهد تا سریع تصویر را Remix کنید. استایل تصویر را تغییر دهید یا فضای دیگری را درخواست کنید، ویسک به سرعت خروجی دیگری را به شما تحویل میدهد. این موضوع چرخه بازخورد سریعی را برای طراحان و تولیدکنندگان محتوا به وجود میآورد و روند ایدهپردازی را سریعتر میکند.
4. قدرت مدل Imagen 3
هوش مصنوعی whisk از جدیدترین مدل تولید تصویر یعنی Imagen 3 بهره میبرد. مدلی که دقت زیادی روی جزئیات و درک بیشتری از انواع بافتهای پیچیده و نورپردازی دارد. به همین دلیل تصاویر درست شده توسط ویسک بسیار خلاقانه و واقعگرایانه به نظر میرسند.

مزیتهای اصلی استفاده از ویسک برای تولید تصویر
استفاده از ویسک برای تولیدکنندگان محتوای بصری از جهات زیادی کاربردی است. اولین موردی که توجه تولیدکنندگان را جلب کرده است، سرعت بالای هوش مصنوعی و در نتیجه صرفهجویی آنها در زمان است.
با کمک ویسک نه نیازی به نوشتن پرامپتهای طولانی دارند و نه نیازی به ادیتهای زیاد. حتی اگر هم از نتیجه راضی نباشند راحت آن را تغییر میدهند. همین ویژگی روی خلاقیت تاثیر مستقیم دارد. به جای صرف زمان برای درست کردن تصویر، زمان بیشتری را صرف خلاقیت و ایدهپردازی میکنند.
و در نهایت، همیشه تصاویری منحصربهفرد دریافت خواهند کرد. عکسهای شخصی و خاطرات هر فرد حس خاصی را به هر تصویر میبخشند.

جدول مقایسه ویسک با سایر ابزارهای تولید تصویر
| ویژگی | Google Whisk | Midjourney | DALL-E 3 (ChatGPT) |
|---|---|---|---|
| روش ورودی اصلی | تصویر (Visual) تمرکز بر روی آپلود تصویر به جای نوشتن متن. | متن (Text) نیاز به نوشتن پرامپتهای دقیق و پیچیده. | متن (Text) گفتگو با چتبات برای تولید تصویر. |
| سیستم ترکیببندی | سهگانه (Subject, Setting, Style) جدا کردن و ترکیب هوشمندانه سه عنصر اصلی تصویر. | تکی بر پرامپت ترکیببندی وابسته به مهعت کاربر در توصیف متن است. | تکی بر پرامپت هوش مصنوعی بر اساس متن شما ترکیببندی را انجام میدهد. |
| اتصال به گالری شخصی | دارد (Google Photos) دسترسی مستقیم به عکسهای شخصی کاربر. | ندارد فقط آپلود دستی تصاویر از طریق دیسکورد. | ندارد فقط آپلود دستی تصاویر در پلتفرم OpenAI. |
| مدل زبانی و تصویری | Imagen 3 جدیدترین مدل اختصاصی گوگل با تمرکز بر درک بصری. | مدلهای اختصاصی Midjourney تمرکز بالا بر زیباییشناسی و هنر. | مدلهای OpenAI تلفیق قدرتمند با قابلیتهای درک متنی GPT-4. |
| سهولت استفاده برای مبتدیان | بسیار بالا مناسب کسانی که مهارت نوشتن پرامپت ندارند. | متوسط تا دشوار نیاز به یادگیری دستورات و تکنیکهای پرامپتنویسی دارد. | بالا رابط کاربری گفتگو ساده است، اما هنوز هم توصیف متنی لازم است. |
| بهترین کاربرد | ریمیکس عکسها، ایدهپردازی سریع و ترکیب سبکها. | خلق آثار هنری دیجیتال و تصاویر با کیفیت سینمایی. | تولید تصاویر برای ارائهها، مطالب وبلاگ و کارهای تجاری. |
