رویداد Google I/O 2025 با مجموعه‌ای از اعلامیه‌های هیجان‌انگیز

پربازدیدترین این هفته:

مطالب ترند و داغ:

شما هم با خودتان حرف میزنید/ بخوانید

از قانون 2-7-30 برای بهبود چشمگیر حافظه خود استفاده کنید

دیگران در حال خواندن این صفحات هستند:

خانه » رویداد Google I/O 2025 با مجموعه‌ای از اعلامیه‌های هیجان‌انگیز

اشتراک گذاری این مطلب:

رویداد Google I/O 2025 با مجموعه‌ای از اعلامیه‌های هیجان‌انگیز، عمدتاً در زمینه هوش مصنوعی، بسیار برجسته بود. ما به‌روزرسانی‌ها و ویژگی‌های جدیدی برای مدل‌های Gemini 2.5 (نسخه Pro و Flash) دریافت کردیم، به همراه یک تولیدکننده تصویر قدرتمندتر به نام Imagen 4 و تولیدکننده ویدیو با هوش مصنوعی Veo 3. گوگل همچنین Flow را معرفی کرد – یک ابزار اختصاصی فیلم‌سازی با هوش مصنوعی که مدل‌های Imagen، Veo و Gemini را ترکیب می‌کند تا از طریق ورودی‌های متنی ساده، صحنه‌های سینمایی خلق کند.

جمینی ۲.۵ پشتیبانی گسترده‌تری از زبان‌ها را با قابلیت تبدیل متن به گفتار و صداهای بیان‌گر به بیش از ۲۴ زبان ارائه می‌دهد. گوگل مدعی است که توانایی‌های استدلالی، چند حالته، برنامه‌نویسی و پردازش متن طولانی در هر دو مدل فلش و پرو بهبود یافته‌اند.

متن ویدئو در اینجا قرار داده شده است:

ویژگی جدید و بزرگ مدل پرو، اضافه شدن حالت استدلال “تفکر عمیق” برای وظایف پیچیده ریاضی و کدنویسی است. این ویژگی هنوز در مرحله “آزمایشی” است و به زودی برای آزمایش‌کنندگان مورد اعتماد منتشر خواهد شد. گوگل می‌گوید که این حالت می‌تواند قبل از پاسخگویی، چندین فرضیه را مورد بررسی قرار دهد.

جمینی ۲.۵ پرو اکنون پیشروترین حالت هوش مصنوعی در بنچمارک‌های WebDev Arena و LMArena است. این مدل ابزارهای کدنویسی و ساخت برنامه‌های وب را بهبود داده و تا یک میلیون توکن برای فهم طولانی‌مدت محتوا فراهم می‌کند. همچنین، جمینی ۲.۵ امنیت در برابر تزریق‌های غيرمستقيم را بهبود بخشیده است.

نسخه پیش‌نمایش Gemini 2.5 Flash برای تمام کاربران در اپلیکیشن Gemini در دسترس است و انتشار عمومی آن در اواخر ماه ژوئن اتفاق می‌افتد. انتشار تجاری Gemini 2.5 Pro نیز کمی بعد از آن خواهد بود.

Imagen 4 اکنون می‌تواند تصاویر را با وضوح تا 2K تولید کند. گوگل ادعا می‌کند که دقت متن در کارت‌ها، پوسترها و کمیک‌های تولید شده بهبود یافته است. Imagen 4 از امروز در اپلیکیشن‌های Gemini، Google Workspace، Whisk و Vertex AI در دسترس است.

**نمونه‌های Imagen 4 (به اشتراک‌گذاشته شده توسط گوگل)**

**Veo 3** مدل جدید ویدئویی هوش مصنوعی گوگل است که ویژگی شناخت بهبود یافته‌ای برای تبدیل متن به ویدیو دارد. این مدل قادر است ویدئوهایی با صدا، دیالوگ شخصیت‌ها و صداهای پس‌زمینه تولید کند. Veo 3 از امروز برای مشترکین Google AI Ultra در ایالات متحده و کاربران شرکتی Vertex AI در دسترس است.

**Veo 2** قابلیت حرکت دوربین و افزودن یا حذف اشیاء را دریافت کرده است. کاربران همچنین می‌توانند برای کنترل سبک ویدئوها، تصاویر اضافه کنند و قاب‌ها را با استفاده از ویژگی “outpainting” فراتر از مرزهای اولیه گسترش دهند.

**Flow** ابزار جدید فیلم‌سازی هوش مصنوعی گوگل است که ترکیبی از قابلیت‌های مدل‌های Veo، Imagen و Lyria را برای تولید صحنه‌های سینمایی با جزئیات بیشتر ارائه می‌دهد. گوگل ادعا می‌کند که Flow می‌تواند به قصه‌گویان کمک کند تا کلیپ‌های سینمایی فوق‌العاده‌ای با رعایت اصول فیزیکی و واقع‌گرایی خلق کنند. کاربران می‌توانند حرکت دوربین، زوایا و دیدگاه‌ها را کنترل کنند. علاوه بر این، امکان ویرایش و گسترش ویدئوهای تولید شده قبلی نیز وجود دارد. Google Flow اکنون برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس است.

نظرسنجی

نظر شما در مورد کیفیت این مقاله چیست؟

اینجا می تونی سوالاتت رو بپرسی یا نظرت رو با ما در میون بگذاری: