رویداد Google I/O 2025 با مجموعهای از اعلامیههای هیجانانگیز، عمدتاً در زمینه هوش مصنوعی، بسیار برجسته بود. ما بهروزرسانیها و ویژگیهای جدیدی برای مدلهای Gemini 2.5 (نسخه Pro و Flash) دریافت کردیم، به همراه یک تولیدکننده تصویر قدرتمندتر به نام Imagen 4 و تولیدکننده ویدیو با هوش مصنوعی Veo 3. گوگل همچنین Flow را معرفی کرد – یک ابزار اختصاصی فیلمسازی با هوش مصنوعی که مدلهای Imagen، Veo و Gemini را ترکیب میکند تا از طریق ورودیهای متنی ساده، صحنههای سینمایی خلق کند.
جمینی ۲.۵ پشتیبانی گستردهتری از زبانها را با قابلیت تبدیل متن به گفتار و صداهای بیانگر به بیش از ۲۴ زبان ارائه میدهد. گوگل مدعی است که تواناییهای استدلالی، چند حالته، برنامهنویسی و پردازش متن طولانی در هر دو مدل فلش و پرو بهبود یافتهاند.
متن ویدئو در اینجا قرار داده شده است:
ویژگی جدید و بزرگ مدل پرو، اضافه شدن حالت استدلال “تفکر عمیق” برای وظایف پیچیده ریاضی و کدنویسی است. این ویژگی هنوز در مرحله “آزمایشی” است و به زودی برای آزمایشکنندگان مورد اعتماد منتشر خواهد شد. گوگل میگوید که این حالت میتواند قبل از پاسخگویی، چندین فرضیه را مورد بررسی قرار دهد.
جمینی ۲.۵ پرو اکنون پیشروترین حالت هوش مصنوعی در بنچمارکهای WebDev Arena و LMArena است. این مدل ابزارهای کدنویسی و ساخت برنامههای وب را بهبود داده و تا یک میلیون توکن برای فهم طولانیمدت محتوا فراهم میکند. همچنین، جمینی ۲.۵ امنیت در برابر تزریقهای غيرمستقيم را بهبود بخشیده است.
نسخه پیشنمایش Gemini 2.5 Flash برای تمام کاربران در اپلیکیشن Gemini در دسترس است و انتشار عمومی آن در اواخر ماه ژوئن اتفاق میافتد. انتشار تجاری Gemini 2.5 Pro نیز کمی بعد از آن خواهد بود.
Imagen 4 اکنون میتواند تصاویر را با وضوح تا 2K تولید کند. گوگل ادعا میکند که دقت متن در کارتها، پوسترها و کمیکهای تولید شده بهبود یافته است. Imagen 4 از امروز در اپلیکیشنهای Gemini، Google Workspace، Whisk و Vertex AI در دسترس است.
**نمونههای Imagen 4 (به اشتراکگذاشته شده توسط گوگل)**
**Veo 3** مدل جدید ویدئویی هوش مصنوعی گوگل است که ویژگی شناخت بهبود یافتهای برای تبدیل متن به ویدیو دارد. این مدل قادر است ویدئوهایی با صدا، دیالوگ شخصیتها و صداهای پسزمینه تولید کند. Veo 3 از امروز برای مشترکین Google AI Ultra در ایالات متحده و کاربران شرکتی Vertex AI در دسترس است.
**Veo 2** قابلیت حرکت دوربین و افزودن یا حذف اشیاء را دریافت کرده است. کاربران همچنین میتوانند برای کنترل سبک ویدئوها، تصاویر اضافه کنند و قابها را با استفاده از ویژگی “outpainting” فراتر از مرزهای اولیه گسترش دهند.
**Flow** ابزار جدید فیلمسازی هوش مصنوعی گوگل است که ترکیبی از قابلیتهای مدلهای Veo، Imagen و Lyria را برای تولید صحنههای سینمایی با جزئیات بیشتر ارائه میدهد. گوگل ادعا میکند که Flow میتواند به قصهگویان کمک کند تا کلیپهای سینمایی فوقالعادهای با رعایت اصول فیزیکی و واقعگرایی خلق کنند. کاربران میتوانند حرکت دوربین، زوایا و دیدگاهها را کنترل کنند. علاوه بر این، امکان ویرایش و گسترش ویدئوهای تولید شده قبلی نیز وجود دارد. Google Flow اکنون برای مشترکین Google AI Pro و Ultra در ایالات متحده در دسترس است.