По традиции Google провела ежегодную весеннюю презентацию I\O, но вопреки ожиданиям нам не показали свежий Android 15 и новые смартфоны Pixel. Долгая двухчасовая презентация была целиком посвящена искусственному интеллекту, поэтому пробежимся по основным моментам.
Перед запуском трансляции Google напомнила о сервисе MusicFX, где мелодии создаются по текстовому запросу. Оценить способности ИИ-композитора могут все желающие по ссылке, где требуется залогиниться в свой Google-аккаунт.
Мы узнали, что более 1,5 млн разработчиков используют Gemini. Теперь Gemini 1.5 Pro доступен как разработчикам, так и пользователям на 35 языках. Новая версия обработает больше данных, это касается текстов, аудио и видео. Контекстное окно увеличили с 1 до 2 млн токенов.
Ещё появилась «облегчённая» версия Gemini 1.5 Flash, оптимизированная для более простых задач, Упор на более быстрый отклик и низкую стоимость. Как пример — чат-приложения или поиск данных в документах.
В приложении Google Photo точнее распознаются запросы, а значит, легче и быстрее найти нужное изображение. Как пример, можно попросить показать фотографии с определёнными госномерами на машинах, а поиск выдаст нужный результат. Или попросить показать своего ребёнка в воде, а в ответ появятся все подходящие по смыслу фото и видео.
К тому же, в этом году для жителей США в поиске Google станет доступна функция AI Overview — это краткий ответ по запросу. Нейросеть анализирует источники и выдаёт суть, без необходимости посещать сайт и искать нужное самому. Функция тестирует с 2023 года, но только сейчас начнёт «раскатываться».
Imagen 3 — лучший инструмент Google для создания фото по текстовому описанию на сегодняшний день. Чёткость, высокая детализация, реалистичное освещение — всё, что душе угодно в самых разных стилях.
Все фото сделаны в Imagen 3
Veo — нейросеть для создания и редактирования видео в 1080p длительностью более минуты в различной обработке: нуар, фотореализм, киберпанк или сюрреализм. Она создаёт ролики по текстовому запросу, но можно использовать другое видео или фото.
Поисковые запросы в Google будут анализироваться системой, разделяться на части. Поисковик сам поймёт приоритеты и выдаст ответ за секунды, сэкономив несколько минут или даже часов. Если лень писать текстовый запрос, то можно сразу отправить видео — функция пока недоступна, но в скором времени появится.
Сообразительный помощник обработает данные в документах. К примеру, можно проанализировать свои расходы в таблице, отправив простой текстовый запрос: «Куда ушли деньги?» Gemini 1.5 Pro появится в боковой панели офисных приложений Google, в течение следующего месяца пользователи с платной подпиской смогут с его помощью выполнять рутинные задачи. Подготовить ответы на электронную почту, используя ранее просмотренные документы. Или просто напомнить в нужное время, что пора бы отправить письмо.
Gemini Live — это ответ на ChatGPT 4o. Вы можете пообщаться с Gemini, он выступит в роли собеседника. Он не только даст ответы на вопросы, но и расскажет, что видит вокруг, определяя объекты через камеру в режиме реального времени. Причём речь не только про камеру смартфонов, но и очки. Диалоги с ИИ выйдут на новый уровень в ближайшем будущем, функция пока что в разработке.
Всё это многообразие контента, созданного нейросетями, нужно как-то помечать. Для этого пригодятся водяные знаки SynthID. Ими можно маркировать не только фото или видео, но и музыку. Борьба с дипфейками, защита авторских прав — человечество справедливо опасается возможных проблем от ИИ в будущем.
Борьба с надоедливым спамом и мошенничеством по телефону тоже ляжет на Gemini. Ассистент определит подозрительные запросы собеседника во время звонков и выдаст уведомление, если заметит неладное во время сомнительного диалога с представителем банка. Добровольная прослушка телефона со стороны Google? Звучит как-то не очень скверно.
Google Gems — это персонифицированный чат-бот со своим характером, который будет доступен для пользователей платной версии Gemini Advanced.
В Chrome на компьютерах появится помощник Gemini Nano. Облегчённая версия нейросети сгенерирует текст для соцсетей или напишет заметку прямо в окошке браузера.
Функция «Обвести и найти» (Circle to Search), доступная владельцам Pixel и Samsung Galaxy S24, теперь работает и с математическими формулами. Нужно выделить объект, изобразив круг на экране, после чего система выдаст подсказку.
Презентация была исключительно софтовой, но можно порадоваться за будущих пользователей новых Pixel — они смогут оценить все многочисленные возможности Gemini на устройствах. Эра ИИ в разгаре, будет интересно посмотреть, чем на это ответит летом Apple во время ежегодной WWDC. Учитывая, что на днях Apple договорилась с OpenAI об использовании технологий в айфонах, есть надежда, что наконец-то она будет на равных тягаться с Google в этой части.
И да, небольшая новость про Android была. Уже завтра пользователи Pixel и других смартфонов от партнёров смогут скачать вторую бету Android 15. И для тех, кто любит считать — 121 раз прозвучало слово AI (ИИ) во время презентации, такая история.
Нет комментариев.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.
Microsoft Windows 11, 10, 8.1, 7, XP, Server -
10-10-2024, 09:31История и эволюция программного обеспечения Aimp
31-03-2021, 15:38Схемы материнских плат ПК
3-05-2024, 12:29Схемы материнских плат ноутбуков
3-05-2024, 12:29Microsoft подтвердила, что мартовские
12-03-2021, 11:31Нашли ошибку?
Вы можете сообщить об этом администрации.
Выделив текст нажмите CTRL+Enter