Ну что, наконец-то Google выпустили что-то по-настоящему крутое? Или нет?
Gemini 1.5 Pro с возможностью анализировать до 1 миллиона токенов, и все это с пониманием сложных контекстов и мультимодальностью данных (изображения, видео, файлы, доки и т.д.)
Вот ссылка на блог-пост от Google, где представлены крутые примеры понимания контекста: 400 страниц книги/документа, изображения, видео продолжительностью 44 минуты, где модель находит нужный кадр. Выглядит прям очень круто, рекомендую посмотреть!
Видео 1, Видео 2, Видео 3
В конце блог-поста есть ссылка на Google AI Studio, где можно это потрогать своими руками, чем я прямо сейчас и займусь.
P.S.: Немецкий IP не сработал, я включил VPN и выбрал IP-адрес США, теперь все работает.
Gemini 1.5 Pro с возможностью анализировать до 1 миллиона токенов, и все это с пониманием сложных контекстов и мультимодальностью данных (изображения, видео, файлы, доки и т.д.)
Вот ссылка на блог-пост от Google, где представлены крутые примеры понимания контекста: 400 страниц книги/документа, изображения, видео продолжительностью 44 минуты, где модель находит нужный кадр. Выглядит прям очень круто, рекомендую посмотреть!
Видео 1, Видео 2, Видео 3
В конце блог-поста есть ссылка на Google AI Studio, где можно это потрогать своими руками, чем я прямо сейчас и займусь.
P.S.: Немецкий IP не сработал, я включил VPN и выбрал IP-адрес США, теперь все работает.