AI Expansion 🎛 📑


Гео и язык канала: Весь мир, Русский
Категория: Технологии


AI инструменты, интересные фичи AI сервисов и кейсы их использования. Нейронки для реализации проектов и прикладных задач. Админ @umdoma

Связанные каналы

Гео и язык канала
Весь мир, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Ринат Шакиров | Промпты для Midjourney | ChatGPT
⭐️ Alibaba выпускает свою следующую мощную модель Qwen2.5-Max

Китай не успокаивается и давит по полной.

Подробности:

🔴Предварительно обучен на больших объемах данных и постобучен с помощью тщательно отобранных рецептов SFT и RLHF

🔴Достигает конкурентоспособной производительности по сравнению с моделями высшего уровня и превосходит DeepSeek V3 в таких бенчмарках, как Arena Hard, LiveBench, LiveCodeBench, GPQA-Diamond.

Вы можете попробовать его бесплатно в Qwen Chat, а также доступно в API.


Чат
Демо
API

#новости


Репост из: Точка сингулярности💥
🧬 Вышла новая нейросеть- примерочная, теперь ещё более качественная и с приятным интерфейсом.

Просто закидываем фото себя или модели, а в окно рядом — нужную одежду. ИИ сам вас приоденет, подогнав размер и структуру одежды.

Это бесплатно, пробуйте.

🧩 #КаталогНейросетей


Репост из: Метаверсище и ИИще
Видео недоступно для предпросмотра
Смотреть в Telegram
Вы будете смеяться, но у нас новый генератор видео (и картинок).

И это не китайские интерны, это .. китайские слоняры!

Алибаба сделала свой Qwen Chat и теперь там не только тексты, но и генерация картинок (как в chatGPT, Mistral LeChat, Gemini), более того, там же есть генерация видосов!

Бесплатно (лимиты пока не знаю), логин Гуглом возможен, генерит видео в 5 секунд.

Более того, там несколько моделей, среди которых опенсорсная Qwen2.5-1M с контекстом в Один Миллион токенов.

Мне все это отчаянно нравится - если каждый чат будет иметь теперь картинко- и видео-гегератор, я только за!

Ждём ответок от остальных.

https://chat.qwenlm.ai/

Пойду помучаю с телефона, не дают в выходные подетокситься.

@cgevent


Репост из: Миша, давай по новой
🤖 Как сделать подкаст по любой теме с несколькими спикерами

Да еще и поучаствовать в нем. И все это — бесплатно.

В этом поможет нейронка Google и их сервис Notebooklm.

1️⃣ Перейдите на сайт, авторизуйтесь через гугл-аккаунт и создайте новый проект. На стадии создания появится вкладка «Добавьте источники», куда можно добавить до 50 файлов. Туда можно загрузить файлы с гугл диска или ПК, добавить ссылку на сайт или YouTube.

2️⃣ Выберите нужные файлы и кликните на «Аудиопересказ» или «Глубокое обсуждение темы», чтобы создать подкаст. В первом случае получите что-то вроде саммари-рецензии. А во втором — большой подкаст.

И получается реально круто: нейронка проанализирует вашу информацию и создаст двух собеседников, которые будут ее разбирать. При этом голоса звучат очень реалистично.

Но что еще круче — вы тоже можете поучаствовать в беседе. Для этого запустите полученную запись и нажмите «Присоединиться» — собеседники остановятся и будут ждать ваших вопросов. А потом — отвечать на них.

Единственный минус — сейчас все работает на английском. Зато это отличный шанс попрактиковать общение.

Ну а если очень хочется получить подкаст на русском, то сначала делайте его на английском в Notebooklm → скачивайте → идите на сайт Elevenlabs и оформляйте подписку Creator за $11 → открывайте раздел “Dubbing Studio” → загружайте подкаст → выбирайте количество спикеров и язык, на который все нужно перевести. Через пару минут забирайте переозвученный подкаст и радуйтесь ;)

P. S. Запись подкаста на английском добавлю в комменты


Репост из: InNeuralNetwork
— Operator у аппарата 📞

OpenAI запустила Operator – первого агента, который может выполнять задачи на ПК за вас. Теперь AI не просто отвечает на вопросы, а реально действует: прокручивает страницы, кликает по кнопкам, заполняет формы и даже заказывает товары. Как человек, Operator взаимодействует с графическими и текстовыми данными. Например, вы можете попросить его:
– заказать продукты на
– забронировать билеты на самолет
– спалнировать путешествие на букинге

Но без ограничений не обошлось. Operator всегда спрашивает разрешение перед важными действиями: логином, оплатой или отправкой данных. Это тянет за собой, что нельзя заниматься незаконной и мошеннической деятельностью (помним про полиси и ее чудаковатость). Но можно сохранить шаблоны задач для повседневного использования.

И закатывать губу рано. Доступна бета, да и то в под пике Pro за 200$ в месяц для США 😭

Operator хоть и похож на CCU, но однозначно большой шаг для AI ассистентов. Работает из коробки и позволяет автоматизировать рутинные задачи

🤖 InNeuralNetwork


Репост из: эйай ньюз
Kling Elements: есть ли смысл?

Я уже писал про генерацию видео с заданныит объектами, когда вышла пика 2.0. Но пика, мягко говоря, слабовата. Клинг объективно на голову выше, да и версия 1.6 недавно вышла.

И вот я всё-таки решил потестировать *Elements*. Мои спекуляции о том, как работает эта фича в Pika (там она зовётся ingredients), можете почитать здесь.

Ну что там по тестам? Я закинул мокап с телефоном и фон с каким-то модерновым домом. Я сам не очень представлял, как их совместить — собственно, и вышла шляпа. Но я хотел проверить, как передастся текст, и... на удивление, у него получилось! Ну, почти. По крайней мере, надпись "эйай ньюз" реально видна. А это очень важно для всяких AI-шных промо-роликов, ведь это значит, что эта штука способна передавать логотипы.

(Но, кстати, если отдельно залить только лого, он вообще его не воспринимает.)

Юзать для каких-то брендовых историй, где нужно, чтобы логотип обязательно сохранился, можно. Если просто задать конечный и начальный кадры с таким вот мелким (да и крупным тоже) текстом, у вас, скорее всего, ничего, кроме каши из пикселей, не выйдет.

Однако всё равно это очень тупо — генерить видео текстом, не имея контроля над начальной картинкой (как это делается в обычном image2video). А что, если мне нужна композиция или "киношность" MidJourney? Приходится кучу раз тестировать разные комбинации фона и продукта. Поэтому на ожидание генерации уходит просто неимоверное количество времени и токенов.

Кстати, Клинг по ощущениям — самый медлительный генератор. Даже в те моменты, когда на серверы не такая большая нагрузка, как сегодня на релизе, ждать приходится в среднем минут 7.

Так что хз, такой себе костыль. Не более чем временное решение.

klingai.com

@ai_newz


Репост из: Двоичный Кот
Видео недоступно для предпросмотра
Смотреть в Telegram
Имба для инженеров: показали тулзу Adam CAD — она генерит ЛЮБЫЕ CAD-модели за считанные СЕКУНДЫ!

Модель можно сразу распечатать на 3D-принтере или пустить в производство: небольшой корпус для своих поделок, фигура для дома, отдельные детали крупного механизма — в мгновение тулза спроектирует ВСЁ!

Тестим тут.


Репост из: Tips AI | IT & AI
🗺 Простые инструменты на базе ИИ, но всё же интересно хотя бы раз их попробовать!

nomorecopyright — берет за основу загруженную картинку и генерирует похожую, таким образом можно обойти копирайт.

Documator — AI-сумматор документов.

Animated Drawings — анимирует нарисованный от руки рисунок, ребенок будет восторге!

infografix — генератор инфографики, таймлайнов и прочих визуализаций, ИИ доступен на 10 запросов в день.

whybot — это инструмент для глубокого изучения вопроса или темы. Он начинался как проект хакатона и им остается, можете использовать их api или свой от OpenAI.

@tips_ai #tools


Репост из: Метаверсище и ИИще
Видео недоступно для предпросмотра
Смотреть в Telegram
Kling Elements мне определенно нравятся.

Хотя бы тем, что можно выпить за Reels

Очень крутой автор.

@cgevent


Билл Гейт рекомендует прочитать эту книгу про AI, считая ее лучшей книгой освещающей будущее AI. Книга рассказывает о вызовах с которыми сталкивается и будет сталкиваться человечество интегрируя AI во все сферы жизни.




Репост из: Точка сингулярности💥
Видео недоступно для предпросмотра
Смотреть в Telegram
🧬 Luma AI выпустила модель для генерации видео Ray2

Ray2 для генерации видео из текста уже доступна платным подписчикам на официальном сайте https://lumalabs.ai/dream-machine

В будущем обещают возможность генерации видео из изображения и другого видео, а также доступ через API.

🧩 #КаталогНейросетей


Репост из: Метаверсище и ИИще
Ничего себе, а ответочка на Оператора из опенсорса (ТикТока) прилетела уже сегодня!

"Мы непосредственно воспринимаем изображение на экране, применяем процессы рассуждения и автономно генерируем правильные действия. Более того, мы может учиться на предыдущем опыте, итеративно улучшая свою работу за счет использования обратной связи с окружением."

А теперь внимание:
У них есть два способа генерирования следующего действия - один "интуитивный" (S1) и один "рассуждающий" (CoT) (S2).

S1 выигрывает на внутридоменных задачах, но S2 работает лучше внедоменных.

Все по Канеману - думай медленно, решай быстро. Под задачу.

Вот тут гитхаб: https://github.com/bytedance/UI-TARS-desktop
Тут фарш и модели: https://huggingface.co/bytedance-research/UI-TARS-7B-SFT

Тут рекомендуемый к просмотру собственный твиттор: https://x.com/UI_TARS

@cgevent


Репост из: AI для продакта 🧠🚀
Видео недоступно для предпросмотра
Смотреть в Telegram
📝 Кейс: Персональный AI-ментор

Смотрите, собрали GPTs-ментора для продактов. Он заточен под логистику, но вы можете поиграться с ним и понять, как это работает. А дальше расскажем, как сделать такого же помощника под ваши задачи - может даже круче нашего! 🙂

Если хотите быстрее расти, меньше сомневаться в решениях и вообще прокачаться в профессии - этот кейс для вас. Расскажем на примере Анны, как она сделала себе AI-помощника. Вот что у неё получилось:
• быстрее разобраться в новой сфере
• наладить работу с командой
• увереннее принимать решения по продукту

В полном руководстве вы найдете:

• Пошаговый процесс создания ментора
• Реальные диалоги и кейсы
• Готовые шаблоны промптов
• Чек-листы для самопроверки

➡️ Когда пригодится личный AI-ментор:

• Осваиваете новую область (перешли в новую сферу работы, начали изучать новый навык, погружаетесь в незнакомую тему)

• Хотите расти в профессии (нужен спарринг-партнер для проверки идей, готовитесь к повышению, развиваете новые компетенции)

• Решаете сложную задачу (запускаете свой проект, меняете карьеру, работаете над большой целью)

• Нужна регулярная поддержка (в творческих проектах, в личной эффективности)

➡️ Классно помогает, когда:
• Не с кем обсудить рабочие вопросы
• Нужен взгляд со стороны
• Хочется структурировать свои мысли
• Ищете нестандартные решения

🌟 Полное руководство по ссылке.

🌟 Попробуйте готового GPTs-ментора. Нужен аккаунт ChatGPT и VPN.

А ещё лучше — создайте своего персонального наставника, следуя инструкции!

#ИИ #AI #Нейросети #ChatGPT
———
#Кейсы #Ментор

✍️Подписывайтесь: @aiforproduct


Репост из: Метаверсище и ИИще
Видеогенераторы потихоньку тырят новые фичи друг у друга и у image-генераторов.

Но вот эта вот Minimax Subject Reference выглядит чуть убойнее, чем у других.

Лора по одной фотке. Без цензуры. Хорошее попадание.

Ибо обучено именно на лицах, и насколько я знаю, на мишках, мышках и котиках работать не будет.

Пара читов, для тех, кто будет пробовать:
- чем качественнее фотки, тем лучше
- чем подробнее промпты, тем лучше

Поглядите примеры, и снова вспомните, где мы были год назад.

Мне нравится бьюти стилист(ка), тем что конец бьютиблоггерам, Крыгину в каждый дом.

И конечно умопомрачительный Tahta Ular // Serpent's Throne от великолепного Дана Прадана

Эта отвязанная трейлер-панк-история с крокодилом, змеями и дифчонками в духе Страх и Ненависть в Азии нравится мне сильно больше, чем скафандры от Dor Brothers.
Оцените жестоко-хороший монтаж, динамику движений (Минимакс хорош) и нейрокавер от Udio.

Ещё раз: на входе одна фотка и ваше умение вязать лыко промпты. И Минимакс.
Поглядите 3, 4, 5й ролики, все поймёте

@cgevent


Репост из: CGIT_Vines
Видео недоступно для предпросмотра
Смотреть в Telegram
В Suno появилась функция audio input, теперь можно записать свои звуки, речь, и собрать из этого композицию.

Я когда спотифай слушаю, каждый раз ловлю себя на мысли сколько сгенерированных треков я уже послушал не подозревая этого.

На сколько просто теперь стало делать музыку, все еще удивляюсь.


Репост из: Tips AI | IT & AI
Видео недоступно для предпросмотра
Смотреть в Telegram
| Посмотрите, как Hunyuan AI может заменить персонажа в видеосцене.

[Парень] взял начало второго сезона сериала «Разделение» и из главного героя сделал Джона Уика.

Для этого был использован инструмент с открытым кодом — [Hunyuan Video], связку [ComfyUI-HunyuanLoom] и модель [LoRA] по Джону Уику.

Результат получился качественным, что это может перевернуть подход к созданию спецэффектов и съёмкам в целом 👍

@tips_ai #generated

Показано 17 последних публикаций.