AI Expansion 🎛 📑


Гео и язык канала: Весь мир, Русский
Категория: Технологии


AI инструменты, интересные фичи AI сервисов и кейсы их использования. Нейронки для реализации проектов и прикладных задач. Админ @umdoma

Связанные каналы

Гео и язык канала
Весь мир, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Derp Learning
Видео недоступно для предпросмотра
Смотреть в Telegram
Step-Video-T2V - opensource 30b text2video model (MIT)

What are you doing, StepFun?
Китайцы в очередной раз упоролись риса и выкатили в опенсорс здоровенную модель text2video.

Генерит до 544px992px204кадров, жрет 80gb VRAM, любит партию и вождя - все как мы любим.
Лицензия при этом MIT на код и модели (хотя веса и попахивают hunuyan)

hunuyan в девичестве генерил 720px1280px129f за 60gb VRAM, затем народные умельцы усмирили его аппетиты до 12gb - HunyuanVideoGP: Large Video Generation for the GPU Poor
Так что ждем gpu poor версию и погнали!

github
paper
model
demo (из поднебесной)

@derplearning


Репост из: эйай ньюз
Введение в LLM с нуля - новое видео Карпатого

Видео простым языком объясняет что такое LLM, как они работают внутри, что они могут и не могут и как этим пользоваться.

Для тех кто не знает - Андрей Карпатый был одним из сооснователей OpenAI и директором по AI в Tesla. Сейчас занимается образованием и пилит лучшие видосы про ИИ на ютубе. Если интересно посмотреть больше - вот подборка видосов.

https://www.youtube.com/watch?v=7xTGNNLPyMI

#ликбез
@ai_newz


Репост из: AI News | Midjourney & ChatGPT
Видео недоступно для предпросмотра
Смотреть в Telegram
⚡️ Нейронка для оценки здоровья

Эта нейронка смогла найти редкую болезнь, которую НЕ ОБНАРУЖИЛИ даже врачи: редиттор пять лет боролся с хронической усталостью и болью в суставах, а на лечение он потратил более 100 тыс. долларов, посетив более 30 больниц.

В итоге он просто сотворил шедевр — загружаете в нейронку ваши мед. записи, она автоматом оценивает их и выносит вердикт.

Бесплатно пробуем тут.

Ai News


Репост из: AI News | Midjourney & ChatGPT
⚡️ Генерируем любые приложения прямо на смартфоне

• Основа — Claude Sonnet 3.5.
• Генерируй всё: от офисных приложений до сложных игр с сюжетом.
• Просто вводи запрос — получай готовый код.
• ИИ отлично понимает русский язык.
• Мгновенное тестирование приложений.
• Отдельный ИИ-агент поможет редактировать финальный продукт.

Пробуем тут.

Ai News


Репост из: AI News | Midjourney & ChatGPT
Видео недоступно для предпросмотра
Смотреть в Telegram
⚡️ Бесплатно генерируем музыку

Генератор аудио доступен бесплатно, но работает по очереди.

Пока лучше справляется с инструменталами и семплами, но теперь с лицензией Apache — можно использовать в коммерческих проектах.

Пробуем тут.

Ai News


Репост из: AI News | Midjourney & ChatGPT
⚡️ OpenAI запустил свой поисковик для ВСЕХ

Теперь использовать Search можно без регистрации, мы проверили.

• Никаких простыней из ссылок — SearchGPT сразу выдаёт готовый ответ с таблицами, картинками и схемами.
• Доступен на сайте и легко ставится как поисковик по умолчанию.

Доступ для первых 10 тысяч пользователей уже на подходе — вот здесь.

Ai News


Репост из: The Open Ai | Нейросети
Собрали топ-5 ИИ-сервисов для кодеров — с ними вы больше не будете застревать в работе и сэкономите ЧАСЫ на выполнении любой задачи.

• Cursor БАЗА. Поможет уже опытным прогерам быстро пилить сложные проекты. Прога понимает контекст и на скорости оптимизирует код, создавая приложения ЛЮБОЙ сложности.

• Windsurf — мастхев для новичков. Задачи щелкает за секунды и помогает закрывать таски без лишних хлопот.

• Bolt — генерит веб-приложения по одному промпту. Устанавливается по клику, а в удобном интерфейсе разберется даже гуманитарий.

Lovable — клепает лендинги или небольшие веб-приложения ПРЯМО В БРАУЗЕРЕ. Один промпт — и результат готов. Но сложными задачами сервис лучше не грузить.

• v0 dev — спроектирует и создаст интерфейс для любого проекта. Анимации, кнопки, поп-апы или всплывающие окна — v0 сделает весь UI за секунду. Совмещаем с Cursor или Windsurf для генерации полноценных продуктов.

Сохраняем себе и бустим продуктивность в разы.


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Имба для удалёнщиков — Pickle

Записываем 3 минуты своей говорящей головы. Затем ждём сутки, а то и двое, пока тренируется моделька — и вуаля, готово! Лежим на диване во время мита, пока ваш виртуальный клон с реалтайм липсинком отсиживается за вас перед веб-камерой.

Это молодой стартап с командой из 5–7 человек, так что технических деталей никаких. Есть только подписка, по которой за 24 бакса в месяц можно наговорить аж на 1000 минут (чего, надеюсь, хватит всем). Пока работает только на Mac — поддержка остальных устройств в разработке.

Пообещайте, что не будете пользоваться этой штукой 😗

getpickle.ai

@ai_newz


Репост из: Tips AI | IT & AI
Видео недоступно для предпросмотра
Смотреть в Telegram
🤖 agentrecipes — рецепты ИИ агентов.

Сайт, на котором можно узнать о рабочих процессов агентов с примерами кода, которые вы сможете легко скопировать и вставить в свои собственные приложения ИИ.

Пока есть 5 примеров. Добавлю сайт в канал, чтобы не потерять — потом примеров станет намного больше.

Ссылка [тут]

@tips_ai #tools


Репост из: Нейронавт | Нейросети в творчестве
Видео недоступно для предпросмотра
Смотреть в Telegram
Хорошие новости для недомузыкантов вроде меня

Генератор музыки YuE можно установить локально в пару кликов в Pinokio

Для работы достаточно 10Гб VRAM, только Nvidia

Умеет принимать ваше аудио на вход!

#text2music #music #audio2music #music2music


Репост из: Миша, давай по новой
🤖 Как сделать живого ИИ-спикера

Короче, тут сервис HeyGen выпустил крутую фишку, которая позволяет оживить любую фотку с человеком. И не просто заставить его говорить, но еще и двигаться. Например, ходить, двигать руками или поворачиваться. Я потестил — получается реально круто. Вот пошаговая инструкция:

1️⃣ Переходим на сайт HeyGen в раздел Avatars → Photo Avatar.

2️⃣ Нажимаем Generate или Upload. В первом случае описываем будущего аватара по промпту. Во втором — загружаем в сервис свою или чужую фотку.

3️⃣ Когда фотка будет готова, наводимся в ее правый верхний угол → Add motion. И описываем, что должен делать аватар.

4️⃣ Когда анимация будет готова, наводимся на ее правый угол → Create video with this avatar и дальше уже накладываем голос. Готово.


Репост из: Метаверсище и ИИще
AI coding agents & IDEs

В продолжение предыдущего поста.

Вот вам список кодогенераторов разной степени сложности. Нет Zed и Junie.

Оригинальный твит с картинками твиттор подсунул мне просто в ту же секунду, когда я опубликовал предыдущий пост. ИИ все видит и слышит...

Не перевожу, чтобы не бесить господ из чата.

1. SoftgenAI
- works well for both coders and non coders
- can fix its own bugs
- can host the web apps


2. Cursor
- a fork of a VC code
- raised loads of funding turning into a unicorn
- founders went on a Lex Fridman pod
- turns coders into 10x devs. Not the best fit for non-coders.

3. Wrapifai
- perfect for mini tools (lead magnets or tools to drive SEO traffic)
- mostly produces functioning app right away with one prompt
- doesn't handle serious apps
- unlimited apps (instead of per token..)

4. Windsurf (works well for advanced apps. my top 3)
- acts as a true agent
- offers deepseek
- can use the web search
- has a memory.

5. GitHub Copilot ( the OG of this game, started back in 2020 )
- can generate code
- handles large codebases
- can merge PRs, fix bugs, search code

6. Lovable
- fastest-growing EU based startup today ($10M ARR)
- has native supabase integration
- has the best AI+NoCode mix on the market

7. Bolt
- started as a side project of stackblitz and went huge raising $105M
- works similar to softgen, lovable & windsurf


8. v0
- best for making well-designed web pages or UIs
- doesn't work well for fullstack apps
- can use figma as a starting point
- lets you edit elements one by one

9. Replit
- most advanced AI Agent for coding imho
- has two modes: Agent or Assistant
- true full stack app generator. Has its own server, db, hosting...

10. MarsX (my own product)
- a mix of AI, NoCode and High Code
- I built @seobotai, @indexrusher and all my other products using marsx
- it basically takes the whole coding world to the next level since it isn't a website builder, but "SaaS builder"

11. Claude
- it can write and run code
- super easy to get started (free)
- works for basic cases. e.g. building components or learning coding

12. Amazon Q
- very few people use it
- totally lagging behind the top players

13. Pear AI
- entered into YC
- had a huge drama around forking a github repo
- had a mentor call with them, two very talented guys taking an alternative path on competing with cursor

14. Devin
- super expensive
- targets corporate world
- acts as a junior dev in a dev team

very good review:
15. Github Spark
- works well for small or demo apps
- still behind the "waitlist"

16. IDX
- free alternative to cursor
- can build mobile apps
- uses gemini

17. Webdraw
- best for people with zero coding experience
- totally genius UX
- free
- turns sketches into web apps

18. Tempo Labs
- Generates full-stack apps using a text or image prompt
- It starts by making an architecture and diagrams
- I think they have the best AI Coding UX, wow

19. Cline
- VC code plugin
- works for large codebases
- supports any LLM
- runtime awareness

20. Continue dot Dev.
- an open source alternative to Cursor

21. Databutton
- from Norway
- backed by VCs who backed one of my startups
- has very unique approach, different from most of the players
- works great for true nocoders

22. Base44
- for noncoders
- all in one
- creates dashboard-like apps pretty well

23. Qodo
- for coders
- can write tests, refactor and generate code
- supports all llms(including deepseek)

24. Caffeine AI
- new player
- too early to say anything. for now just putting them into the list to come back to them later when they launch

25. Aider
- a terminal app for generating web apps out of prompts

@cgevent


Репост из: Tips AI | IT & AI
Видео недоступно для предпросмотра
Смотреть в Telegram
Энтузиасты выпустили клон [Deep Research]

Агент ИИ, который анализирует большие объемы веб-данных, извлеченных с помощью [firecrawl_dev].

Это открытый исходный код. Работает на [aisdk]. Вы можете использовать этот клон не платив OpenAI 200$ за Deep Research.

Проект на [GitHub]

@tips_ai #tools


Репост из: ИИволюция 👾
Классный твит от Андрея Карпатого (в переводе на русский).

Сообщение Андрея:
“Есть новый стиль программирования, который я называю "вайб-кодинг" (vibe coding) — когда просто плывёшь по течению, смиряешься с экспоненциальным разрастанием кода и вообще забываешь, что он существует. Это возможно, потому что LLM'ы (например, Cursor Composer с Sonnet) уже слишком хороши.

Я почти не трогаю клавиатуру — просто разговариваю с Composer через SuperWhisper. Прошу его делать самые ленивые вещи, типа "уменьши паддинг у сайдбара в два раза", потому что мне лень искать, где это исправить. Всегда жму "Accept All", даже не смотрю диффы. Если появляются ошибки, просто копирую их обратно без комментариев — и обычно это почему-то помогает.

Код растёт сам по себе, я уже не совсем понимаю, как он устроен, и чтобы в нём разобраться, пришлось бы реально сесть и читать. Иногда LLM'ы не могут починить баг, тогда я либо просто обхожу его, либо прошу случайные изменения, пока он каким-то образом не исчезнет.

Для одноразовых проектов на выходных это не так уж и плохо, но всё равно довольно забавно. Сейчас я делаю какой-то проект или веб-приложение, но это уже даже не совсем программирование — я просто смотрю на код, говорю, что надо сделать, запускаю, копирую какие-то куски, вставляю другие, и в целом всё работает.”


И вот теперь я однозначно могу сказать, что это супер подход для запуска MVP. Ты просто на вайбе фигачишь что-то и оно работает. А если не работает, то просто говоришь: “Оно не работает и нейросеть пытается починить”. Пофиг на качество кода на старте, мы на вайбе пилим стартапы!

ИИволюция


Репост из: Анализ данных (Data analysis)
🔥 DeepSeek Code Companion — это локальный чат-бот для помощи в программировании, основанный на модели DeepSeek-R1!

🌟 Он предоставляет функции отладки кода, генерации документации и разработки решений, при этом работает полностью офлайн, что обеспечивает конфиденциальность данных. Взаимодействие с ботом осуществляется через Gradio, предоставляя удобный веб-интерфейс.

🖥 Github

@data_analysis_ml


Репост из: эйай ньюз
Deep Research - продвинутый поиск от OpenAI

Выглядит это так - вы описываете модели что бы вы хотели узнать, она задаёт уточняющие вопросы и начинает поиск. Он занимает от 5 минут, до, примерно, получаса. Модель ищет новую инфу на основе уже найденой и возвращается с детальным репортом, с указанием источников.

Основана модель для Deep Research на ещё не релизнутой o3, которую зафайнтюнили делать поиск в интернете. Кроме обычного поиска ей в руки дали ещё и интерпретатор питона - так что она сможет строить графики и другие визуализации, на основе найденной информации.

На Humanity's last exam она умудряется набрать 26,6%, правда используя внешние источники и Python. И двух недель не прошло, а топовые результаты на бенче уже практически утроились с 9,4% на старте.

Фича уже доступна Pro подписчикам (100 запросов в месяц), Plus и Team на очереди (~10 запросов в месяц), остальные получат ещё позже. У гугла, если что, такая же фича запустилась ещё в декабре. Правда внутри там Gemini 1.5 Pro, так что качество по идее заметно хуже. Если кто-то пользовался - как ваши впечатления?

@ai_newz


Репост из: Dmitry
Langflow — это мощный инструмент, предназначенный для упрощения работы с языковыми моделями и создания сложных приложений на их основе. Он представляет собой графический интерфейс (GUI) для фреймворка LangChain, что позволяет пользователям легко экспериментировать и разрабатывать прототипы, используя интуитивно понятный интерфейс с функцией перетаскивания элементов.

## Преимущества Langflow

1. Удобство использования:
Langflow предлагает интуитивно понятный интерфейс, который позволяет пользователям без глубоких технических знаний быстро создавать и тестировать цепочки взаимодействий с языковыми моделями[1][6].

2. Автоматизация процессов:
Инструмент автоматически определяет язык, анализирует местоположение пользователя и идентифицирует язык браузера, что значительно улучшает пользовательский опыт, направляя посетителей на соответствующую языковую версию сайта[1].

3. Гибкость в разработке:
Langflow поддерживает создание пользовательских компонентов с использованием Python, что позволяет интегрировать специфическую логику и взаимодействовать с внешними API[3]. Это открывает возможности для создания уникальных решений под конкретные задачи.

4. Эффективность в обработке данных:
С помощью Langflow можно легко создавать конвейеры Retrieval-Augmented Generation (RAG), которые улучшают генерацию текста за счет извлечения релевантной информации из базы данных перед формированием ответа[7].

5. Поддержка различных случаев использования:
Langflow подходит для создания персональных ассистентов, чат-ботов и других приложений обработки естественного языка, что делает его универсальным инструментом для разработчиков[5][6].

В целом, Langflow является ценным ресурсом для разработчиков, стремящихся оптимизировать свои рабочие процессы и создавать инновационные приложения на основе языковых моделей.


Репост из: AI для продакта 🧠🚀
Видео недоступно для предпросмотра
Смотреть в Telegram
🎙 Клонируем голос за пару минут — тестируем Hailuo AI для озвучки текста

Делимся интересной находкой для тех, кто работает с озвучкой текста. Протестировали Hailuo AI, и результат впечатлил!

Что особенно хорошо:

• Озвучка происходит практически моментально, не нужно долго ждать результата
• В библиотеке есть готовая коллекция голосов на выбор. Доступен русский язык. Есть женские и мужские голоса, а также можно выбрать голос по возрасту
• А самый топ — можно создать клон своего голоса!

Как это работает: записываете себя всего 5-20 секунд, и программа на основе этой записи создаёт ваш цифровой голос. После этого любой текст можно озвучить своим голосом. Результат получается настолько реалистичным, что если не знать — даже можно не догадаться, что это AI!

Сейчас программа находится в бета-версии, вход через Google-аккаунт, информации о лимитах и ценах пока не нашли, работали без ВПН. 🔥

На видео показываем, как это работает на практике. Попробуйте — это прикольно!
#ИИ #AI #Нейросети #Hailuo
———
#Инструменты #Аудио

✍️Подписывайтесь: @aiforproduct


Репост из: Двоичный Кот
Видео недоступно для предпросмотра
Смотреть в Telegram
Пушка: NVIDIA выкатили Studio Vice — фичу, которая звучание даже самого УБИТОГО микрофона и вебки сделает СТУДИЙНЫМ! С помощью ИИ, конечно.

Тестим прямо сейчас, скачивая NVIDIA Broadcast тут и изучив специальный гайд тут.

Идеальная тулза для онлайн-заруб.


Репост из: эйай ньюз
Опенсорс Suno🤡🤡🤡

Наконец-то в опенсорс генераторах музыки сподвижки. Угадайте, кто? Правильно, китайцы YuE — по-русски йе! Yeah, ну или просто 乐. По звуку похоже скорее на Suno v2, но и это уже очень хорошо. Примеры в видосе и полные треки в комментариях.

К сожалению, какого-то демо не нашёл, поэтому своих тестов нет. Пейпер обещают скоро, а вот раскатить модельку у себя уже можно. Потребуется только 24 GB VRAM, то есть 4090 может осилить.

Ждём, когда оптимизируют и понаделают всякие финтифлюшки, по типу звуковых IP-адаптеров и контролнетов. :)

Модели на HF
Project page
GitHub

@ai_newz

Показано 20 последних публикаций.