RE_POST


Гео и язык канала: не указан, Русский
Категория: Технологии


Инфоблог про нейросети. Копипаста. Репост.
👾Основной канал : https://t.me/future_2049
🔴 YouTobe https://clck.ru/38VZJo
🔵 ЧАТ https://t.me/ABILITY_2049
⚡️Буст https://t.me/boost/REPOST_AI
🧩Админ: https://t.me/arsen_ask

Связанные каналы

Гео и язык канала
не указан, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Tips AI | IT & AI
Видео недоступно для предпросмотра
Смотреть в Telegram
🎨 Flux.1-dev Upscaler ControlNet — оно берет изображение с низким разрешением и превращает его в высококачественную картинку. И всё это на GPU!

⚠️Хотя модель может работать с картинками большего разрешения, в демо есть ограничение — итоговое изображение не превышает 1024x1024 пикселей. Если запросишь что-то больше, система сначала уменьшит изображение, а потом снова его увеличит, из-за чего могут появиться артефакты.

Ссылка на демо. А если хочешь идеально четкую картинку? Запусти демо локально.

@tips_ai #tools


Репост из: ИИволюция 👾
Видео недоступно для предпросмотра
Смотреть в Telegram
Умельцы всё же «заставили» advanced voice mode петь песни, хотя эта возможность была урезана/обрезана в публичном доступе.

Пение конечно такое себе вышло, но пение 😀Достаточно было обхитрить модель в промпте. Вот что говорит пользователь реддита:

I've gotten it to sing by telling it to respond in the style of a character from Les miserables.


ИИволюция


Репост из: Data Secrets
⚙️ Сегодня Hugging Face пробил 1 млн загруженных моделей!


Репост из: Метаверсище и ИИще
На text-to-image арене появилась совершенно новая и непонятная модель для генерации картинок blueberry_0, которая побивает всех на свете, включая FLUX и Ideogram

Это тонкий троллинг strawberry или это опенАИ сами троллят?

Судя по тому, как она уходит от фотореализьма, это может быть та самая Dalle-4o, про которую нам намекали в мае.

Но качество (по крайней мере на арене.. ну такое).

Давайте сюда теории заговора, что это за модель?

И нет, это не Mystic v2, Мистик - это просто Флюкс с украшалками.

https://huggingface.co/spaces/ArtificialAnalysis/Text-to-Image-Leaderboard

На реддите народ бьется в истерике уже сутки...
https://www.reddit.com/r/StableDiffusion/comments/1fp6w4n/_/

@cgevent


Репост из: Нейродвиж
Видео недоступно для предпросмотра
Смотреть в Telegram
Ваш «Гарри Поттер» теперь Вархамеер 40 000.

Хагрид смотрится в броне лучше, чем в оригинальном фильме.


Репост из: Data Secrets
Возможно Llama 3.2 была не самым интересным вчерашним мультимодальным релизом: вышла Molmo, которая круче показывает себя на бенчмарках

Это семейство опенсорсных моделей от лаборатории Ai2. Есть варианты на 7В MoE (1B активных), 7В (таких две) и 72В. Самая крупная на бенчмарках обгоняет Llama 3.2 90B, и достает до полноразмерной GPT-4o, Gemini 1.5 Pro и Claude Sonnet 3.5.

В основе крупной модели Qwen2-72B + OpenAI CLIP в качестве vision-основы. А еще исследователи обещают скоро выкатить датасеты и код (включая vision encoder).

Все модели доступны под лицензией Apache 2.0 на HF (и в ЕС тоже!). Статью можно прочитать здесь, а вот тут доступно демо.


Репост из: Psy Eyes
Видео недоступно для предпросмотра
Смотреть в Telegram
Кстати FluxGym обновился и в нём теперь можно тренить не только Dev, но и Schnell с Dev2Pro.

Выбранные модели будут скачиваться автоматом.

Ещё там в Advanced просто море настроек появилось. Пока не решил это баг или фича.

Для обновления запустите FluxGym в Pinokio, нажмите Update в левой панели, и перезагрузите приложение.

Установка
Подробнее о FluxGym


Репост из: Psy Eyes
Flux Dev2Pro: базовая модель FLux из коробки хорошо умеет в детализацию и текст. Но некоторые недовольны лорами получаемыми на её основе, и тем, что тюнить её сложней, чем SD 1.5 или SDXL.

Технической документации на Flux нет, поэтому народ занимаются реверс инжинирингом, пытаясь из дистиллированной Dev версии воссоздать Pro, которой нет в опенсорсе.

Так недавно появилась Dev2Pro. Это модель натренированная на Dev, используя 3 млн высококачественных изображений при guidance = 1, чтобы приблизиться к Pro по настройкам и избавиться от модели учителя. Подробнее об этом подходе @zhiwangshi28/why-flux-lora-so-hard-to-train-and-how-to-overcome-it-a0c70bc59eaf' rel='nofollow'>написано тут.

Полученная модель Dev2Pro пригодна только для тренировки лор на её основе, а не инференса — генерации надо делать используя Dev (также как лору полученную из SDXL можно гонять в SDXL-Turbo).

По первым отзывам, лоры из Dev2Pro показывают более качественные результаты. Я потестил, пока 50/50: где-то хорошо следует промту, а где-то выдаёт одинаковые результаты.

Тренировать на основе Dev2Pro можно в FluxGym или OneTrainer, например.

@zhiwangshi28/why-flux-lora-so-hard-to-train-and-how-to-overcome-it-a0c70bc59eaf' rel='nofollow'>Пост
Хаггинг


Репост из: Метаверсище и ИИще
Я слежу за всеми этими AI 3D Generators.

Все эти многочисленниые бумаги и демо на Хаггинг Фейсе помирают сразу после публикации. Я больше не вижу смысла даже упоминать их в канале.

Среди тех, кто не помер, Tripo 3D, Meshy и Rodin.

Потому что они смотрят немного дальше, чем генерация.

Уже сейчас становится понятно, что из генерации приезжает говномеш. До тех пор, пока все используют одни и те же говнодатасеты.

Возможно что-то изменится, когда Shutterstock, который пожрал TurboSquid(не знали?) или Getty Images сделают что-то принципиально иное, на основе своих 3Д-стоков, содержащих информацию не только про облако вертексов, а и про UV, топологию, текстуры, нормали и прочая. Автодеск делал такое в 2018 году, но они выпилили из интернета это видео, хотя я в Ванкувере сам его видел на Сигграфе.

Итого, смышленые вышеперечисленные игроки пытаются пришпандорить к своим говномешам ретоп(отличная новость, смотри видео от Meshy, хотя это просто скрипт), текстуры и даже шейдеры (Rodin) - благо тут можно приподшаманить с апскейлерами и ИИ. Кстати, они делают автоматический паблишинг на Sketchfab.

Но самое дерзкое, что они замахиваются на анимацию.

Поглядите на анимационные пресеты в Meshy. Там виден, мать его, ТАЙМЛАЙН.

Да, это все пляшущие 3Д-монстротянки. И до прода там пропасть. Но до тиктока - нет.

И мы видим любопытную ситуацию. Все эти генераторы начинают обрастать функционалом взрослых 3Д-пакетов. Ретоп, риг, скин, таймлайн, ключи и пр. И как бы двигаться в эту сторону (но тут проблема в том, что для нового нормального это все ДИКО СЛОЖНО, как и весь 3Д по сути, это вам не фотошоп).

С другой стороны есть взрослыя мальчики Максон и Автодеско. Ну и прям просится пара кнопок и промпт в ZBrush. Которые и сгенерят, и отретопят, и зашейдят. И можно будет это мять в ЗНАКОМОМ интерфейсе. А не вот в этих вот веб-поделках от программистов.

Но Максон как воды в рот набрал по поводу ИИ. Автодеск что-то вякнул про Бернини и затих.

Ну и тут я ожидаю, как обычно, что Адобченко всех пожрет.
Со своим Сабстансом. Прикупив по дороге пару стартапов.

@cgevent


Репост из: XOR
⚡️ Возможно, одна из причин ухода Мурати раскрыта: OpenAI официально станет коммерческой корпорацией.

🟢 Компания больше не будет контролироваться ее некоммерческим советом директоров и будет менее подконтрольна внешнему воздействию.

🟢 В компании считают, что этот шаг сделает ее более привлекательной для инвесторов, а Сэм Альтман при этом получит долю в компании.

@xor_journal


Репост из: Бэкдор
Видео недоступно для предпросмотра
Смотреть в Telegram
Это «‎Офис», но в главных ролях — Трамп, Путин, Обама и Ким Чен Ын.

Нейронки придумали ради этого.

👍 Бэкдор


Репост из: Нейронавт | Нейросети в творчестве
JoyCaption Alpha One

Обновился инструмент для текстового описания изображений JoyCaption

- расширен набор данных
- контроль длины описания
- выбор тона текста формальный/неформальный
- выбор типа описания. Descriptive - на чисто естественном языке. Training Prompt - сочетания естественного языка, фрагментов предложений и тегов booru - имитация промптов для SD. rng-tags - только теги booru, работает не очень хорошо, не рекомендовано

#image2text #captioning


Репост из: addmeto
Сегодня все пишут про СТО OpenAI, которая покинула компанию. Но оказывается вместе с ней ушли руководитель по ресерчу Боб МакГрю и вицепрезидент по ресерчу Баррет Зоф. Что происходит? https://techcrunch.com/2024/09/25/openais-chief-research-officer-has-left/


Репост из: Метаверсище и ИИще
Видео недоступно для предпросмотра
Смотреть в Telegram
Чтобы отвлечься от метановостей, подкину вам вот такой инфоповод.

В Хедру интегрируют Флюкс!

На видео засветился Flux Schnell, Flux + Realism Lora и олдовый SDXL.

В отличие от Хейгена, который не жалует генеративных тварей, тут прямо указано:

Создавайте высококачественных, ультрареалистичных персонажей всего за минуту (с помощью Флюкс).
Ваши герои не только будут выглядеть соответствующе, но и смогут говорить естественными, четкими голосами.
Все встроено прямо в ваш существующий процесс. Не нужно переключаться между инструментами - просто сосредоточьтесь на создании.


Похоже надо вонзить им деньжат - эта фича пока только для платных аккаунтов.
Хотя меня до сих пор бесит их низкое качество, приходится полировать Face Fusion-ом.

Ну то есть они пилят кнопку "Сгенери и оживи", что круто. Осталось допилить качество.

https://www.hedra.com/


Репост из: Точки над ИИ
Сегодня на Meta Connect 2024 нам приоткрыли шторку в мир удобных консьюмерских AR-очков, которые выглядят так, как должен выглядеть такой девайс – легкие, без проводов и с удобным управлением. Называться будут Orion.

Но есть нюанс. Даже два.

1. Очки пока на стадии производства, в особенности из-за следующего пункта.
2. Стоимость производства одной пары очков на данный момент – 10k$. На рынок по этой причине они выйти пока не могут.

Зато внутри много AI-штучек: голосовое управление, Meta AI помощник, хэнд трекинг и даже управление специальным браслетом (картинки прикрепляю).


Репост из: Джарвис Ньюс | Нейросети
⚡️ Цукерберг только что представил РЕВОЛЮЦИЮ — Orion. Это самые продвинутые умные очки за всю историю, которые превращают будущее в реальность.

• Браслет в комплекте с очками отслеживает сигналы МОЗГА — это нейронный интерфейс.
• Можно скроллить голограммы с помощью движений рук или ГЛАЗ — похоже на чтение мыслей!
• В линзах Orion есть всё то же самое, что и в Vision Pro — звонки с 3D-аватарами, игры, фильмы, браузер.
• Лучшая фича — синхронный перевод речи! Он на лету переводит десятки языков в динамики очков.
• Внутри стоят самые лучшие дисплеи для умных очков — огромное поле зрения в 72 градуса.
• Весят меньше 100 граммов и НЕОТЛИЧИМЫ от обычных очков.
• В кармане лежит небольшой процессорный блок, он беспроводным (!) образом передает голограммы на очки.
• Пока не для продажи — их будут тестировать сотрудники и обзорщики, но будущие версии выйдут на рынок.

Это — революция в дополненной реальности, которую НЕ СМОГ сделать Тим Кук.

💻  Новости AI • Бот Midjourney


Репост из: Love. Death. Transformers.
ОБОЖАЮЮЮЮ

Показано 17 последних публикаций.