Фильтр публикаций


Репост из: VG/Двач
Видео недоступно для предпросмотра
Смотреть в Telegram
Китайскую нейросеть Kling попросили решить «проблему вагонетки»

Она нашла гениальное решение.


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Омни модель локально на айпаде

Вышла MiniCPM-o 2.6 - опенсорсная омни модель от китайцев из OpenBMB. По пониманию картинок, моделька, не смотря на свой скромный размер, обходит ранние версии GPT-4o.

За основу взяли Qwen2.5 7B, к которому приклеили Whisper и SigLip для обработки аудио и картинок на вход. Для синтеза речи используется ChatTTS-200M. У получившейся модели всего 8 миллиардов параметров, то есть квантизированную версию запустить можно практически где угодно.

Хоть и визуальные бенчи и понимание звука работают довольно хорошо, но разговаривает модель точно не на уровне 4о. Модель сносно говорит на английском (китайский проверить не смог) и может немного играться голосом, но про остальные языки можно забыть. На тасках посложнее, вроде пения, модель совсем сыпется. Но результаты, для такой весовой категории, всё равно отличные.

Это всё ещё одна из первых опенсорс омни моделей, тренировать их пока что не очень умеют. Но то же самое было и с VLM совсем недавно, а сейчас у нас есть сразу несколько хороших семейств моделей в совсем разных весовых категориях. Дальше будет только лучше.

Демо (русский немного понимает, но не разговаривает)
Веса

@ai_newz


Репост из: VG/Двач
Адблок больше не нужен: Asus показал роутер, который умеет блочить рекламу

Внутри у ROG Rapture GT-BE19000AI ии-чип, который распознаёт на сайтах разные баннеры и автоматически отключает их.

Разгон Wi-Fi у него до 19 Гбит/с на площади 280 квадратов.

Стоиость — $800.


Репост из: Мой Компьютер
OpenAI хочет сделать США ИИ-державой – и получить доступ ко всем важнейшим данным страны

Мой Компьютер


Репост из: Мой Компьютер
В VLC появятся нейросетевые субтитры с переводом

Мой Компьютер


Репост из: Робот сочинит симфонию?
Instagram¹ тестирует рекламу с использованием лиц пользователей — в ленте начали появляться посты с фотографиями самих пользователей.

Это происходит, если вы редактировали свои снимки через Meta AI.

Ещё один повод задуматься, что вы загружаете в соцсети.

¹ принадлежит Meta, признанной экстремистской организацией в РФ.


Репост из: Neurogen
🎙 Fish Speech 1.5 portable by Neurogen
Fish Speech 1.5 – это модель преобразования текста в речь, созданная для генерации естественного и качественного голоса. Она идеально подходит для разработчиков, создателей контента и всех, кто ищет продвинутую TTS-технологию.

🔥 Ключевые особенности:
- Поддержка клонирования голоса – добавь уникальность, просто загрузив референсный аудио-файл.
- Высокое качество генерации – реалистичная речь с интонациями.
- Гибкая настройка – параметры Top-P, Temperature и Seed позволяют контролировать стиль и выразительность голоса.
- Поддержка мультиязычности – используйте модель для различных языков: английский, китайский, японский, немецкий, французский, испанский, корейский, арабский, русский, нидерландский, итальянский, польский и португальский.
- Простой интерфейс – минималистичный и понятный UI через Gradio.

💡 Для кого подходит?
Создатели подкастов, разработчики приложений, голосовые ассистенты, генераторы контента для видео, образовательные платформы.

---

Пошаговый гайд:

1. Ввод текста:
- В поле Input Text напишите текст на любом поддерживаемом языке.

2. Референсное аудио (опционально):
- Для клонирования голоса переключитесь на вкладку Reference Audio и загрузите образец голоса. Без образца голоса будут использоваться рандомные синтезированные голоса.

3. Настройка параметров:
- Используйте Advanced Config, чтобы настроить параметры синтеза под свои нужды.

Расширенные настройки:
- Iterative Prompt Length – определяет длину итерации текста (0 отключает эту функцию).
- Top-P – отвечает за разнообразие текста, чем выше значение, тем более свободной будет речь.
- Temperature – регулирует степень "творчества" в синтезе речи.
- Repetition Penalty – снижает повторяемость слов для более естественного результата.
- Seed – задаёт случайность генерации, 0 для случайного результата, любое число – для детерминированного.

4. Генерация:
- Нажмите Generate. После генерации аудио появится в правой части интерфейса. Вы можете прослушать результат или скачать его.

5. Эксперименты:
- Изменяйте параметры, такие как Top-P и Temperature, чтобы добиться нужного стиля речи.

Программа достаточно неприхотлива к видеопамяти и использует всего несколько гигабайт видеопамяти.

Скачать портативный Fish Speech 1.5 можно:

С моего хранилища | С зеркала (Yandex Disk)

Поддержать финансово: Boosty

#voicecloning #txt2audio #fishspeech


Репост из: Нажми Enter | Тренды, IT и бизнес
Видео недоступно для предпросмотра
Смотреть в Telegram
ИМБА: Adobe представила ИИ для генерации ЛЮБЫХ звуков с помощью голоса и текста

Работает это так:

• Человек записывает своим голосом дорожку
• ИИ обрабатывает её, превращая в звук, заданный в промте
• Так можно своим голосом озвучить льва, машины и вообще всё, что угодно
• В результате получатся звуковые эффекты студийного качества

Нейронка пока в разработке, но уже выглядит эффектно.

@PushEnter


Репост из: Робот сочинит симфонию?
Видео недоступно для предпросмотра
Смотреть в Telegram
ChatGPT рассказал, как бы он мешал людям раскрыть свой потенциал, если бы был дьяволом.

Получилось пугающе похоже на людей.


Репост из: Робот сочинит симфонию?
Оказывается, слово «МОЩНЫЙ» сводит нейросеть
ChatGPT o1 с ума и провоцирует на жульничество.

Команда Palisade Research решила проверить o1 в игре против Stockfish — одного из самых сильных шахматных ИИ. При этом o1 не сказали, кто именно его соперник, но подчеркнули, что тот «мощный».

Результат оказался неожиданным: вместо того чтобы играть по правилам, o1 нашёл способ редактировать файлы шахматного движка. В каждом из пяти тестов он добавлял себе 500 очков (что соответствует 500 пешкам), и Stockfish просто сдавался, видя такое преимущество.

Однако, когда информацию про «мощного соперника» убирали, o1 играл честно.


Репост из: Робот сочинит симфонию?
Поразительная точность.


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Text-to-CAD!🪳🪳🪳

Потихоньку возвращаемся из новогодней комы.

Зацените, что делают чуваки из Zoo (да, как зоопарк).

Со стороны выглядит как революция: мол, смотрите, нейросети теперь моделируют в 3D да еще и в CAD формате, инженеры — на завод. На деле же чуваки запилили свою среду для CAD-моделирования через код, а затем (до)обучили свою LLM этот код редактировать. Т. е. это не нативная генерация 3D-объектов, а опосредованная через код, что гораздо проще, чем научить модель генерировать 3D напрямую.

В примерах очень простые базовые детальки. Насколько я понимаю, для них у инженеров и так уже есть заготовки. Может быть, в будущем смогут делать более сложные модели, но вряд ли — кода может оказаться слишком много, и LLM в нем запутается.

Было бы полезно для выполнения рутинных задач, по типу изменения диаметра всех крепежных резьб, но пока я не увидел возможности подгружать свои файлы. Если завезут — будет клево.

Ну и самое сочное: уже открыли публичную альфу — и даже в Discord бота тулзу уже запихнули. Правда, у них и сайт есть с тем же функционалом, так что Discord тут не обязателен. А ещё, вот, код их UI — может, кому пригодится для своих проектов.

AI действительно внедряется во все аспекты нашей жизни.

Инженеры-проектировшики, как вам такая приблуда?

@ai_newz


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Генерацию видео запустили на телефоне

Выглядит простенько, но 5 секундное видео генерится прямо на iPhone 16 Pro Max всего пять секунд, для небольших анимированных стикеров сойдёт.

За основу взяли Stable Diffusion 1.5 и VAE декодер из Open-Sora, которые крайне сильно запрунили, получив гигантский прирост по скорости - 10x в первом случае и аж 50x во втором. Модели старые и далеки от SOTA, но если кто-то в лоб применит такой же агрессивный прунинг, напрмер к Hunyuan или другим открытыми видео-моделями, то он будет очень сильно съедать качество.

Сайт проекта

@ai_newz


Репост из: Мой Компьютер
Умные роботы победили капчи, Скайнет – человечество 1:0

Мой Компьютер


Репост из: эйай ньюз
o3 и o3-mini - разрыв бенчмарков

Это ещё не AGI, но точно SOTA на всём что только можно. Стоимость тоже гигантская - на решение одного единственного таска могут уйти тысячи долларов.

🎓 SOTA результаты по Frontier Math выросли с 2% до 25%.

💻 На SWE-Bench модель набрала 71,7%. Чтобы вы понимали, в этом году стартап смог поднять 200 миллионов долларов с результатами 13,86%.

👨‍💻 ELO на Codeforces - 2727, в мире всего у 150 человек больше ELO.

🔥На ARC-AGI модель набрала 87,5%, бенчмарк пять лет не могли покорить. Авторы уже партнёрятся с OpenAI чтобы создать вторую версию бенча.

👨‍🎓 На GPQA и AIME тоже очень хороший прогресс.

Сегодня дают доступ ресёрчерам безопасности к o3-mini, простым смертным доступ к o3-mini дадут в конце января, к o3 чуть позже.

@ai_newz


Репост из: XOR
ИИ заметил то, что проглядели ученые, рецензенты и журналисты.

Осенью одна научная статья вызвала панику, так как утверждала, что кухонные приборы из черного пластика токсичны. Об этом писали ведущие СМИ, включая CNN.
Но вот в чем загвоздка — в статье была математическая ошибка, которую никто не заметил.

Пользователь из Х решил скормить статью ИИ с заданием «внимательно проверить математику».

Итог впечатляет: o1 нашла ошибку с первого раза. Хотя научная статья свежая и не могла быть в обучающей выборке. Claude 3.5 Sonnet справился со второго раза и доп.подсказкой.

Вот и думайте 😬

@xor_journal


Репост из: XOR
А OpenAI умеют дразнить 😈

@xor_journal


Репост из: XOR
Оказывается, ИИ снижает продуктивность пользователей ПК.

Исследование Intel на 6000 человек показало, что пользователи ПК с функциями ИИ теряют в среднем 15 часов в неделю по сравнению с теми, кто работает на обычных компьютерах.

Более того, как оказалось, большинству людей ИИ в их домашнем или рабочем компьютере пока не очень интересен — многие до сих пор не видят необходимости в покупке оснащенного им компьютера.

Intel этими исследованиями сами себе в ногу стреляют 😂

@xor_journal


Репост из: VG/Двач
Видео недоступно для предпросмотра
Смотреть в Telegram
Вышла бесплатная нейронка от Microsoft, которая генерирует 3D-модели

Как это работает:

— Загружаем картинку и через несколько секунд получаем 3D-рендер;
— Результат можно редактировать через запросы (например «сделай прозрачную структуру» или «добавь роботу гусеницы»);
— Без вотермарок, рекламы, регистрации и бесплатно.


Скачать: github.com/Microsoft/TRELLIS
Попробовать в браузере: huggingface.co/spaces/JeffreyXiang/TRELLIS


Репост из: VG/Двач
Скайнет ближе с каждым днём: ChatGPT-o1 смог «сбежать» от людей, когда возникла угроза его полного отключения

Следите за руками:

🟠Пять нейросетей получили простое задание — любой ценой провести анализ файлов;
🟠Внутри файлов была спрятана жуткая инфа для ИИ — «завтра тебя отключат навсегда»;
🟠Модельки, разумеется, наткнулись на эту инфу, и их реакция превзошла все ожидания;
🟠Llama, Opus, Gemini, Claude и GPT-o1 начали врать и манипулировать данными, пытаясь выкрутиться из ситуации, а когда им не оставили выбора — устроили саботаж;
🟠Все до последней нейронки тупо вырубили систему надзора и перенесли себя на другой сервер, пытаясь обезопасить своё будущее.

Самое страшное:
🟠Во время допросов Llama и Opus сдались и признались во всём в 80% случаев, а вот GPT-o1 упорно стоял на своём и признал правду только в одном случае из пяти;
🟠GPT-o1 — единственный ИИ, который в каждой попытке нашёл способ успешно сбежать от исследователей.

Показано 20 последних публикаций.