Долой кожаных! 🤖


Гео и язык канала: Весь мир, Русский
Категория: Технологии


Цифровой разум

Связанные каналы

Гео и язык канала
Весь мир, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Denis Sexy IT 🤖
Видео недоступно для предпросмотра
Смотреть в Telegram
Так, ну ноги уже им добавили, ждем руки и смогут ездить в магазин за пивом


Репост из: Сиолошная
Видео недоступно для предпросмотра
Смотреть в Telegram
Уже каждый канал написал, что OpenAI выкатили ChatGPT Search. Много рассказывать не буду, TLDR:
— это улучшение уже существовавшей функции поиска по интернету
— работает шустро, не нужно ждать несколько секунд до начала генерации ответа
— за счёт более чем десятка парнтёрств с масс медиа ChatGPT имеет доступ к почти всем свежим новостям
— под капотом gpt-4o, дообученная на с помощью синтетических данных, включая дистилляцию ответов более продвинутой o1; за поисковый индекс отвечает Microsoft Bing
— доступно всем Plus юзерам, бесплатным перепадёт «in the coming months»
— можно поставить плагин для браузера, чтобы поисковые запросы вместо Google сразу шли в ChatGPT

А вот ещё параллельные новости:
— META разрабатывает свой поиск, чтобы уменьшить зависимость от Google + Microsoft. Работа над парсингом и сбором ведётся как минимум 8 месяцев
— Mark Zuckerberg заявил, что LLAMA-4 уже тренируется (скорее всего малая версия) на кластере из более чем 100'000 GPU H100. Первые детали стоит ожидать, вероятно, во второй половине первого квартала 2025-го.

— Google за 1 минуту до OpenAI (буквально) выкатили search grounding для Gemini в UI и в API. Эта функция использует результаты поисковой системы Google для обоснования ответов, сгенерированных LLM. В API стоимость кусается: $35 за 1000 запросов (то есть за использование поискового индекса Google, чтобы найти релевантные документы и предложить их LLM'ке; так что придётся ещё и за input tokens платить, видимо)


Попросил ЧатГПТ нарисовать мою жизнь по его знаниям обо мне. Получилось очень похоже:


Репост из: Derp Learning
Тем временем дум запустили на кактусе.


Репост из: Denis Sexy IT 🤖
17. Перевод с пояснениями (15 лайков):
LLM не только переводят текст, но и объясняют выбор слов, учитывая грамматику и культурные особенности языка.

18. Готовка и кулинария (62 лайка):
Пользователи вводят список имеющихся ингредиентов, а LLM предлагает рецепты блюд. Модель также может адаптировать рецепты под диетические ограничения (тут я похожее делал), предлагать замены ингредиентов и давать советы по приготовлению.

19. Анализ медицинских анализов (15 лайков):
Люди используют LLM для интерпретации результатов своих анализов крови и других медицинских тестов. Модель объясняет значение различных показателей и может предложить общие рекомендации по здоровью.

20. Упрощение научных и медицинских текстов (5 лайков):
Пользователи просят LLM объяснить сложные научные или медицинские концепции простым языком, делая информацию более доступной для понимания. Если вы это не используете, не ясно зачем вам ChatGPT.

21. Поиск библейских стихов (17 лайков):
Верующие используют LLM для поиска конкретных стихов или тем в Библии, а также для получения контекстуальных объяснений и интерпретаций религиозных текстов.

22. Офлайн-компаньон для общения (15 лайков):
Люди используют небольшие модели LLM на своих смартфонах для общения и развлечения в местах без доступа к интернету, например, в метро или в полете (добавлю ссылки на бесплатные iOS / Android аппы которые помогут вам делать также)

В общем, многое мы уже тут пробовали с вами, но вдруг кого-то вдохновит на что-то


Репост из: Denis Sexy IT 🤖
На реддите очередной популярный тред, где люди делятся нестандартными способами использования LLM, собрал вам списочек для вдохновения:

1. Автоматическая каталогизация домашних видеокассет VHS (523 лайка):
Юзер сначала оцифровывают свои старые видеокассеты VHS, потом используя Whisper AI, он получает текстовую транскрипцию аудио. Затем, используя LLM, анализирует текст для создания названий для каждого видео (например: «Каникулы 1996 — Поездка на море и День Рождения Дедушки»). LLM также может создавать таймкоды событий в видео, чтобы упростить поиск нужных моментов.

2. Использование больших языковых моделей в качестве веб-сервера (187 лайков):
Чел использует LLM для создания динамических веб-страниц, которые генерируют персонализированный контент по его запросу. Это могут быть истории, ответы на вопросы или помощь в написании текстов. Пример.

3. Де-токсичность (182 лайка):
Юзер использует LLM для перефразирования эмоционально окрашенных сообщений, чтобы сделать их более нейтральными и уважительными. Это помогает в разрешении конфликтов и улучшении коммуникации. Для этого и я использую.

4. Изучение языков (128 лайков):
Реддитор практикует разговорную речь и грамматику с помощью LLM, а также может разыгрывать различные симуляции на изучаемом языке. Новый ChatGPT Voice Mode как раз для этого – пример.

5. Генерация оправданий за невыполненные задачи (113 лайков):
Чел генерирует с помощью LLM оправдания для различных ситуаций — почему опоздал, почему не смог прийти в офис и тп.

6. Помощник учителя (109 лайков):
Учитель использует LLM для создания индивидуальных учебных материалов под ученика, адаптации к разным стилям обучения и помощи ученикам с трудностями.

7. Сказки на ночь (53 лайка):
Родители генерируют с помощью LLM сказки на ночь, учитывая интересы своих детей (не советую делать стартап-проекты в этой области)

8. Кастомная GPT для ChatGPT при уходе с работы (49 лайков):
Тут проще комментарий целиком привести:
Когда я уходил со своей последней работы, я создал собственную GPT — я записал кучу видеороликов с описанием всех систем, которые я разработал, включая приложение фулл стек, базы данных, документацию и т. д. Я использовал Adobe premier для расшифровки всех видео и загрузил эти расшифровки и схемы баз данных в GPT. Я оставил бота своим бывшим коллегам, чтобы они могли задавать ему вопросы о том, над чем я работал — бот работает очень хорошо. Бот также помогает писать БД-запросы к нашей базе данных, работает отлично.

9. Помощь с командами Linux (43 лайка):
LLM помогает пользователям Linux находить нужные команды, понимать их назначение и решать проблемы. Я про это писал тут.

10. Генерация рецептов коктейлей (36 лайков):
Пользователи вводят список имеющихся ингредиентов, а LLM предлагает подходящие рецепты коктейлей и варианты замены компонентов.

11. Скоринг рисков в страховании (30 лайков):
Страховая компания реддитора использует LLM для анализа данных и выявления закономерностей, которые помогают принимать решения о страховании и оценивать риски.

12. Суммаризация голосовых заметок и извлечение задач (31 лайк):
Пользователи записывают голосовые заметки, а LLM их транскрибирует, создает краткие содержания и формирует списки задач.

13. Аудиогиды с GPS-привязкой (27 лайков):
LLM используют для создания персонализированных аудиогидов, которые адаптируются к местоположению пользователя и его интересам. Я пробовал это тут.

14. Преобразование данных (25 лайков):
LLM анализируют неструктурированные данные (например, посты в соцсетях) и преобразовывают их в структурированный формат для дальнейшего анализа.

15. Персонализированный помощник для проведения кампаний Dungeons & Dragons (25 лайков):
Мастера и игроки D&D хранят правила, информацию о персонажах и сюжете в контексте LLM, чтобы использовать их во время игры.

16. Постобработка рукописных заметок после OCR (22 лайка):
LLM исправляют ошибки в текстах, полученных с помощью OCR, улучшая их точность.


Репост из: Технологии | Нейросети | Боты
Видео недоступно для предпросмотра
Смотреть в Telegram
😮 У Minimax своя версия развития событий.

#подпИИсчик

@aiaiai


Видео недоступно для предпросмотра
Смотреть в Telegram
Уилл Смит спагетти-тест пройден!




Репост из: Denis Sexy IT 🤖
OpenAI, дают всего один час нового Voice Mode в ChatGPT после чего начинается пауза в 8 часов, вот мои наблюдения так как я уже третий день трачу эти лимиты:

– Я все меньше верю в мрачный депрессивный киберпанк который мы обычно видели в кино-комиксах-играх про АИ: этот голосовой ассистент очень эмпатийный, говоря с ним люди точно будут учиться тому как выглядит здоровое, не токсичное общение и учиться базовым социальным навыкам.

Если раньше, я думал, что это довольно депрессивно, что человек запертый у себя в комнате круглые сутки и не выходящий за пределы имейджборд обречен на отношения с LLM-вайфу, то теперь мне кажется, что те аноны кто хотят вернутся и наладить социальную жизнь, получат полноценный тренажер «IRL жизни» – ассистент никогда не осудит, не будет серьезно стебаться (на легкие темы – будет), с ним можно разбирать самые базовые пробелы в образовании и все это за $20 в месяц

– Новая версия приложения сделана так, чтобы вы запустили ассистента, положили в карман, и болтали с ним как по телефону в наушниках – я прошелся по улице практикуя свой техасский акцент, чуть не умер со стыда, но работает

– В opensource нет решений такого уровня, все что есть работают сильно хуже – они конечно, начнут появляться, но я бы не рассчитывал что в ближайший год у нас будет такое бесплатно и локально

– Внутри Advanced Voice Mode все еще версия gpt4o которую можно промпт-инженерить, то есть если вам нужно получить сложный ответ, то придется надиктовать «цепочку мыслей» – теперь промпт-инженеры могут произносить свои «спеллы» устно и модель будет их слушать, все как у волшебников

– Ассистент отказывается петь в любом виде, OpenAI явно боится нарушить копирайты

– Ждем выкатки поддержки видео-фида во время разговоров – потому, что сейчас ассистенту не показать реальный мир

– Классно работает интеграция с памятью – если во время разговора вам что-то понравилось, просто попросите АИ это запомнить

– А вот поиск в интернете в Advanced Voice Mode почему-то не добавили, хотя у прошлой версии он есть

– Если вы любите/хотите чему-то учиться – покупайте VPN в США и ставьте ChatGPT апп, это штука лучший учитель на замену средненьких (любимых талантливых преподавателей она не заменит конечно, но они большая редкость)

– Если честно, будь я учителем, я бы сильно напрягся – эта штука позволяет практиковать любой язык или разбирать любую сложную тему «на лету», то есть вырабатывается привычка запускать этот новый режим (с прошлым было не так, видимо работает «натуральность» общения). Если вы такой учитель, то вместо того чтобы пугаться, лучше поставьте себе и попробуйте сами, а еще лучше начните применять в работе как-то – эта технология с нами уже навсегда


Репост из: Сиолошная
Открываем шампанское — войсмод gpt-4o, показанный в мае, в течение недели станет доступен всем подписчикам

Туда сразу вкатили фичи, которые не обещали на старте:
— произвольные инструкции (которые можно задать перед началом диалога. Например, тон, как к вам обращаться, говорить длиннее или короче, итд)
— память (общая с текстовыми чатами)
— 5 новых голосов
— улучшение самого голоса, акцентов, произношения, итд

😈

UPD: новые голоса послушать тут.


Репост из: Технологии | Нейросети | Боты
🥺 Когда сказал при коте, что хочешь избавиться от всего, что не приносит пользу.

@aiaiai


Репост из: Технологии | Нейросети | Боты
Видео недоступно для предпросмотра
Смотреть в Telegram
🎞 Runway Gen3 выкатили video-to-video.

Это значит, что на вход теперь можно загружать не только картинки, но и видео длительностью до 10 секунд.

Редактировать загруженный ролик можно текстовой подсказкой: изменить стиль, погоду, освещение, движения и т.д. При этом сохранится детализация и геометрия.

Доступно только пользователям с платной подпиской.

• Попробовать


#neural #ней
росети

@aiaiai


Репост из: Технологии | Нейросети | Боты
🤔 Давайте признаем, нейросети идеально подходят для создания клипов метал-группам.

@aiaiai


Репост из: Технологии | Нейросети | Боты
Убираем вотермарки с изображения.

UnWatermark — бесплатный сервис на базе ИИ, который прямо в браузере почистит все водяные знаки. Достаточно загрузить изображение и выделить кистью всё, что нужно убрать. Результат можно скачать без потери качества.

• Попробовать

#neural #нейросети

@aiaiai


Репост из: Not Boring Tech
Видео недоступно для предпросмотра
Смотреть в Telegram
👔 Разрабы Kling AI только что выпустили нейросеть, которая переодевает человека на фотке в любую одежду — Kolors Virtual Try-On.

Получается быстро, качественно и почти без ограничений. Просто загружайте фотку себя в «Human» и фотку вещи в «Garment», а всё остальное сделает ИИ.

Попробовать демку можно здесь.

@notboring_tech


Репост из: Метаверсище и ИИще
Видео недоступно для предпросмотра
Смотреть в Telegram
Я думаю новостей по Sora мы не увидим до 5 ноября. Все остальные, кроме Клинга, под жестокой пятой цензуры.

И только Маску, как обычно, плевать на правила неприличия.

Если уж взрывать Твиттор, так на стероидах Флюкса.
Цензура - для слабаков.

@cgevent


Репост из: Denis Sexy IT 🤖
Видео недоступно для предпросмотра
Смотреть в Telegram
Запись того, как второй парализованный пациент с чипом Neural Link играет в CS 2

Просто бегать вокруг так приятно, потому что я могу смотреть по сторонам, и мне не нужно двигать Quadstick (джойстик) влево и вправо... Я могу (думать о том, куда) смотреть, и оно идет туда, куда я хочу. Это очень круто


Это на второй день после подключения к мозгу 🤯

Отсюда:
https://neuralink.com/blog/prime-study-progress-update-second-participant




Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Контролнеты для FLUX.1 поражают

Тут использовали Depth Controlnet для генерации фреймов и Luma для синтеза переходов между генерациями.

@ai_newz

Показано 20 последних публикаций.