AVR products & Games & LIFE


Гео и язык канала: Весь мир, Русский
Категория: Технологии


Про, ИИ, стартапы, продукты, разработку продуктов больше про технологии но немного про бизнес

Связанные каналы

Гео и язык канала
Весь мир, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Сиолошная
Sama настолько расщедрился, что анонсировал введение o3-mini в БЕСПЛАТНЫЙ тир. Не в Plus за $20/месяц — в БЕСПЛАТНЫЙ.

Что..странно, с учётом того, что на подписке за $200 компания теряет деньги.

Но Big для наращивания аудитории.


Репост из: LLM под капотом
Что бы вы хотели знать о проблемах и задачах крупных компаний в Европе?

На Enterprise RAG Challenge в конце февраля придет с keynote Stephan Gillich. По его роду деятельности, у него есть куча инсайтов о крупном бизнесе в Европе. Он расскажет про задачи, которые компании пытаются с решать с помощью AI, что у них из этого выходит, и на что есть спрос.

Например, одна из таких вещей - OPEA - это комбайн вроде LangChain для enterprise, но из Linux Foundation и на более высоком уровне. В него вкладываются компании вроде AMD, Intel, ByteDance, SAP и China Unicom. И при этом про него в русскоязычном сегменте мало кто слышал.

Кстати, Stephan говорит, что спрос на локальные решения сейчас на самом деле очень большой, и Project Digits от NVidia вышел в очень удачное время.

Эти топики уже интересны, и будет про них очень здорово услышать подробнее. Но, может быть, еще есть какие-то вопросы вокруг этих тем? Задавайте свои вопросы в комментарии, я потом их соберу, обработаю и вынесу на Q&A сессию после Keynote.

Ваш, @llm_under_hood 🤗


Репост из: Denis Sexy IT 🤖
Ресечеры смогли сделать модель АИ на базе трансформеров, которая смотрит данные МРТ-сканирования мозга и предсказывает как мозг будет работать в следующие 5 секунд ☕️

То есть алгоритм «читает» 30 кадров сканирования мозга (примерно ~21 секунды данных), а затем выдает свой прогноз – какой будет активность на следующих кадрах, в будущем. Первые секунды модель предсказывает с очень большой точностью — совпадение с реально полученным данными выше 85%

Для чего пригодится алгоритм:

– Чтобы обыграть нас как дешевок

– Более короткие сессии МРТ – пациенту не надо долго лежать в трубе томографа, если часть данных можно «дорисовать» алгоритмом

– Предупреждение об опасных состояниях – например, при подозрении на скорый эпилептический приступ

– Усовершенствование нейроинтерфейсов (BCI), которые считывают сигналы мозга и позволяют управлять внешними устройствами. Если система будет знать чуть вперёд, она может реагировать быстрее

– «Персонализированный» АИ, который подстраивается под настроение или состояние человека, реагируя на меняющиеся сигналы мозга

– ну и ученые смогут глубже понять, как мозг «предвосхищает» будущее и какие внутренние нейронки мозга при этом активируются

Исследование тут

Tldr: кожаные предсказуемые


Репост из: Denis Sexy IT 🤖
Как и зачем использовать Tasks в ChatGPT

Создать Таск | Список Тасков

Пару дней OpenAI добавили новую фичу: теперь ChatGPT может выполнять разные задачи по расписанию и присылать вам пуш уведомление; это попытка стать главным персональным ассистентом забрав на себя любые повторяющиеся задачи (хоть работает и кривовато пока что)

Tasks пока не умеют гуглить и не имеют доступа к другим чатам

Я пару дней погонял, делюсь юзкейсами:

1. Персональный список To Do
Я часто использую Saved Messages в Telegram для записи каких-то промежуточных задач, это не очень удобно потому что они теряются со временем; поэтому я попросил ChatGPT Tasks каждый день, в 10 утра, писать мне и спрашивать какие у меня задачи на сегодня, приоритизировать и суммировать текущий список. Теперь я закидываю в этот чат оперативные задачи, а она добавляет их в общий список сама. Из минусов — задачи хранятся как часть описания таска (явный костыль чат интерфейса); зато утро всегда начинается с To Do по личным и рабочим проектам — мне пока нравится; чаты тоже можно выносить в папки проектов.

Остальные юзкейсы я вытащил из тредов:

2. Практика иностранного языка
Запланируйте ежедневные «уроки» или короткие диалоги. Например, ChatGPT в 19:00 присылает вам новые слова для запоминания или предлагает мини-тест на грамматику. Это поможет заниматься регулярнее

3. Подготовка к экзаменам и обучению
Создайте серию задач, которые ежедневно или еженедельно выдают вам набор вопросов/тестов. Например, вы готовитесь к программированию: ChatGPT может напоминать о прошедших темах и предлагать упражнения на закрепление

4. Еженедельные (или ежедневные) чекины кукухи
Запросите у ChatGPT раз в неделю «проверку состояния», где он предлагает короткие вопросы на саморефлексию или техники для снижения стресса. Хоть это не заменит профессиональную помощь, такие напоминания могут помочь вовремя обратить внимание на собственные эмоциональные колебания и позволит эффективно вести дневник кукушки

5. Отслеживание прогресса в долгосрочных проектах
ChatGPT Tasks может «помнить» несколько этапов вашего большого проекта и раз в неделю присылать вам вопрос: «Как ты сейчас? Есть ли новые задачи или сложности?» При желании он подскажет идеи о следующих шагах, если есть проблемы

6. Автоматическая генерация контента
Попросите ChatGPT по расписанию (например, по понедельникам и пятницам) создавать наброски статей или постов для соцсетей на заданную тему. Или, если вы пишете художественные произведения, пусть еженедельно он предлагает сюжетные идеи для книги или блога

7. Ведение личной базы знаний
Если вы используете ChatGPT как «записную книжку», можно попросить Tasks периодически упорядочивать заметки, находить дубли и выделять ключевые моменты - что-то вроде само-сортирующихся Saved Messages в telegram

8. Напоминания о релизах, событиях и датах — ChatGPT как календарь
Хотите не пропустить выход новой игры, книги или день рождения близкого человека? Попросите ChatGPT уведомить вас за несколько дней, а потом ещё раз в день релиза/праздника. Модель может даже предложить идеи подарков или занятия по теме

9. Поддержка здоровья и фитнеса
Запланируйте утренние и вечерние «пинги» о том, чтобы выпить воды, сделать зарядку или прогуляться. ChatGPT Tasks можно попросить генерировать новые идеи упражнений или рецепты здоровых завтраков с учётом ваших предпочтений, чтобы избежать однообразия

10. «Поддержка и похвала»
Можно сделать чтобы ChatGPT периодически писал и говорил «Я горжусь тобой!». Я настроил утренние цитаты в стиле Теда Лассо, потому что он клевый

11. Помощь с написанием научной статьи или книги «по частям»
Если вы делаете большой проект (диссертацию, книгу), можно разбить её на главы и попросить ChatGPT генерировать материалы или проверять ваши черновики по графику. Например, «каждый понедельник» Tasks спрашивает: «Напиши 500 слов о таком-то разделе» и сохраняет контекст

Пока это beta фича и очень не хватает web-поиска в ней


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
ChatGPT Tasks

Ну всё, теперь гптишка может быть полноценным персональным ассистентом. Новая фича позволяет гптишке отправлять вам уведомления и напоминания. Это не геймчейнджер, конечно, но довольно полезная штука для экономии времени. Хотя какой-нибудь Okey-Google мог делать это давным-давно, но с этой штукой можно делать что-то гораздо более интересное, чем просто записывать напоминалки. Дополнительного контекста из чата, особенно если вы активно пользуетесь памятью, может делать очень много. Как насчет: «Придумай, что мне сегодня поесть, основываясь на том, что осталось в холодильнике из списка покупок, который ты писал в начале недели, и учитывая всё то, что я уже готовил по твоей команде»?

Такая фича - явно предвестник агентов, которые, по слухам, OpenAI собирается запустить скоро. Простые уведомления это, конечно, прикольно. Но когда ChatGPT сможет автономно делать за вас даже простые запланированные действия в интернете, всё станет гораздо интереснее. Название проекта - Operator. Оно в последнее время светится всё чаще и чаще, так что релиз не за горами.

@ai_newz


На Spotify вышел мой последний релиз.
Да, я еще электронную музыку пишу.

Если нравится Drum and Bass прошу поддержать.

Кстати в треке с женским вокалом, вокал я делал в Udio.


Новая модель для 3d генерации от nvidia кайф!
Классный дядечка с two minutes paper интересно рассказывает.

Вот тут можно потыкать картинки только те что есть в примерах для инпута, а текст любой. регистрация не поможет с ней или без нее генерирует только из предварительного набора картинок

https://www.youtube.com/watch?v=DjSipUhjJX8


У Realtime APi обновления

Обновление модели:
- С 9 января gpt-4o-realtime-preview-2024-12-17 по умолчанию с 60% снижением цены на аудио и улучшенным качеством голоса.
- GPT-4o mini теперь доступен в Realtime API: в 10 раз дешевле, чем предыдущие варианты.
- Поддержка WebRTC
- Одновременные ответы в фоновом режиме (например, модерация контента без прерывания общения).
- Настройка контекста входных данных (использование нужных фрагментов беседы).
- Контролируемое время ответа (ручной запуск реакции после получения данных).
- Увеличение максимальной длины сессии до 30 минут.

Мы делали на заказ телефонного чат бота и экономика пока не сходилась, с новыми изменениями возможно ситуация изменится.


Репост из: Denis Sexy IT 🤖
И вот суммарно все дни, что показали – для тех кто пропустил:

ℹ️ День 1/12:
• Модель O1 доступна для всех: более быстрая, умная, с поддержкой изображений
• Подписка за €230/мес: безлимитный доступ к O1/O1-mini/GPT-4o, Advanced Voice Mode и O1 Pro (более ресурсоемкий режим)

ℹ️ День 2/12:
• O1 и O1-mini можно файнтюнить (настраивать под конкретную область с небольшим набором примеров)
• Доступно с 2025 года

ℹ️ День 3/12:
• Релиз Sora (sora.com) и Sora Turbo (упрощенная, быстрая модель)
• Интеграция с редактором видео, встроенные инструменты
• Лимиты для генераций в месяц зависят от тарифного плана

ℹ️ День 4/12:
• Обновление ChatGTP Canvas: умный интерфейс редактирования текстов и кода в реальном времени, поддержка кастомных GPT-моделей и возможность запуска Python-кода

ℹ️ День 5/12:
• Интеграция ChatGPT с Mac, iOS и iPad на уровне ОС (ничего принципиально нового)

ℹ️ День 6/12:
• Advanced Voice Mode теперь поддерживает видео-стрим
• Можно вместе решать задачи, кодить или готовить, используя видео или шаринг экрана
• Добавлен голосовой “Санта” в ChatGPT

ℹ️ День 7/12:
• Появились “Проекты” в ChatGPT: загрузка документов, кастомные инструкции, организация чатов

ℹ️ День 8/12:
• Улучшенный поиск в ChatGPT, доступен и для бесплатных пользователей
• Можно использовать поиск во время голосового общения и сделать его браузерным поисковиком по умолчанию

ℹ️ День 9/12:
• O1-модели: строгий JSON формат, Functions calling, Developers Messages, настройка “Reasoning Effort”
• O1 API поддерживает картинки на вход
• Advanced Voice Mode API поддерживает WebRTC, цены снижены
• Preference Finetuning: обучение модели на парах данных «нравится/не нравится»
• Новые SDK для Go и Java 10.

ℹ️ День 10/12:
• Можно звонить по номеру в США или писать через WhatsApp и общаться с ChatGPT голосом или текстом 11.

ℹ️ День 11/12:
• Ничего нового
• Показали возможность для ChatGPT “видеть” запущенные приложения 12.

ℹ️ День 12/12:
• Новые модели o3 и o3-mini в стадии Public Safety Tests
• o3 показывает результаты на уровне доктора наук, превосходит людей в ARC-бенчмарке (~87.5%)
• Есть пресеты “времени на размышление”, влияющие на стоимость и качество ответа


Когда-то проводился эксперимент, где человек предлагал деньги прохожим на улице. И, представьте себе, не все их брали. Это значит, что даже в таком простом случае конверсия меньше 100%. Если перевести это на язык «денег», то получается, что чтобы отдать кому-то деньги, нужно потратить ещё больше денег. Но речь сейчас не об этом.

Как я писал выше, мы пытаемся найти рекламную площадку на Substack для email-рассылки. Где блогеры используют email как основную платформу.

Я уже отправил предложения небольшому числу авторов и вот что из этого вышло:

Из 40 авторов 3 ответило.

1 написал: «Давай после праздников».

1 сказал, что не будет рекламировать, но готов помочь чем-то другим.

1 отказался рекламировать вовсе.

Конверсия в положительный ответ составила 2,5%.

С учётом того, что дальше воронка предполагает конверсию на уровне 30%, мне нужно написать ещё примерно 133 авторам, чтобы найти одну площадку.

Занимательное воронковедение!


Репост из: addmeto
Вот эта работа имеет все шансы стать куда более значимой, чем все нынешние "соры", выпущенные в последние полгода. Это система, в которой вы можете симулировать реальные физические процессы и визуализировать их. По сути используется физическая модель, где из текста строится не видео (как все уже привыкли), а моделируется 3д с учетом физики процессов и материалов. Слова тут вероятно лишние, посмотрите на картинки https://genesis-embodied-ai.github.io


#полезно хочу затестить у себя на компе.


Репост из: AI для Всех
Прогнозирование будущего с помощью языковых моделей 🤖📈

Друзья, сегодня поговорим о прогнозировании будущего с помощью больших языковых моделей (LLM). Исследователи показали как можно скомбинировать силу чисел и контекста!

🔍 Ключевой прорыв
До недавнего времени системы прогнозирования работали только с числами - представьте себе графики продаж или температуры. Но в реальном мире мы принимаем решения, учитывая множество факторов! Новый подход позволяет моделям понимать контекст так же, как это делаем мы с вами.

🛠️ Как это работает?

- Модель анализирует не только числовые данные, но и важную текстовую информацию
- Учитывает исторические события и будущие планы
- Понимает причинно-следственные связи
- Адаптируется к различным сценариям

📊 Практические примеры

- Прогноз загруженности дорог с учетом предстоящих мероприятий
- Предсказание потребления энергии с учетом погодных условий
- Анализ продаж с учетом маркетинговых кампаний

🎯 Интересные результаты

- GPT-4 и Gemini показали впечатляющие результаты в понимании временных рядов
- Модели успешно интегрируют текстовую информацию в прогнозы
- Точность прогнозов значительно улучшается при добавлении контекста

🔮 Будущее прогнозирования

Представьте себе системы, которые смогут:

- Анализировать множество источников данных одновременно
- Учитывать глобальные тренды и локальные особенности
- Давать объяснения своим прогнозам на человеческом языке

Это захватывающее время для искусственного интеллекта и анализа данных! Мы становимся свидетелями того, как машины учатся понимать временные ряды почти так же целостно, как люди.

Что думаете об этом прорыве? Делитесь своими мыслями в комментариях! 💭

Статья


#полезно


Апдейт по voice to text.

Во первых зовется он теперь YappaType
Во вторых вот уже первый релиз скоро.
В третьих лендинг он наверное почти в финальном виде и вот тут
В четвертых в качестве первого источника трафика решил попробовать email тематические рассылки. Пишу авторам на substack интересно что из этого выйдет.

Вот апдейты все.
Картинка чтобы была.


Репост из: AI для Всех
Открытая реализация масштабирования времени обдумывания (inference time): от O1 к открытым моделям

Команда Hugging Face успешно воспроизвела и адаптировала для открытых моделей подход, который OpenAI впервые продемонстрировала в своей модели O1. Теперь эта техника доступна всем! 🚀

В 2024 году OpenAI первыми показалили, как увеличение времени "обдумывания" может значительно улучшить производительность модели на сложных задачах. В частности, их модель O1 демонстрировала постоянное улучшение результатов на математических задачах при увеличении вычислительного бюджета на этапе вывода.

Что удалось воспроизвести? 🔍

Команда Hugging Face адаптировала этот подход для открытых моделей и показала, что:
- Маленькая модель Llama 1B может достичь производительности Llama 8B
- Модель Llama 3B может конкурировать с Llama 70B
- Всё это возможно без доступа к закрытым моделям или огромным вычислительным ресурсам

Как это работает? 🤔

Основная идея та же, что и у OpenAI - дать модели больше времени на "размышление". Команда реализовала и сравнила три подхода:

1. Best-of-N (Базовый подход)
- Генерируем несколько решений
- Выбираем лучшее с помощью верификатора
- Простой, но эффективный метод

2. Beam Search (Продвинутый метод)
- Систематический поиск решений
- В 4 раза эффективнее Best-of-N
- Оптимален для сложных задач

3. DVTS (Новый метод от HF)
- Улучшение beam search
- Фокус на разнообразии решений
- Лучшая производительность при большом бюджете

Необходимые компоненты:
- Открытая базовая модель (например, Llama-3.2-1B-Instruct)
- Модель-верификатор (например, RLHFlow/Llama3.1-8B-PRM)
- Реализация стратегии поиска

Значение для сообщества 🌟

Эта работа особенно важна, потому что:
- Делает продвинутые техники доступными для всех
- Показывает, что маленькие открытые модели могут быть очень эффективными
- Предоставляет практическую реализацию для экспериментов

Что дальше? 🚀

Открытая реализация этих методов открывает новые возможности:
- Применение подхода к другим задачам
- Улучшение верификаторов
- Разработка новых стратегий поиска

Это отличный пример того, как открытые модели и исследования двигают область вперёд.

Блог-пост


Репост из: Denis Sexy IT 🤖
Я решил, что продолжу отдавать OpenAI $200 в месяц (пока не вышли конкуренты у Google / Anthropic) — потому, что o1 Pro фантастический компаньон в жизни/работе

— Наверное, стоит сказать пару слов, что LLM-бенчмарки часто критикуют за их неспособность объективно оценить качество модели — и с Pro O1 такая же ситуация:
Я видел результаты, где какая-то новая модель, якобы, пишет код также и даже лучше, чем Sonnet 3.6 — а по факту, альтернатива может и хорошо пишет код, но не способна в то, что Anthropic делает лучше всего — Sonnet эстетически лучше, чем конкуренты, не только в коде, но и в дизайне, в UX, в чувстве прекрасного у решений которые он предлагает

— Такая же ситуация с o1 Pro — очень сложно выразить в числах, почему эта модель хорошая; я уже писал выше, что мне нравится o1 Pro потому что она для узких специалистов (место для дилятор-шутки), но я чуть дополню свой тогдашний отзыв — o1 Pro модель ответам которой можно доверять и это полностью меняет мой подход к работе с LLM. Если раньше, за ответами Sonnet / Gemeni / 4o — мне приходилось ходить и пруфчекать факты, пытаясь понять придумала она их или нет, то внутренние рассуждения o1 Pro практически полностью лечат модель от галлюцинаций (в разумных пределах, время на циферблате она все еще распознает). То есть: я готов платить за гарантии того, что модель с очень высокой вероятностью не ошибется в ответе, потому что если она не уверена — она откажется давать ответ в целом и мне кажется это самой ценной фичей этих моделей

— o1 Pro сложнее поддается инструкциям — и не потому, что она им плохо следует, а наоборот, потому что она слишком хорошо им следует и любая ошибка в инструкциях может привести к неправильным результатам (например, если приложить непродуманный пример решения задачи, в таком же формате все и придет и тп)

— Самое клевое: помните я с вами делился кастомными инструкциями для ChatGPT которые доказательно улучшали качество ответов gpt4o на 7%? Так вот, во-первых — я их выложил на GitHub, можно подписаться и получить уведомление когда будет новая версия; во-вторых — o1 Pro полностью раскрывается с такой инструкцией: модель, перед тем как начать цепочку внутренних рассуждений, сначала назначает себе профессиональную роль и уже потом, от имени этой роли «думает» и пишет промежуточные ответы. Я попробовал пару дней пожить без инструкций этих и не смог — o1 модели по настоящему раскрываются с такой инструкцией, потому что вешают на себя роли каких-то выдающихся специалистов в области

— Я перевел в o1 Pro вообще все, что делаю или потребляю: она пишет для меня вики-лайк статьи (они совпадают с реальными в фактах, я проверял), книги-истории, помогает в учебе, бизнесе и творчестве, и сейчас мой день больше всего напоминает какой-то SciFi фильм 60х, где коммуникатор героя решает для него все вопросы и задачи. У меня однажды уже было похожее чувство — когда мне было 12 лет и я попал в интернет по карточкам, и ощутил что теперь можно узнать что угодно и не мог выбрать с чего начать, куда пойти, потому что интернет уже тогда был большим, и все было интересным

Я понимаю, что $200 заградительная цена для многих — и не призываю вас тратить на нее деньги; я просто рассказываю свою мотивацию, почему я продолжу платить — потому что люди часто спрашивают в личке

Если вы хотите похожие на o1 модели дома, вы можете рассмотреть эти: QwQ 32B, Phi 14B и Deepthought 8b, но все они будут всегда ограничены знаниями которые поместились в их размеры, ну и не забывайте их просить решать задачи шаг-за-шагом и проверять свои ответы по пути

tl;dr Денис поехавший — отдает ClosedAI 200 баксов в месяц


Интересно.


Репост из: Denis Sexy IT 🤖
Что показали:

В ChatGPT теперь появились проекты – можно загрузить нужные к проекту документы, кастомные инструкции, ну или просто использовать проекты как папки для чатов

Наконец-то хаос в левой колонке можно организовать


Репост из: эйай ньюз
Sora всё ближе! 🥳

На сайте OpenAI уже появилась страница со списком стран где будет доступна Sora. Сюрприза не случилось: модель недоступна в ЕС и Великобритании, из-за драконовских регуляций. Всем остальным странам, где есть ChatGPT, доступ дадут.

Судя по тому, как участились утечки (вроде вчерашней экранки), релиз не за горами, может быть даже сегодня вечером! Но, мне кажется, что желающим попробовать Sora стоит приготовить $200 на новый тир подписки - генерация даже пары секунд видео это очень дорогое удовольствие, а ведь Sora 2, судя по утечкам, сможет генерить аж целую минуту!

@ai_newz

Показано 20 последних публикаций.