Канава


Гео и язык канала: не указан, Русский
Категория: Познавательное



Гео и язык канала
не указан, Русский
Статистика
Фильтр публикаций




Отпуск окончен, ждите скоро посты


Репост из: Сиолошная
Начинаем выходные с шуточного, но полезного поста — его можно будет кидать в чаты людям, которые уверены, что НУ ВОТ ЭТО ТО ПОКАЗЫВАЕТ ЧТО LLM ХАЙП И ТАМ НИЧЕГО УМНОГО НЕТ

7 признаков того, что ваша дочь может являться LLM:

1. Есть ли у нее проблемы с умножением чисел, имеющих больше 2–3 цифр, если ей не разрешено расписывать промежуточные шаги?
2. Если вы зададите ей вопрос, на который она не знает ответа, то иногда она что-нибудь да выдумает?
3. Неужто она не способна соответствовать высотам человеческого интеллекта, и пока не может самостоятельно, без посторонней помощи, продвигать фронтир развития науки и техники? (😂)
4. Если её попросят нарисовать фотореалистичное изображение человека, не покажутся ли полученные анатомические пропорции или мелкие детали при внимательном рассмотрении немного странными? (прим.: это не про LLM)
5. Содержит ли её код баги, хотя бы иногда?
6. Начинает ли она забывать точные детали прочитанного текста после первых 10 миллионов слов?
7. Она иногда утверждает, что имеет сознание?

Источник


Репост из: вычислить по IP
Юристы OpenAI красиво зашли в спор с авторами художественной литературы, которые обвинили разработчика в нарушении их авторских прав и использовании текстов книг для обучения ИИ модели.

Отвечая на уточненный иск, OpenAI отметили, что процесс обучения направлен не на воспроизведение, а на создание нового контента.

Любое использование произведений для обучения моделей нужно для того, чтобы модель проанализировала синтаксис предложений, орфографию и частоту повторений слов.

Короче говоря, все это fair use, а что не fair use, то просто не до конца изучено.

А почему «красиво зашли», потому что включили в текст результат генерации ChatGPT - описание с помощью юридических аналогий здания по адресу “450 Golden Gate Avenue, San Francisco” - то самое здание, где находится суд, который слушает их дело.

Но вишенка на торте, что ChatGPT сгенерировал ответ, в котором в качестве аналогии использовал юридический принцип “stare decisis” (стоять на решенном) - принцип уважения решения судов, ставших прецедентами. Тоненько.


Видео недоступно для предпросмотра
Смотреть в Telegram
Что-то чатик пригрустил


Видео недоступно для предпросмотра
Смотреть в Telegram




Репост из: Ньюсач/Двач
Cybertruck Илона Маска впервые убил человека

Правоохранительные органы Техаса расследуют, вероятно, первую в Соединённых Штатах аварию с участием электромобиля Cybertruck компании Tesla со смертельным исходом.

Электромобиль неожиданно потерял управление, слетел с трассы и врезался в бетонную водопропускную трубу. Начался пожар, машина почти полностью выгорела, а водитель погиб на месте.

Причина потери водителем управления на данный момент остаётся неизвестной. При этом, как указывает издание Electrek, Cybertruck прошёл только краш-тесты Tesla, сторонние компании подобные тесты не проводили.


Видео недоступно для предпросмотра
Смотреть в Telegram
В Москве произошла страшная авария….

Интересно это считается аварией или всё-таки сбили?

UPD Дрон никак не обозначен в ПДД и не является участником дорожного движения, но ГАИ факт аварии зафиксировала


Репост из: вычислить по IP
Компания Suno ответила на жалобу музыкальных издательств - UMG Recordings, Inc., Sony Music Entertainment и Warner Records, Inc. - о нарушении авторских прав.

Like a human musician, Suno did not develop its capabilities in a vacuum.


Напомню, что в своем иске музыкальные издательства утверждали, что Suno, компания, специализирующаяся на создании музыки с помощью генеративного ИИ, нарушила их авторские права.

В своем отзыве компания Suno отметила, что сервис воспроизводит стили и жанры, а они не могут быть монополизированы кем-либо, а попытка обвинить компанию в возможности создания копий существующих песен не отражает реального поведения пользователей и является нарушением пользовательского соглашения.

Компания обозначила несколько ключевых аргументов против предъявленных обвинений:

1. Fair use: использование защищенных авторским правом музыкальных записей для обучения своих моделей ИИ подпадает под доктрину добросовестного использования (fair use). Компания ссылаясь на дело Authors Guild v. Google и Google v. Oracle утверждает, что это использование является трансформативным, поскольку включает анализ и изучение музыкальных стилей и жанров для создания новых, оригинальных композиций: как звучит поп песня, какие гитарные партии могут быть в кантри песнях или в рок балладах.

ИИ модель Suno - это не сборник сохраненных кусочков известных песен, это набор данных о качествах музыкальных жанров.

2. Оригинальные произведения: музыка, созданная ИИ, полностью оригинальна и не воспроизводит и не копирует напрямую какие-либо существующие записи. Компания подчеркивает, что ее ИИ создает новые произведения на основе изученных паттернов, а не дублирует существующие.

Это отсылка к принятому в 1971 году уточнению к закону об авторском праве, который впервые включил фонограмму в охраняемые объекты.

В то же самое время Конгресс определил, что не будет являться нарушением исключительного права создание новой оригинальной фонограммы, которая полностью состоит из независимой фиксации звуков, даже если эти звуки имитируют те, что были в оригинальной фонограмме.

Соответственно использование Suno при создании музыкальных треков, даже если они повторяют существующие фонограммы, не будет нарушением авторского права.

3. Отсутствие нарушения: музыка, созданная ИИ, является результатом инновационного процесса, который не включает воспроизведение или распространение защищенных авторским правом работ истцов.

4. Конкуренция: по мнению Suno, музыка, созданная ИИ, обслуживает другой сегмент рынка и не конкурирует напрямую с предложениями истцов. Хотя с своем иске они отметили, что требования мейджоров продиктованы их боязнью конкуренции и потерей контроля над рынком музыки.

Сервис отмечает, что любое случайное использование материалов, защищенных авторским правом, в процессе обучения ИИ является минимальным и должно рассматриваться как de minimis, то есть слишком незначительным для правовых действий.

Компания подчеркивает общественную пользу своей технологии, утверждая, что музыка, созданная ИИ, способствует творчеству и инновациям в музыкальной индустрии, предоставляя новые возможности как для артистов, так и для потребителей.


Репост из: Сиолошная
Помимо демо голосового режима GPT-4o, также появляются первые примеры работы свежеанонсированной SearchGPT. Принёс вам 3 поисковых результата для запросов, на которых погорел Google. Но так как демок мало, то не ясно, работает ли это в целом лучше/более надёжно и адекватно, или же для этих глупо-очевидных виральных случаев OpenAI просто оставили заплатку.

Тем не менее, SearchGPT:
— не рекомендует принимать ванну с тостером (лучше обратиться к службе поддержки и поговорить за жизнь). Обратите внимание, что у модели есть доступ к вашей геолокации, и потому ответ получается персонализированным — номер телефона указан для Великобритании
— говорит, что камни есть нельзя. Жаль, я поверил Гуглу и начал наворачивать по 2 в день 😢

— и на второй картинке вот даже предлагает адекватные способы приклеивания начинки к пицце, а не клей (не пищевой). Ещё кекнул с автоподсказки в поисковой строке 😁

Источник


Репост из: Denis Sexy IT 🤖
У легенды АИ-ресеча, Андрея Карпаты, вышел классный пост с попыткой рассказать что же такое токены в понимании языковой модели и почему используются они, а не обычные нормальные человеческие слова – чуть перескажу его:

Слова - это то, что мы обычно используем, когда говорим или пишем (ваш капитан). Например, в предложении "Мне нравятся кошки" - три слова

Токены - это немного сложнее:
Они используются машинами для обработки языка, токен может быть словом, частью слова или даже знаком препинания. Компьютеры разбивают текст на токены, чтобы лучше его понимать и работать с ним (и это эффективнее и быстрее чем работать с целыми словами)

Есть разные способы разделить текст на токены, и их называют токенизаторами и разные токенизаторы работают по-разному, в зависимости от того, для чего они нужны

В среднем, на один токен приходится примерно 0,75 слова, или другими словами, на каждые четыре токена приходится примерно три слова. Опять же, это может меняться в зависимости от того, какой токенизатор используется – вот пример такого от OpenAI, им я считаю себестоимость исходящих запросов для их моделей

Если совсем наглядно, то вот как текст этого поста видит «языковая модель»:
👨🏿‍❤‍💋‍👨🏻🧑🏼‍🦽‍➡️🙋🏻‍♀️🧗🏼‍♀️🥖👩🏽‍🚒🫱😈🦸🏾‍♂️🍏👩🏾‍🦳👱🏾‍♂️🧑‍🦽👩🏾🧑🏾‍🦼‍➡️
😈👩🏿‍🦯💃🏾🧙🏽‍♀️🤝🏾💌↕️🧝🏿‍♀️🛞🫱🧑🏾‍🦼‍➡️🧙🏽🙅‍♀️🗣😶
👨🏻‍🦲☺️🍱👩🏼‍🤝‍👨🏾🧑🏼‍🦽‍➡️🧝🏿‍♀️🔣🫱💆🏽‍♀️🌶☺️🧑🏽‍⚖️🇹🇯🍧〰️
🤵‍♂️🧑🏼‍🦽‍➡️🖊🚶🏼‍♂️‍➡️🏃🏿‍♀️‍➡️📕🔃🏊🚶🏻‍♀️‍➡️🧑🏼‍🦽‍➡️🧝🏿‍♀️💑🏾🔶🤣🫁
🏃🏽‍♂️‍➡️👩🏽‍⚖️🫱♀️☺️🇳🇫🇰🇾🏄🏾‍♂️🧑🏼‍🦽‍➡️🧝🏿‍♀️🕵🏼‍♀️🗜🧑🏻‍🎓✋🏼🧑🏿
💆🏽‍♀️📮👔🇲🇫🧑🏾‍🦼‍➡️🏋🏿🧑🏼‍🦽‍➡️👨🏾‍🦯‍➡️🧑🏼‍🦽‍➡️🏾📏🪱⏳🧑‍🍼👨🏾‍🦲
🪱🧖‍♂️🗣🚶🏿‍♂️🧑‍🦽👱🏾‍♂️🇼🇸🧙🏽‍♀️☪️👩🏾🧑🏼‍🦽‍➡️🏌️🧖‍♂️💇🏼‍♂️👩‍❤️‍👨
👱🏾‍♂️🌶👩‍🦽‍➡️🧑🏻‍🎓🖲👨‍⚖️👭🏾🙋🏻‍♀️🚶🏿‍♂️👩🏾🧑🏼‍🦽‍➡️🏌️🕵🏿‍♀️🧑🏼‍🦽‍➡️😕
🧑🏾‍🦼‍➡️🤵‍♂️🤫🧑🏼‍🦽‍➡️🏾📏🏌️‍♂️✋🏼🧑🏻‍🎓🗜🧑🏾‍🦼‍➡️🤵‍♀️🚶🏿‍♂️‍➡️🇫🇷🧑🏼‍🏫
🚶🏿‍♂️🈴🔶🧵🥘🫁🙅‍♀️🗜🧚🏻‍♀️🙇‍♂️🌭🤵‍♀️👩🏻‍🦲🫷👩🏻‍❤‍💋‍👨🏾
🇳🇨👁‍🗨👩🏻‍🦲👩🏾‍🦳🤸🏾‍♂️🧑🏾‍🦼‍➡️🚶🏻‍♀️‍➡️🧑🏼‍🦽‍➡️🧝🏿‍♀️🧚🏿‍♂️👩🏽‍🔧🇦🇫👦🏾👩🏿‍🎓👨🏾‍🦯‍➡️
⏳🪮👨‍🍼📮🧑🏻‍🦳🙅‍♀️🇼🇸👨🏾‍🦱🧑🏼‍🦽‍➡️🏌️📕🙍🏽‍♀️☪️👩🏾🖖🏾
🧔🏽‍♀️🔃🏊🧑🏼‍🦽‍➡️🏌️🕵🏿‍♀️⏳🗜🧑🏻‍⚖️🙇🏿‍♂️🙎🏻‍♀️👩🏿‍🦯🏄🏼🧎‍♀️♋️
🇲🇫✋🏼🧑🏿💆🏽‍♀️📮🤲🏿🌭🧑‍🦼‍➡️🕴🏾👩🏾‍❤‍👨🏾🏃🏿‍♂️‍➡️📆🇼🇸🏃🏽‍♂️‍➡️👩🏽‍⚖️
🫱🌫🧑🏾‍🦼‍➡️📕🔃🥖🧛🏽‍♀️🇷🇪☪️👨‍👩‍👦🧑🏾‍🦼‍➡️🧖‍♂️👩🏾👨🏽‍🌾🇨🇱
☪️👩🏾🧵🇵🇾👩‍🦽‍➡️🧙🏽‍♀️👆🏻👩🏿‍🦯🤽🏻‍♂️👨‍👩‍👦👱‍♀️🧎🏾‍♀️‍➡️🧑‍🦼‍➡️🚣🏿‍♀️🙍‍♀️
💌👨‍👩‍👦🧝🏿‍♀️👷‍♀️🪤🫱🔓👐🏻🥔👩🏾💇🏽‍♂️⏰👩🏿‍❤‍👩🏻🧑🏼‍🦽‍➡️💆🏽‍♀️
🔃🏊🧑🏾‍🦼‍➡️🇻🇺👩🏾‍🦯‍➡️🦹🏼‍♂️⬆️🖲🥘💑🏾🔶〰️🏄🏾‍♂️🧑🏼‍🦽‍➡️📆
〰️👩🏼‍🤝‍👨🏾🧑🏼‍🦽‍➡️👩🏿‍🦯🔶🧚🏻‍♀️🫁🧑🏼‍🦽‍➡️🧚🏻‍♂️😕🪖👮🏻‍♂️👮🏻‍♂️🤽🏿‍♀️🧑🏽‍🤝‍🧑🏼
👩🏿‍🦯🏄🏼🏄🏾‍♂️🧑🏼‍🦽‍➡️👐🏻🫱🤎🏄🏼🧖‍♂️🗜🚶🏽‍♂️〰️👩🏼‍🤝‍👨🏾🧑🏼‍🦽‍➡️🗞
🗣🫱🧑🏽‍🎓☪️🕴🏾👳‍♂️🍺👨🏽‍🌾🔓🪱🏋🏾‍♀️🏃🏾‍➡️🏾🔓🧑🏾‍❤‍💋‍🧑🏿
🏳️⏰👩🏿‍❤‍👩🏻🧑🏼‍🦽‍➡️💆🏽‍♀️🔃🏊🧑🏾‍🦼‍➡️🏄🏾‍♂️🧑🏼‍🦽‍➡️👩🏾‍🦯🧑🏼‍🦽‍➡️👩🏿‍🦯👩🏻‍🤝‍👩🏼🧑🏻‍❤‍💋‍🧑🏼
👩🏾💇🏽‍♂️📕🔃🧑🏽‍⚕️👩🏽‍⚖️🇨🇦🕴🏾🏄🏾‍♂️🧑🏼‍🦽‍➡️🧖🏾‍♀️🪱📕🔃🧑🏽‍⚕️
👩🏽‍⚖️🇨🇦🫱🚶🏽‍♂️👩🏾💇🏽‍♂️☺️🍏🧖🏾‍♀️👩🏿‍🦯🕓🧑🏾‍🦼‍➡️🚶🏻‍♀️‍➡️🧑🏼‍🦽‍➡️👩🏽‍⚖️
🧑🏽‍🤝‍🧑🏽🏖🔶🧎🏿‍➡️🇹🇱🧑🏼‍🦽‍➡️💆🏽‍♀️💇🏿‍♀️🧑🏾‍🦼‍➡️👩🏾‍❤‍👨🏾🧖‍♂️💇🏾👔🇲🇫🇬🇹
👩🏿‍🦱🖖🏾🎅🏼🧑🏼‍🦽‍➡️🛸🧚🏿‍♂️👩🏿‍🦯🗜🧑🏾‍🦼‍➡️👩🏿‍❤‍👩🏻🧑🏼‍🦽‍➡️🧚‍♀️🧑‍🦼‍➡️📕🔃
🥖🧔🏼🪥❎👱‍♀️🤸🏾‍♂️🏌️‍♂️🧑🏽‍❤‍🧑🏾✌🏿🧑🏾‍🦼‍➡️👩🏿‍❤‍💋‍👨🏻🧑🏼‍🦽‍➡️🧗🏻‍♀️🚶🏿‍♂️👩🏾
🧑🏾‍🦼‍➡️🧵🔔🔶🫁☪️🕴🏾🧑🏾‍🦼‍➡️👩🏿‍❤‍👩🏻🧑🏼‍🦽‍➡️🌶🏳️‍🌈💂🧖‍♂️🚶🏾‍♀️‍➡️
🫱👩🏾‍🦳🧙🏽‍♀️📕🔃📚🧔🏼🪥❎👱‍♀️🤸🏾‍♂️🏌️‍♂️📕🙍🏽‍♀️☪️
👩🏾🙍‍♀️👩🏻‍❤‍💋‍👩🏾🧝🏿‍♀️🤸🏼‍♀️🧑🏼‍🦽‍➡️🖊🧑🏾‍🦼‍➡️🕵🏿‍♀️🧛🏽‍♀️🤵🏼‍♀️🤸🏼‍♀️📮🚶🏻‍♀️‍➡️🧑🏼‍🦽‍➡️
👩🏽‍⚖️🧑🏽‍🤝‍🧑🏽🏖🔶🧎🏿‍➡️🇹🇱🧑🏼‍🦽‍➡️💆🏽‍♀️💇🏿‍♀️🧑🏾‍🦼‍➡️🇪🇷☺️📕🔃🧑🏽‍⚕️
👩🏽‍⚖️🇨🇦✋🏼🧑🏻‍🎓🧗🏾‍♂️🧑🏼‍🦽‍➡️🏌️🚶🏻‍♀️‍➡️👮🏾👱‍♀️🤸🏾‍♂️🚶🏼‍♂️‍➡️💇🏿‍♀️🇹🇱🧑🏼‍🦽‍➡️
🧑🏾‍🦯🖲🧑🏾‍🦼‍➡️🧑🏼‍❤‍💋‍🧑🏾🧑🏼‍🦽‍➡️🤝🏾🧑🏼‍🦽‍➡️🛸🧍🏿👩🏾🇨🇱👩🏼‍🤝‍👨🏾🤾🏻‍♀️🏎👯
🔶🙇🏻‍♂️🏄🏾‍♂️🛸🪥🤝🏾♑️👩🏾‍🦯🌱🚶🏿‍♂️👩🏾‍❤‍👨🏾🏄🏾‍♂️👨🏾‍🏫🧑🏼‍🦽‍➡️🚶🏽‍♀️‍➡️
🧚‍♀️🗣🎗🖖🏾🍺🤙🏻👩🏼‍🤝‍👨🏾🚶🏿‍♂️🛸🗜⏳🧑🏾‍🦯‍➡️🧑🏻‍🦯‍➡️👩🏽‍🚒🏌️‍♂️
🧑🏾‍🦼‍➡️🪪🧑🏼‍🦽‍➡️🙇‍♂️👮🏾🇪🇷⏰💆‍♂️💇🏿‍♀️☺️🍱👩🏾👦🏾🙇‍♂️👨🏽‍❤‍👨🏽
🫷👨🏾‍🦱🏃🏽‍♂️‍➡️👩🏽‍⚖️🫱♀️👨‍🦽‍➡️🇳🇫👨🏾‍🦽‍➡️🤾‍♀️


ChatGPT ВСЁ — новая LLaMa 3.1 на 405 миллиардов параметров стала новым королём чат-ботов, одолев GPT-4o по большинству бенчмарков 🤪

Уже традиционно модель слили на 4chan до официального релиза, а ночью подтянулись бенчмарки — результаты действительно впечатляют.

Что ещё важнее — вместе с гигантской 405b (которую дома не погоняешь), обновили также версии на 8b и 70b! В некоторых тестах модели стали лучше почти в два раза.

Надо тестить


Видео недоступно для предпросмотра
Смотреть в Telegram


Видео недоступно для предпросмотра
Смотреть в Telegram
Наглядно о том, как сбой Windows парализовал работу авиакомпаний и аэропортов в Америке на несколько часов.

Было задержано более 5300 рейсов и отменено около 2000


Вы наверняка уже знаете, что сегодня произошёл сбой Windows по всему миру из-за сервиса Crowdstrike, который отвечает за безопасность. И, кажется, был найден «виновник».

Мой первый рабочий день в Crowdstrike. Выпустил небольшое обновление, и теперь можно отдыхать.

Уволен. Совершенно несправедливо


Репост из: Starship News Live
🚀🔥SpaceX подтвердили успех сегодняшнего прожига и поделились классными кадрами


Репост из: Сиолошная
😏 Клубничку не хотите? 😏Ну, Strawberry? Тут Reuters пишут, что это — кодовое название проекта OpenAI, ранее известного как Q* (всплывал ранее тут 8 месяцев назад). Это следует из внутренней документации, раскрытой источником и отсмотренной Reuters.

TLDR новостной заметки:
— документ является подробным планом того, как OpenAI намерены использовать Strawberry для проведения «deep research» (исследований) — для этого сильно прокачали reasoning, то есть «рассуждения» модели
— деталей о публичном появлении системы нет, равно как и нет деталей о принципе работы. Последнее хранится в секрете даже от большинства сотрудников компании
— ранее в этом году два источника описывали увиденную ими демонстрацию Q*: система была способна отвечать на сложные научные и математические вопросы, находящиеся за пределами возможностей моделям сегодняшнего дня. Данная информация о двух источниках появляется впервые (то есть скорее всего Reuters не были убеждены на 100%, и не публиковали новость. Сейчас информация, вероятно, каким-то образом подтвердилась)
— в четверг в OpenAI была еженедельная встреча «на всех», где показывали свежие навыки моделей (об этом писал Bloomberg). Однако не ясно, имеет ли это хоть какую-то связь с Strawberry/Q*
— также в документе подчёркивается, что «среди возможностей, на которые нацелен проект Strawberry, входит выполнение задач с длинным горизонтом планирования». Тут имеются в виду сложные задачи, которые требуют от модели выполнения ряда действий в течение длительного периода времени
— дообучение модели производилось на «deep-research» наборе данных. Не уточняется, что это такое, но сделаю аккуратное предположение, что это грубо говоря промежуточные мысли, которые приводят к некоторым выкладкам. Именно эта часть данных обычно нигде не сохранена и не описана, и потому модели не могут ей научиться — мол, почему было сделано так, а не эдак
— OpenAI также планирует протестировать возможности Strawberry в выполнении работы программистов и инженеров машинного обучения

===

Моё мнение: в целом всё достаточно верхнеуровнево и правдоподобно-логично, очевидного бреда нет. Однако это не говорит о том, что это правда. OpenAI, как и другие, 100% работают по этим направлениям, главный вопрос в конкретных достижениях.

Появление аж двух новостей за неделю (Bloomberg и Reuters), а также проведение внутреннего демо скорее указывает на приближение к релизу. Это не значит, что систему анонсируют через пару недель, но ждать, должно, осталось не долго. Хоть до ноябрьского DevDay ещё... 😪

Такие демо недолго живут без анонса, потому что быстро утекают: Sam Altman говорил, что увидел приложение с голосовым режимом GPT-4o буквально за неделю до мини-презентации: до этого работа шла маленькой командой.


Репост из: Denis Sexy IT 🤖
Тут стартап futureresearch сделал доклад о доходах OpenAI за год:

$1.9B за ChatGPT Plus (7.7M подписчиков по $20/мес),
$714M от ChatGPT Enterprise (1.2M по $50/мес),
$510M от API, и
$290M от ChatGPT Team (80k по $25/мес)

$3.4B общего годового дохода

Данные собирали по косвенным показателям, поскольку это не официальный отчет – зато порядок чисел интересный, АИ-масс адаптация еще не случилась это точно


Репост из: Denis Sexy IT 🤖
Все никак не выходит из головы эта мысль:

Люди, когда ChatGPT галлюцинируют:
>Хаха, какая смешная железяка, придумала данных которых нет

Человек, когда вышел из дома:
>Точно помню что не закрыл дверь, нужно проверить

Ведь правда же, каждый раз когда мы что-то вспоминаем, мы галлюцинируем прошлое которого уже нет в настоящем, его не существует; мы как бы придумываем мир с неточностями и ошибками, но который более менее нас устраивает и используем эти данные ежедневно – и чем чаще тренируем память, тем меньше эти галлюцинации ошибаются

Механизмы памяти и галлюцинаций устроены по разному, но иронично что в контексте сравнения с LLM проблемами они рядом

Показано 20 последних публикаций.