Нейросети удивляют


Kanal geosi va tili: Butun dunyo, Ruscha


Рассказываю о самых крутых возможностях нейросетей и своих экспериментах.
Автор @arslanovdev

Связанные каналы

Kanal geosi va tili
Butun dunyo, Ruscha
Statistika
Postlar filtri


Мне до сих пор сносит крышу от того, как хорошо Claude пишет код. С одного запроса Claude Sonnet 3.7 Extended сделал полноценную игру-аналог алхимии с совмещением элементов. 64 комбинации, среди которых биотехнологии, робототехника, квантовые технологии и многое другое. Встроенные подсказки, журнал открытий. Играется интересно! 🔥

Поиграть можно тут 🔗тык
Работает только с vpn.


Джимми Нейрон 🚀 dan repost
Google выпустила Gemini Flash 2.0

Это своего рода фотошоп, в котором можно редактировать изображения текстом. Прикольная штука! Потестил немного, всё получилось практически с первой попытки.

Gemini Flash 2.0 умеет: реставрировать и раскрашивать фото, переносить текстуры на объекты, генерировать отдельные объекты и изображения. Не умеет увеличивать картинки (да и качество картинок пока не очень). Не может перевести текст на картинке, но может добавить туда текст.

Модель бесплатная. Попробовать можно тут (нужен vpn). В AI Studio нужно включить Gemini 2.0 Flash Experimental, в Output format выбрать «Image and text».

Области применения и возможности модели пока сложно оценить, насколько хватит вашей фантазии. Например, Денис Sexy IT придумал, что можно просить Gemini Flash 2.0 создавать на основе любых изображений 3d-персонажей для MMORPG.


ElKornacio dan repost
забавная ситуация сейчас развернулась на стыке фронтенда и LLM.
в чём замес:

1. Tailwind - одна из самых (если не самая) популярных библиотек в мире фронтенда
2. соответственно, есть десятки миллионов строк кода, написанных с Tailwind, на которых обучали LLM
3. и 3.5 Claude, и 4o умеют оооочень хорошо помогать писать код с Tailwind, выдают целые компонентные блоки
4. около месяца назад вышла новая версия Tailwind - v4. это мажорный апдейт - в ней есть некоторые отличия от v3
5. и... LLM, естественно, ничего про v4 не знают. и Cursor, и Windsurf, и прочие продолжают генерировать код на v3 в проектах, в которых уже подключена v4
6. и их нереально переубедить. им дают документацию, явно пишут в промптах что это v4, и так далее, но миллионы строк кода, на которых обучались LLM, видимо, берут верх над доками в контексте, и она всё равно выдает смесь v3/v4

и это стало большой проблемой.
одна из самых популярных в мире библиотек обновилась, а пользователи AI-редакторов не могут ей пользоваться - AI им мешает и пишет код в старом стиле, его приходится полностью отключать.

отсюда интересно задуматься вот над чем:
1. а насколько массовый переход людей на AI-решения будет создавать отставание между "что-то уже появилось" и "AI узнал о том, что что-то появилось"?
2. будет ли это решаться регулярным fine-tuning'ом или подмешиванием некоторых апдейтов в контекст?
3. насколько ИИ консервирует старые знания (которые в тексте встречаются многократно, годами), и реже опирается на новые (которые встречались в обучающей выборке редко, только в свежих текстах)?


🔍 Наткнулся на исследование Princeton University о том, как писать тексты для поисковиков нового поколения (тех, что работают на больших языковых моделях типа GPT-4).

Если раньше для продвижения в Google достаточно было правильно расставить ключевые слова, то для AI-поисковиков работают совсем другие методы.

Что реально повышает видимость текста:
– Цитаты экспертов и авторитетных источников (+40% заметности)
– Конкретные цифры и статистика
– Грамотное указание источников
– Простой и понятный текст

🎯 Разные темы – разные подходы:
– Для исторических статей → экспертный тон
– Для правовых тем → много статистики
– Для социальных тем → больше цитат реальных людей

⚡️ Главные открытия:
– Старые приёмы с ключевыми словами больше не работают
– Лучше использовать несколько методов сразу
– Маленьким сайтам эти методы помогают даже больше, чем крупным

💡 Если хотите применить: сначала определите тематику вашего контента и подберите подходящую комбинацию методов. Но при этом не забывайте, что текст должен оставаться полезным для читателя.

Скоро напишу большую статью про то, как построить аналитику переходов из AI-поисковиков и и поделюсь другими полезными хаками в этой теме 😉


Адель и МЛь dan repost
Сэм Альтман рассказал о дальнейших планах OpenAI.

Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.

Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.

GPT-5 включи в себя o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).

GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!


Video oldindan ko‘rish uchun mavjud emas
Telegram'da ko‘rish
Еще аналог ChatGPT Operator – TARS от ByteDance (разработчик TikTok).

Берет управление над вашим компьютером, и выполняет заданную задачу. Например, запостить что-то куда-то, заполнить эксель табличку по инструкции и т.д.

🔗 https://github.com/bytedance/UI-TARS-desktop


ИИ для бизнеса / Михаил Ларькин dan repost
и сова здравствуйте)

Китайцы убили ChatGPT: Alibaba выпустили модель Qwen2.5-1M с миллионом токенов контекста.

Её возможности поражают:
— Это одна из нейронок с самым большим контекстом, в Gemini 2 млн. если что.
— Можно загнать в чат целую книгу и получать ответы по ней;
— Скорость стала выше в 7 раз;
— Веб-поиск, генерация картинок и даже видео прямо в чате;
— Прекрасно понимает русский язык;
— Всё это абсолютно бесплатно и без VPN.


chat.qwenlm.ai


Джимми Нейрон 🚀 dan repost
Нейросетевой аватар

Я нашел самый простой способ создания своей цифровой копии, к тому же совершенно бесплатный. Если раньше для создания качественной модели нужно было разбираться в Stable Diffusion или пользоваться платными сервисами с ограниченным функционалом, сейчас для этой задачи надо разбираться во Flux. Но я нашел еще один способ: вы можете создать свою нейро-копию с помощью Weights (или другого сервиса, подробнее можно посмотреть в ролике Никиты Брускова) — в нем, например, я создавал Лору на «Остров сокровищ».

Для этого потребуется от 5 до 20 ваших фотографий (в качестве обучающей выборки я взял 9 селфи), нужно сделать их квадратными и запустить обучение Лоры. Подождать потребуется минут 30 (но это зависит от времени дня). А дальше остается только писать разные промпты. Я пользовался такой структурой промпта: [токен вашей модели], [описание человека], [фон, окружение], [настройки стиля, например, professional photo].

Несмотря на то, что для теста я взял не особо качественные фото, снятые на фронтальную камеру, с помощью этого метода можно достичь качества студийной фотосессии. При необходимости нейро-фото можно пропустить через апскейлер. Причем Weights дает полную творческую свободу, ограниченную только вашей фантазией. А самое классное, что вы можете подключать любые другие лоры, имеющиеся на сайте, и комбинировать их. Например, так я сделал себя в стиле Pixar. Балуйтесь на здоровье!✨


Китайцы выкатили свою опенсорсную альтернативу ChatGPT 4o – Deepseek AI.

Кратко:
– Доступ бесплатный и без VPN

– Доступно на сайте, есть мобильное приложение

– Можно поставить на свою машину

– Режим DeepThink – модель имитирует многоэтапное рассуждение, аналогичное человеческому мышлению

– Режим Search – модель начинает гуглить необходимую инфу

– Читает диаграммы, работает с файлами

– Хорошо пишет код


Кладбище Биохакеров dan repost
Кто бы мог подумать, но чем чаще мы пользуемся ИИ в работе, тем больше мы рискуем стать тугодумами.

Естественно это не является причиной не пользоваться эти «костылем»(просто потому что те, кто не пользуются им, будут отстаивать в своей работе от тех, кто пользуется), но это может служить еще одним напоминанием того, что периодически напрягать мозги тоже нужно. Иначе совсем грустненько. Как и со всеми вещами в жизни «If you don’t use it you lose it».


С появлением продвинутого AI мы стоим на пороге революции в интерфейсах. Сейчас у нас есть темная тема, которая выставляется согласно настройкам системы – это только начало умных интерфейсов.

⚡️ Веб-приложения уже собирают тонну данных о том, как мы с ними взаимодействуем. Знают, какими разделами меню пользуемся чаще, сколько времени проводим на страницах, какой у нас размер экрана и настройки доступности. Даже отслеживают, в какое время мы активнее всего работаем с приложением.

Самое интересное начнется, когда мы научим AI правильно использовать эти данные.

Например, AI сможет:

– Сделать более заметными те 3 пункта меню из 10, которые вы используете чаще всего

– Автоматически увеличить шрифт, если видит, что вы постоянно меняете масштаб

– Расположить рядом действия, которые вы обычно выполняете в связке

– Закрепить на главной данные, к которым часто возвращаетесь

И знаете что? Для этого не нужны какие-то космические технологии – достаточно научить AI правильно анализировать то, что приложения уже умеют отслеживать.

Подробнее о том, как это может работать, можно почитать тут.


Denis Sexy IT 🤖 dan repost
А еще, инстаграм тестируют фичу где они подмешивают рекламу с внешностью пользователей, прямо в ленту 🤔

Я бы офигел если бы увидел – типа, доводим до вашего сведения, ваша внешность уже наша

Появится если использовать Meta AI для редактирования селфи и тп

12 ta oxirgi post ko‘rsatilgan.