Фильтр публикаций


Репост из: Denis Sexy IT 🤖
Сделал простой гайд какие модели когда использовать в ChatGPT:

GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям

GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней

GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп

o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.

o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.

o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.

o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.

Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили

Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты


Репост из: Denis Sexy IT 🤖
А если спросите, чего я там программирую:
То в выходные закончил эту штуку – https://shir-man.com/convert-video/

Полезна она для всяких контент креаторов или веб-предпринимателей

Читатели всегда остро реагируют, когда закидываешь в канал какое-то непожатое видео на 200 Мб (😘 ), а это муторная операция, потому что мир видео кодеков проклят и настроек там миллионы – я это решил сделав одну классную команду которую я постоянно дергаю на маке

Но на Windows у меня ничего не настроено кроме игр и нейронок, а иногда хочется быстро пожать какое-то видео и залить в канал, и как всегда, все сайты завалены рекламой или настройками конвертации, регистрацией и тп

Короче, по ссылке выше, вынес свои команды которые использую в бизнесе или ведении канала постоянно:

➡️ пожать любую видео или даже гифку в нормальный mp4, с лучшим балансом качество-размер
➡️ пожать видео в нормальный формат, чтобы встроить на сайт и везде работало, и гугл не писимизировал в выдаче
➡️ сделать гифку вменяемого размера из видео
➡️ удалить куски тишины в видео (медленно работает)

Буду добавлять со временем новые пресеты (или не буду)

🔒 Файлы, как водится, не покидают вкладку браузера

🔨 И нет, я все еще не умею программировать – я знаю как работает софт, как он должен выглядеть и как устроен условный linux сервер, но я смотрю на этот JavaScript как на древне-арамейский – не для JavaScript меня мама родила 🤨


Репост из: Denis Sexy IT 🤖
Массовая адаптация выглядит так:

Не пропусти
будущее
!


Репост из: Denis Sexy IT 🤖
Сделал еще один тул который работает во вкладке браузера (без сервера), удобный для разных операцией над текстом при подготовке его к LLM – с нормальной мобильной версткой:
🔬 https://shir-man.com/text-processor

Помимо поиска и замены, там еще 63 пресета, и я честно уже не знаю, что еще туда можно добавить из простых операций над текстом 😮


Репост из: Denis Sexy IT 🤖
Видео недоступно для предпросмотра
Смотреть в Telegram
Наткнулся на любопытный проект:
https://asim.sh/

Он позволяет визуализировать любую идею в виде мини-приложения в вебе, причем бесплатно

Автор отдельно заморочился и подключил много разных API к сервису, поэтому там есть и генерация картинок, и музыки, и распознание картинок и еще куча всего

В общем, залипательная штука - давно хочу что-то такое же сделать, но руки не доходят


Репост из: CGIT_Vines
Видео недоступно для предпросмотра
Смотреть в Telegram
Decart в демку Oasis добавил возможность создавать представления на основе вашей входящей картинки.

Ожидаемо, такой мир довольно быстро начинает деградировать и разваливаться. В следующих версиях обещаем сделать его более стабильным. Все инсинуации с будущим оставляю вам в комментариях.

Пробовать всё там же. Свои миры кидайте в комменты — либо картинками, либо видосами.

@CGIT_vines


Репост из: Denis Sexy IT 🤖
Если пропустили, на той неделе вышло пару интересных проектов — делюсь в виде подборки:

🔬 STORM
Если помните, я уже делился работой от Stanford где они научились получать ответы от LLM которые почти не содержат галлюцинаций (wiki демка). Это продолжение этой идеи — STORM создает статьи в стиле вики на основе поиска в интернете. Можно в конце и PDF скачать, и сам ресеч направлять в нужную сторону.
Мне понравилось намного больше чем платный Perplexity с их лучшей платной моделью (о нем я позже пост напишу)

🔬 memenome.gg
Видели эти видео, где на фоне майнкрафт и робо-голос что-то там читает? Ну вот можете теперь производить их в промышленных масштабах на любую тему

🔬 NotebookLlama
Помните гугловский сервис генерации подкастов? Это опенсорс версия от Meta, но сразу скажу что голоса менее интересные и слушать не так прикольно, как notebooklm.google.com от Google – зато опенсорс

🔬 Openrouter Hermes 3 405b
У популярного LLM-провайдера какая-то акция видимо, потому что они дают использовать хорошую модель Hermes 3 405b LLM бесплатно — это та, у которой нашли депрессию, правда, думаю в датасете


Репост из: Ai molodca 🤖
Мой аишный чемоданчик.

Подумал, вдруг будет полезно собрать для вас инструменты и сервисы, которые я сейчас использую на ежедневной основе. Отсортированы в порядке частоты использования.

Графика:

Ideogram, Adobe Firefly (в Фотошопе), Midjourney, Dalle-3, Phygital+ (там кручу Flux), Krea (для реалтайм генерации), когда нужно что-то поделать в Поломатике1111 - RunDiffusion - позволяет поминутно арендовать любой UI на отличном железе, Magnific для апскейла.

Для работы с текстами:

Claude 3.5 (проекты - топ), ChatGPT (только из за выхода в интернет), Wispr Flow (отличная приблуда для мака, которая позволяет переводить речь в текст, сейчас практически не пишу, а диктую), Perplexity для поиска.

Видео:

Kling 1.5, Gen-3, Luma. Тут все понятно, пацаны вообще ребята.

Озвучка и звуки:

ElevenLabs, Replay (для аи-каверов).

Песни, музыка:

Suno.

Говорящие головы:

HeyGen, Hedra.

Монтаж:

Capcut, хоть базово и не совсем аи, но напичкан им.

Если есть какие-то классные сервисы, которыми вы действительно пользуетесь ежедневно, делитесь в комментариях 👍


На волне последних трендов




Все так представляли?


Репост из: эйай ньюз
Видео недоступно для предпросмотра
Смотреть в Telegram
Уходим красиво💨 заливаем код в опенсорс

DeveloperHarris, довольно известный в узких кругах разработчик интересных инди-игрушек вокруг концепта использования ИИ для НПС и сторителлинга, закрыл свою "геймстудию" starlightlabsco. Но как же стильно он ушел:

Чел слил в опенсорс весь код своих проектов, так что теперь каждый может дать его детищу второй шанс или поучиться на его примере.

Внутри:

- Starlight: игрушка про деревню, в которой каждый житель имеет свою историю, свою жизнь и мозг. С НПС можно поболтать и простенько повзаимодействовать (собрать урожай вместе).
- Discord Dungeons & Dragons: когда-то писал про бота, который создает ролевую историю. Так вот, это то же самое, но для компании. LLM будет вашим персональным Данжен Мастером.
- Bonfire: LLM-рассказчик, который генерирует визуал.
- Прототип карточной игры, которая позволяет на лету создавать свою колоду.
- StarlightLabsDemo: болтай с 3D-аватарами голосом.

Здесь стоит оговориться, что проекты еще крайне сырые, но, возможно, кто-то из вас соберется да запустит что-то из этого у себя, а может, даже продолжит работу над этим или другим подобным проектом, коих скоро будет огромное количество. За интерактивным и уникальным геймплеем для каждого игрока — будущее!

Гитхаб
Твит, там еще прикольные размышления о том, как сделать игры интереснее и почему он решил закрыть проект. Надеюсь, он не пожалел о содеянном, респект.

@ai_newz


Репост из: Нейросети и Блендер
Видео недоступно для предпросмотра
Смотреть в Telegram
FLUX интерполяция по рандом латентному пространству

📕 Что мне нравится в этом блуждании, так это его абсолютная непредсказуемость. Мы переходим от одного вектора к другому, причем длина и направление этих переходов задаются случайным шумом. В итоге получается нечто похожее на сон или беспорядочный набор кадров, плавно переходящих из одного сюжета в другой.

Если хотите попробовать, вот(требует много VRAM):

GITHUBCOLAB

Пример для SD 1.5 кода от Karpathy

Музыка из Suno


Репост из: Технологии | Нейросети | Боты
Видео недоступно для предпросмотра
Смотреть в Telegram
Убираем фон с изображения.

BiRefNet — новый инструмент для быстрого удаления фона. Разработчики утверждают, что он на голову лучше конкурентов.

Проверить самим можно уже сейчас, бесплатно и без лимитов.

• Github
• Попробовать

#neural #нейросети

@aiaiai


Репост из: Нейросети и Блендер
Фотореалистичность во FLUX

Пока FLUX Union ControlNET только ждет адаптирование под ComfyUI, поигрался с фотореализмом генераций.

📕 FLUX Union ControlNET содержит в себе 7 моделей и пока доступен в diffusers: canny, tile, depth, blur, pose, gray, low quality

Собрал json для фотореализма + апскейл (в комментах)
Лоры: Реализм | Пленка

🔥 А тут собрал Glif —> можно погенерить 20 картинок бесплатно в день (Совсем недавно было 100 🐈‍⬛🐈‍⬛)

Glif — кстати позволяет не только бесплатно генерить картинки, но еще и собирать пайплайны под свой вкус с огромным выбором LLM, text2image, и даже ComfyUI есть для особо желающих кастомы делать (правда пока с минимальным набором нод и моделей)

Еще завтра планирую стрим по Flux и Glif, подробнее тут.

@monkeyinlaw


Репост из: 🟡NeuroGraph
Первые версии Control Net для Fluх Dev уже появляются.

Flex 1 Controlnet Cany можно потестировать ЗДЕСЬ



Показано 17 последних публикаций.