ML&|Sec Feed


Гео и язык канала: не указан, не указан
Категория: не указана


Feed for @borismlsec channel
author: @ivolake

Связанные каналы

Гео и язык канала
не указан, не указан
Категория
не указана
Статистика
Фильтр публикаций


Репост из: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Опубликованы национальные стандарты в области качества данных для аналитики и машинного обучения:

🔸ГОСТ Р 71484.2-2024 Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных
🔸ГОСТ Р 71484.4-2024 Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 4. Структура процесса управления качеством данных

Дата введения в действие: 01.01.2025.
👁️


Репост из: Эксплойт
Один из крупнейших инвестфондов Andreessen Horowitz (a16z) провел опрос среди своих специалистов, какими нейросетями они пользуются. Вот их топ самых полезных ИИ-сервисов:

Ассистенты:


Perplexity: поисковая система с ИИ и помощник в исследованиях;
Claude: универсальный чат-бот, подходит для проектов и обмена работами;
ChatGPT: вы точно знаете его, но волки советуют Advanced Voice Mode для общения с ИИ.

Для продуктивной работы:


Granola: ИИ-блокнот, который слушает ваши встречи и преобразует стенограммы в заметки;
Flow: голосовая диктовка, преобразующая речь в текст в любом приложении;
Gamma: создание презентаций, документов и сайтов с помощью ИИ;
Adobe Acrobat: инструмент для подведения итогов и работы с PDF-файлами;
Cubby: пространство для совместных исследований с ИИ;
Cora: ИИ-помощник для работы с электронной почтой, автоматизация ответов и организация писем;
Lindy: создание ИИ-агентов для автоматизации рабочих процессов.

Для буста аудитории:

Delphi: текстовые, голосовые и видеоклоны для общения с аудиторией;
HeyGen: ИИ-аватары для масштабирования контента и перевода видео;
Argil: ИИ-аватары для социальных сетей;
Overlap и Opus: преобразование длинных видео в короткие вирусные клипы;
Persona: ИИ-агент для контент-криэйторов;
Captions: ИИ для видеомонтажа (автосубтитры, коррекция зрительного контакта).

Для создания продуктов (код):

Cursor: редактор кода с ИИ, понимающий вашу кодовую базу;
Replit: ИИ для создания приложений и сайтов из текстового описания;
Anychat: использование любых ИИ-моделей в одном месте;
Codeium: инструмент автозаполнения кода с ИИ.

Для создания контента:

ElevenLabs: реалистичные ИИ-голоса;
Suno и Udio: создание музыки на основе текстовых запросов;
Midjourney, Ideogram, Playground: генерация изображений с помощью ИИ;
Runway, Kling, Viggle: генерация видео с использованием ИИ;
Krea: платформа для создания и редактирования изображений и видео;
PhotoRoom: редактор изображений для товаров и визуализаций с помощью ИИ.

Для обучения и развития:

Rosebud: интерактивный дневник с аналитикой от ИИ;
Good Inside: коучинг для родителей с персонализированной поддержкой;
Ada Health: оценка медицинских симптомов с использованием ИИ;
Ash: персонализированный ИИ-консультант и коуч;
NotebookLM: превращение документа в AI-подкаст;
Particle: новостное приложение с кратким резюме историй.

Для развлечений:

Remix: приложение для создания и обмена AI-контентом;
Grok: чат-бот от Илона Маска. Он весёлый, попробуйте;
Curio: игрушки для детей с AI, которые разговаривают.

@exploitex




Анализ инцидентов с ИИ


Протокол SLMP-PIS. Это безопасный и эффективный протокол конфиденциальных вычислений для группы участников, который позволяет вычислять сумму связанных значений на основе пересечения частных множеств. Протокол основан на симметричной криптосистеме и поддерживает конфиденциальность данных на основе нулевого совместного использования (Zero Sharing) и псевдорандомных функций «с забыванием» (Oblivious Pseudorandom Functions). 
Источник: https://ib-bank.ru/bisjournal/blog/72 (статья про безопасные облачные вычисления)

Протоколы безопасных многосторонних вычислений. К ним относятся, например, «коррелированный» протокол передачи с забыванием, протоколы конфиденциального умножения матриц, вычисления значений функций активации ReLU и LeakyReLU. Безопасность таких протоколов доказывается на основе методологии универсальной компонуемости (UC-security).
Источник: https://cyberrus.info/wp-content/uploads/2024/11/vokib-2024-5-st03-s018-027.pdf (интересная научная статья)


Репост из: ИИ & Право
Выпущено новое Руководство NIST по борьбе с рисками синтетического контента

Национальный институт стандартов и технологий США (U.S. National Institute of Standards and Technology, NIST) опубликовал отчет "Reducing Risks Posed by Synthetic Content", посвященный проблемам, связанным с deepfake-технологиями на основе ИИ. Документ рассматривает, в частности, следующие темы:

1️⃣ Отслеживание происхождения контента для проверки его источника и изменений.
2️⃣ Разработка инструментов для маркировки и идентификации материалов, созданных ИИ.
3️⃣ Борьба с ИИ-генерируемыми материалами CSAM (материалы сексуального насилия над детьми) и NCII (интимные изображения без согласия) реальных людей.

В отчете рассмотрен широкий спектр рисков синтетического контента: от личных угроз до масштабной дезинформации, затрагивающей общество. Особое внимание уделено кибербезопасности и мошенничеству, так как deepfake-технологии могут использоваться для взлома биометрических систем аутентификации или обмана через подделку голоса.

NIST отмечает, что эффективность методов борьбы с рисками зависит от их цели и аудитории. Такие меры, как отслеживание происхождения контента, могут повысить прозрачность для широкого круга пользователей, в то время как специализированные инструменты для обнаружения синтетического контента лучше подходят для аналитиков и платформ, чтобы оценивать риски и разрабатывать меры противодействия.

#Deepfakes #ЭтикаИИ #КонтрольКонтента #NIST


Репост из: Анализ данных (Data analysis)
⚡️ Исследователи Microsoft выпустили лабораторию AIOpsLab: Комплексный ИИ-фреймворк с открытым исходным кодом для агентов AIOps

Исследователи Microsoft совместно с группой ученых из Калифорнийского университета в Беркли, Иллинойского университета в Урбане-Шампейне, Индийского научного института и колледжа Агнес Скотт разработали AIOpsLab - систему оценки, предназначенную для систематического проектирования, разработки и развития агентов AIOps.

Эта платформа с открытым исходным кодом охватывает весь жизненный цикл облачных операций - от обнаружения неисправностей до их устранения.

Предлагая модульную и адаптируемую платформу, AIOpsLab поддерживает исследователей и практиков в повышении надежности облачных систем и снижении зависимости в системах.

Фреймворк AIOpsLab включает в себя несколько ключевых компонентов.

Центральный модуль, обеспечивает взаимодействие между агентами и облачными средами, предоставляя описания задач, API-интерфейсы действий и обратную связь.

Генераторы отказов и рабочих нагрузок воспроизводят реальные условия для испытания тестируемых агентов.

Наблюдаемость, еще один краеугольный камень структуры, обеспечивает всесторонние телеметрические данные, такие как журналы, метрики и трассировки, для помощи в диагностике неисправностей.

$ git clone
$ cd AIOpsLab
$ pip install poetry
$ poetry install -vvv
$ poetry shell

Github
Запуск
Статья


Репост из: -CyberSecurityTechnologies-
GAI_Mem_Analysis.pdf
4.4Мб
#Whitepaper
"Leveraging Generative Artificial Intelligence for Memory Analysis", 2024.


Репост из: -CyberSecurityTechnologies-
CleanCode_v2.pdf
30.3Мб
#DevOps
#Tech_book
#Sec_code_review
"Clean Code Principles and Patterns:
A Software Practitioner’s Handbook",
2nd Edition, 2024.




Репост из: Machinelearning
📌Топ Python-проектов для ML 2024 года.

Эти проекты были выбраны на основе их актуальности на 2024 год. Каждый из них - смесь практической полезности, новизны и, честно говоря, крутости, будь то смелый и инновационный подход, элегантное решение сложных проблем или просто умная реализация.

🟢BAML - предметно-ориентированный язык для работы с LLM.

BAML превращает текстовые промпты в многократно используемые функции LLM с типизированными переменными и обеспечивают конкретный тип выходных данных. BAML превосходит другие методы получения структурированных данных от LLM и поддерживает VS Code и Cursor.

🟢marimo - Python notebooks геймчейджер.

Новый подход к notebook, который превращает их в мощную, реактивную среду для создания удобных для совместного использования рабочих процессов. Marimo готов заменить Jupyter и Streamlit, устраняя проблемы скрытого состояния и ручного выполнения ячеек.

🟢OpenHands - мощный агент для разработки.

Безопасная изолированная среда, где AI-агенты могут выполнять код, взаимодействовать с веб-браузерами, управлять файлами, отлаживать проблемы, рефакторить код и даже сотрудничать с другими агентами. Среда включает в себя Docker-песочницу с доступом к bash-оболочке, веб-браузингом и IPython-сервером.

🟢Crawl4AI - интеллектуальный веб-скрапинг.

Библиотека, которая обрабатывает динамический контент, обходит механизмы защиты от ботов, извлекает структурированные данные и масштабирует задачи сбора массивов информации. Асинхронная архитектура дает высокую скорость работы даже со сложным JavaScript. На выходе - форматы JSON, markdown и очищенный HTML, готовые для импорта в LLM. Crawl4AI поддерживает Chromium, Firefox и WebKit через Playwright.

🟢LitServe - универсальный движок для развертывания моделей.

Детище LightningAI - мощный инструмент для развертывания моделей и сложных AI-конвейеров. Построен на базе FastAPI, поддерживает PyTorch, TensorFlow, JAX и работает с GenAI, СV, ASR и эмбедингами. LitServe умеет в KV-кэширование для LLM, и подходит как для легких приложений, так и для тяжелых корпоративных нагрузок.

🟢Mirascope - унифицированный интерфейс LLM.

Python-инструмент для упрощения извлечения структурированных данных из LLM. Он предлагает удобный интерфейс, основанный на декораторах и декларативных схемах. Mirascope поддерживает OpenAI, Anthropic и Cohere и имеет свой поисковый агент WebSearchAgent, который может автономно собирать информацию из интернета.

🟢Surya - OCR с высокой точностью.

OCR-система на 90 языках. Surya извлекает текст из сканированных изображений, PDF-файлов и других визуальных форматов с точностью, сравнимой с Google Cloud Vision. Помимо OCR, Surya проводит расширенный анализ документа, определяя заголовки, изображения, таблицы и порядок чтения, что идеально для оцифровки книг, форм и научных документов.

🟢DataChain - конвейер данных для ИИ.

Платформа для управления версиями мультимодальных наборов изображений, видео, текста и PDF-файлов. Библиотека преобразует разрозненные файлы в централизованные датасеты, которые легко запрашивать и манипулировать с помощью Python без использования Spark или SQL. DataChain поддерживает PyTorch, TensorFlow, AI-генерацию метаданных, сериализацию инференса LLM и выполнение пакетных процедур.

🟢Narwhals - универсальный слой совместимости для DataFrame-библиотек.

Легковесный слой, который объединяет pandas, Polars, PyArrow, Modin и cuDF в Python. Он позволяет писать код, не зависящий от используемого бэкенда, используя подмножество API Polars в качестве интерфейса. Поддерживает как eager, так и lazy execution стили, включая Dask. Narwhals не имеет зависимостей и обеспечивает статическую типизацию для автозавершения и подсказок в IDE.

🟢PydanticAI - фреймворк для разработки AI-приложений.

Фреймворк агентов, которые управляют взаимодействием с LLM и проверкой их инференса. Имеет систему внедрения зависимостей, позволяющую динамически получать контекстные данные. PydanticAI поддерживает пользовательские функции Python, вызываемые агентами для доступа к информации и выполнения вычислений.


@ai_machinelearning_big_data


Репост из: GitHub Community
System-design-101 — oбъясняйте сложные системы с помощью наглядных примеров и простых терминов.

Это поможет вам подготовиться к собеседованию по проектированию систем.

4️⃣ GitHub


Репост из: GitHub Community
TEN-Agent — это диалоговый ИИ-агент в реальном времени на базе TEN.

Он легко интегрирует API OpenAI в реальном времени, возможности RTC и расширенные функции, такие как обновление погоды, веб-поиск, компьютерное зрение и генерация с дополненным поиском (RAG).

4️⃣ GitHub


Репост из: BOGDANISSSIMO
Очень ясный и практичный гайд по тому, какие системы можно строить с LLM, где какой трейд-офф, когда к какому уровню сложности переходить, чем workflow отличается от AI agent и т.д.

https://www.anthropic.com/research/building-effective-agents


Репост из: GitHub Community
PDFMATH translate — перевод научных статей в формате PDF с сохранением форматирования — полный двуязычный перевод PDF-документов с сохранением форматирования на основе ИИ, поддержка сервисов Google/DeepL/Ollama/OpenAI и других, предоставление CLI/GUI/Docker.

4️⃣ GitHub


Репост из: -CyberSecurityTechnologies-
LLM_Cybersecurity.pdf
11.8Мб
#MLSecOps
#Tech_book
"Large Language Models in Cybersecurity:
Threats, Exposure and Mitigation", 2024.


Репост из: Анализ данных (Data analysis)
TikTok только что выложил в открытый доступ свой фреймворк для рекомендательных систем (Monolith) - и в нем используется Keras

Это означает, что почти все основные рекомендательные системы в индустрии построены на Keras - YouTube, TikTok, Spotify, Snap, X/Twitter и многие другие.

Github

@data_analysis_ml


Репост из: 42 секунды
Коммерсантъ: Объем рынка информбезопасности за 2024 превысил 500 млрд руб.

– Объем ИБ-рынка России составит 593 млрд руб. (+30%)
– Почти половина рынка (46%) приходится на сегмент ПО
– Еще 35% рынка пришлось на IT-услуги и 19% на hardware
– В деньгах на сегмент ПО пришлось около 273,6 млрд руб.
– На IT-услуги и hardware приходится 206,6 и 113,2 млрд руб.
– За прошлый год рынок вырос на 45,7%, до 453 млрд руб.
– Доля ИБ для всего IT-рынка за последние пять лет растет
– По итогам 2020 доля была 13,5%, за 2024 составит 18,1%
– Сегмент ПО лидирует из-за роста количества киберугроз
– Аппаратное обеспечение дополняет лидирующий сегмент
– В след. году рост ИБ-рынка может показать замедление

@ftsec


Репост из: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ
Google Cloud выпустил свой отчет 2025 AI Business Trends Report
5 ключевых трендов ИИ для бизнеса:
1. Мультимодальный ИИ.
Мультимодальный ИИ обрабатывает информацию из текста, изображений, аудио и видео. Он обеспечивает более интуитивное взаимодействие и значительно повышает точность выходных данных ИИ.
2. Агенты ИИ.
По мере того, как агенты ИИ становятся все более популярными в бизнесе, они смогут управлять сложными рабочими процессами, автоматизировать бизнес-процессы и поддерживать сотрудников.
3. Корпоративный поиск.
Корпоративные поисковые системы — внутренние поисковые системы для компаний — больше не ограничиваются запросами на основе ключевых слов. Теперь люди смогут использовать изображения, аудио, видео и диалоговые подсказки для быстрого доступа к внутренним данным и их использования.
4. Клиентский опыт.
Решения на базе ИИ меняют клиентский опыт, отчасти предвосхищая потребности клиентов и помогая компаниям оставаться на связи со своими клиентами. Это приводит к увеличению доходов, эффективности и лояльности к бренду.
5. Системы безопасности.
В 2025 году ИИ поможет усилить защиту, выявлять и бороться с угрозами, автоматизировать ручные задачи безопасности и ускорить время реагирования. Однако это борьба между защитниками и нападающими, поскольку злоумышленники используют ИИ для более сложных атак
👁️



Показано 20 последних публикаций.