Telegram-канал "ML&|Sec Feed" — @mlsecfeed

ML&|Sec Feed

27 Dec 2024, 16:32

Репост из: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

Опубликованы национальные стандарты в области качества данных для аналитики и машинного обучения:

🔸ГОСТ Р 71484.2-2024 Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 2. Показатели качества данных
🔸ГОСТ Р 71484.4-2024 Искусственный интеллект. Качество данных для аналитики и машинного обучения. Часть 4. Структура процесса управления качеством данных

Дата введения в действие: 01.01.2025.
👁️

13 0 2

ML&|Sec Feed

27 Dec 2024, 13:04

Репост из: Эксплойт

Один из крупнейших инвестфондов Andreessen Horowitz (a16z) провел опрос среди своих специалистов, какими нейросетями они пользуются. Вот их топ самых полезных ИИ-сервисов:

Ассистенты:

— Perplexity: поисковая система с ИИ и помощник в исследованиях;
— Claude: универсальный чат-бот, подходит для проектов и обмена работами;
— ChatGPT: вы точно знаете его, но волки советуют Advanced Voice Mode для общения с ИИ.

Для продуктивной работы:

— Granola: ИИ-блокнот, который слушает ваши встречи и преобразует стенограммы в заметки;
— Flow: голосовая диктовка, преобразующая речь в текст в любом приложении;
— Gamma: создание презентаций, документов и сайтов с помощью ИИ;
— Adobe Acrobat: инструмент для подведения итогов и работы с PDF-файлами;
— Cubby: пространство для совместных исследований с ИИ;
— Cora: ИИ-помощник для работы с электронной почтой, автоматизация ответов и организация писем;
— Lindy: создание ИИ-агентов для автоматизации рабочих процессов.

Для буста аудитории:

— Delphi: текстовые, голосовые и видеоклоны для общения с аудиторией;
— HeyGen: ИИ-аватары для масштабирования контента и перевода видео;
— Argil: ИИ-аватары для социальных сетей;
— Overlap и Opus: преобразование длинных видео в короткие вирусные клипы;
— Persona: ИИ-агент для контент-криэйторов;
— Captions: ИИ для видеомонтажа (автосубтитры, коррекция зрительного контакта).

Для создания продуктов (код):

— Cursor: редактор кода с ИИ, понимающий вашу кодовую базу;
— Replit: ИИ для создания приложений и сайтов из текстового описания;
— Anychat: использование любых ИИ-моделей в одном месте;
— Codeium: инструмент автозаполнения кода с ИИ.

Для создания контента:

— ElevenLabs: реалистичные ИИ-голоса;
— Suno и Udio: создание музыки на основе текстовых запросов;
— Midjourney, Ideogram, Playground: генерация изображений с помощью ИИ;
— Runway, Kling, Viggle: генерация видео с использованием ИИ;
— Krea: платформа для создания и редактирования изображений и видео;
— PhotoRoom: редактор изображений для товаров и визуализаций с помощью ИИ.

Для обучения и развития:

— Rosebud: интерактивный дневник с аналитикой от ИИ;
— Good Inside: коучинг для родителей с персонализированной поддержкой;
— Ada Health: оценка медицинских симптомов с использованием ИИ;
— Ash: персонализированный ИИ-консультант и коуч;
— NotebookLM: превращение документа в AI-подкаст;
— Particle: новостное приложение с кратким резюме историй.

Для развлечений:

— Remix: приложение для создания и обмена AI-контентом;
— Grok: чат-бот от Илона Маска. Он весёлый, попробуйте;
— Curio: игрушки для детей с AI, которые разговаривают.

@exploitex

20 0 2

ML&|Sec Feed

27 Dec 2024, 12:20

https://github.com/onnx/models

GitHub - onnx/models: A collection of pre-trained, state-of-the-art models in the ONNX format

A collection of pre-trained, state-of-the-art models in the ONNX format - GitHub - onnx/models: A collection of pre-trained, state-of-the-art models in the ONNX format

29 0 0

ML&|Sec Feed

26 Dec 2024, 18:23

Анализ инцидентов с ИИ

33 0 0

ML&|Sec Feed

26 Dec 2024, 17:01

Протокол SLMP-PIS. Это безопасный и эффективный протокол конфиденциальных вычислений для группы участников, который позволяет вычислять сумму связанных значений на основе пересечения частных множеств. Протокол основан на симметричной криптосистеме и поддерживает конфиденциальность данных на основе нулевого совместного использования (Zero Sharing) и псевдорандомных функций «с забыванием» (Oblivious Pseudorandom Functions).
Источник: https://ib-bank.ru/bisjournal/blog/72 (статья про безопасные облачные вычисления)

Протоколы безопасных многосторонних вычислений. К ним относятся, например, «коррелированный» протокол передачи с забыванием, протоколы конфиденциального умножения матриц, вычисления значений функций активации ReLU и LeakyReLU. Безопасность таких протоколов доказывается на основе методологии универсальной компонуемости (UC-security).
Источник: https://cyberrus.info/wp-content/uploads/2024/11/vokib-2024-5-st03-s018-027.pdf (интересная научная статья)

Протоколы вычислений SLMP-PIS отменяют «облачную» беззащитность

Развитие технологий искусственного интеллекта и облачных вычислений, как носителя совместных вычислений, привело к значительному возрастанию роли использования больших данных для реализации успешных бизнес-моделей как национальной, так и глобальной цифровой экономики.

37 0 1

ML&|Sec Feed

24 Dec 2024, 10:24

Репост из: ИИ & Право

Выпущено новое Руководство NIST по борьбе с рисками синтетического контента

Национальный институт стандартов и технологий США (U.S. National Institute of Standards and Technology, NIST) опубликовал отчет "Reducing Risks Posed by Synthetic Content", посвященный проблемам, связанным с deepfake-технологиями на основе ИИ. Документ рассматривает, в частности, следующие темы:

1️⃣ Отслеживание происхождения контента для проверки его источника и изменений.
2️⃣ Разработка инструментов для маркировки и идентификации материалов, созданных ИИ.
3️⃣ Борьба с ИИ-генерируемыми материалами CSAM (материалы сексуального насилия над детьми) и NCII (интимные изображения без согласия) реальных людей.

В отчете рассмотрен широкий спектр рисков синтетического контента: от личных угроз до масштабной дезинформации, затрагивающей общество. Особое внимание уделено кибербезопасности и мошенничеству, так как deepfake-технологии могут использоваться для взлома биометрических систем аутентификации или обмана через подделку голоса.

NIST отмечает, что эффективность методов борьбы с рисками зависит от их цели и аудитории. Такие меры, как отслеживание происхождения контента, могут повысить прозрачность для широкого круга пользователей, в то время как специализированные инструменты для обнаружения синтетического контента лучше подходят для аналитиков и платформ, чтобы оценивать риски и разрабатывать меры противодействия.

#Deepfakes #ЭтикаИИ #КонтрольКонтента #NIST

Reducing Risks Posed by Synthetic Content An Overview of Technical Approaches to Digital Content Transparency

This report examines the existing standards, tools, methods, and practices, as well as the potential development of further science-backed standards and techniq

43 0 2 2

ML&|Sec Feed

23 Dec 2024, 17:37

Репост из: Анализ данных (Data analysis)

⚡️ Исследователи Microsoft выпустили лабораторию AIOpsLab: Комплексный ИИ-фреймворк с открытым исходным кодом для агентов AIOps

Исследователи Microsoft совместно с группой ученых из Калифорнийского университета в Беркли, Иллинойского университета в Урбане-Шампейне, Индийского научного института и колледжа Агнес Скотт разработали AIOpsLab - систему оценки, предназначенную для систематического проектирования, разработки и развития агентов AIOps.

Эта платформа с открытым исходным кодом охватывает весь жизненный цикл облачных операций - от обнаружения неисправностей до их устранения.

Предлагая модульную и адаптируемую платформу, AIOpsLab поддерживает исследователей и практиков в повышении надежности облачных систем и снижении зависимости в системах.

Фреймворк AIOpsLab включает в себя несколько ключевых компонентов.

Центральный модуль, обеспечивает взаимодействие между агентами и облачными средами, предоставляя описания задач, API-интерфейсы действий и обратную связь.

Генераторы отказов и рабочих нагрузок воспроизводят реальные условия для испытания тестируемых агентов.

Наблюдаемость, еще один краеугольный камень структуры, обеспечивает всесторонние телеметрические данные, такие как журналы, метрики и трассировки, для помощи в диагностике неисправностей.

$ git clone
$ cd AIOpsLab
$ pip install poetry
$ poetry install -vvv
$ poetry shell

▪Github
▪Запуск
▪Статья

52 0 4

ML&|Sec Feed

23 Dec 2024, 07:44

Репост из: -CyberSecurityTechnologies-

GAI_Mem_Analysis.pdf

4.4Мб

#Whitepaper
"Leveraging Generative Artificial Intelligence for Memory Analysis", 2024.

41 0 1

ML&|Sec Feed

23 Dec 2024, 07:44

Репост из: -CyberSecurityTechnologies-

CleanCode_v2.pdf

30.3Мб

#DevOps
#Tech_book
#Sec_code_review
"Clean Code Principles and Patterns:
A Software Practitioner’s Handbook",
2nd Edition, 2024.

39 0 1

ML&|Sec Feed

22 Dec 2024, 20:22

https://arxiv.org/pdf/2310.01405

51 0 0

ML&|Sec Feed

22 Dec 2024, 19:18

Репост из: Machinelearning

📌Топ Python-проектов для ML 2024 года.

Эти проекты были выбраны на основе их актуальности на 2024 год. Каждый из них - смесь практической полезности, новизны и, честно говоря, крутости, будь то смелый и инновационный подход, элегантное решение сложных проблем или просто умная реализация.

🟢BAML - предметно-ориентированный язык для работы с LLM.

BAML превращает текстовые промпты в многократно используемые функции LLM с типизированными переменными и обеспечивают конкретный тип выходных данных. BAML превосходит другие методы получения структурированных данных от LLM и поддерживает VS Code и Cursor.

🟢marimo - Python notebooks геймчейджер.

Новый подход к notebook, который превращает их в мощную, реактивную среду для создания удобных для совместного использования рабочих процессов. Marimo готов заменить Jupyter и Streamlit, устраняя проблемы скрытого состояния и ручного выполнения ячеек.

🟢OpenHands - мощный агент для разработки.

Безопасная изолированная среда, где AI-агенты могут выполнять код, взаимодействовать с веб-браузерами, управлять файлами, отлаживать проблемы, рефакторить код и даже сотрудничать с другими агентами. Среда включает в себя Docker-песочницу с доступом к bash-оболочке, веб-браузингом и IPython-сервером.

🟢Crawl4AI - интеллектуальный веб-скрапинг.

Библиотека, которая обрабатывает динамический контент, обходит механизмы защиты от ботов, извлекает структурированные данные и масштабирует задачи сбора массивов информации. Асинхронная архитектура дает высокую скорость работы даже со сложным JavaScript. На выходе - форматы JSON, markdown и очищенный HTML, готовые для импорта в LLM. Crawl4AI поддерживает Chromium, Firefox и WebKit через Playwright.

🟢LitServe - универсальный движок для развертывания моделей.

Детище LightningAI - мощный инструмент для развертывания моделей и сложных AI-конвейеров. Построен на базе FastAPI, поддерживает PyTorch, TensorFlow, JAX и работает с GenAI, СV, ASR и эмбедингами. LitServe умеет в KV-кэширование для LLM, и подходит как для легких приложений, так и для тяжелых корпоративных нагрузок.

🟢Mirascope - унифицированный интерфейс LLM.

Python-инструмент для упрощения извлечения структурированных данных из LLM. Он предлагает удобный интерфейс, основанный на декораторах и декларативных схемах. Mirascope поддерживает OpenAI, Anthropic и Cohere и имеет свой поисковый агент WebSearchAgent, который может автономно собирать информацию из интернета.

🟢Surya - OCR с высокой точностью.

OCR-система на 90 языках. Surya извлекает текст из сканированных изображений, PDF-файлов и других визуальных форматов с точностью, сравнимой с Google Cloud Vision. Помимо OCR, Surya проводит расширенный анализ документа, определяя заголовки, изображения, таблицы и порядок чтения, что идеально для оцифровки книг, форм и научных документов.

🟢DataChain - конвейер данных для ИИ.

Платформа для управления версиями мультимодальных наборов изображений, видео, текста и PDF-файлов. Библиотека преобразует разрозненные файлы в централизованные датасеты, которые легко запрашивать и манипулировать с помощью Python без использования Spark или SQL. DataChain поддерживает PyTorch, TensorFlow, AI-генерацию метаданных, сериализацию инференса LLM и выполнение пакетных процедур.

🟢Narwhals - универсальный слой совместимости для DataFrame-библиотек.

Легковесный слой, который объединяет pandas, Polars, PyArrow, Modin и cuDF в Python. Он позволяет писать код, не зависящий от используемого бэкенда, используя подмножество API Polars в качестве интерфейса. Поддерживает как eager, так и lazy execution стили, включая Dask. Narwhals не имеет зависимостей и обеспечивает статическую типизацию для автозавершения и подсказок в IDE.

🟢PydanticAI - фреймворк для разработки AI-приложений.

Фреймворк агентов, которые управляют взаимодействием с LLM и проверкой их инференса. Имеет систему внедрения зависимостей, позволяющую динамически получать контекстные данные. PydanticAI поддерживает пользовательские функции Python, вызываемые агентами для доступа к информации и выполнения вычислений.

@ai_machinelearning_big_data

40 0 3

ML&|Sec Feed

22 Dec 2024, 18:27

Репост из: GitHub Community

System-design-101 — oбъясняйте сложные системы с помощью наглядных примеров и простых терминов.

Это поможет вам подготовиться к собеседованию по проектированию систем.

4️⃣ GitHub

38 0 4

ML&|Sec Feed

22 Dec 2024, 18:27

Репост из: GitHub Community

TEN-Agent — это диалоговый ИИ-агент в реальном времени на базе TEN.

Он легко интегрирует API OpenAI в реальном времени, возможности RTC и расширенные функции, такие как обновление погоды, веб-поиск, компьютерное зрение и генерация с дополненным поиском (RAG).

4️⃣ GitHub

39 0 1

ML&|Sec Feed

22 Dec 2024, 18:24

Репост из: BOGDANISSSIMO

Очень ясный и практичный гайд по тому, какие системы можно строить с LLM, где какой трейд-офф, когда к какому уровню сложности переходить, чем workflow отличается от AI agent и т.д.

https://www.anthropic.com/research/building-effective-agents

Building effective agents

A post for developers with advice and workflows for building effective AI agents

39 0 4

ML&|Sec Feed

22 Dec 2024, 14:40

Репост из: GitHub Community

PDFMATH translate — перевод научных статей в формате PDF с сохранением форматирования — полный двуязычный перевод PDF-документов с сохранением форматирования на основе ИИ, поддержка сервисов Google/DeepL/Ollama/OpenAI и других, предоставление CLI/GUI/Docker.

4️⃣ GitHub

45 0 2

ML&|Sec Feed

21 Dec 2024, 19:45

Репост из: -CyberSecurityTechnologies-

LLM_Cybersecurity.pdf

11.8Мб

#MLSecOps
#Tech_book
"Large Language Models in Cybersecurity:
Threats, Exposure and Mitigation", 2024.

33 0 4 1

ML&|Sec Feed

21 Dec 2024, 18:30

Репост из: Анализ данных (Data analysis)

✅ TikTok только что выложил в открытый доступ свой фреймворк для рекомендательных систем (Monolith) - и в нем используется Keras

Это означает, что почти все основные рекомендательные системы в индустрии построены на Keras - YouTube, TikTok, Spotify, Snap, X/Twitter и многие другие.

▪ Github

@data_analysis_ml

49 0 4 1

ML&|Sec Feed

21 Dec 2024, 17:10

Репост из: 42 секунды

Коммерсантъ: Объем рынка информбезопасности за 2024 превысил 500 млрд руб.

– Объем ИБ-рынка России составит 593 млрд руб. (+30%)
– Почти половина рынка (46%) приходится на сегмент ПО
– Еще 35% рынка пришлось на IT-услуги и 19% на hardware
– В деньгах на сегмент ПО пришлось около 273,6 млрд руб.
– На IT-услуги и hardware приходится 206,6 и 113,2 млрд руб.
– За прошлый год рынок вырос на 45,7%, до 453 млрд руб.
– Доля ИБ для всего IT-рынка за последние пять лет растет
– По итогам 2020 доля была 13,5%, за 2024 составит 18,1%
– Сегмент ПО лидирует из-за роста количества киберугроз
– Аппаратное обеспечение дополняет лидирующий сегмент
– В след. году рост ИБ-рынка может показать замедление

@ftsec

39 0 1

ML&|Sec Feed

21 Dec 2024, 15:41

Репост из: ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

Google Cloud выпустил свой отчет 2025 AI Business Trends Report
5 ключевых трендов ИИ для бизнеса:
1. Мультимодальный ИИ.
Мультимодальный ИИ обрабатывает информацию из текста, изображений, аудио и видео. Он обеспечивает более интуитивное взаимодействие и значительно повышает точность выходных данных ИИ.
2. Агенты ИИ.
По мере того, как агенты ИИ становятся все более популярными в бизнесе, они смогут управлять сложными рабочими процессами, автоматизировать бизнес-процессы и поддерживать сотрудников.
3. Корпоративный поиск.
Корпоративные поисковые системы — внутренние поисковые системы для компаний — больше не ограничиваются запросами на основе ключевых слов. Теперь люди смогут использовать изображения, аудио, видео и диалоговые подсказки для быстрого доступа к внутренним данным и их использования.
4. Клиентский опыт.
Решения на базе ИИ меняют клиентский опыт, отчасти предвосхищая потребности клиентов и помогая компаниям оставаться на связи со своими клиентами. Это приводит к увеличению доходов, эффективности и лояльности к бренду.
5. Системы безопасности.
В 2025 году ИИ поможет усилить защиту, выявлять и бороться с угрозами, автоматизировать ручные задачи безопасности и ускорить время реагирования. Однако это борьба между защитниками и нападающими, поскольку злоумышленники используют ИИ для более сложных атак
👁️

37 0 1

ML&|Sec Feed

20 Dec 2024, 19:15

https://ironcorelabs.com/downloads/securing-gen-ai/

Securing Gen-AI White Paper Download

The ultimate guide to AI security: key AI security risks, vulnerabilities and strategies for protection. 61% of companies use AI, but few secure it. This white paper covers the key AI risks being overlooked from LLMs to RAG.

48 0 4

GramAds: реклама в Telegram. $1.5 cpm

Гениальные трюки бизнеса

Solo - путешествие!

ML&|Sec Feed

Гео и язык канала

Категория

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

ML&|Sec Feed

211

Популярное в канале

Язык сайта

GramAds: реклама в Telegram. $1.5 cpm

Гениальные трюки бизнеса

Solo - путешествие!

ML&|Sec Feed

Гео и язык канала

Категория

211

Популярное в канале