Репост из: AI Happens
Краткость — сестра таланта. Как нейросеть от «Вконтакте» упростит жизнь пользователям?
Компания «Вконтакте» представила нейросеть, которая генерирует новостные заголовки на русском и английском языках. Для этого она читает текст новости, а дальше формулирует заголовок, соблюдая правила грамматики. Обучение проходило на материалах «РИА Новости» и «The New York Times».
Почему важно: Генератор заголовков от ВК получает семантический смысл крупных блоков текста и выносит из него главную мысль. Как всегда непростой этап в решении подобных задач — это оценить качество на выходе. Хороший получился заголовок или плохой? Чтобы ответить на этот вопрос «Вконтакте» проверил нейросеть на фокус-группе. Около 45% опрошенных отметили, что человеческий и машинный заголовки ничем не отличаются, 15% сказали, что алгоритм справился лучше. Оставшиеся 40% отметили, что нейросеть пока рано устраивать в штат Нью-Йорк Таймс. Вероятно, разработчики сделают работу над ошибками и дообучат алгоритм.
Эту pазработку нужно развивать не только из-за заголовков. Мы живем во времена, когда от количества нотификейшенов дергается глаз, и потоки информации — уже не потоки, а ураганы, сбивающие с ног. Алгоритм, который способен сократить простыню текста до пары строк, не потеряв смысл по дороге, сэкономит кучу времени — и журналистам и нам, читателям.
Компания «Вконтакте» представила нейросеть, которая генерирует новостные заголовки на русском и английском языках. Для этого она читает текст новости, а дальше формулирует заголовок, соблюдая правила грамматики. Обучение проходило на материалах «РИА Новости» и «The New York Times».
Почему важно: Генератор заголовков от ВК получает семантический смысл крупных блоков текста и выносит из него главную мысль. Как всегда непростой этап в решении подобных задач — это оценить качество на выходе. Хороший получился заголовок или плохой? Чтобы ответить на этот вопрос «Вконтакте» проверил нейросеть на фокус-группе. Около 45% опрошенных отметили, что человеческий и машинный заголовки ничем не отличаются, 15% сказали, что алгоритм справился лучше. Оставшиеся 40% отметили, что нейросеть пока рано устраивать в штат Нью-Йорк Таймс. Вероятно, разработчики сделают работу над ошибками и дообучат алгоритм.
Эту pазработку нужно развивать не только из-за заголовков. Мы живем во времена, когда от количества нотификейшенов дергается глаз, и потоки информации — уже не потоки, а ураганы, сбивающие с ног. Алгоритм, который способен сократить простыню текста до пары строк, не потеряв смысл по дороге, сэкономит кучу времени — и журналистам и нам, читателям.