MosaicLeaks проверяет, умеют ли ИИ-агенты хранить секреты
Краткая выжимка по источнику: Hugging Face рассказал о MosaicLeaks - проверке того, раскрывают ли исследовательские ИИ-агенты конфиденциальные данные.
Короткие русские выжимки свежих новостей о моделях, инструментах, open source, продуктах и рынке ИИ. У каждой новости есть ссылка на первоисточник.
Краткая выжимка по источнику: Hugging Face рассказал о MosaicLeaks - проверке того, раскрывают ли исследовательские ИИ-агенты конфиденциальные данные.
Краткая выжимка по источнику: Google DeepMind финансирует исследования рисков, которые могут возникнуть, когда миллионы ИИ-агентов начнут взаимодействовать онлайн.
Краткая выжимка по источнику: OpenAI описала Deployment Simulation - подход для проверки поведения моделей до релиза на основе реальных диалогов.
Краткая выжимка по источнику: OpenAI описала свое видение развития ИИ с акцентом на доступность, безопасность и более широкое распределение выгод от AGI.
Краткая выжимка по источнику: OpenAI представила видение будущего ИИ с акцентом на доступность, безопасность и распределение выгод от развития AGI.
Краткая выжимка по источнику: OpenAI представила план действий по использованию ИИ для усиления биологической устойчивости и защиты от биорисков.
Краткая выжимка по источнику: NVIDIA рассказала на Hugging Face о Nemotron 3.5 Content Safety - подходе к настраиваемой мультимодальной безопасности ИИ.
Краткая выжимка по источнику: OpenAI описала приоритеты регулирования ИИ - безопасность, защита молодежи, адаптация рынка труда и глобальные стандарты.
Краткая выжимка по источнику: OpenAI предложила подход к федеральному управлению frontier AI в США с акцентом на безопасность, устойчивость и нацбезопасность.