Лента AI

Alignment|30 апр. 2026 г.

Обучение ИИ принципам вместо правил: новый подход к выравниванию моделей

Anthropic опубликовала исследование нового метода выравнивания: вместо списка запрещённых действий модели обучаются принципам этического рассуждения. Первые результаты — впечатляющие.

AlignmentAnthropicБезопасность AI9 мин

Обучение ИИ принципам вместо правил: новый подход к выравниванию моделей

Anthropic|25 апр. 2026 г.

Лента AI

Обучение ИИ принципам вместо правил: новый подход к выравниванию моделей

Anthropic передает инструмент оценки безопасности ИИ независимому фонду

Чтение мыслей нейросетей: как Anthropic переводит внутренние процессы ИИ