Claude е асистент со вештачка интелигенција заснован на истражувањето на Anthropic за обука на корисни, и безопасни системи за вештачка интелигенција. Достапен преку интерфејс за разговор и API во нашата програмерска конзола, Claude е способен за широк спектар на задачи за разговор и обработка на текст, одржувајќи висок степен на сигурност и предвидливост.
We show the basic steps of our Constitutional AI (CAI) process, which consists of both a super- vised learning (SL) stage, consisting of the steps at the top, and a Reinforcement Learning (RL) stage, shown as the sequence of steps at the bottom of the figure. Both the critiques and the AI feedback are steered by a small set of principles drawn from a ‘constitution’. The supervised stage significantly improves the initial model, and gives some control over the initial behavior at the start of the RL phase, addressing potential exploration problems. The RL stage significantly improves performance and reliability.
Source: Bai, Y., et al. (2022). Constitutional AI: Harmlessness from AI Feedback. pp22-23. Anthropic. https://arxiv.org/abs/2212.08073