AI Evaluation & Pipeline Engineer
Делаешь AI-pipeline измеряемым: настраиваешь evals и autoresearch-цикл — чтобы агенты улучшали промпты по метрикам, а не на ощупь.
- Evals и LLM-as-Judge для каждого этапа AURA-pipeline
- Autoresearch: агент сам прогоняет варианты промптов, оставляет лучшие

