Wie identifiziert man Verbesserungspotenziale in KI Agenten?