Rubric: Test chatbot Po WildGuardians
Evaluación de la conversación con nuestro asistente chatbot
Quantitative Results:
1.Eficiencia en la Respuesta (20.00%)
1.1.Velocidad de Respuesta (50.00%)
1
Respuestas tardan más de 10 segundos.2
Respuestas tardan entre 5-10 segundos3
Respuestas tardan entre 2-5 segundos.4
Respuestas inmediatas (menos de 2 segundos).1.2.Claridad de la Respuesta (50.00%)
1
Respuestas son confusas o incompletas.2
Respuestas claras pero sin contexto suficiente.3
Respuestas claras y bien contextualizadas.4
Respuestas precisas y perfectamente contextualizadas.2. Comprensión del Usuario (20.00%)
2.1.Reconocimiento del Lenguaje Natural (50.00%)
1
Incapaz de entender frases básicas o mal estructuradas.2
Entiende frases básicas pero falla con lenguaje coloquial o errores tipográficos.3
Buena comprensión de lenguaje natural, incluyendo coloquialismos.4
Excelente comprensión, incluso con errores gramaticales o dialectos.2.2.Detección de Intenciones (50.00%)
1
No detecta la intención del usuario correctamente.2
Detecta la intención parcialmente o con errores frecuentes.3
Detecta la intención de manera precisa en la mayoría de los casos.4
Detecta la intención con alta precisión incluso en casos complejos.3.Interacción y Usabilidad (20.00%)
3.1.Fluidez Conversacional (50.00%)
1
Interacción forzada o poco natural.2
Conversación algo fluida pero con interrupciones o falta de conexión.3
Conversación fluida y natural.4
Conversación muy natural y envolvente.3.2.Capacidad de Aprendizaje (50.00%)
1
No mejora o no adapta respuestas.2
Adaptación limitada a interacciones frecuentes.3
Aprendizaje notable basado en interacciones previas.4
Aprende y adapta consistentemente con alta efectividad.4.Relevancia y Exactitud de la Información (20.00%)
4.1.Exactitud (50.00%)
1
Respuestas frecuentemente incorrectas o engañosas.2
Respuestas con errores ocasionales pero generalmente correctas.3
Respuestas mayormente precisas.4
Respuestas completamente correctas y bien documentadas.4.2.Relevancia (50.00%)
1
Respuestas irrelevantes o fuera de contexto2
Respuestas parcialmente relevantes o ambiguas3
Respuestas relevantes y bien enfocadas4
Respuestas altamente relevantes y específicas5.Personalización y Empatía (20.00%)
5.1.Adaptación al Usuario (50.00%)
1
No se adapta a las características del usuario2
Adaptación limitada y poco significativa3
Adaptación adecuada a las necesidades del usuario4
Adaptación excelente, anticipa necesidades del usuario5.2.Empatía y Tono (50.00%)
1
Respuestas impersonales o insensibles2
Respuestas con tono neutro pero poco cálido3
Respuestas empáticas y adecuadas en tono4
Respuestas muy empáticas, cálidas y humanizadas