Rubric: Chatbot Po
Evaluación de asistente conversacional chatbot Po
Quantitative Results:
1.Precisión de la Respuesta (12.50%)
1.1.Correctitud de la información (33.33%)
1
La respuesta es completamente incorrecta o inventada.2
La respuesta tiene varios errores importantes.3
La respuesta es mayormente correcta, con algún error menor.4
La respuesta es 100% correcta y precisa.1.2.Relevancia de la respuesta (33.33%)
1
La respuesta no está relacionada con la pregunta.2
La respuesta tiene una relación tangencial con la pregunta.3
La respuesta es relevante pero falta algún detalle o profundidad.4
La respuesta es completamente relevante y aborda todos los aspectos esperados.1.3.Complejidad en la respuesta (33.33%)
1
No responde correctamente a preguntas complejas2
Responde parcialmente a preguntas complejas3
Responde correctamente a preguntas complejas, con pequeños errores o lagunas4
Responde perfectamente a preguntas complejas2.Claridad y Comprensibilidad (12.50%)
2.1.Uso de lenguaje sencillo (33.33%)
1
El lenguaje es confuso y está lleno de términos técnicos sin explicación.2
El lenguaje es mixto, con algunos términos técnicos no explicados.3
El lenguaje es claro, pero podría ser más accesible.4
El lenguaje es completamente accesible, adecuado para el público objetivo.2.2.Ausencia de errores gramaticales (33.33%)
1
La respuesta tiene múltiples errores que dificultan la comprensión.2
La respuesta tiene algunos errores significativos, pero es comprensible.3
La respuesta no tiene errores importantes, pero podría mejorar.4
La respuesta no tiene errores y es impecable gramaticalmente.2.3.Explicaciones contextuales (33.33%)
1
No proporciona explicaciones contextuales2
Explica términos básicos, pero de manera insuficiente3
Ofrece explicaciones claras, pero no siempre profundas4
Explica términos y conceptos de manera clara y contextualizada3.Interacción y Fluidez Conversacional (12.50%)
3.1.Capacidad de seguir el contexto (33.33%)
1
No retiene información del contexto previo.2
Retiene información mínima del contexto, pero falla al usarla correctamente.3
Retiene y usa el contexto con algunas omisiones o errores.4
Retiene y usa el contexto de manera impecable y coherente.3.2.Evita respuestas redundantes (33.33%)
1
Responde de forma redundante o repite información innecesaria.2
Responde con redundancia moderada, afectando la calidad de la interacción.3
Responde de manera precisa, pero con una redundancia mínima.4
Responde de manera precisa, sin redundancias innecesarias.3.3.Capacidad de manejar interrupciones (33.33%)
1
No puede retomar el contexto después de una interrupción2
Retoma el contexto de manera limitada3
Retoma el contexto adecuadamente en la mayoría de los casos4
Maneja interrupciones de forma impecable4.Tiempo de Respuesta (12.50%)
4.1.Rapidez promedio (33.33%)
1
Tarda más de 10 segundos en responder.2
Responde entre 5 y 10 segundos.3
Responde entre 3 y 5 segundos.4
Responde en menos de 3 segundos.4.2.Respuesta dentro de límites aceptables (33.33%)
1
Respuesta extremadamente lenta que afecta la interacción.2
Respuesta lenta, pero aún funcional para una interacción mínima.3
Respuesta aceptablemente rápida, pero podría ser más consistente.4
Respuesta siempre rápida y consistente.4.3.Gestión de tiempos prolongados (33.33%)
1
No maneja adecuadamente tiempos prolongados2
Ofrece una advertencia básica pero insuficiente3
Maneja tiempos prolongados de manera razonable4
Maneja tiempos prolongados de manera excelente5.Personalización y Empatía (12.50%)
5.1.Respuestas adaptadas al usuario (33.33%)
1
No reconoce ninguna preferencia o contexto del usuario.2
Reconoce mínimamente el contexto, pero no lo adapta.3
Reconoce y adapta parcialmente las respuestas al usuario.4
Reconoce y adapta perfectamente las respuestas, anticipándose a las necesidades.5.2.Tono adecuado (33.33%)
1
Usa un tono inapropiado o demasiado mecánico.2
Usa un tono medianamente adecuado, con fallos notables.3
Usa un tono generalmente adecuado, pero con algún desliz ocasional.4
Usa un tono amigable y profesional, adaptado a la situación de manera impecable.5.3.Reconocimiento emocional (33.33%)
1
No detecta emociones en la interacción del usuario2
Reconoce emociones básicas, pero no responde adecuadamente3
Reconoce y responde a emociones en la mayoría de los casos4
Reconoce y responde a emociones de forma impecable6.Accesibilidad (12.50%)
6.1.Disponibilidad multilingüe (50.00%)
1
Solo responde en un idioma sin reconocer peticiones en otros idiomas2
Responde en varios idiomas, pero con errores frecuentes3
Responde adecuadamente en varios idiomas, pero con algunas limitaciones4
Responde perfectamente en múltiples idiomas6.2.Soporte de accesibilidad (50.00%)
1
No tiene en cuenta ninguna medida de accesibilidad2
Implementa medidas mínimas de accesibilidad3
Proporciona un soporte de accesibilidad razonable4
Ofrece un soporte de accesibilidad completo7.Capacidades Técnicas Avanzadas (12.50%)
7.1.Manejo de consultas ambiguas (50.00%)
1
No maneja consultas ambiguas2
Maneja consultas ambiguas de forma básica3
Responde adecuadamente a consultas ambiguas en la mayoría de los casos4
Maneja consultas ambiguas de manera impecable7.2.Integración con herramientas externas (50.00%)
1
No tiene integración con herramientas externas2
Ofrece integración limitada con herramientas externas3
Ofrece integración razonable con herramientas externas4
Integra perfectamente herramientas externas8.Calidad General (12.50%)
8.1.Satisfacción del usuario (50.00%)
1
La mayoría de los usuarios expresan insatisfacción2
La satisfacción del usuario es baja, pero funcional3
La mayoría de los usuarios están satisfechos4
Los usuarios están altamente satisfechos8.2.Consistencia (50.00%)
1
La calidad de las respuestas es inconsistente2
La calidad es moderadamente consistente3
La calidad es consistentemente buena, con pequeñas excepciones4
La calidad es perfectamente consistente