Rubric: Chatbot Po

Evaluación de asistente conversacional chatbot Po

Quantitative Results:

1.Precisión de la Respuesta
1.1.Correctitud de la información
1
La respuesta es completamente incorrecta o inventada.
2
La respuesta tiene varios errores importantes.
3
La respuesta es mayormente correcta, con algún error menor.
4
La respuesta es 100% correcta y precisa.

1.2.Relevancia de la respuesta
1
La respuesta no está relacionada con la pregunta.
2
La respuesta tiene una relación tangencial con la pregunta.
3
La respuesta es relevante pero falta algún detalle o profundidad.
4
La respuesta es completamente relevante y aborda todos los aspectos esperados.

1.3.Complejidad en la respuesta
1
No responde correctamente a preguntas complejas
2
Responde parcialmente a preguntas complejas
3
Responde correctamente a preguntas complejas, con pequeños errores o lagunas
4
Responde perfectamente a preguntas complejas

2.Claridad y Comprensibilidad
2.1.Uso de lenguaje sencillo
1
El lenguaje es confuso y está lleno de términos técnicos sin explicación.
2
El lenguaje es mixto, con algunos términos técnicos no explicados.
3
El lenguaje es claro, pero podría ser más accesible.
4
El lenguaje es completamente accesible, adecuado para el público objetivo.

2.2.Ausencia de errores gramaticales
1
La respuesta tiene múltiples errores que dificultan la comprensión.
2
La respuesta tiene algunos errores significativos, pero es comprensible.
3
La respuesta no tiene errores importantes, pero podría mejorar.
4
La respuesta no tiene errores y es impecable gramaticalmente.

2.3.Explicaciones contextuales
1
No proporciona explicaciones contextuales
2
Explica términos básicos, pero de manera insuficiente
3
Ofrece explicaciones claras, pero no siempre profundas
4
Explica términos y conceptos de manera clara y contextualizada

3.Interacción y Fluidez Conversacional
3.1.Capacidad de seguir el contexto
1
No retiene información del contexto previo.
2
Retiene información mínima del contexto, pero falla al usarla correctamente.
3
Retiene y usa el contexto con algunas omisiones o errores.
4
Retiene y usa el contexto de manera impecable y coherente.

3.2.Evita respuestas redundantes
1
Responde de forma redundante o repite información innecesaria.
2
Responde con redundancia moderada, afectando la calidad de la interacción.
3
Responde de manera precisa, pero con una redundancia mínima.
4
Responde de manera precisa, sin redundancias innecesarias.

3.3.Capacidad de manejar interrupciones
1
No puede retomar el contexto después de una interrupción
2
Retoma el contexto de manera limitada
3
Retoma el contexto adecuadamente en la mayoría de los casos
4
Maneja interrupciones de forma impecable

4.Tiempo de Respuesta
4.1.Rapidez promedio
1
Tarda más de 10 segundos en responder.
2
Responde entre 5 y 10 segundos.
3
Responde entre 3 y 5 segundos.
4
Responde en menos de 3 segundos.

4.2.Respuesta dentro de límites aceptables
1
Respuesta extremadamente lenta que afecta la interacción.
2
Respuesta lenta, pero aún funcional para una interacción mínima.
3
Respuesta aceptablemente rápida, pero podría ser más consistente.
4
Respuesta siempre rápida y consistente.

4.3.Gestión de tiempos prolongados
1
No maneja adecuadamente tiempos prolongados
2
Ofrece una advertencia básica pero insuficiente
3
Maneja tiempos prolongados de manera razonable
4
Maneja tiempos prolongados de manera excelente

5.Personalización y Empatía
5.1.Respuestas adaptadas al usuario
1
No reconoce ninguna preferencia o contexto del usuario.
2
Reconoce mínimamente el contexto, pero no lo adapta.
3
Reconoce y adapta parcialmente las respuestas al usuario.
4
Reconoce y adapta perfectamente las respuestas, anticipándose a las necesidades.

5.2.Tono adecuado
1
Usa un tono inapropiado o demasiado mecánico.
2
Usa un tono medianamente adecuado, con fallos notables.
3
Usa un tono generalmente adecuado, pero con algún desliz ocasional.
4
Usa un tono amigable y profesional, adaptado a la situación de manera impecable.

5.3.Reconocimiento emocional
1
No detecta emociones en la interacción del usuario
2
Reconoce emociones básicas, pero no responde adecuadamente
3
Reconoce y responde a emociones en la mayoría de los casos
4
Reconoce y responde a emociones de forma impecable

6.Accesibilidad
6.1.Disponibilidad multilingüe
1
Solo responde en un idioma sin reconocer peticiones en otros idiomas
2
Responde en varios idiomas, pero con errores frecuentes
3
Responde adecuadamente en varios idiomas, pero con algunas limitaciones
4
Responde perfectamente en múltiples idiomas

6.2.Soporte de accesibilidad
1
No tiene en cuenta ninguna medida de accesibilidad
2
Implementa medidas mínimas de accesibilidad
3
Proporciona un soporte de accesibilidad razonable
4
Ofrece un soporte de accesibilidad completo

7.Capacidades Técnicas Avanzadas
7.1.Manejo de consultas ambiguas
1
No maneja consultas ambiguas
2
Maneja consultas ambiguas de forma básica
3
Responde adecuadamente a consultas ambiguas en la mayoría de los casos
4
Maneja consultas ambiguas de manera impecable

7.2.Integración con herramientas externas
1
No tiene integración con herramientas externas
2
Ofrece integración limitada con herramientas externas
3
Ofrece integración razonable con herramientas externas
4
Integra perfectamente herramientas externas

8.Calidad General
8.1.Satisfacción del usuario
1
La mayoría de los usuarios expresan insatisfacción
2
La satisfacción del usuario es baja, pero funcional
3
La mayoría de los usuarios están satisfechos
4
Los usuarios están altamente satisfechos

8.2.Consistencia
1
La calidad de las respuestas es inconsistente
2
La calidad es moderadamente consistente
3
La calidad es consistentemente buena, con pequeñas excepciones
4
La calidad es perfectamente consistente