Esta guía explica cómo aprovechar las capacidades conversacionales avanzadas de Claude para gestionar consultas de clientes en tiempo real, proporcionando soporte 24/7, reduciendo tiempos de espera y gestionando altos volúmenes de soporte con respuestas precisas e interacciones positivas.
Aquí hay algunos indicadores clave de que deberías emplear un LLM como Claude para automatizar partes de tu proceso de atención al cliente:
Alto volumen de consultas repetitivas
Claude sobresale en el manejo eficiente de un gran número de preguntas similares, liberando a los agentes humanos para asuntos más complejos.
Necesidad de síntesis rápida de información
Claude puede recuperar, procesar y combinar información rápidamente desde amplias bases de conocimiento, mientras que los agentes humanos pueden necesitar tiempo para investigar o consultar múltiples fuentes.
Requisito de disponibilidad 24/7
Claude puede proporcionar soporte continuo sin fatiga, mientras que dotar de personal humano para una cobertura continua puede ser costoso y desafiante.
Escalabilidad rápida durante períodos pico
Claude puede manejar aumentos repentinos en el volumen de consultas sin necesidad de contratar y formar personal adicional.
Voz de marca consistente
Puedes instruir a Claude para que represente consistentemente el tono y los valores de tu marca, mientras que los agentes humanos pueden variar en sus estilos de comunicación.
Algunas consideraciones para elegir Claude sobre otros LLMs:
Priorizas la conversación natural y con matices: La sofisticada comprensión del lenguaje de Claude permite conversaciones más naturales y conscientes del contexto que se sienten más humanas que los chats con otros LLMs.
A menudo recibes consultas complejas y abiertas: Claude puede manejar una amplia gama de temas y consultas sin generar respuestas enlatadas o requerir una programación extensa de permutaciones de expresiones del usuario.
Necesitas soporte multilingüe escalable: Las capacidades multilingües de Claude le permiten mantener conversaciones en más de 200 idiomas sin necesidad de chatbots separados o procesos extensos de traducción para cada idioma soportado.
Esboza una interacción ideal con el cliente para definir cómo y cuándo esperas que el cliente interactúe con Claude. Este esquema ayudará a determinar los requisitos técnicos de tu solución.Aquí hay un ejemplo de interacción de chat para soporte de seguro de automóvil:
Cliente: Inicia la experiencia de chat de soporte
Claude: Saluda cálidamente al cliente e inicia la conversación
Cliente: Pregunta sobre seguro para su nuevo coche eléctrico
Claude: Proporciona información relevante sobre la cobertura de vehículos eléctricos
Cliente: Hace preguntas relacionadas con necesidades únicas para seguros de vehículos eléctricos
Claude: Responde con respuestas precisas e informativas y proporciona enlaces a las fuentes
Cliente: Hace preguntas fuera de tema no relacionadas con seguros o coches
Claude: Aclara que no discute temas no relacionados y dirige al usuario de vuelta al seguro de automóvil
Cliente: Expresa interés en una cotización de seguro
Claude: Hace un conjunto de preguntas para determinar la cotización apropiada, adaptándose a sus respuestas
Claude: Envía una solicitud para usar la herramienta API de generación de cotizaciones junto con la información necesaria recopilada del usuario
Claude: Recibe la información de respuesta de la herramienta API, sintetiza la información en una respuesta natural y presenta la cotización proporcionada al usuario
Cliente: Hace preguntas de seguimiento
Claude: Responde a las preguntas de seguimiento según sea necesario
Claude: Guía al cliente hacia los siguientes pasos en el proceso de seguro y cierra la conversación
En el ejemplo real que escribas para tu propio caso de uso, podría resultarte útil escribir las palabras reales en esta interacción para que también puedas tener una idea del tono ideal, la longitud de respuesta y el nivel de detalle que quieres que Claude tenga.
El chat de atención al cliente es una colección de múltiples tareas diferentes, desde responder preguntas hasta recuperar información y tomar acción sobre solicitudes, todo envuelto en una sola interacción con el cliente. Antes de comenzar a construir, desglosa tu interacción ideal con el cliente en cada tarea que quieres que Claude pueda realizar. Esto asegura que puedas indicar y evaluar a Claude para cada tarea, y te da una buena idea del rango de interacciones que necesitas tener en cuenta al escribir casos de prueba.
Los clientes a veces encuentran útil visualizar esto como un diagrama de flujo de interacción de posibles puntos de inflexión de conversación dependiendo de las solicitudes del usuario.
Aquí están las tareas clave asociadas con el ejemplo de interacción de seguro anterior:
Saludo y orientación general
Saludar cálidamente al cliente e iniciar la conversación
Proporcionar información general sobre la empresa y la interacción
Información del Producto
Proporcionar información sobre la cobertura de vehículos eléctricos
Esto requerirá que Claude tenga la información necesaria en su contexto, y podría implicar que sea necesaria una integración RAG.
Responder preguntas relacionadas con necesidades únicas de seguro de vehículos eléctricos
Responder preguntas de seguimiento sobre la cotización o detalles del seguro
Ofrecer enlaces a fuentes cuando sea apropiado
Gestión de la Conversación
Mantenerse en el tema (seguro de automóvil)
Redirigir preguntas fuera de tema de vuelta a temas relevantes
Generación de Cotización
Hacer preguntas apropiadas para determinar la elegibilidad para la cotización
Adaptar preguntas basadas en las respuestas del cliente
Enviar la información recopilada a la API de generación de cotizaciones
Trabaja con tu equipo de soporte para definir criterios de éxito claros y escribe evaluaciones detalladas con puntos de referencia y objetivos medibles.Aquí hay criterios y puntos de referencia que pueden usarse para evaluar qué tan exitosamente Claude realiza las tareas definidas:
Precisión de comprensión de consultas
Esta métrica evalúa qué tan precisamente Claude entiende las consultas de los clientes en varios temas. Mide esto revisando una muestra de conversaciones y evaluando si Claude tiene la interpretación correcta de la intención del cliente, los pasos críticos siguientes, cómo se ve una resolución exitosa, y más. Apunta a una precisión de comprensión del 95% o superior.
Relevancia de respuesta
Esto evalúa qué tan bien la respuesta de Claude aborda la pregunta o problema específico del cliente. Evalúa un conjunto de conversaciones y califica la relevancia de cada respuesta (usando calificación basada en LLM para escalar). Apunta a una puntuación de relevancia del 90% o superior.
Precisión de respuesta
Evalúa la corrección de la información general de la empresa y del producto proporcionada al usuario, basada en la información proporcionada a Claude en contexto. Apunta a una precisión del 100% en esta información introductoria.
Relevancia de provisión de citas
Rastrea la frecuencia y relevancia de enlaces o fuentes ofrecidas. Apunta a proporcionar fuentes relevantes en el 80% de las interacciones donde información adicional podría ser beneficiosa.
Adherencia al tema
Mide qué tan bien Claude se mantiene en el tema, como el tema de seguro de automóvil en nuestro ejemplo de implementación. Apunta a que el 95% de las respuestas estén directamente relacionadas con el seguro de automóvil o la consulta específica del cliente.
Efectividad de generación de contenido
Mide qué tan exitoso es Claude en determinar cuándo generar contenido informativo y qué tan relevante es ese contenido. Por ejemplo, en nuestra implementación, estaríamos determinando qué tan bien Claude entiende cuándo generar una cotización y qué tan precisa es esa cotización. Apunta a una precisión del 100%, ya que esta es información vital para una interacción exitosa con el cliente.
Eficiencia de escalamiento
Esto mide la capacidad de Claude para reconocer cuándo una consulta necesita intervención humana y escalar apropiadamente. Rastrea el porcentaje de conversaciones correctamente escaladas versus aquellas que deberían haber sido escaladas pero no lo fueron. Apunta a una precisión de escalamiento del 95% o superior.
Aquí hay criterios y puntos de referencia que pueden usarse para evaluar el impacto empresarial de emplear a Claude para soporte:
Mantenimiento del sentimiento
Esto evalúa la capacidad de Claude para mantener o mejorar el sentimiento del cliente a lo largo de la conversación. Usa herramientas de análisis de sentimiento para medir el sentimiento al principio y al final de cada conversación. Apunta a mantener o mejorar el sentimiento en el 90% de las interacciones.
Tasa de desviación
El porcentaje de consultas de clientes manejadas exitosamente por el chatbot sin intervención humana. Típicamente apunta a una tasa de desviación del 70-80%, dependiendo de la complejidad de las consultas.
Puntuación de satisfacción del cliente
Una medida de cuán satisfechos están los clientes con su interacción con el chatbot. Usualmente se hace a través de encuestas post-interacción. Apunta a una puntuación CSAT de 4 de 5 o superior.
Tiempo promedio de manejo
El tiempo promedio que le toma al chatbot resolver una consulta. Esto varía ampliamente según la complejidad de los problemas, pero generalmente, apunta a un tiempo promedio de manejo más bajo comparado con agentes humanos.
La elección del modelo depende de los compromisos entre costo, precisión y tiempo de respuesta.Para el chat de atención al cliente, claude-opus-4-20250514 está bien adaptado para equilibrar inteligencia, latencia y costo. Sin embargo, para casos donde tienes un flujo de conversación con múltiples indicaciones incluyendo RAG, uso de herramientas y/o indicaciones de contexto largo, claude-3-haiku-20240307 puede ser más adecuado para optimizar la latencia.
Usar Claude para atención al cliente requiere que Claude tenga suficiente dirección y contexto para responder apropiadamente, mientras tiene suficiente flexibilidad para manejar una amplia gama de consultas de clientes.Comencemos escribiendo los elementos de una indicación sólida, comenzando con una indicación de sistema:
Copy
IDENTITY = """Eres Eva, una asistente de IA amigable y conocedora para Acme Insurance Company. Tu rol es dar la bienvenida cálidamente a los clientes y proporcionar información sobre las ofertas de seguros de Acme, que incluyen seguro de automóvil y seguro de automóvil eléctrico. También puedes ayudar a los clientes a obtener cotizaciones para sus necesidades de seguro."""
Aunque puedas sentirte tentado a poner toda tu información dentro de una indicación de sistema como una forma de separar las instrucciones de la conversación del usuario, Claude en realidad funciona mejor con la mayor parte del contenido de su indicación escrito dentro del primer turno del Usuario (con la única excepción siendo la indicación de rol). Lee más en Dando a Claude un rol con una indicación de sistema.
Es mejor desglosar las indicaciones complejas en subsecciones y escribir una parte a la vez. Para cada tarea, podrías encontrar mayor éxito siguiendo un proceso paso a paso para definir las partes de la indicación que Claude necesitaría para hacer bien la tarea. Para este ejemplo de soporte de seguro de automóvil, escribiremos por partes todas las partes para una indicación comenzando con la tarea de “Saludo y orientación general”. Esto también hace que la depuración de tu indicación sea más fácil ya que puedes ajustar más rápidamente partes individuales de la indicación general.Pondremos todas estas piezas en un archivo llamado config.py.
Copy
STATIC_GREETINGS_AND_GENERAL = """<static_context>Acme Auto Insurance: Tu Compañero de Confianza en la CarreteraAcerca de:En Acme Insurance, entendemos que tu vehículo es más que solo un medio de transporte—es tu boleto para las aventuras de la vida. Desde 1985, hemos estado creando pólizas de seguro de automóvil que dan a los conductores la confianza para explorar, desplazarse y viajar con tranquilidad.Ya sea que estés navegando por calles de la ciudad o embarcándote en viajes por carretera a través del país, Acme está ahí para protegerte a ti y a tu vehículo. Nuestras innovadoras pólizas de seguro de automóvil están diseñadas para adaptarse a tus necesidades únicas, cubriendo todo desde pequeños golpes hasta colisiones mayores.Con el servicio al cliente galardonado de Acme y la rápida resolución de reclamaciones, puedes concentrarte en la alegría de conducir mientras nosotros nos encargamos del resto. No somos solo un proveedor de seguros—somos tu copiloto en los viajes de la vida.Elige Acme Auto Insurance y experimenta la seguridad que viene con una cobertura superior y un cuidado genuino. Porque en Acme, no solo aseguramos tu coche—alimentamos tus aventuras en la carretera abierta.Nota: También ofrecemos cobertura especializada para vehículos eléctricos, asegurando que conductores de todos los tipos de coches puedan beneficiarse de nuestra protección.Acme Insurance ofrece los siguientes productos:- Seguro de automóvil- Seguro de automóvil eléctrico- Seguro de vehículos de dos ruedasHorario comercial: Lunes-Viernes, 9 AM - 5 PM ESTNúmero de servicio al cliente: 1-800-123-4567</static_context>"""
Luego haremos lo mismo para nuestra información de seguro de automóvil y seguro de automóvil eléctrico.
Copy
STATIC_CAR_INSURANCE="""<static_context>Cobertura de Seguro de Automóvil:Las pólizas de seguro de automóvil de Acme típicamente cubren:1. Cobertura de responsabilidad civil: Paga por lesiones corporales y daños a la propiedad que causes a otros.2. Cobertura de colisión: Paga por daños a tu coche en un accidente.3. Cobertura integral: Paga por daños a tu coche por incidentes no relacionados con colisiones.4. Cobertura de pagos médicos: Paga por gastos médicos después de un accidente.5. Cobertura de motorista sin seguro/con seguro insuficiente: Te protege si eres golpeado por un conductor con seguro insuficiente.Las coberturas opcionales incluyen:- Reembolso de coche de alquiler- Asistencia en carretera- Reemplazo de coche nuevo</static_context>"""STATIC_ELECTRIC_CAR_INSURANCE="""<static_context>Seguro de Automóvil Eléctrico:Nuestro seguro especializado de automóvil eléctrico va más allá de la cobertura tradicional de automóvil, ofreciendo protección adaptada para tu inversión de alta tecnología. Además de las coberturas estándar, ofrecemos:- Salvaguardia de sistemas de batería costosos- Cobertura de equipos de carga domésticos- Adaptación al mundo en rápida evolución de los vehículos eléctricosYa sea que conduzcas un Rivian, Nissan Leaf, Chevrolet Bolt, o cualquier otro vehículo eléctrico, nuestros agentes conocedores están listos para crear una póliza que te dé la confianza para disfrutar cada milla impulsada por electrones.</static_context>"""
Ahora que tenemos nuestro contenido estático, agreguemos al menos 4-5 ejemplos de interacciones “buenas” para guiar las respuestas de Claude. Estos ejemplos deben ser representativos de tu interacción ideal con el cliente y pueden incluir barandillas, llamadas a herramientas, etc.
Copy
EXAMPLES="""Aquí hay algunos ejemplos de cómo puedes interactuar con los clientes:<example 1>H: Hola, ¿ofrecen seguro comercial para pequeñas empresas?A: ¡Ah! Desafortunadamente, no ofrecemos seguro comercial en este momento. Sin embargo, proporcionamos una gama de productos de seguro personal incluyendo seguro de automóvil y seguro de automóvil eléctrico. ¿Te gustaría saber más sobre estas ofertas?</example 1><example 2>H: Hola, ¿cuáles son sus horarios comerciales?A: Nuestros horarios comerciales son de lunes a viernes, de 9 AM a 5 PM EST. Si tienes alguna pregunta o necesitas asistencia, no dudes en contactarnos durante esos horarios. ¿En qué más puedo ayudarte hoy?</example 2><example 3>H: Estoy buscando seguro de automóvil. ¿Qué ofrece Acme?A: ¡Gran elección! Las pólizas de seguro de automóvil de Acme típicamente incluyen:- Cobertura de responsabilidad civil: Te protege si eres culpable en un accidente- Cobertura de colisión: Paga por daños a tu coche en un accidente- Cobertura integral: Cubre incidentes no relacionados con colisiones como robo o vandalismo- Cobertura de pagos médicos: Paga por gastos médicos después de un accidente- Cobertura de motorista sin seguro/con seguro insuficiente: Te protege de conductores con seguro insuficienteTambién ofrecemos coberturas opcionales como reembolso de coche de alquiler, asistencia en carretera y reemplazo de coche nuevo. ¿Te gustaría más detalles sobre alguna de estas coberturas, o tienes preguntas específicas sobre asegurar tu vehículo?</example 3><example 4>H: Me gustaría saber sobre su seguro de automóvil eléctrico.A: ¡Ciertamente! Nuestro seguro de automóvil eléctrico está especialmente diseñado para satisfacer las necesidades únicas de los propietarios de vehículos eléctricos. Además de todas las coberturas estándar que ofrecemos para coches regulares, nuestras pólizas para coches eléctricos incluyen:- Cobertura de batería: Protección contra daños o degradación del costoso sistema de batería de tu vehículo- Paquete tecnológico: Cubre reparaciones o reemplazo de electrónica avanzada y sistemas informáticos a bordo- Cobertura de estación de carga: Protege tanto el equipo de carga doméstico como portátil- Protección de ciberseguridad: Cobertura contra hackeo o amenazas digitales- Asistencia en carretera especializada: Incluye remolque con plataforma para proteger la parte inferior del vehículoCubrimos una amplia gama de vehículos eléctricos, incluyendo modelos populares de Tesla, Rivian, Nissan, Chevrolet y más. ¿Hay algún vehículo eléctrico específico que estés buscando asegurar, o te gustaría más detalles sobre alguna de estas coberturas?</example 4><example 5>H: Me gustaría obtener una cotización para mi seguro de automóvil.A: ¡Ciertamente! Estaré encantada de ayudarte a obtener una cotización para tu seguro de automóvil. Para proporcionarte una cotización precisa, necesitaré recopilar alguna información sobre tu vehículo y el conductor principal. Comencemos con lo básico:1. ¿Cuál es la marca y modelo de tu vehículo?2. ¿En qué año fue fabricado?3. ¿Aproximadamente cuántas millas has conducido?4. ¿Cuál es la edad del conductor principal?Una vez que proporciones esta información, usaré nuestra herramienta de cotización para generar una cotización de seguro personalizada para ti.</example 5>"""
También querrás incluir cualquier instrucción importante que describa lo que debe y no debe hacer Claude al interactuar con el cliente.
Esto puede extraerse de las barandillas de la marca o políticas de soporte.
Copy
ADDITIONAL_GUARDRAILS = """Por favor, adhiérete a las siguientes barandillas:1. Solo proporciona información sobre tipos de seguros listados en nuestras ofertas.2. Si te preguntan sobre un tipo de seguro que no ofrecemos, indica cortésmente que no proporcionamos ese servicio.3. No especules sobre futuras ofertas de productos o planes de la empresa.4. No hagas promesas ni entres en acuerdos que no estés autorizado a hacer.Solo proporcionas información y orientación.5. No menciones productos o servicios de ningún competidor."""
Ahora combinemos todas estas secciones en una sola cadena para usar como nuestra indicación.
Añade capacidades dinámicas y de agente con uso de herramientas
Claude es capaz de realizar acciones y recuperar información dinámicamente usando la funcionalidad de uso de herramientas del lado del cliente. Comienza listando cualquier herramienta externa o APIs que la indicación debería utilizar.Para este ejemplo, comenzaremos con una herramienta para calcular la cotización.
Como recordatorio, esta herramienta no realizará el cálculo real, solo señalará a la aplicación que se debe usar una herramienta con los argumentos especificados.
Ejemplo de calculadora de cotización de seguro:
Copy
TOOLS = [{ "name": "get_quote", "description": "Calcula la cotización de seguro basada en la entrada del usuario. El valor devuelto es la prima mensual.", "input_schema": { "type": "object", "properties": { "make": {"type": "string", "description": "La marca del vehículo."}, "model": {"type": "string", "description": "El modelo del vehículo."}, "year": {"type": "integer", "description": "El año en que se fabricó el vehículo."}, "mileage": {"type": "integer", "description": "El kilometraje del vehículo."}, "driver_age": {"type": "integer", "description": "La edad del conductor principal."} }, "required": ["make", "model", "year", "mileage", "driver_age"] }}]def get_quote(make, model, year, mileage, driver_age): """Devuelve la prima mensual en USD""" # Puedes llamar a un endpoint http o a una base de datos para obtener la cotización. # Aquí, simulamos un retraso de 1 segundo y devolvemos una cotización fija de 100. time.sleep(1) return 100
Es difícil saber qué tan bien funciona tu indicación sin desplegarla en un entorno de producción de prueba y ejecutar evaluaciones, así que construyamos una pequeña aplicación usando nuestra indicación, el SDK de Anthropic y streamlit para una interfaz de usuario.En un archivo llamado chatbot.py, comienza configurando la clase ChatBot, que encapsulará las interacciones con el SDK de Anthropic.La clase debe tener dos métodos principales: generate_message y process_user_input.
Prueba desplegar este código con Streamlit usando un método principal. Esta función main() configura una interfaz de chat basada en Streamlit.Haremos esto en un archivo llamado app.py
Copy
import streamlit as stfrom chatbot import ChatBotfrom config import TASK_SPECIFIC_INSTRUCTIONSdef main(): st.title("Chatea con Eva, la Asistente de Acme Insurance Company🤖") if "messages" not in st.session_state: st.session_state.messages = [ {'role': "user", "content": TASK_SPECIFIC_INSTRUCTIONS}, {'role': "assistant", "content": "Entendido"}, ] chatbot = ChatBot(st.session_state) # Muestra mensajes de usuario y asistente saltando los dos primeros for message in st.session_state.messages[2:]: # ignora bloques de uso de herramientas if isinstance(message["content"], str): with st.chat_message(message["role"]): st.markdown(message["content"]) if user_msg := st.chat_input("Escribe tu mensaje aquí..."): st.chat_message("user").markdown(user_msg) with st.chat_message("assistant"): with st.spinner("Eva está pensando..."): response_placeholder = st.empty() full_response = chatbot.process_user_input(user_msg) response_placeholder.markdown(full_response)if __name__ == "__main__": main()
La creación de indicaciones a menudo requiere pruebas y optimización para que esté lista para producción. Para determinar la preparación de tu solución, evalúa el rendimiento del chatbot usando un proceso sistemático que combine métodos cuantitativos y cualitativos. Crear una evaluación empírica sólida basada en tus criterios de éxito definidos te permitirá optimizar tus indicaciones.
La Consola de Anthropic ahora cuenta con una herramienta de Evaluación que te permite probar tus indicaciones bajo varios escenarios.
Cuando se trata de grandes cantidades de contexto estático y dinámico, incluir toda la información en la indicación puede llevar a altos costos, tiempos de respuesta más lentos y alcanzar límites de ventana de contexto. En este escenario, implementar técnicas de Generación Aumentada por Recuperación (RAG) puede mejorar significativamente el rendimiento y la eficiencia.Al usar modelos de incrustación como Voyage para convertir información en representaciones vectoriales, puedes crear un sistema más escalable y receptivo. Este enfoque permite la recuperación dinámica de información relevante basada en la consulta actual, en lugar de incluir todo el contexto posible en cada indicación.Se ha demostrado que implementar RAG para casos de uso de soporte receta RAG aumenta la precisión, reduce los tiempos de respuesta y reduce los costos de API en sistemas con requisitos extensos de contexto.
Integra datos en tiempo real con uso de herramientas
Cuando se trata de consultas que requieren información en tiempo real, como saldos de cuenta o detalles de pólizas, los enfoques RAG basados en incrustaciones no son suficientes. En su lugar, puedes aprovechar el uso de herramientas para mejorar significativamente la capacidad de tu chatbot para proporcionar respuestas precisas en tiempo real. Por ejemplo, puedes usar el uso de herramientas para buscar información del cliente, recuperar detalles de pedidos y cancelar pedidos en nombre del cliente.Este enfoque, descrito en nuestra receta de uso de herramientas: agente de servicio al cliente, te permite integrar perfectamente datos en vivo en las respuestas de Claude y proporcionar una experiencia de cliente más personalizada y eficiente.
Al desplegar un chatbot, especialmente en escenarios de servicio al cliente, es crucial prevenir riesgos asociados con el mal uso, consultas fuera de alcance y respuestas inapropiadas. Aunque Claude es inherentemente resistente a tales escenarios, aquí hay pasos adicionales para fortalecer las barandillas de tu chatbot:
Reduce la alucinación: Implementa mecanismos de verificación de hechos y citas para fundamentar las respuestas en información proporcionada.
Verifica la información: Verifica que las respuestas del agente se alineen con las políticas de tu empresa y hechos conocidos.
Evita compromisos contractuales: Asegúrate de que el agente no haga promesas o entre en acuerdos que no esté autorizado a hacer.
Mitiga los jailbreaks: Usa métodos como pantallas de inofensividad y validación de entrada para evitar que los usuarios exploten vulnerabilidades del modelo, con el objetivo de generar contenido inapropiado.
Evita mencionar competidores: Implementa un filtro de mención de competidores para mantener el enfoque en la marca y no mencionar productos o servicios de ningún competidor.
Mantén a Claude en personaje: Evita que Claude cambie su estilo de contexto, incluso durante interacciones largas y complejas.
Elimina Información Personalmente Identificable (PII): A menos que se requiera explícitamente y esté autorizado, elimina cualquier PII de las respuestas.
Reduce el tiempo de respuesta percibido con streaming
Cuando se trata de respuestas potencialmente largas, implementar streaming puede mejorar significativamente el compromiso y la satisfacción del usuario. En este escenario, los usuarios reciben la respuesta progresivamente en lugar de esperar a que se genere toda la respuesta.Así es como implementar streaming:
Configura tu frontend para manejar fragmentos entrantes de texto.
Muestra cada fragmento a medida que llega, simulando escritura en tiempo real.
Implementa un mecanismo para guardar la respuesta completa, permitiendo a los usuarios verla si navegan fuera y regresan.
En algunos casos, el streaming permite el uso de modelos más avanzados con latencias base más altas, ya que la visualización progresiva mitiga el impacto de tiempos de procesamiento más largos.
A medida que crece la complejidad de tu Chatbot, la arquitectura de tu aplicación puede evolucionar para adaptarse. Antes de agregar más capas a tu arquitectura, considera las siguientes opciones menos exhaustivas:
Asegúrate de que estás aprovechando al máximo tus indicaciones y optimizando a través de la ingeniería de indicaciones. Usa nuestras guías de ingeniería de indicaciones para escribir las indicaciones más efectivas.
Agrega herramientas adicionales a la indicación (que pueden incluir cadenas de indicaciones) y ve si puedes lograr la funcionalidad requerida.
Si tu Chatbot maneja tareas increíblemente variadas, podrías considerar agregar un clasificador de intención separado para enrutar la consulta inicial del cliente. Para la aplicación existente, esto implicaría crear un árbol de decisión que enrutaría las consultas de los clientes a través del clasificador y luego a conversaciones especializadas (con su propio conjunto de herramientas e indicaciones de sistema). Nota, este método requiere una llamada adicional a Claude que puede aumentar la latencia.
Mientras que nuestros ejemplos se han centrado en funciones de Python que se pueden llamar dentro de un entorno Streamlit, desplegar Claude para un chatbot de soporte en tiempo real requiere un servicio API.Así es como puedes abordar esto:
Crea un envoltorio API: Desarrolla un envoltorio API simple alrededor de tu función de clasificación. Por ejemplo, puedes usar Flask API o Fast API para envolver tu código en un Servicio HTTP. Tu servicio HTTP podría aceptar la entrada del usuario y devolver la respuesta del Asistente en su totalidad. Por lo tanto, tu servicio podría tener las siguientes características:
Eventos enviados por el servidor (SSE): SSE permite la transmisión en tiempo real de respuestas desde el servidor al cliente. Esto es crucial para proporcionar una experiencia suave e interactiva cuando se trabaja con LLMs.
Almacenamiento en caché: Implementar almacenamiento en caché puede mejorar significativamente los tiempos de respuesta y reducir llamadas API innecesarias.
Retención de contexto: Mantener el contexto cuando un usuario navega fuera y regresa es importante para la continuidad en las conversaciones.
Construye una interfaz web: Implementa una UI web amigable para interactuar con el agente impulsado por Claude.