Actualidad

Casos de uso de IA generalista: uso del modo de voz avanzado para preparar los interrogatorios a testigos civiles, penales y laborales

El autor del post  Pablo Sáez Hurtado Pablo Sáez Hurtado
- de lectura

Pablo Sáez Hurtado, abogado especializado en LegalTech y transformación digital del sector jurídico, escritor y doctorando en la Universidad de Valladolid, miembro de OdiseIA y docente en innumerables programas formativos, analiza en este artículo otro caso de uso de IA Generalista. En este caso, analiza el uso del modo voz avanzado de 4 LLMs para preparar los interrogatorios a testigos civiles, penales y laborales.

  • La función «imprescindible» de tu día a día en el despacho, que aún no conoces y que te cambiará completamente la vida: el uso del «modo voz avanzado» de las Apps. de hasta cuatro LLMs GenAI «generalistas» con los que podrás preparar in voce los mejores interrogatorios de testigos civiles, penales y laborales pensables.
  • La contra-ofensiva de GROK-4, Perplexity, Gemini y ChatGPT.
  • Artículo elaborado mediante investigación exhaustiva (wide-research) con IA avanzada en septiembre 2025.

Introducción: La revolución silenciosa de la voz en el Derecho español

En los pasillos de los despachos de abogados españoles, una revolución silenciosa está cobrando impulso. No se trata de una nueva ley disruptiva ni de un cambio jurisprudencial inesperado, sino de una transformación tecnológica que redefine la interacción más fundamental del ser humano: la voz. El paradigma «voice-first», que ha conquistado nuestros hogares y dispositivos móviles, irrumpe ahora en la práctica jurídica con una fuerza arrolladora, prometiendo optimizar flujos de trabajo, potenciar la productividad y elevar la calidad de la preparación procesal a un nivel sin precedentes.

Mientras el sector legal español avanza con cautela pero con firmeza en la adopción de la inteligencia artificial generativa, con un 90% de los abogados afirmando que estas herramientas les ayudan de manera eficaz en su trabajo [1], una nueva frontera se abre con los sistemas de voz avanzada. Esta tecnología, lejos de ser una mera comodidad, se erige como un instrumento estratégico de un potencial incalculable.

La presente análisis se adentra en el corazón de esta revolución, explorando cómo los profesionales del derecho en España pueden capitalizar los sistemas de voz de cuatro de los modelos de lenguaje más avanzados del mercado —GROK-4 de xAI, Gemini Live de Google, Perplexity Voice Assistant y ChatGPT Voice de OpenAI— para una de las tareas más críticas y delicadas de su práctica: la preparación de interrogatorios de testigos. A través de un análisis riguroso y práctico, demostraremos que estas herramientas, lejos de ser un mero asistente de dictado, se han convertido en auténticos sparrings procesales, capaces de simular escenarios complejos, ofrecer feedback instantáneo y perfeccionar las habilidades de litigación de cualquier abogado, mediador o árbitro.

(Pablo Sáez Hurtado, abogado especializado en LegalTech y transformación digital del sector jurídico, es el autor de este artículo)

El marco legal español: Fundamentos normativos para la innovación procesal

La introducción de tecnologías de IA en la preparación de interrogatorios no opera en un vacío legal, sino que se inserta en un sólido marco normativo que rige la práctica de la prueba testifical en España. Comprender estos fundamentos es crucial para utilizar las nuevas herramientas de forma eficaz y deontológicamente responsable.

En la jurisdicción civil, los artículos 361 a 381 de la Ley de Enjuiciamiento Civil (LEC) [2] configuran el interrogatorio como un acto procesal presidido por los principios de oralidad, inmediación y contradicción, donde la valoración de la prueba se deja a la «sana crítica» del juzgador. Este margen de valoración es precisamente el campo de entrenamiento donde la IA puede jugar un papel crucial, permitiendo al abogado anticipar cómo la coherencia, la precisión y la seguridad del testigo pueden influir en la percepción judicial.

En el ámbito penal, la Ley de Enjuiciamiento Criminal (LECrim) [3], en sus artículos 410 a 449, establece un marco aún más garantista, dada la naturaleza de los derechos en juego. La preparación de un testigo en un proceso penal mediante simulación con IA debe ser extremadamente cuidadosa para no cruzar la delgada línea que separa la preparación legítima del aleccionamiento indebido, una distinción que la jurisprudencia del Tribunal Supremo ha perfilado con detalle.

La Ley Reguladora de la Jurisdicción Social (LRJS) [4], en sus artículos 87 a 90, presenta sus propias especificidades, adaptadas a la naturaleza de los conflictos laborales. La capacidad de la IA para simular diferentes registros y tonos de comunicación resulta especialmente valiosa en este ámbito, donde la carga emocional y las relaciones de poder pueden jugar un papel determinante en el desarrollo del interrogatorio.

Análisis técnico comparativo: Los cuatro sistemas de voz avanzada

Para comprender el potencial real de estas herramientas, es imprescindible realizar un análisis técnico exhaustivo de sus capacidades, diferencias y limitaciones. Cada uno de estos sistemas presenta una arquitectura y un enfoque únicos, diseñados para satisfacer diferentes necesidades profesionales y estilos de trabajo en el ámbito jurídico.

GROK-4 Voice Mode se posiciona como una herramienta de alto rendimiento para el trabajo en profundidad y el análisis crítico. Su arquitectura se beneficia de una ventana de contexto masiva de 256,000 tokens, lo que le permite procesar y recordar grandes volúmenes de información durante una conversación extensa, característica esencial para la simulación de interrogatorios complejos que se extienden en el tiempo y requieren mantener la coherencia narrativa a lo largo de múltiples sesiones. La función «ver lo que ves» añade una capa multimodal revolucionaria, permitiendo al abogado mostrar documentos, contratos, fotografías o cualquier tipo de evidencia visual al sistema durante la simulación para un entrenamiento más contextualizado y realista. En términos de privacidad y seguridad, aspectos cruciales para la práctica legal, xAI afirma cumplir rigurosamente con normativas internacionales como SOC2, GDPR y CCPA, ofreciendo un Anexo de Procesamiento de Datos (DPA) crucial para el manejo de información sensible de clientes. Su latencia reportada de aproximadamente 50 tokens por segundo garantiza una fluidez conversacional adecuada para simulaciones intensivas.

Gemini Live de Google destaca por su excepcional capacidad multimodal y su profunda integración con el ecosistema de aplicaciones de la compañía tecnológica. Su API Live permite una interacción en tiempo real no solo a través de la voz, sino también mediante vídeo en directo, compartición de pantalla, análisis de imágenes y procesamiento de archivos de múltiples formatos. Esta capacidad abre un abanico extraordinario de posibilidades para la preparación de interrogatorios, permitiendo, por ejemplo, simular la reacción de un testigo ante una prueba documental mostrada en pantalla o entrenar la respuesta ante evidencias fotográficas o videográficas. La conversación con Gemini Live es notablemente natural y fluida, permitiendo interrupciones espontáneas y cambios de tema con una fluidez que replica con mayor fidelidad la dinámica impredecible de un interrogatorio real. Su arquitectura de audio utiliza PCM de 16 bits con frecuencias de muestreo de 24 kHz para la salida y 16 kHz para la entrada, garantizando una calidad de audio profesional. Disponible en más de 45 idiomas y 150 países, su accesibilidad global es uno de sus puntos fuertes más destacados.

Perplexity AI se diferencia radicalmente por su enfoque especializado en la investigación rigurosa y la verificación de la información en tiempo real. Su asistente de voz no solo transcribe y responde, sino que actúa como un motor de búsqueda conversacional avanzado que proporciona respuestas precisas acompañadas de citas bibliográficas y fuentes verificables en tiempo real. Esta característica es de un valor incalculable para el abogado en la fase de preparación, permitiéndole verificar datos jurisprudenciales, contrastar información normativa y fundamentar sus preguntas con un rigor factual impecable y documentado. La capacidad de obtener respuestas fiables y académicamente fundamentadas al instante, simplemente preguntando en voz alta, optimiza drásticamente el tiempo dedicado a la investigación preliminar y permite al abogado centrarse en la estrategia del interrogatorio con una base informativa sólida.

ChatGPT Voice, impulsado por el potente modelo de reconocimiento de voz Whisper de OpenAI, fue uno de los pioneros en popularizar las conversaciones de voz con inteligencia artificial y mantiene una posición de liderazgo en términos de adopción y versatilidad. Su modo de voz avanzado permite interacciones fluidas y naturales, lo que lo convierte en una herramienta excepcionalmente eficaz para la práctica de la oratoria, la simulación de diálogos complejos y el entrenamiento de habilidades comunicativas. Su principal ventaja competitiva reside en el vasto ecosistema de plugins y GPTs personalizados disponibles en la GPT Store, que permiten adaptar y especializar la herramienta para tareas legales específicas, desde la redacción de contratos hasta el análisis de jurisprudencia o la gestión de casos.

Aplicación práctica: Casos de uso avanzados en la preparación de interrogatorios

La verdadera revolución de los asistentes de voz reside en su aplicación práctica, en la transformación de la teoría en una ventaja procesal tangible y medible. Los casos de uso que se presentan a continuación ilustran cómo estas herramientas pueden ser utilizadas para preparar interrogatorios en las principales jurisdicciones, llevando la preparación del abogado a un nuevo nivel de sofisticación, eficacia y profesionalidad.

En interrogatorios civiles, consideremos un litigio complejo sobre incumplimiento de contrato de suministro entre dos empresas multinacionales. El abogado de la parte demandante necesita preparar al director comercial de su cliente para un interrogatorio que se prevé largo, técnico y potencialmente hostil. Utilizando Gemini Live, el abogado puede iniciar una sesión de simulación multimodal altamente sofisticada. Comienza con un prompt inicial detallado: «Actúa como el abogado de la parte contraria en un juicio por incumplimiento de contrato de suministro. Eres incisivo, extremadamente detallista y buscas cualquier contradicción o inconsistencia en el testimonio. Conoces perfectamente el derecho mercantil y tienes experiencia en litigios complejos. Yo seré el testigo y debes interrogarme como si fuera el director comercial de la empresa demandante». Durante la simulación, el abogado puede compartir en pantalla el contrato original, las modificaciones posteriores, los correos electrónicos de negociación y los informes de incumplimiento, pidiendo a Gemini que formule preguntas específicas sobre cláusulas concretas, plazos de entrega, condiciones de pago y responsabilidades contractuales. La IA, gracias a su capacidad avanzada de análisis de documentos y comprensión contextual, puede generar preguntas de alta complejidad jurídica y detectar inconsistencias sutiles en las respuestas del testigo en tiempo real, proporcionando un entrenamiento intensivo que replica fielmente la presión y la dinámica de un interrogatorio real.

Para interrogatorios penales, donde la libertad del acusado está en juego y los estándares de prueba son más exigentes, la preparación alcanza una criticidad máxima que no admite improvisaciones. Consideremos la preparación de un testigo presencial en un caso complejo de delito contra la seguridad vial con resultado de lesiones graves. El abogado defensor puede utilizar GROK-4 Voice Mode para simular un contrainterrogatorio agresivo y técnicamente sofisticado por parte de la acusación particular y el ministerio fiscal. El prompt podría ser: «Simula ser un fiscal experimentado especializado en delitos de tráfico con más de veinte años de experiencia en juicios orales. Mi cliente es el testigo principal de la defensa que presenció el accidente. Tu objetivo es desacreditar completamente su testimonio, cuestionando sistemáticamente su percepción visual, su capacidad de memoria, sus posibles motivaciones ocultas, su estado emocional en el momento de los hechos y cualquier detalle que pueda generar duda razonable. Sé implacable pero siempre dentro de los límites legales y deontológicos». La gran ventana de contexto de Grok permite mantener la coherencia narrativa y la presión psicológica a lo largo de una simulación prolongada de varias horas, recordando detalles específicos de declaraciones previas para generar preguntas capciosas y contradicciones aparentes que pongan a prueba la solidez del testimonio.

En jurisdicción laboral, los litigios como un despido disciplinario por supuesto acoso laboral a menudo involucran una alta carga emocional, relaciones de poder complejas y un lenguaje técnico específico que requiere un manejo delicado y profesional. Un abogado laboralista puede emplear ChatGPT Voice, utilizando un GPT personalizado específicamente entrenado con el convenio colectivo aplicable, la normativa laboral vigente, la jurisprudencia del Tribunal Supremo en materia de despidos disciplinarios y los protocolos internos de la empresa, para simular un interrogatorio realista y técnicamente preciso. Para el trabajador despedido, el prompt podría ser: «Actúa como el abogado de la empresa en un juicio por despido disciplinario. Representa a una multinacional con un departamento jurídico experimentado. Formula preguntas incisivas sobre mi rendimiento laboral, mis ausencias, mi relación con superiores y compañeros, mi conocimiento de los protocolos internos y mi versión de los hechos que motivaron el despido, utilizando un tono profesional pero escéptico y buscando inconsistencias en mi relato». La capacidad de ChatGPT para adaptarse dinámicamente a diferentes registros lingüísticos, desde el técnico-jurídico hasta el coloquial-laboral, y su acceso a un vasto conocimiento sectorial a través de plugins especializados, permiten crear simulaciones de gran realismo que preparan al testigo para enfrentar tanto preguntas técnicas complejas como situaciones emocionalmente desafiantes.

El verdadero salto cualitativo en el uso profesional de estas herramientas proviene de la implementación sistemática de meta-prompts y sistemas de feedback automatizado que permiten una mejora continua y medible de las habilidades de litigación. Tras una sesión intensiva de simulación, el abogado puede activar el modo de análisis crítico preguntando a la IA: «Analiza exhaustivamente mi técnica de interrogatorio durante los últimos treinta minutos de simulación. Evalúa con criterio profesional la estructura lógica de mis preguntas, la progresión narrativa del interrogatorio, mi tono de voz y modulación, mi capacidad para mantener el control del interrogatorio sin ser agresivo, mi habilidad para detectar evasivas o inconsistencias en las respuestas, y mi efectividad para obtener la información clave que buscaba. Proporciona un análisis detallado con ejemplos específicos y sugiere cinco mejoras concretas que podría implementar inmediatamente para optimizar mi rendimiento». Esta capacidad de autoevaluación asistida por IA, combinada con la posibilidad de obtener análisis comparativos con las mejores prácticas descritas en manuales de litigación de referencia, abre la puerta a la creación de programas de formación continua personalizados y científicamente fundamentados dentro de los despachos, democratizando el acceso a un entrenamiento de élite que hasta ahora estaba reservado a unos pocos profesionales privilegiados.

Análisis comparativo y recomendaciones estratégicas

La elección de la herramienta adecuada dependerá de las necesidades específicas de cada profesional y la naturaleza de su práctica. Para grandes despachos, la combinación de GROK-4 y Google Gemini Live ofrece la robustez en seguridad y capacidad de manejo de grandes contextos ideal para casos complejos, mientras que la versatilidad multimodal facilita el despliegue a gran escala. Los despachos medianos encontrarán en ChatGPT Voice, con su ecosistema de GPTs personalizables, la solución más adaptable con mejor retorno de inversión. Para el abogado individual, Perplexity Voice Assistant y Gemini Live gratuito proporcionan un punto de entrada potente y económico.

Consideraciones éticas y futuro de la profesión

La adopción de estas herramientas plantea desafíos éticos importantes. El «automation bias» puede llevar a estrategias procesales deficientes, mientras que el «deskilling» amenaza con la pérdida de habilidades críticas de litigación. Es imperativo que el CGAE actualice los códigos deontológicos para ofrecer guías claras sobre el uso responsable de la IA. La responsabilidad final recae en el abogado, quien debe utilizar estas herramientas como asistentes para potenciar, no sustituir, su juicio profesional.

La convergencia futura de la IA por voz con realidad aumentada promete simulaciones de juicios totalmente inmersivas. La correcta utilización de estos sistemas marcará un antes y un después en la búsqueda de la excelencia procesal, ofreciendo una ventaja competitiva decisiva en un entorno cada vez más exigente y tecnológico.

Referencias

[1] ELTA y Lefebvre Sarrut. (2024). *Informe sobre el impacto de la IA generativa en el sector legal*.

[2] Ley 1/2000, de 7 de enero, de Enjuiciamiento Civil. *Boletín Oficial del Estado*. https://www.boe.es/buscar/act.php?id=BOE-A-2000-323

[3] Real Decreto de 14 de septiembre de 1882 por el que se aprueba la Ley de Enjuiciamiento Criminal. *Boletín Oficial del Estado*. https://www.boe.es/buscar/act.php?id=BOE-A-1882-6036

[4] Ley 36/2011, de 10 de octubre, reguladora de la jurisdicción social. *Boletín Oficial del Estado*. https://www.boe.es/buscar/act.php?id=BOE-A-2011-15936