Guerra de Irán, en directo: El petróleo da un respiro tras el anuncio de nuevas negociaciones

Inteligencia Artificial

Una startup india humilla a ChatGPT y Gemini: su IA entiende lo que ellos nunca podrán

Sarvam AI desafía a los gigantes de Silicon Valley con un modelo de visión y voz ajustado a la complejidad de las 22 lenguas oficiales de la India, prometiendo una precisión inaudita

La IA total llegará en menos de 8 años, pero tiene un problema ridículo: el CEO de Google DeepMind admite que aún falla en matemáticas de primaria
China planta cara a OpenAI con una inteligencia artificial 200 veces más barata que ChatGPT
Científicos están intentando drogar a la inteligencia artificial y estaría funcionando

El reconocimiento de caracteres y la síntesis de voz se convierten en el nuevo campo de batalla para la inteligencia artificial fuera del dominio exclusivo del inglés

Sergio Agudo

Creada: 22.02.2026 16:00

Última actualización: 22.02.2026 16:00

La lectura automatizada de documentos y la síntesis de voz tienen un nuevo contendiente nacido en Bengaluru, ya que Sarvam AI asegura haber superado a Gemini y ChatGPT en pruebas clave de reconocimiento óptico de caracteres gracias a un modelo capaz de procesar los alfabetos locales con una precisión inalcanzable para las alternativas occidentales.

La prensa internacional especializada como TechRadar ya se hace eco de este anuncio, que incluye a Bulbul V3 como un sistema de texto a voz preparado para los 22 idiomas oficiales del país asiático con el objetivo de construir una infraestructura independiente capaz de entender los matices culturales indios sin depender de servidores extranjeros en ningún momento.

Promesas de soberanía frente al músculo de Silicon Valley

On OmniDocBench v1.5 (English only subset), Sarvam Vision achieves 93.28% overall score, excelling in complex formulas and layout parsing and being within touching distance of the current state of the art. pic.twitter.com/7YDfbX1pCz
— Pratyush Kumar (@pratykumar) February 5, 2026

Si desgranamos lo que hay detrás de estos anuncios, vemos que Sarvam Vision actúa como un lector digital diseñado para interpretar tablas complejas y extraer texto de imágenes reales; un campo donde Google lleva tiempo modificando la estructura de sus propios modelos generativos para no perder terreno frente a alternativas globales que suelen fallar estrepitosamente ante la caligrafía india.

Por su parte, Bulbul V3 ataca el problema de la naturalidad auditiva integrando 35 voces diferentes programadas para esquivar el acento robótico y sonar como un nativo, porque resulta inútil desarrollar asistentes que analizan el entorno físico a través de la cámara si luego pronuncian las indicaciones como si las leyera un turista recién aterrizado.

Aunque digitalizar archivos polvorientos en una oficina gubernamental carece de atractivo visual, en el fondo es un proceso vital donde reducir los caracteres corruptos al escanear un papel con el móvil ahorra muchísimas horas de corrección manual, permitiendo a cualquier empleado transformar registros antiguos en bases de datos navegables sin perder información por culpa de malas traducciones automáticas.

Plantarle cara a las grandes tecnológicas requiere algo más que buenas intenciones, sobre todo cuando el enorme volumen de usuarios diarios que manejan los sistemas de Mountain View aplasta cualquier intento de competir por pura fuerza bruta, lo que obliga a Sarvam a jugar la carta de la especificidad: prefieren dominar un mercado regional hipercomplejo a ser mediocres mundialmente.

Aquí debe entrar en juego nuestro pragmatismo al analizar unos números que no dejan de ser pruebas de laboratorio donde no hay rastro de métricas exactas, requisitos de hardware ni precios; en un mercado que ya alerta sobre el agotamiento inminente de los chatbots masivos, colgarse medallas de victoria usando test internos genera dudas totalmente razonables.

Todo este concepto de inteligencia artificial construida por y para los locales vende muy bien sobre el papel, pero la verdadera prueba de fuego será la implantación real en las oficinas de la India; vencer a OpenAI en una gráfica promocional resulta relativamente fácil frente al monumental reto de lograr que una empresa confíe su facturación a este nuevo sistema.

Accede a tu cuenta para comentar

Una startup india humilla a ChatGPT y Gemini: su IA entiende lo que ellos nunca podrán

Sarvam AI desafía a los gigantes de Silicon Valley con un modelo de visión y voz ajustado a la complejidad de las 22 lenguas oficiales de la India, prometiendo una precisión inaudita

Promesas de soberanía frente al músculo de Silicon Valley

Noticias destacadas

La AEMET avisa de un nuevo giro del tiempo en España: llega un "veranillo" con temperaturas de 30 grados

EE UU desestima el recurso del Gobierno y autoriza el embargo de bienes de la selección en el Mundial

Regularización de inmigrantes: un defecto grave podría anular el proceso

Cuestión de ética: en Moncloa hay quien piensa que Begoña Gómez se pasó de lista