La IA tiene un idioma favorito para trabajar, y te permite hacer más con menos tokens

0
5

No es novedad que la inteligencia artificial (IA) adapta sus respuestas a múltiples idiomas. Sin embargo, detrás de esta capacidad hay un lado B: su costo, en especial en un escenario en el que cada vez más personas hacen uso de esta tecnología. De hecho, solo ChatGPT cuenta con más de 900 millones de usuarios activos cada semana y más de 50 millones de suscriptores, según datos de OpenAI.

En este contexto, hay un único idioma que podría considerarse más “barato”: el inglés. ¿El motivo? Su arquitectura. En detalle, el 95% de los datos de entrenamiento de los modelos frontera, como GPT-5, Gemini 3.1 y Claude Opus, fueron entrenados en dicha lengua.

Además, la IA no funciona a partir de palabras, sino de tokens. Es decir, si un usuario redacta un prompt en español, el sistema debe primero “traducirlo”, para luego convertirlo en tokens. En este sentido, no todos los idiomas tienen el mismo costo en términos de tokens (y lo importante, aquí, es que las suscripciones tienen un límite de tokens, por lo que reducir su uso hará que podamos aprovechar mejor la plataforma).

Por ejemplo, para ChatGPT la palabra “desarrollador” tiene tres tokens (des-arroll-ador), mientras que “developer” solo cuesta uno. En lo que respecta a Claude, la misma palabra en español equivale a nueve tokens y, en inglés, solo seis, según un análisis del sitio especializado en tecnología Xataka, en el que se utilizó la herramienta Claude Tokenizer.

El 95% de los datos de entrenamiento de los modelos frontera fueron entrenados en inglés

Seguido del inglés, el español es el idioma más eficiente. En concreto, una conversación con Claude Opus 4.7 en español es casi un 30% “más cara”, pero en árabe el costo se eleva en un 76,3%. Todo depende del modelo y su tokenizador.

En el caso de OpenAI, la compañía contaba con una herramienta que utilizaba 1,1 veces menos tokens al hablar con ella en español pero hasta 2,9 veces menos en hindi o 3,5 veces menos en telugu.

El inglés también puede ser más eficiente dependiendo del tipo de tarea que se le asigne a la IA. Por ejemplo, diversos estudios señalan que, si se utiliza dicha lengua para programar, los resultados tenderán a ser mejores. Otras investigaciones también indican que hacer uso de varias lenguas puede contribuir a elevar la capacidad multiidioma de los modelos.

“El prompting multiidioma puede reducir el uso de tokens entre un 20 y un 40% sin que la precisión se vea comprometida, lo que plantea una estrategia simple y efectiva para mejorar la eficiencia de la inferencia sin necesidad de un reentrenamiento”, explica un trabajo realizado por investigadores de Microsoft.

Pero en la realidad, hay otro factor: la caída en los precios de las suscripciones. En este sentido, el sobrecosto del uso de tokens no tiene relevancia para los usuarios comunes. Además, la mayoría aprovecha los planes mensuales, de manera que prevalece una “pseudotarifa plana”.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí