Skip to content
← volver al blog Read in English

SAP Adquiere Prior Labs y Dremio: La Apuesta de €1.000M por la IA de Datos Estructurados

Filas de datos empresariales estructurados que se disuelven en una red neuronal — modelos tabulares fundacionales para ERP

Dos adquisiciones. Una semana. Un mensaje muy claro del mayor proveedor de software empresarial del mundo: la capa que falta en la IA empresarial no es un modelo más inteligente — es una infraestructura de datos que entienda realmente tus números de negocio.

El 4 y 5 de mayo de 2026, SAP anunció dos operaciones consecutivas: la adquisición de Prior Labs (pioneros de los Modelos Fundacionales Tabulares) y la de Dremio (una plataforma lakehouse abierta para unificar datos SAP y externos). En conjunto, los movimientos representan un compromiso de más de €1.000 millones para cerrar la brecha entre las capacidades de la IA de frontera y los datos estructurados — filas y columnas — que sostienen la economía global. Para cualquier organización que gestione previsiones, inventario, cuentas por cobrar o riesgo en un ERP o una hoja de cálculo, las noticias de esta semana cambian lo que la IA puede hacer por ella.

Qué Construyó Realmente Prior Labs

Prior Labs es una empresa de investigación fundada por Frank Hutter, Noah Hollmann y Sauraj Gambhir — académicos cuyo trabajo sobre TabPFN (Tabular Prior-data Fitted Networks) fue publicado en Nature en 2024 y ha superado los tres millones de descargas en PyPI.

La idea central de TabPFN es elegante: en lugar de entrenar un modelo con tu conjunto de datos empresariales específico (lo que requiere datos etiquetados, ingeniería de características y semanas de trabajo), se entrena un único modelo fundacional sobre cientos de millones de conjuntos de datos tabulares sintéticos que cubren todo el espacio de patrones estadísticos posibles. Cuando después le presentas una nueva tabla — por ejemplo, tu libro de cuentas por cobrar — puede hacer predicciones precisas en segundos, sin ajuste fino, porque ya ha aprendido la gramática subyacente de los datos tabulares.

TabPFN 2.5, la versión pública actual, escala hasta 50.000 puntos de datos y 2.000 características por tabla. TabPFN Enterprise, el nivel comercial incluido en el acuerdo con SAP, añade ajuste fino, razonamiento con contexto, inferencia en tiempo real y razonamiento causal — las capacidades necesarias para pasar de un experimento de ciencia de datos a un flujo de trabajo empresarial en producción.

Por Qué los LLMs No Se Llevan Bien con Tus Hojas de Cálculo

Es tentador asumir que un modelo capaz de superar el examen del bar o de escribir código de producción también puede procesar tu previsión de ingresos. En la práctica, la brecha es enorme.

Los modelos de lenguaje están preentrenados con texto. Cuando encuentran una tabla, la serializan como tokens — colapsando la geometría relacional que da significado a una hoja de cálculo. Los tipos de datos mixtos (fechas, variables categóricas, monedas), los valores faltantes y la semántica específica del negocio (la diferencia entre “neto 30” y “neto 60” en tu columna de AR) se convierten en ruido. El resultado: los LLMs alucinan cifras financieras, pierden el rastro de la importancia de las variables y no pueden producir de forma nativa los intervalos de confianza que un CFO necesita para tomar decisiones.

El propio CTO de SAP, Philipp Herzig, lo resumió con claridad en el anuncio: “La IA empresarial no se estanca porque los modelos no sean suficientemente buenos. Se estanca porque los datos no están listos para los agentes de IA.” Los Modelos Fundacionales Tabulares están diseñados exactamente para esta brecha de preparación — operan sobre los datos tal como ya existen en tu ERP, sin necesidad de transformarlos en texto libre ni de costosos pipelines de etiquetado.

Datos Estructurados: LLM vs Modelo Fundacional Tabular

Modelo de Lenguaje (LLM)

Precisión tabularModerada
Tiempo de configuraciónDías–semanas
Valores faltantesDificultad
Intervalos de confianzaNo fiables
Ajuste fino necesarioCon frecuencia

Modelo Fundacional Tabular

Precisión tabularEstado del arte
Tiempo de configuraciónSegundos
Valores faltantesManejo nativo
Intervalos de confianzaIncorporados
Ajuste fino necesarioZero-shot

Dremio: El Pipeline de Datos que Hace Posible la Predicción

Adquirir un potente modelo de IA tabular resuelve solo la mitad del problema. La otra mitad es obtener datos limpios y unificados en tiempo real. Ahí es donde entra Dremio.

Dremio es un lakehouse abierto nativo de Apache Iceberg diseñado para federar datos de sistemas SAP y externos — Salesforce, Snowflake, ERPs de terceros, archivos de socios — en una única capa consultable sin necesidad de mover ni convertir los datos físicamente. El CTO de SAP lo resumió con precisión: con Dremio, SAP Business Data Cloud se convierte en un lakehouse empresarial donde los agentes pueden consultar todos tus datos en tiempo real, no solo los que residen en las tablas propias de SAP.

La implicación práctica es significativa. Los agentes de IA empresarial fracasan hoy con frecuencia no porque el modelo subyacente sea débil, sino porque no pueden responder de manera confiable preguntas como “¿cuál es nuestro inventario disponible actual en todos los almacenes regionales, neto de órdenes de compra abiertas, actualizado a la última hora?”. Esa consulta toca al menos tres sistemas. Sin un lakehouse que federe esas fuentes bajo un esquema único, el agente tiene que improvisar — e improvisar con datos financieros genera alucinaciones, no decisiones.

Juntos, TabPFN y Dremio forman un stack de dos capas: Dremio garantiza que los datos estén unificados, limpios y consultables; TabPFN los convierte en predicciones precisas y accionables sin un rodeo de entrenamiento de modelos.

Qué Significa Esto para las Empresas que Trabajan con SAP

Las implicaciones inmediatas afectan a las aproximadamente 27.000 empresas que utilizan SAP como sistema de registro. A mediano plazo — SAP proyecta la integración en los próximos dos a cuatro años — estas organizaciones verán predicciones potenciadas por TabPFN integradas de forma nativa en los flujos de trabajo habituales de Business AI:

  • Cuentas por cobrar: puntuaciones de probabilidad sobre el momento de pago de facturas, identificando pagadores con riesgo antes del vencimiento
  • Cadena de suministro: puntuación de riesgo de proveedores con una visión en vivo y federada de los datos de aprovisionamiento
  • Previsión de ventas: predicciones de regresión sobre la conversión del pipeline con intervalos de confianza integrados — sin necesidad de un equipo de data science propio
  • Abandono de clientes: tareas de clasificación sobre la salud del cliente extrayendo datos simultáneamente de CRM, soporte y tablas de uso

La capacidad zero-shot de TabPFN es determinante aquí: la mayoría de los clientes SAP del mercado medio no tienen ingenieros de ML dedicados. Un modelo que funciona con nuevas tablas de inmediato, sin reentrenamiento, pone la predicción de nivel IA al alcance de empresas que hasta ahora dependían de fórmulas de Excel y revisiones trimestrales.

La Señal Más Grande: La Capa de Infraestructura que le Faltaba a la IA Empresarial

Las dos adquisiciones de SAP señalan algo más grande que la hoja de ruta de una sola empresa. Articulan una tesis que gana fuerza en toda la industria: el modelo de frontera no es el cuello de botella; lo es la infraestructura para suministrarle datos empresariales.

Este enfoque cambia la forma en que las empresas deben pensar sus inversiones en IA. Comprar acceso a la API de GPT-5.5 o Claude Opus 4.7 es un comienzo, pero si los datos subyacentes están en silos, inconsistentemente etiquetados o atrapados en esquemas heredados, la salida del modelo será poco fiable. La ventaja competitiva se desplaza hacia quien domine la capa de preparación de datos.

Para las PYMEs que aún no tienen una estrategia formal de IA, este es un momento crítico para auditar no qué herramientas de IA se tienen contratadas, sino en qué estado están los datos. Las empresas que más extraerán de los agentes de IA en 2027 y 2028 son las que hoy invierten en datos limpios, federados y consultables.

En AgentsGT, la plataforma de construcción de agentes que seguimos de cerca, los equipos con resultados más rápidos son casi siempre los que empezaron con la limpieza de datos — normalizando registros de CRM, unificando tablas de inventario, configurando feeds en tiempo real desde sistemas operacionales — antes de añadir la capa de IA. La historia de SAP/Prior Labs es, en esencia, una validación de €1.000 millones de ese enfoque.


¿Quieres evaluar la preparación de datos de tu organización para la IA? El equipo de DDR Innova ayuda a empresas a construir la infraestructura y los flujos de agentes que convierten los datos estructurados en ventaja competitiva. Escríbenos hoy o contacta a info@ddrinnova.com.


Fuentes

Imagen de portada: representación generada por IA de datos empresariales estructurados convergiendo con arquitectura de red neuronal.

Preguntas Frecuentes

¿Qué es un Modelo Fundacional Tabular?

Es un sistema de IA preentrenado específicamente para datos estructurados en filas y columnas, como los que contienen los ERP, los CRM y las hojas de cálculo. A diferencia de los LLMs, que aprenden de texto, los Modelos Fundacionales Tabulares aprenden patrones estadísticos de millones de conjuntos de datos sintéticos y generalizan a nuevos problemas empresariales sin necesidad de reentrenamiento.

¿Por qué los LLMs no manejan bien los datos empresariales estructurados?

Los LLMs están preentrenados con texto. Cuando encuentran una tabla, la serializan como tokens, perdiendo la geometría relacional que da sentido a los datos. Los tipos de datos mixtos, los valores faltantes y la semántica específica de cada negocio se convierten en ruido, lo que genera alucinaciones numéricas y predicciones no confiables.

¿Qué implicaciones tiene la adquisición de Prior Labs para las empresas que usan SAP ERP?

A mediano plazo, los usuarios de SAP verán predicciones potenciadas por TabPFN integradas directamente en sus flujos de trabajo habituales: probabilidades de retraso en pagos, riesgo de proveedores, pronóstico de ventas con intervalos de confianza — sin necesidad de un equipo de ciencia de datos propio.

¿TabPFN es de código abierto?

Sí. TabPFN seguirá siendo de código abierto bajo la estrategia actual de Prior Labs. La adquisición por parte de SAP no cambia la disponibilidad pública del modelo base, aunque los niveles empresariales — ajuste fino, inferencia en tiempo real y razonamiento causal — continuarán como productos comerciales.

Compartir