De un tiempo a esta parte se escucha con insistencia en distintos foros, más o menos tecnológicos, que “data is the new oil”. La frase es afortunada, pese a su aparente simpleza, y ya que a base de peinar canas he acabado por conocer casi todas las derivadas de la industria de los datos -a la que me dedico desde hace más de 40 años- he invertido un tiempo en analizar la estructura de la industria del petróleo a la caza de paralelismos. Las conclusiones son cuanto menos curiosas.

Finales del siglo pasado. Mr. 5% (apelativo porcentual de Galouste Gulbenkian) organiza la propiedad de los yacimientos y el transporte del crudo. Ha pasado mucho tiempo, pero es el momento en el que nacen las primeras petrolíferas tal y como hoy las conocemos. Desde el principio se crean las tres divisiones que aún perviven: upstream (desde la exploración hasta la extracción), midstream (actividades logísticas y de trading)  y downstream (fase final, del refino a la distribución). Lo mismo sucede en los datos: recogida/collectdataquality/almacenamiento y explotación.

Esta división gana en complejidad con la llegada de la diversificación, las energías sostenibles o los derivados del petróleo (los plásticos, sin ir mas lejos). Sin embargo, las tres fases de actividad son comunes en todas las petrolíferas integrales. También hay empresas que sólo se dedican a alguna de las parcelas, pero son normalmente outsourcers de las grandes operadoras.

El valor añadido es enorme a lo largo de la cadena y su peso en las economías, también.

No menos compleja es a día de hoy la industria de los datos, de la que sólo se puede hablar a partir de la expansión de los ordenadores, apenas hace cuarenta años. La llegada de internet supuso un avance espectacular que se ve  acelerado por el acceso mobile. El próximo ‘empujón’ vendrá de la mano del Internet de las Cosas.

Mas allá, el futuro es casi imposible de prever. Lo mismo que el Sr. Rockefeller no pudo imaginar que el petróleo teñiría la industria de los medios de pago o que aceleraría el transporte marítimo mientras se convertía en santo y seña de las grandes farmacéuticas.

Mirando hacia atrás constatamos que hace pocas décadas pocos eran los que poseían una tarjeta de crédito, y las que circulaban se empleaban para ser pasadas por las míticas “bacaladeras”. En los ochenta, Telefónica mecanizó su ‘Fichero General de Abonados’ y, años más tarde, la Tesorería de la Seguridad Social hizo algo similar con los tc1 y tc2. Hay que esperar al cambio de siglo para que Hacienda rehaga el Catastro con medios informáticos (hasta entonces era cosa de registradores de la propiedad y de delineantes). Gracias a estas macrobases de datos España puede presumir de contar con una buena IDE (infraestructura de datos espaciales) a la que referir la mayoría de los recientes desarrollos. En nueve de cada diez países las cosas son mucho mas precarias, ya que es difícil encontrar relaciones univocas e inequívocas entre datos de diferente procedencia y, por tanto, la validación es insegura, por ejemplo, en lo concerniente a la identidad de un cliente.

No ha pasado tanto desde aquel tiempo en que el mundo del software y el de la gestión se daban la espalda. Por un lado se hablaba de bases de datos relacionales, de datawarehouse, de dataminning, de almacenamiento… De otra parte estaban los impuestos, los procesos electorales, los crm, billing. Las audiencias, meros porcentajes de share, eran clasificadas de un modo impreciso -Alta, Media-Alta, Media-Media y Media-Baja (la Baja no existía). Hoy no hay distinción entre ambos territorios de forma que tampoco podríamos hablar de refino sin tener en cuenta el tipo de crudo o el mix diesel/gasolina en cada país.

Los orígenes de los integrantes de la industria de datos son diversos: informáticos, contables, telecos, médicos, estadísticos, marketinianos, periodísticos, y hasta políticos. Nadie quiere ni puede estar fuera. En el mundo del petróleo debió de suceder lo mismo.

Hay un factor diferencial: la velocidad de adopción. En más de un siglo sólo consume derivados de los hidrocarburos para transporte la mitad de la humanidad. En sólo veinte años consume y genera datos un porcentaje del planeta sensiblemente mayor. En zonas dispersas, por orografía o población, sobre todo en América Latina y África, es frecuente localizar lugares donde solo es posible hacerse con gasoil en bidón, pero no tendremos problema en que alguien nos preste su teléfono móvil si el nuestro se ha quedado sin batería. Setas tecnológicas que pronto serán smartphones. Parece que el ser humano ha priorizado la comunicación frente a la energía.

Las consecuencias de otro rasgo distintivo son más impredecibles. El petróleo hay que buscarlo, extraerlo, transportarlo… Los datos son generados por humanos o por las máquinas que hay a su servicio. La cadena de valor -añadido- va a ser muy diferente. ¿Serán los datos una commodity? ¿Dónde estará entonces esa cadena de valor, las barreras del mercado que hacen que la oferta sea escasa? Ni siquiera la tecnología tiene barreras de entrada. Si la década pasada irrumpíael software libre, la actual vive bajo el reinado del cloud computing. Algo nuevo ha cambiado las reglas del juego en los imperios del software y el hardware; hechos que no han sucedido nunca en más de un siglo de industria petrolera.

Los hallazgos vinculados al petróleo han cambiado nuestras vidas: plásticos, fertilizantes, gas e incluso las gasolineras como ejemplo por de comercio de proximidad. En la industria del dato ha sucedido algo parecido; avances en la verificación de la identidad, en la fiscalidad, en las relaciones humanas gracias a haber intensificado la comunicación, en los medios de comunicación cambiando el modelo publicitario; se ha economizado drásticamente la interrelación de las empresas e instituciones con los clientes o ciudadanos. En realidad, el conjunto de lo que vimos hace poco más de los antes mencionadoscuarenta años ya esta desfasado, y todo por culpa de los datos.

Permítame el lector un último paralelismo entre ambos campos, y es que las dos industrias han generado sus propios enemigos. El petróleo se rodea de una nube, valga la redundancia, en la que asoman la huella de carbono, las renovables, los lobbies o la fiscalidad medioambiental. Los datos no pierden comba: protección de la privacidad, anonimización, cookies, consentimiento, la gran conversación global que son las redes sociales… Están aquí para quedarse. Así lo demuestra el nuevo Reglamento Europeo que obliga a la administración y a muchas empresas a contar en sus filas con un Delegado de Protección de Datos, una especie de delegado de los trabajadores, pero sin rango sindical. Una figura que reportará al primer ejecutivo (o cargo público) al estilo de los representantes que en Alemania ocupan un sillón en los Consejos de Administración.

Si subimos un peldaño y oteamos, Europa pretende pararle los pies aEstados Unidos en estos temas. En la emisiones no se ha logrado un compromiso realmente consensuado a gran escala. No sé si lo conseguiremos con los datos.  Leemos y escuchamos que en Internet no habrá autoridad,  ni estados, ni gobiernos.  Esperemos que en los datos al menos nos ayuden a autocontrolarnos.

Antonio Romero Sanchiz; presidente de DataCentric