Actualmente, los inventarios de recursos naturales (ya sean en forma de listados y/o o de sus representaciones espaciales) son almacenados en bases de datos. Una vez allí depositadas, muchos investigadores hacemos uso de ellas con vistas a elaborar análisis numéricos, detectar patrones espaciales, cuantificar diversidades, implementar sistemas de modelización numérica, etc. Sin embargo, la calidad de los resultados obtenidos (y como corolario, de las publicaciones derivadas de ellos) son muy variables. En ocasiones, los científicos ofrecen productos excelentes, en otras verdadera basura, incluso trabajando con un mismo producto. ¿Cuál es la razón? En este post daremos cuenta de ella, así como de la escasa fiabilidad de los productos realizados por expertos que (i) no proceden de las mismas disciplinas que los que realizaron tales inventarios, y/o (ii) no han profundizado en la calidad de los mismos. Por estas razones, las denominadas metabases de tatos comienzan a ser demandadas con urgencia.  

 

 

 

Riqueza en Edafotaxa al segundo nivel de la FAO (1988), para

Espacios geográficos anidados y muestreados a distintas Escalas

 (Después de Ibáñez et al. 2003)

 

La mayor parte de las bases de datos actuales adolecen de numerosos problemas, tanto más cuando se han elaborado por armonizaciones de otras previas procedentes de diversas iniciativas institucionales. Son varias las razones que generan tales deficiencias, no siendo imposible detallar todas, por lo que expondremos tan solo algunos casos concretos.  

 

Por un lado, resulta moneda común que los expertos deban armonizar las bases de datos elaborados por diferentes escuelas (distintas metodologías, taxonomías, etc.), procedentes de inventarios elaborados a distintas escalas (lo cual suele conllevar diferentes intensidades de muestreo en el espacio y/o el tiempo) y finalizadas en diferentes épocas (unas son más antiguas en decenios que otras, por lo cual fueron realizadas con distintas instrumentaciones y conocimientos del recurso en cuestión por parte de los expertos).

 

Las denominadas metabases de datos, contienen la información pertinente, con vistas a que el usuario entiendan la procedencia, edad, metodología, etc., etc. de la base de datos. Sin su lectura y comprensión detallada no es posible, con harta frecuencia, explotarlas adecuadamente. Dicho de otro modo, se desconocerían sus incertidumbres y limitaciones. Por esta razón, resulta cada vez más habitual que las bases de datos comiencen a presentarse con sus correspondientes metabases de datos. Tras leer una abundante literatura sobre el tema, y participar como coautor en EUSIS hasta este año (Sistema de Información de Suelos de la UE), he observado que su uso por expertos de otros campos, sin asesoramiento de profesionales cualificados en las materias en que versan tales compilaciones, dan lugar a publicaciones cuyas conclusiones adolecen de graves errores. Se trata de un serio problema cuando, por ejemplo, se intentan implementar modelos numéricos con información de diferentes recursos naturales. En estos casos, los analistas transdisciplinares, o incorporan a expertos de las disciplinas implicadas, o corren el  riesgo de generar un producto de escasa calidad y confundentes para sus potenciales lectores.

 

Hablemos de dos casos concretos. El primero se ha extraído del estudio de la edafodiversidad, mientras que el segundo compete a la biodiversidad. Así, por ejemplo, cuando se trabaja con bases de datos o cartografías edafológicas, se procede mediante un modelo de generalización cartográfica y taxonómica que tienden a ir eliminando los edafotaxa que cubren menos extensión conforme disminuye la escala. Del mismo modo, la densidad de muestreo resulta ser de suma importancia: usualmente no se detectará la misma edafodiversidad con una densidad de muestreo baja (pocos tipos de suelos) que con una alta (es muy probable que aparezcan nuevos suelos). Desde este punto de vista, se debe ser cauto a la hora de comparar la diversidad de edafotaxa procedente de distintas áreas y realizadas por distintos autores, etc., etc. Por ejemplo, para la implementación de EUSIS a la Escala 1:1.000.000, se compilaron las bases de datos de todos los países de la UE. Al margen de haber sido realizados usando diferentes metodologías y con una gran disparidad de recursos técnicos y económicos, unas procedían por escalamiento ascendente (generalización) de bases de datos detalladas (Holanda, Bélgica, etc.), semidetalladas (UK, Francia, etc.) o de la propia 1:1.000.000 (lamentablemente el caso de España y algunos países más: denominadas groseras o de grano grueso). Este hecho suele generar una clara tendencia a que el número de edafotaxa descienda de las primeras a las últimas. De este modo, jugar con los datos en bruto puede acarrear llegar a resultados incorrectos. Por el contrario, reelaborar aquellos, utilizando la metabase de datos permite, al menos, corregir una buena parte de los sesgos que padecen.      

 

El la Figura que incluimos al principio del post, se muestra el efecto de las escalas en los estudios de edafodiversidad. Se trata de análisis “parcialmente” anidados de cartografías realizados en Europa desde una escala 1:20.000 de un pequeño segmento del continente a otra 1:1.000.000 de su globalidad. Como puede observarse, una pequeña porción de paisaje muestreado a una escala detallada puede detectar casi el mismo número de tipos de suelos que el que se muestra para el conjunto de la Europa (se utiizaron tan solo los grupos principales de la FAO de 1988).  La información más fina procede de un cuadrado de 20 km2 que fue cartografiada a la escala descrita en la figura por este impresentable administrador durante su Tesis Doctoral. Resumiendo, escala y densidad de muestreo deben ser tenidas muy en cuenta, como también ocurre en el ámbito de la biodiversidad. 

 

En la figura de abajo, mostramos como las estimas del número de especies detectadas en una misma localidad incrementan conforme aumenta el número de años muestreados. La mayor parte de los inventarios de biodiversidad se basan en campañas que, a lo sumo, duran una estación o un año. Por tanto, estas últimas tan solo ofrecen subestimaciones y no pueden ser comparadas directamente con las obtenidas en Estaciones Experimentales (como en el caso del gráfico), cuya biodiversidad se ha monitorizado a lo largo de décadas. Por tanto, las metabases de datos son necesarias con vistas a elaborar productos que tengan un mínimo de rigor. De no hacerlo así, suele generarse un sesgo que prima la “elevada biodiversidad” de los países que tienen productos más precisos y de mayor calidad respecto a los que no disfrutaron de tales ventajas. Empero los resultados muestran el que hacer de los científicos y no lo que denominamos coloquialmente “la verdad terreno”.

 

 

 

Incremento del Número de especies vasculares

detectadas en un campo abandonado de Illinois

durante 40 años de monitorización.

Fuente: Cox & Morre,Biogeography.2000; Blacwell.

 

De todo ello, debemos advertir al lector que tenga mucho cuidado con lo que se lee en la literatura científica, ya que con harta frecuencia los investigadores no han tenido en cuenta todo lo dicho con anterioridad.  Del mimo modo alertamos al experto que las bases de datos que no contienen tales metabases hay que considerarlas como “peligrosas”. Lo que ocurre es que tales productos suelen ser un tostón y algunos Imprudentemente soslayan leerlas.  Luego pasa lo que pasa ¿verdad?.

 

Juan José Ibáñez

Compartir:

2 comentarios

  1. Hola!, buen día, mi nombre es roman soriano, soy alumno del diplomado en bases de datos que se imparte en la Universidad Autónoma de Puebla, el tema de mi tesis es: Desarrollar un sistema de base de datos que gestione información relacionada con los factores de contaminación del medio ambiente… Estoy definiendo los alcances y resultados que se esperan de este sistema, sin embargo deseo limitar el trabajo para que pueda ser realizable y no se quede sin implementar…

    Me gustaria recibir alguna observación o consejo…

    Gracias y hasta pronto!!

  2. Román, desgraciadamente recibo muchas peticiones de este tipo que no puedo atender ni aun si trabajara a tiempo completo para esta weblog. Y no es el caso no le puedo dedicar más que unas dos o tres horas diarias.

    Lo lamento de verdad. Mucha suerte

    Juanjo Ibáñez

Deja un comentario