Sandra Ospina-Garcés,
Marcia Ramírez-Sánchez y
Efraín De Luna
(Editores).
Manual de Morfometría (o algún otro titulo conveniente)
Sección 1 Introducción, Protocolo y Definiciones.
cap 1. Introducción.
Sección 2: Los datos y las variables, Ajustes y Comparación.
Sección 3: Los métodos estadísticos.
Sección 4: Aplicaciones. Estudios de caso. Para los capítulos de esta sección, se invitan colaborador@s. Desea colaborar? Bienvenid@! Registrese para poder publicar aqui.

27 febrero 2013

Geometría de los espacios morfométricos

Los datos y las variables
La matriz de datos contiene los valores de los descriptores numéricos de la forma y tamaño (n hileras) expresados en función de un conjunto de variables (columnas).

Si las variables morfométricas son "distancias" entre marcas, la matriz representa una colección de vectores (row vectors) que configura una nube de objetos o puntos (N) en un espacio Euclidiano. Si las variables son las "coordenadas cartesianas" de marcas, entonces un objeto es una colección de vectores (un tensor) y la colección de objetos configura una nube de puntos (tensores) en un espacio Riemanniano curvo.

En ambos casos, los objetos o muestras son puntos posicionados en un espacio multidimensional definido por los "vectores base" (basis vectors).  La diferencia entre un par de objetos es una distancia entre dos puntos. Cuando los ejes base son las distancias entre marcas, la diferencia es la distancia Euclidiana entre objetos. Cuando los ejes base son las coordenadas cartesianas, la diferencia entre objetos se mide con las distancias Procrustes. El calculo de las distancias entre puntos se basa en el teorema de Pitagoras para la estimación de la hipotenusa de algún triángulo rectángulo implícito. Para esto se requieren ejes ortogonales que funcionen como catetos en ese triangulo.

Geometría del espacio de las distancias entre marcas.

Los ejes base del espacio Euclidiano configurado por las "distancias" como variables característicamente son oblicuos entre si (no ortogonales). La matriz de correlaciones provee un diagnóstico de las relaciones angulares entre ejes base. Además los ejes no son homogéneos por el efecto de distintas escalas de medición de distancias entre marcas. La dispersión en la nube de objetos tampoco es homogénea en la dirección de cada variable.  La heterogeneidad de las varianzas es un indicador de esta dispersión. Dadas estas características geométricas, el espacio de configuración debe ser ajustado para encontrar nuevos ejes ortogonales para la estimación de distancias entre objetos como la hipotenusa de un triángulo rectángulo.

El procedimiento de ajuste se denomina "eigenanalisis" y generalmente consiste en transformar, ortogonalizar, normalizar, centrar y rotar ejes base. Como resultado se genera un nuevo sistema de ejes base ortogonales, cuyo origen es el centro de la nube de datos. El objeto promedio ahora es el  nuevo origen del sistema de coordenadas de posición del resto de los objetos. Los valores en cada celda de la matriz de configuración son modificados a nuevos valores (scores). En la matriz ajustada el numero de hileras y el numero de columnas permanece sin cambio. En la nube de puntos, la posición relativa entre objetos tampoco se ha modificado.

Geometría del espacio de las coordenadas cartesianas.

Los ejes base del espacio Riemanniano configurado por las "coordenadas" de marcas como variables son ortogonales por su origen como coordenadas rectangulares. Por la misma razón, los ejes base son homogéneos, pues no hay diferencia de escala. El espacio de configuración definido por las coordenadas cartesianas se denomina "espacio de Kendall".  La idea central del espacio de Kendall es que un objeto (n=1) registrado por una configuración de varios puntos (p, marcas y/o semimarcas) matemáticamente se representa como un punto en el espacio de Kendall (Bookstein 1996).

El espacio de Kendall es un espacio matemático que contiene un conjunto de "n" objetos en "k" dimensiones (2D o 3D) y descritos numéricamente con diferentes configuraciones de "p" puntos. Este espacio no es Euclidiano, es un manifold Riemanniano curvo (Mitteroecker & Huttegger 2009).  Este espacio se denota algebraicamente con el símbolo "sumatoria para p y k" dibujarlo o insertar.  Las características geométricas del espacio de Kendall pueden imaginarse a partir del caso más sencillo de una configuración de coordenadas cartesianas 2D "x,y" (k=2) para tres marcas (p=3). Cuando los objetos son definidos en términos de tres puntos (p=3) en dos dimensiones (k=2), el espacio de Kendall es un sector de una esfera con los objetos representados como puntos (n) en la superficie curva.

Cuando se usan configuraciones de más de tres puntos el espacio de la forma se vuelve mas complicado (O`Higgins xxxx).  Ademas, cuando los objetos están descritos con coordenadas 3D "x, y, z" (k=3), los espacios matemáticos son todavía "substancialmente más complicados" (Goodall 1992, Rohlf 1996). El espacio de Kendall es una superficie curva de la clase de objetos geométricos denominados toros. Se usa la notación n-toro para definir la dimensionalidad. La superficie de una dona es un 3-toro embebido en un espacio tridimensional. El espacio de este toro simple es generado por la rotación de un circulo. En el caso de las configuraciones de coordenadas cartesianas, para "p" puntos (marcas o semimarcas) el espacio de Kendall es un toro complejo, (p-2)-toro, construido por el producto Cartesiano de esferas. Las propiedades matemáticas de este espacio son "sorprendentemente complejas" (Rohlf 1996).

-----
Ajuste de las Coordenadas cartesianas en el espacio de un objeto y coordenadas cartesianas en el espacio de todos los objetos

Imaginemos que un punto (n) sobre una hiperesfera es el tensor correspondiente a una configuración de las marcas de un objeto. La ubicación del punto es referida con los valores de las coordenadas rectangulares en el plano xy del objeto. Imaginemos las coordenadas de los puntos de un objeto referido a la esquina inferior izquierda de una hoja de papel rectangular. La configuración de un segundo objeto define otro punto sobre la hiperesfera en una ubicación diferente. La localización de ambos puntos (n=2) no es en términos de las coordenadas de la hiperesfera, sino respecto al origen (x=0, y=0) en los sistemas rectangulares locales a cada objeto. Imaginemos las coordenadas de los puntos de varios objetos referidos a la esquina inferior izquierda de cada hoja de papel rectangular, dispersas sobre la superficie de una gran esfera.

La colección de objetos registrados con configuraciones de marcas constituye una nube de puntos sobre la superficie curva de un sector en la hiperesfera. Parte de la dispersión en esta nube de puntos se debe a que los valores de las marcas de cada objeto están referidos diferentes sistemas de coordenadas locales.  El mismo objeto (misma forma) pero registrado en diferente posición respecto del origen de los ejes "x,y" tendrá valores diferentes en las coordenadas de cada marca. Por lo tanto este espacio de configuracion debe ser ajustado para generar un sistema de coordenadas comun para referir todos los objetos respecto al mismo origen. En este espacio ajustado, dos diferentes configuraciones del mismo objeto se ubicarán en la misma posición habiendo eliminado los efectos de dos juegos de valores referidos a coordenadas locales.

El procedimiento de ajuste del espacio de Kendall consiste en varios métodos alternativos de Superposición. En general el ajuste de la matriz de configuraciones consiste en centrar y rotar ejes base para estandarizar los valores de las coordenadas y eliminar las diferencias debido a localización, rotación y tamaño de los objetos. El resultado es un nuevo sistema de coordenadas con centro y origen ("x=0, y=0") común para referir la ubicación de todos los objetos. Usualmente esta es una estandarización centrada en la configuración de la forma promedio. La matriz de coordenadas ajustadas por superposición contiene el mismo numero de hileras y de columnas "x,y". Los valores de las coordenadas ajustadas son diferentes pues ahora son referidos respecto a nuevos ejes, dependiendo del método de superposición. En este espacio curvo ajustado (Kendall shape space), la distancia entre puntos es indicadora de diferencia entre formas. Dos objetos con forma idéntica ocuparán el mismo punto en este espacio.

Bookstein FL. 1996. Biometrics, biomathematics and the morphometric synthesis. Bull. Math. Biol. 58(2):313–65 [CrossRef] [ISI]
Mitteroecker P & SM Huttegger. 2009. The concept of morphospaces in evolutionary and developmental biology: Mathematics and metaphors. Biological Theory 4: 54-67.
O´Higgins, P. O. xxxx. Chp 4. Methodological issues in the description of forms. En: P. E. Lestrel (ed). Fourier descriptors and their applications in Biology. Cambridge University Press. pp 74-105.
Rohlf, F. J. 1996. Morphometric spaces, shape components and the effects of linear transformations. En: L. F. Marcus & al (eds). Advances in Morphometrics. Pp 117-129.




No hay comentarios.:

Publicar un comentario

Preguntas, aclaraciones y/o correcciones, bienvenidas. Muchas gracias.