Morfometría Descomplicada: Matriz de datos

Estructura de la matriz de distancias

Convencionalmente cada objeto o espécimen (Pn) es descrito por una colección de números arreglados en una hilera de la matriz de datos ("row vector"). Las columnas de la matriz son las variables (v), las cuales definen los ejes, el tipo de algún espacio geométrico y su dimensión. El numero de dimensiones "k" en principio es igual numero de variables o ejes de ese espacio. Cada longitud y ancho medido es una columna. Geométricamente cada columna define los ejes base de un espacio multivariado. El orden de las columnas no cambia las características cuantitativas de la matriz ni las propiedades geométricas de la nube de datos en el espacio multidimensional.

Para ilustrar los ejemplos de las dos matrices que siguen, consideremos seis objetos, a los que llamaremos "pentagonoides" (Fig. 2.31. p 49, Banchoff & Werner, 1991)

Primero precedemos a medir las longitudes de cada lado empezando desde el punto etiquetado con un "1". La sexta distancia medida es entre el punto "6" y el punto "4". En cada "pentagonoide" el punto "6" lo ubicamos a la mitad del lado definido por los puntos "1" y "2". Los seis valores medidos en centímetros en ese orden son mostrados en la siguiente matriz de distancias.

Matriz de distancias para seis pentagonoides (n=6, v=6)
a 18 18 18 18 18 27
b 30 30 20 35 20 37
c 25 11 28 18 20 22
d 18 18 18 18 18 27
e 29 10 23 25 12 17
f 25 25 34 18 34 45

Estructura de la matriz de coordenadas Cartesianas

El registro de coordenadas Cartesianas con el programa tpsDIG genera archivos de números en un bloque para cada objeto. Este arreglo por lo tanto se conoce como "formato TPS". El formato alternativo es en hileras, donde convencionalmente cada objeto o espécimen (Pn) es descrito por una colección de pares o trios de coordenadas de puntos arreglados en una hilera de la matriz de datos. Las columnas de la matriz son pares (x, y) o trios de variables (x, y, z), las cuales definen los ejes base de un espacio geométrico y su dimensión. El numero de dimensiones "k" en principio es igual numero de puntos por el numero de coordenadas registradas del objeto físico (2D o 3D). Cada punto registrado son dos o tres columnas, cuyo orden registra las relaciones geométricas entre puntos. Por lo tanto el orden de las columnas es muy informativo.

Con los mismos seis "pentagonoides", ahora procedemos a registrar las coordenadas Cartesianas de cada punto del "1" al "5". Para cada figura, las coordenadas "0, 0" son el cruce de los dos ejes abajo a la izquierda. Registrados así, los valores de las coordenadas "x, y" para cada punto, para cada figura son los que se presentan en la siguiente matriz:

Matriz de coordenadas Cartesianas 2D para seis pentagonoides, en el formato TPS (n=6, v=10)
LM=5
74.00000 325.00000
241.00000 447.00000
411.00000 326.00000
347.00000 129.00000
135.00000 131.00000
IMAGE=pentagonoide1.jpg
ID=0
LM=5
97.00000 328.00000
435.00000 452.00000
771.00000 329.00000
638.00000 132.00000
223.00000 132.00000
IMAGE=pentagonoide2.jpg
ID=1
LM=5
318.00000 343.00000
614.00000 465.00000
657.00000 343.00000
395.00000 146.00000
184.00000 148.00000
IMAGE=pentagonoide3.jpg
ID=2
LM=5
396.00000 279.00000
273.00000 110.00000
75.00000 175.00000
76.00000 381.00000
275.00000 444.00000
IMAGE=pentagonoide4.jpg
ID=3
LM=5
82.00000 352.00000
246.00000 636.00000
419.00000 686.00000
356.00000 423.00000
145.00000 220.00000
IMAGE=pentagonoide5.jpg
ID=4
LM=5
120.00000 564.00000
289.00000 809.00000
456.00000 563.00000
391.00000 167.00000
183.00000 173.00000
IMAGE=pentagonoide6.jpg
ID=5

Preparación de la matriz.

Una vez que se ha colectado una serie de observaciones en un grupo de especimenes (nA), el primer paso es disponer los valores en un formato que los programas estadísticos puedan leerlos. La matriz de datos usualmente debe prepararse de manera que las columnas correspondan a las variables y las hileras a los “n” datos.

Cuando los análisis planeados consisten en la comparación de promedios de grupos a priori, cada hilera debe identificarse a que grupo pertenece. La asignación de las observaciones en grupos (muestras de A y B) se efectua al insertar una o dos columnas clasificatorias en la matriz de datos. Este tipo de columnas no son variables reales (“dummy”) por lo que no modifican la dimensión de la matriz de datos.

La membresía de grupos se identifica en la mayoría de los programas estadísticos con códigos alfanuméricos. Por ejemplo, en el caso de dos grupos a comparar (A, B) con 20 especimenes de cada uno, una columna contendrá los códigos "0" o "1", lo cual indicará la membresía de cada hilera a los grupos A o B.

Banchoff T. & J. Wermer. 1991. Linear algebra through geometry. Undergraduate texts in Mathematics. Springer, NY

Morfometría Descomplicada

13 septiembre 2019

Matriz de datos

No hay comentarios.:

Publicar un comentario