Uso de los Análisis de Variables Canónicas (CVA)
Los Análisis de Variables Canónicas de la varianza particionada por grupos (CVA) se usan para explorar la separación de grupos definidos a priori. Cuando son dos grupos los análisis se conocen como “análisis discriminantes” y son “funciones discriminantes múltiples” o “Análisis de Variables Canónicas” cuando son más de dos grupos (Lattin et al., 2003). El objetivo del análisis es tomar “v” variables X1, X2, X3, …, Xv en “g” grupos predefinidos y encontrar funciones (combinaciones lineares) de estas que producen ejes CV1, CV2, CV3, …, CVg-1 los cuales maximicen la distancia entre los promedios de los grupos (Manly, 1986; Kachigan, 1991; Carroll y Green, 1997; Lattin et al., 2003). La primera función CV1 se selecciona en la dirección que maximiza la “proporción F” de la varianza entre grupos dividida sobre la varianza dentro de los grupos. El grupo más diferente es separado en la dirección del CV1. Cada función CV siguiente maximiza la distancia entre los grupos restantes en una dirección diferente de los ejes CV previos. El par de promedios más cercanos define la dirección del último eje. Entonces para “g” grupos existen un máximo de “g-1” ejes. Las diferencias entre los promedios evaluadas con la “proporción F” pueden ser o no significativas en cada uno de los ejes. Por ejemplo, el último eje muy probablemente no sea significativo cuando el valor de la proporción F es bajo (F<2.0) y la distancia entre los dos promedios es muy pequeña. Por eso sólo cierto número de ejes se califican como “ejes significativos”. En el CVA la orientación de cada eje sucesivo rota a diferentes ángulos. En una rotación rígida, todos los ejes rotan con el mismo ángulo, cualquiera que sea el valor, por lo cual la posición relativa de cada punto en la nube de datos se conserva. En cambio, en el CVA, dado que dependen de la posición de los promedios, la rotación de los ejes discriminantes no es rígida. El ángulo de rotación de un eje es independiente del ángulo de la rotación de los otros ejes, por lo que no necesariamente son ortogonales y la dispersión relativa de la nube de puntos se distorsiona. Por esta razón las varianzas explicadas por cada eje discriminante no se suman. En este espacio no ortogonal, la separación entre promedios se calcula con la distancia de Mahalanobis. La fórmula para esta hipotenusa pondera la desviación de ortogonalidad usando las covarianzas entre todos los ejes del CVA considerados como catetos (Manly, 1986; Fielding, 2007).
En la aplicación en sistemática, el análisis discriminante y el CVA permiten detectar cuáles son las mediciones lineales que más contribuyen a la distinción entre grupos, dado que los ejes son en la dirección donde existe mayor separación entre promedios de los grupos (Campbell y Atchley, 1981; Reyment et al., 1984). Un buen ejemplo de la aplicación de los PCA y CVA es el estudio de la variación en tres especies de arbustos del género Cestrum L. (Solanaceae, Del Castillo-Batista et al., 2017). No obstante, en la literatura taxonómica se razona erróneamente que el PCA identifica esos caracteres importantes. Cuando los datos son coordenadas, se razona de manera similar cuando se interpretan los resultados del PCA de la forma. Por ejemplo, los datos de coordenadas de la forma de las hojas se usaron para análisis de “relative warps” (PCA) en especies de helechos del género Ophioglossum L. (Magrini y Scoppola, 2010). Los autores usaron erróneamente las deformaciones del PCA para ubicar diferencias diagnósticas entre especies: “The graphical outputs of the PCA of outlines show the differences between the three species, confirming shape and base of the leaf as the main diagnostic characters”. Lo cierto es que sólo el CVA y el MANOVA asociado calculan la ubicación y magnitud del cambio de forma entre grupos (Webster y Sheets, 2010; Zelditch et al., 2012). Aun suponiendo que las diferencias en forma se estimaran igual, sólo el CVA podría identificar si esas diferencias en forma son significativas o no entre especies.
Igualmente, los PCA a partir de las mediciones informan sobre la dimensión de la varianza generalizada pero no informan sobre la estructura de la varianza entre y dentro de grupos. Las variables con mayor varianza entre especímenes “v1” pueden ser diferentes de las variables “v2” que tienen una varianza mayor entre grupos de especímenes. En el estudio citado de la variación en tres especies de Cestrum, el PCA identificó el largo de la porción libre del filamento como el carácter más variable entre todos los especímenes. Pero el CVA identificó la porción adnada del filamento como el carácter de mayor importancia en la discriminación de especies (Del Castillo-Batista et al., 2017).
Del mismo modo, en el estudio de dos especies de musgos del género Braunia Bruch & Schimp., el PCA indicó que los caracteres con el mayor peso absoluto en el PC1 fueron el ancho de urna de la capsula y la longitud de la lámina de hoja. Pero el CVA detectó que la extensión del margen de la hoja revoluta y el largo de las células superiores de la hoja contribuyeron más a la distinción entre especies (De Luna y Gómez-Velasco, 2008). Estos ejemplos ilustran que los PCA a partir de las mediciones no distinguen entre una variable unimodal “v1” con mucha varianza generalizada y una variable multimodal “v2” igualmente amplia, pero con mucha varianza entre grupos y poca varianza dentro de los grupos. Ambos tipos de variables “v1” y “v2” podrían ser las que más contribuyen a la dirección del PC1, por lo que la identificación de los caracteres taxonómicamente importantes sería potencialmente errónea. En cambio, los CVA sí se basan en las variables tipo “v2”, pues esas son las que contribuyen a la diferencia entre grupos. Cuando se hacen los dos análisis, PCA y CVA, es posible que se descubra que los caracteres que tienen más varianza generalizada no sean los mismos que maximizan las diferencias entre grupos, especialmente cuando los grupos son marginalmente diferentes.
En la aplicación en sistemática, el análisis discriminante y el CVA permiten detectar cuáles son las mediciones lineales que más contribuyen a la distinción entre grupos, dado que los ejes son en la dirección donde existe mayor separación entre promedios de los grupos (Campbell y Atchley, 1981; Reyment et al., 1984). Un buen ejemplo de la aplicación de los PCA y CVA es el estudio de la variación en tres especies de arbustos del género Cestrum L. (Solanaceae, Del Castillo-Batista et al., 2017). No obstante, en la literatura taxonómica se razona erróneamente que el PCA identifica esos caracteres importantes. Cuando los datos son coordenadas, se razona de manera similar cuando se interpretan los resultados del PCA de la forma. Por ejemplo, los datos de coordenadas de la forma de las hojas se usaron para análisis de “relative warps” (PCA) en especies de helechos del género Ophioglossum L. (Magrini y Scoppola, 2010). Los autores usaron erróneamente las deformaciones del PCA para ubicar diferencias diagnósticas entre especies: “The graphical outputs of the PCA of outlines show the differences between the three species, confirming shape and base of the leaf as the main diagnostic characters”. Lo cierto es que sólo el CVA y el MANOVA asociado calculan la ubicación y magnitud del cambio de forma entre grupos (Webster y Sheets, 2010; Zelditch et al., 2012). Aun suponiendo que las diferencias en forma se estimaran igual, sólo el CVA podría identificar si esas diferencias en forma son significativas o no entre especies.
Igualmente, los PCA a partir de las mediciones informan sobre la dimensión de la varianza generalizada pero no informan sobre la estructura de la varianza entre y dentro de grupos. Las variables con mayor varianza entre especímenes “v1” pueden ser diferentes de las variables “v2” que tienen una varianza mayor entre grupos de especímenes. En el estudio citado de la variación en tres especies de Cestrum, el PCA identificó el largo de la porción libre del filamento como el carácter más variable entre todos los especímenes. Pero el CVA identificó la porción adnada del filamento como el carácter de mayor importancia en la discriminación de especies (Del Castillo-Batista et al., 2017).
Del mismo modo, en el estudio de dos especies de musgos del género Braunia Bruch & Schimp., el PCA indicó que los caracteres con el mayor peso absoluto en el PC1 fueron el ancho de urna de la capsula y la longitud de la lámina de hoja. Pero el CVA detectó que la extensión del margen de la hoja revoluta y el largo de las células superiores de la hoja contribuyeron más a la distinción entre especies (De Luna y Gómez-Velasco, 2008). Estos ejemplos ilustran que los PCA a partir de las mediciones no distinguen entre una variable unimodal “v1” con mucha varianza generalizada y una variable multimodal “v2” igualmente amplia, pero con mucha varianza entre grupos y poca varianza dentro de los grupos. Ambos tipos de variables “v1” y “v2” podrían ser las que más contribuyen a la dirección del PC1, por lo que la identificación de los caracteres taxonómicamente importantes sería potencialmente errónea. En cambio, los CVA sí se basan en las variables tipo “v2”, pues esas son las que contribuyen a la diferencia entre grupos. Cuando se hacen los dos análisis, PCA y CVA, es posible que se descubra que los caracteres que tienen más varianza generalizada no sean los mismos que maximizan las diferencias entre grupos, especialmente cuando los grupos son marginalmente diferentes.