Mining Ultraconserved Elements From Transcriptome and Genome Data to Explore the Phylogenomics of the Free-living Lice Suborder Psocomorpha (Insecta: Psocodea)
Oscar Fernando Saenz Manchola, Ernesto Samacá Sáenz, Stephany Virrueta Herrera, Lorenzo Mario D'Alessio, A. G. García Aldrete, Kevin P. Johnson
{"title":"Mining Ultraconserved Elements From Transcriptome and Genome Data to Explore the Phylogenomics of the Free-living Lice Suborder Psocomorpha (Insecta: Psocodea)","authors":"Oscar Fernando Saenz Manchola, Ernesto Samacá Sáenz, Stephany Virrueta Herrera, Lorenzo Mario D'Alessio, A. G. García Aldrete, Kevin P. Johnson","doi":"10.1093/isd/ixac010","DOIUrl":null,"url":null,"abstract":"Abstract The order Psocodea includes the two historically recognized groups Psocoptera (free-living bark lice) and Phthiraptera (parasitic lice) that were once considered separate orders. Psocodea is divided in three suborders: Trogiomorpha, Troctomorpha, and Psocomorpha, the latter being the largest within the free-living groups. Despite the increasing number of transcriptomes and whole genome sequence (WGS) data available for this group, the relationships among the six known infraorders within Psocomorpha remain unclear. Here, we evaluated the utility of a bait set designed specifically for parasitic lice belonging to suborder Troctomorpha to extract UCE loci from transcriptome and WGS data of 55 bark louse species and explored the phylogenetic relationships within Psocomorpha using these UCE loci markers. Taxon sampling was heavily focused on the families Lachesillidae and Elipsocidae, whose relationships have been problematic in prior phylogenetic studies. We successfully recovered a total of 2,622 UCE loci, with a 40% completeness matrix containing 2,081 UCE loci and an 80% completeness matrix containing 178 UCE loci. The average number of UCE loci recovered for the 55 species was 1,401. The WGS data sets produced a larger number of UCE loci (1,495) on average than the transcriptome data sets (972). Phylogenetic relationships reconstructed with Maximum Likelihood and coalescent-based analysis were concordant regarding the paraphyly of Lachesillidae and Elipsocidae. Branch support values were generally lower in analyses that used a fewer number of loci, even though they had higher matrix completeness. Resumen El orden Psocodea incluye actualmente a dos grupos históricamente reconocidos y que una vez fueron considerados órdenes separados, Psocoptera (piojos de vida libre o de las cortezas) y Phthiraptera (piojos verdaderos). Psocodea está dividido en tres subórdenes: Trogiomorpha, Troctomorpha y Psocomorpha, este último siendo el más grande entre los piojos de vida libre. A pesar de que la cantidad de información disponible sobre transcriptomas y secuenciación del genoma completo (WGS) para este grupo se ha incrementado notablemente en los últimos años, las relaciones filogenéticas dentro de Psocomorpha permanecen poco claras. En este estudio, evaluamos la utilidad de un conjunto de sondas diseñadas específicamente a partir de especies de piojos verdaderos del suborden Troctormorpha, para capturar elementos ultra-conservados (UCE) a partir de las secuencias de transcriptomas y WGS de 55 especies de piojos de las cortezas. Igualmente, exploramos las relaciones filogenéticas dentro de Psocomorpha usando estos marcadores de UCE. El muestreo taxonómico estuvo fuertemente enfocado en las familias Lachesillidae y Elipsocidae, ya que sus relaciones han demostrado ser problemáticas en estudios filogenéticos previos. Como resultado, logramos recuperar exitosamente un total de 2,622 marcadores de UCE, con las matrices de completitud del 40% y 80% conteniendo 2,081 y 178 marcadores de UCE respectivamente. El número promedio de UCE recuperados para las 55 especies fue de 1,401. En promedio, el conjunto de datos de WGS produjo un mayor número de loci de UCE (1,495) que las secuencias de transcriptomas (972). Las relaciones filogenéticas reconstruidas a partir de análisis de máxima verosimilitud y métodos coalescentes fueron concordantes respecto a la parafília de Lachesillidae y Elipsocidae, mientras que los valores de soporte de ramas fueron generalmente más bajos en los análisis que incluyeron menor número de loci aún cuando la matriz de completitud era más grande. Graphical Abstract","PeriodicalId":48498,"journal":{"name":"Insect Systematics and Diversity","volume":"6 1","pages":"1 - 11"},"PeriodicalIF":3.2000,"publicationDate":"2022-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Insect Systematics and Diversity","FirstCategoryId":"99","ListUrlMain":"https://doi.org/10.1093/isd/ixac010","RegionNum":1,"RegionCategory":"农林科学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q1","JCRName":"ENTOMOLOGY","Score":null,"Total":0}
引用次数: 2
Abstract
Abstract The order Psocodea includes the two historically recognized groups Psocoptera (free-living bark lice) and Phthiraptera (parasitic lice) that were once considered separate orders. Psocodea is divided in three suborders: Trogiomorpha, Troctomorpha, and Psocomorpha, the latter being the largest within the free-living groups. Despite the increasing number of transcriptomes and whole genome sequence (WGS) data available for this group, the relationships among the six known infraorders within Psocomorpha remain unclear. Here, we evaluated the utility of a bait set designed specifically for parasitic lice belonging to suborder Troctomorpha to extract UCE loci from transcriptome and WGS data of 55 bark louse species and explored the phylogenetic relationships within Psocomorpha using these UCE loci markers. Taxon sampling was heavily focused on the families Lachesillidae and Elipsocidae, whose relationships have been problematic in prior phylogenetic studies. We successfully recovered a total of 2,622 UCE loci, with a 40% completeness matrix containing 2,081 UCE loci and an 80% completeness matrix containing 178 UCE loci. The average number of UCE loci recovered for the 55 species was 1,401. The WGS data sets produced a larger number of UCE loci (1,495) on average than the transcriptome data sets (972). Phylogenetic relationships reconstructed with Maximum Likelihood and coalescent-based analysis were concordant regarding the paraphyly of Lachesillidae and Elipsocidae. Branch support values were generally lower in analyses that used a fewer number of loci, even though they had higher matrix completeness. Resumen El orden Psocodea incluye actualmente a dos grupos históricamente reconocidos y que una vez fueron considerados órdenes separados, Psocoptera (piojos de vida libre o de las cortezas) y Phthiraptera (piojos verdaderos). Psocodea está dividido en tres subórdenes: Trogiomorpha, Troctomorpha y Psocomorpha, este último siendo el más grande entre los piojos de vida libre. A pesar de que la cantidad de información disponible sobre transcriptomas y secuenciación del genoma completo (WGS) para este grupo se ha incrementado notablemente en los últimos años, las relaciones filogenéticas dentro de Psocomorpha permanecen poco claras. En este estudio, evaluamos la utilidad de un conjunto de sondas diseñadas específicamente a partir de especies de piojos verdaderos del suborden Troctormorpha, para capturar elementos ultra-conservados (UCE) a partir de las secuencias de transcriptomas y WGS de 55 especies de piojos de las cortezas. Igualmente, exploramos las relaciones filogenéticas dentro de Psocomorpha usando estos marcadores de UCE. El muestreo taxonómico estuvo fuertemente enfocado en las familias Lachesillidae y Elipsocidae, ya que sus relaciones han demostrado ser problemáticas en estudios filogenéticos previos. Como resultado, logramos recuperar exitosamente un total de 2,622 marcadores de UCE, con las matrices de completitud del 40% y 80% conteniendo 2,081 y 178 marcadores de UCE respectivamente. El número promedio de UCE recuperados para las 55 especies fue de 1,401. En promedio, el conjunto de datos de WGS produjo un mayor número de loci de UCE (1,495) que las secuencias de transcriptomas (972). Las relaciones filogenéticas reconstruidas a partir de análisis de máxima verosimilitud y métodos coalescentes fueron concordantes respecto a la parafília de Lachesillidae y Elipsocidae, mientras que los valores de soporte de ramas fueron generalmente más bajos en los análisis que incluyeron menor número de loci aún cuando la matriz de completitud era más grande. Graphical Abstract