Les logiciels de comparaison de séquences
accueil > logiciels de SVT > comparaison de séquences
Les formats de fichiers sont généralement simples et facilement convertibles d'un standard à un autre. Les anciennes applications (comme Clustal X, TreeView), compactes, simples et efficaces ne sont plus mises à jour et peuvent ne plus être compatibles avec des systèmes d'expoitation récents.
Vous aurez peut-être à vous tourner vers des outils plus polyvalents; Jalview et TreeViewer bénéficient d'une maintenance régulière.
Les logiciels ↑
Coup de coeur : Jalview ↑
Un logiciel libre en Java (donc multiplateforme) qui fait tout ce dont vous aviez révé. Jalview permet de comparer les séquences, de calculer et d'afficher des arbres phylogénétiques, de visualiser des molécules (intérêt pour les protéines). Il existe une version en Javascript (JalviewJS) pour l'utilisation en ligne. N'ayant pas eu la possibilité de le tester en classe, je vous laisse découvrir ce logiciel par vous-même.Clustal X ↑
Clustal X utilise une fenêtre unique et utilise un code de couleur (configurable) pour chaque acide aminé mettant en relief les caractéristiques conservées dans l'alignement. Outre les séquences alignées, le logiciel produit des arbres phylogénétiques affichables avec divers logiciels dont Tree View. Une documentation (actuellement minimaliste) pour utiliser Clustal X.Il est facile de modifier les fichiers Séquaid (INRP) ou Anagène (CNDP) dans un éditeur de texte pour permettre leur lecture par Clustal X. Phylogène utilise les mêmes formats que Clustal X. Les alignements sont d'ailleurs réalisés grâce à une version (malheureusement ancienne)1 de Clustal X installé en même temps que Phylogène.
Copie d'écran (Windows).
www.clustal.org (en anglais)
Téléchargement: www.clustal.org/download/current/
Thompson J.D. Gibson T.J. Plewniak F. Jeanmougin F. Higgins D.G.. 2003. ClustalX (www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html) page disparue.
(1) Remplacer cette version par une plus récente comme la 1.83 ne semble pas poser problème.
Téléchargement: www.clustal.org/download/current/
Thompson J.D. Gibson T.J. Plewniak F. Jeanmougin F. Higgins D.G.. 2003. ClustalX (www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html) page disparue.
(1) Remplacer cette version par une plus récente comme la 1.83 ne semble pas poser problème.
TreeView ↑
TreeView réalise le travail d'affichage des arbres phylogénétiques calculés par Clustal X; Tous les formats de fichiers générés par Clustal X sont importables. L'arbre produit par défaut étant non enraciné (unrooted), l'enracinement se réalise en définissant un groupe extérieur (outgroup). Les versions Linux et MacOS X ne permettent pas l'enracinement.Copie d'écran (Windows).
Roderic D. Glasgow University. 2002. Tree View taxonomy.zoology.gla.ac.uk/rod/treeview.html (le lien n'est plus fonctionnel)
Page R.. 1996. Treeview : An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences 12 : 357-358.
TreeView.
Page R.. 1996. Treeview : An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences 12 : 357-358.
TreeView.
NJ Plot ↑
Une alternative au programme précédent dont il n'est pas beaucoup plus facile de trouver un lien de téléchargement, surtout pour la version MacOS.
Using NJ Plot.
Site de l'auteur (le lien de téléchargement de la version MacOS ne fonctionne plus).
Autre téléchargement (informer.com).
Site de l'auteur (le lien de téléchargement de la version MacOS ne fonctionne plus).
Autre téléchargement (informer.com).
Tree Viewer ↑
Beaucoup plus récent.
Téléchargement sur Github.
Annhyb ↑
Annhyb est le complément idéal de Clustal X. Il affiche les alignements de séquences (fichiers.aln
générés par Clustal X) sous une forme imprimable, assure la traduction des séquences d'ADN en séquences protéiques; affiche la carte de restriction (243 enzymes sont présentes dans sa banque).
Friard O.. . Annhyb. bioinformatics.org/annhyb/
Anagène ↑
C'est un peu le logiciel officiel (utilisé en ECE); vous échapperez donc difficilement à la nécessité de familiariser les élèves à son usage si vous enseignez en spécialité SVT; c'est sans doute l'unique argument pour l'utiliser. Les banques de données (séquences moléculaires et scénarios pédagogiques) sont par contre tout à fait utiles. Le logiciel n'est disponible que sous Windows mais il existe une version en ligne (gratuite mais nécessitant un enregistrement).
Outil en ligne
Version Window: Anagène n'est plus commercialisé; vous pouvez télécharger une version 2 plus et sa mise à jour sur le site ACCES, ici ou là
Version Window: Anagène n'est plus commercialisé; vous pouvez télécharger une version 2 plus et sa mise à jour sur le site ACCES, ici ou là
Phylogène ↑
Phylogène est plus qu'une base de données sur les caractères et la phylogénie, c'est aussi un logiciel d'alignement de séquences; il peut calculer et afficher des matrices de différences et des arbres phylogénétiques. C'est un logiciel gratuit, mais non libre, édité par l'INRP.Pour pouvoir réaliser des alignements, autorisez en écriture le dossier Molecules (situé lui même dans le dossier de base de l'application); mieux, surtout sur un réseau, modifier le fichier
programmes\phylini.ini
pour qu'il contienne une redirection vers un dossier local contenant les fichiers temporaires, par exemple : alignement=c:\temp
(créez cette ligne si elle n'existe pas).
Votre traitement de texte habituel ↑
Tout traitement de texte permet une modélisation de l'action des enzymes de restriction. Il suffit d'untiliser la fonction recherche/remplacement pour entrer la séquence d'ADN reconnue par l'enzyme de restriction. Cette activité est beaucoup plus "modélisante" que ce qu'offrent Annhyb ou Anagène sur le sujet. Je la recommande fortement.Convertisseur en ligne nucléotides > acides aminés ↑
Il est possible de traiter en ligne (ou même sans serveur pour Javascript) une séquence entrée dans un formulaire. Le programme qui suit est un exemple qui fonctionne en ligne ou hors ligne après enregistrement en local : convertisseur ADN → protéine.Autres ↑
A écrire; je citerai déjà: TreeViewer, Phylotree.js
Stephen D. Shank et al. 2018. phylotree.js - a JavaScript library for application development and interactive data visualization in phylogenetics. BMC Bioinformatics, 19: 276. DOI: 10.1186/s12859-018-2283-2.
Phylotree.js Sur Github.
List of Sequence alignement software Wikipedia.
Phylogeny programs. evolution.genetics.washington.edu/phylip/software.html Plus de 208 logicels.
Phylotree.js Sur Github.
List of Sequence alignement software Wikipedia.
Phylogeny programs. evolution.genetics.washington.edu/phylip/software.html Plus de 208 logicels.
Comparatif ↑
De part le format du tableau, ce comparatif ne s'affichera pas sur un petit écran.Clustal X | Treeview | Annhyb | Anagène | Phylogène | Traitement de texte (Textwrangler, Libre Office Writer, Word) | |
---|---|---|---|---|---|---|
plateforme | Linux, Mac OS X, Windows | Linux, Mac Os X, Windows | Windows | Windows version en ligne (très lente) |
Windows | |
statut du logiciel | libre | libre | libre | Commercial, version de démonstration gratuite sans enregistrement possible (basée sur v1.0), parfaitement utilisable en classe dans la mesure où l'enregistrement a peu d'intérêt. Anagène n'est plus commercialisé; vous pouvez télécharger une version 2 plus et sa mise à jour sur le site ACCES (lire plus haut). L'analyse qui suit concerne la première version (v1.0). |
gratuit (inscription nécessaire pour le téléchargement) | suivant l'application choisie |
traduction ADN -> protéines | non | non | oui | oui | non | non |
alignement des séquences | oui | non | non | oui | oui (basé sur Clustal) | non |
calcul, affichage et édition d'arbres phylogénétiques | calcul et affichage | affichages variés et édition | non | non | calcul et affichage (basé sur Clustal) | non |
étude des enzymes de restriction | non | non | oui | oui | non | oui |
langues | anglais | anglais | anglais | français | français | suivant l'application choisie |
remarques | Les versions Linux et Mac OS X sont un peu plus limitées. | Une encyclopédie limitée est incorporée au logiciel et peut être enrichie (de façon malheureusement très malcomode); de même il est peu facile d'ajouter de nouvelles séquences à la banque. On peut regretter ces choix qui de plus éloignent les élèves de l'apprentissage de l'utilisation d'un système d'exploitation (B2i). La v.1.0 oblige à quelques contorsions pour régler les problèmes de droits d'écriture et n'est pas compatible réseau. Il existe suffisamment d'alternatives libres pour s'en passer, mais c'est un logiciel officiel utilisé dans des situations d'examen (ECE). |
Gère aussi la construction manuelle d'arbres phylogénétiques à partir de caractères discrets (morphologiques, etc.); dispose d'une banque de donnée illustrée sur ces caractères et aide à élaborer une matrice. |
Séquences à télécharger ↑
Ce sont des fichiers ASCII décrivant la séquence du brin non transcrit de l'ADN pour la partie codante de l'allèle considéré. Les séquences d'ADN sont représentées par la suite des lettres A, T, C ou G. Les séquences protéiques sont représentées par une suite de lettres qui désignent les acides aminés (une lettre par acide aminé) selon le codage présenté sur la page web Tableau du code génétique. L'en-tête varie d'un logiciel à l'autre : ouvrez les exemples dans un éditeur texte comme le Bloc note de Windows ou TextWrangler (ou TextEdit) sur Mac OS.- Le format exploité par le logiciel Gène (Séquaid) demande des commentaires précédés par
;
la dernière ligne de commentaire contenant uniquement;
les fichiers possèdent l'extension.adn
et chaque fichier ne doit contenir qu'une seule séquence. Anagène utilise le même format que Séquaid pour l'en-tête (les commentaires) mais le fichier peut contenir plusieurs séquences et a pour extension.edi
- Clustal X est capable de lire une multitude de fichiers, mais il est préférable de faire précéder le nom de chaque séquence du signe
>
et d'utiliser l'extension.seq
- Phylogène lit les fichiers alignés
.aln
produits par Clustal X, mais aussi les fichiers ci-dessous (changez l'extension.seq
en.pir
)
D-Loop : Hominidés ADN mitochondrial: pour Clustal X, format .pir pour Phylogène
Groupe sanguin principal humain ADN, protéines
NAD déshydrogénase : Hominidés ADN, protéines
Phénylalanine hydroxylase (PAH) ADN, protéines
Tyrosinase humaine ADN, protéines
Famille des globines humaines ADN, protéines
Globine β : humaine (normale, drépanocytaire, microcytaire) ADN, protéines, Hominidés protéines, Primates protéines, Vertébrés protéines
Globine α : Hominidés protéines, Vertébrés protéines
Myoglobine : Vertébrés protéines
Famille des hormones anté-hypophysaires humaines ADN, protéines, Vertébrés protéines
Famille des opsines protéines
Remarque : comme les fichiers
.pdb
sont des fichiers textes et comportent généralement, lorsqu'ils décrivent des chaînes protéiques, la séquence des acides aminés constitutifs, il est possible d'en extraire un fichier de séquence qui, moyennant quelques traitements simples, sera exploitable dans un logiciel de comparaison de séquences.
Pellerin M.-J.. Conversion d'une séquence protéique d'un fichier PDB en un fichier Anagène. www.snv.jussieu.fr/vie/outils/documents/pdb_to_pro.htm
Bibliographie ↑
Bioinformatique : opportunités pour l'enseignement.
Un questionnement pédagogique (indispensable).
Alignement multiple (pour spécialistes). www.infobiogen.fr/docs/tutoriel/COURS/alignement.html (lien non fonctionnel)
Un questionnement pédagogique (indispensable).
Alignement multiple (pour spécialistes). www.infobiogen.fr/docs/tutoriel/COURS/alignement.html (lien non fonctionnel)
Adresse de cette page: http://www.didac-tic.fr/seq/index.php