1. Les logiciels
    1. Jalview X
    2. Clustal X
    3. TreeView
    4. Annhyb
    5. Anagène
    6. Phylogène
    7. Traitements de texte
    8. Convertisseur en ligne: nucléotides > acides aminés
    9. Autres
    10. Comparatif
  2. Séquences à télécharger
  3. Bibliographie
  4. Tableau du code génétique (ouvrir dans une nouvelle fenêtre)
La comparaion de séquences et la construction d'arbre phylogénétique peut être réalisée "à la main" dans les cas simples (et c'est même ce que l'on peut conseiller pour un apprentissage). Il s'agit cependant de tâches dans lesquelles l'informatique peut apporter une aide précieuse et évite des opérations répétitives et fastidieuses. Nous avons associé ici des tâches voisines telles que l'étude de la transcription et de la traduction, celle des enzymes de restriction et l'analyse des parentés basée sur des caractères phénotypiques.

Les formats de fichiers sont généralement simples et facilement convertibles d'un standard à un autre. Les anciennes applications (comme Clustal X, TreeView), compactes, simples et efficaces ne sont plus mises à jour et peuvent ne plus être compatibles avec des systèmes d'expoitation récents.

Vous aurez peut-être à vous tourner vers des outils plus polyvalents; Jalview et TreeViewer bénéficient d'une maintenance régulière.

Les logiciels ↑

Coup de coeur : Jalview ↑

Un logiciel libre en Java (donc multiplateforme) qui fait tout ce dont vous aviez révé. Jalview permet de comparer les séquences, de calculer et d'afficher des arbres phylogénétiques, de visualiser des molécules (intérêt pour les protéines). Il existe une version en Javascript (JalviewJS) pour l'utilisation en ligne. N'ayant pas eu la possibilité de le tester en classe, je vous laisse découvrir ce logiciel par vous-même.

www.jalview.org Le site officiel.
Principales fonctions du logiciel Jalview Académie de Nice.

Clustal X ↑

Clustal X utilise une fenêtre unique et utilise un code de couleur (configurable) pour chaque acide aminé mettant en relief les caractéristiques conservées dans l'alignement. Outre les séquences alignées, le logiciel produit des arbres phylogénétiques affichables avec divers logiciels dont Tree View. Une documentation (actuellement minimaliste) pour utiliser Clustal X.

Il est facile de modifier les fichiers Séquaid (INRP) ou Anagène (CNDP) dans un éditeur de texte pour permettre leur lecture par Clustal X. Phylogène utilise les mêmes formats que Clustal X. Les alignements sont d'ailleurs réalisés grâce à une version (malheureusement ancienne)1 de Clustal X installé en même temps que Phylogène.

Clustal X Windows
Copie d'écran (Windows).

www.clustal.org (en anglais)
Téléchargement: www.clustal.org/download/current/
Thompson J.D. Gibson T.J. Plewniak F. Jeanmougin F. Higgins D.G.. 2003. ClustalX (www-igbmc.u-strasbg.fr/BioInfo/ClustalX/Top.html) page disparue.
(1) Remplacer cette version par une plus récente comme la 1.83 ne semble pas poser problème.

TreeView ↑

TreeView réalise le travail d'affichage des arbres phylogénétiques calculés par Clustal X; Tous les formats de fichiers générés par Clustal X sont importables. L'arbre produit par défaut étant non enraciné (unrooted), l'enracinement se réalise en définissant un groupe extérieur (outgroup). Les versions Linux et MacOS X ne permettent pas l'enracinement.
Treeview Windows
Copie d'écran (Windows).

Roderic D. Glasgow University. 2002. Tree View taxonomy.zoology.gla.ac.uk/rod/treeview.html (le lien n'est plus fonctionnel)
Page R.. 1996. Treeview : An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences 12 : 357-358.
TreeView.

NJ Plot ↑

Une alternative au programme précédent dont il n'est pas beaucoup plus facile de trouver un lien de téléchargement, surtout pour la version MacOS.

Using NJ Plot.
Site de l'auteur (le lien de téléchargement de la version MacOS ne fonctionne plus).
Autre téléchargement (informer.com).

Tree Viewer ↑

Beaucoup plus récent.

Téléchargement sur Github.

Annhyb ↑

Annhyb est le complément idéal de Clustal X. Il affiche les alignements de séquences (fichiers .aln générés par Clustal X) sous une forme imprimable, assure la traduction des séquences d'ADN en séquences protéiques; affiche la carte de restriction (243 enzymes sont présentes dans sa banque).

Friard O.. . Annhyb. bioinformatics.org/annhyb/

Anagène ↑

C'est un peu le logiciel officiel (utilisé en ECE); vous échapperez donc difficilement à la nécessité de familiariser les élèves à son usage si vous enseignez en spécialité SVT; c'est sans doute l'unique argument pour l'utiliser. Les banques de données (séquences moléculaires et scénarios pédagogiques) sont par contre tout à fait utiles. Le logiciel n'est disponible que sous Windows mais il existe une version en ligne (gratuite mais nécessitant un enregistrement).

Outil en ligne
Version Window: Anagène n'est plus commercialisé; vous pouvez télécharger une version 2 plus et sa mise à jour sur le site ACCES, ici ou

Phylogène ↑

Phylogène est plus qu'une base de données sur les caractères et la phylogénie, c'est aussi un logiciel d'alignement de séquences; il peut calculer et afficher des matrices de différences et des arbres phylogénétiques. C'est un logiciel gratuit, mais non libre, édité par l'INRP.

Pour pouvoir réaliser des alignements, autorisez en écriture le dossier Molecules (situé lui même dans le dossier de base de l'application); mieux, surtout sur un réseau, modifier le fichier programmes\phylini.ini pour qu'il contienne une redirection vers un dossier local contenant les fichiers temporaires, par exemple :
alignement=c:\temp
(créez cette ligne si elle n'existe pas).

Votre traitement de texte habituel ↑

Tout traitement de texte permet une modélisation de l'action des enzymes de restriction. Il suffit d'untiliser la fonction recherche/remplacement pour entrer la séquence d'ADN reconnue par l'enzyme de restriction. Cette activité est beaucoup plus "modélisante" que ce qu'offrent Annhyb ou Anagène sur le sujet. Je la recommande fortement.

Convertisseur en ligne nucléotides > acides aminés ↑

Il est possible de traiter en ligne (ou même sans serveur pour Javascript) une séquence entrée dans un formulaire. Le programme qui suit est un exemple qui fonctionne en ligne ou hors ligne après enregistrement en local : convertisseur ADN → protéine.

Autres ↑

A écrire; je citerai déjà: TreeViewer, Phylotree.js

Stephen D. Shank et al. 2018. phylotree.js - a JavaScript library for application development and interactive data visualization in phylogenetics. BMC Bioinformatics, 19: 276. DOI: 10.1186/s12859-018-2283-2.
Phylotree.js Sur Github.

List of Sequence alignement software Wikipedia.
Phylogeny programs. evolution.genetics.washington.edu/phylip/software.html Plus de 208 logicels.

Comparatif ↑

De part le format du tableau, ce comparatif ne s'affichera pas sur un petit écran.

Clustal X Treeview Annhyb Anagène Phylogène Traitement de texte (Textwrangler, Libre Office Writer, Word)
plateforme Linux, Mac OS X, Windows Linux, Mac Os X, Windows Windows Windows 
version en ligne (très lente)
Windows  
statut du logiciel libre libre libre Commercial, version de démonstration gratuite sans enregistrement possible (basée sur v1.0), parfaitement utilisable en classe dans la mesure où l'enregistrement a peu d'intérêt.

Anagène n'est plus commercialisé; vous pouvez télécharger une version 2 plus et sa mise à jour sur le site ACCES (lire plus haut). L'analyse qui suit concerne la première version (v1.0).
gratuit (inscription nécessaire pour le téléchargement) suivant l'application choisie
traduction ADN -> protéines non non oui oui non non
alignement des séquences oui non non oui oui (basé sur Clustal) non
calcul, affichage et édition d'arbres phylogénétiques calcul et affichage affichages variés et édition non non calcul et affichage (basé sur Clustal) non
étude des enzymes de restriction non non oui oui non oui
langues anglais anglais anglais français français suivant l'application choisie
remarques   Les versions Linux et Mac OS X sont un peu plus limitées.   Une encyclopédie limitée est incorporée au logiciel et peut être enrichie (de façon malheureusement très malcomode); de même il est peu facile d'ajouter de nouvelles séquences à la banque. On peut regretter ces choix qui de plus éloignent les élèves de l'apprentissage de l'utilisation d'un système d'exploitation (B2i). La v.1.0 oblige à quelques contorsions pour régler les problèmes de droits d'écriture et n'est pas compatible réseau.

Il existe suffisamment d'alternatives libres pour s'en passer, mais c'est un logiciel officiel utilisé dans des situations d'examen (ECE).
Gère aussi la construction manuelle d'arbres phylogénétiques à partir de caractères discrets (morphologiques, etc.); dispose d'une banque de donnée illustrée sur ces caractères et aide à élaborer une matrice.
 


Séquences à télécharger ↑

Ce sont des fichiers ASCII décrivant la séquence du brin non transcrit de l'ADN pour la partie codante de l'allèle considéré. Les séquences d'ADN sont représentées par la suite des lettres A, T, C ou G. Les séquences protéiques sont représentées par une suite de lettres qui désignent les acides aminés (une lettre par acide aminé) selon le codage présenté sur la page web Tableau du code génétique. L'en-tête varie d'un logiciel à l'autre : ouvrez les exemples dans un éditeur texte comme le Bloc note de Windows ou TextWrangler (ou TextEdit) sur Mac OS. Les fichiers qui suivent sont au format de Clustal X :

D-Loop : Hominidés ADN mitochondrial: pour Clustal X, format .pir pour Phylogène

Groupe sanguin principal humain ADN, protéines

NAD déshydrogénase : Hominidés ADN, protéines
Phénylalanine hydroxylase (PAH) ADN, protéines
Tyrosinase humaine ADN, protéines

Famille des globines humaines ADN, protéines
Globine β : humaine (normale, drépanocytaire, microcytaire) ADN, protéines, Hominidés protéines, Primates protéines, Vertébrés protéines
Globine α : Hominidés protéines, Vertébrés protéines
Myoglobine : Vertébrés protéines

Famille des hormones anté-hypophysaires humaines ADN, protéines, Vertébrés protéines

Famille des opsines protéines

Remarque : comme les fichiers .pdb sont des fichiers textes et comportent généralement, lorsqu'ils décrivent des chaînes protéiques, la séquence des acides aminés constitutifs, il est possible d'en extraire un fichier de séquence qui, moyennant quelques traitements simples, sera exploitable dans un logiciel de comparaison de séquences.

Pellerin M.-J.. Conversion d'une séquence protéique d'un fichier PDB en un fichier Anagène. www.snv.jussieu.fr/vie/outils/documents/pdb_to_pro.htm

Bibliographie ↑

Bioinformatique : opportunités pour l'enseignement.
Un questionnement pédagogique (indispensable).

Alignement multiple (pour spécialistes). www.infobiogen.fr/docs/tutoriel/COURS/alignement.html (lien non fonctionnel)
Adresse de cette page: http://www.didac-tic.fr/seq/index.php