BioJava:CookbookFrench:Annotations:List

Comment obtenir la liste des annotations d’une sequence?

Lorsque vous lisez un fichier de séquences annotées, comme GenBank or EMBL, celui-ci contient bien plus d’informations que la simple séquence. Si cette information est à une position précise, elle devient un objet Feature. Si elle est plus générique, comme le nom de l’espèce, cette information devient un objet de type Annotation.

Les objets Annotations de BioJava sont semblables à des objets de type Map et contiennent des clés et leur valeurs associées.

Voici le début d’un fichier EMBL:

ID   AY130859  standard; DNA; HUM; 44226 BP.
XX
AC   AY130859;
XX
SV   AY130859.1
XX
DT   25-JUL-2002 (Rel. 72, Created)
DT   25-JUL-2002 (Rel. 72, Last updated, Version 1)
XX
DE   Homo sapiens cyclin-dependent kinase 7 (CDK7) gene, complete cds.
XX
KW   .
XX
OS   Homo sapiens (human)
OC   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia;
OC   Eutheria; Primates; Catarrhini; Hominidae; Homo.
XX
RN   [1]
RP   1-44226
RA   Rieder M.J., Livingston R.J., Braun A.C., Montoya M.A., Chung M.-W.,
RA   Miyamoto K.E., Nguyen C.P., Nguyen D.A., Poel C.L., Robertson P.D.,
RA   Schackwitz W.S., Sherwood J.K., Witrak L.A., Nickerson D.A.;
RT   ;
RL   Submitted (11-JUL-2002) to the EMBL/GenBank/DDBJ databases.
RL   Genome Sciences, University of Washington, 1705 NE Pacific, Seattle, WA
RL   98195, USA
XX
CC   To cite this work please use:  NIEHS-SNPs, Environmental Genome
CC   Project, NIEHS ES15478, Department of Genome Sciences, Seattle, 
WA
CC   (URL: http://egp.gs.washington.edu).

Le programme suivant lit un fichier EMBL et donne la liste des différentes propriétés des Annotations. La sortie du programme est donnée en exemple à la fin du programme.

```java import java.io.*; import java.util.*;

import org.biojava.bio.*; import org.biojava.bio.seq.*; import org.biojava.bio.seq.io.*;

public class ListAnnotations {

 public static void main(String[] args) {

   try {
     //lire un fichier EMBL 
     BufferedReader br = new  BufferedReader(new FileReader(args[0]));
     SequenceIterator seqs = SeqIOTools.readEmbl(br);

     //pour chacune des séquences du fichier, faire la liste des annotations
     while(seqs.hasNext()){
       Annotation anno = seqs.nextSequence().getAnnotation();

       //imprimer chacune des paires clé-valeur 
       for (Iterator i = anno.keys().iterator(); i.hasNext(); ) {
         Object key = i.next();
         System.out.println(key +" : "+ anno.getProperty(key));
       }
     }
   }
   catch (Exception ex) {
     ex.printStackTrace();
   }
 }

} ```

Sortie du programme:

RN : [1]
KW : . 
RL : [Submitted (11-JUL-2002) to the EMBL/GenBank/DDBJ databases., Genome 
Sciences, University of Washington, 1705 NE Pacific, Seattle, WA, 98195, USA]
embl_accessions : [AY130859]
DE : Homo sapiens cyclin-dependent kinase 7 (CDK7) gene, complete cds.
SV : AY130859.1
AC : AY130859;
FH : Key Location/Qualifiers
XX :
OC : [Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia;, 
Eutheria; Primates; Catarrhini; Hominidae; Homo.]
RA : [Rieder M.J., Livingston R.J., Braun A.C., Montoya M.A., Chung M.-W.,, 
Miyamoto K.E., Nguyen C.P., Nguyen D.A., Poel C.L., Robertson P.D.,, Schackwitz 
W.S., Sherwood J.K., Witrak L.A., Nickerson D.A.;]
ID : AY130859 standard; DNA; HUM; 44226 BP.
DT : [25-JUL-2002 (Rel. 72, Created), 25-JUL-2002 (Rel. 72, Last updated, 
Version 1)] 
CC : [To cite this work please use: NIEHS-SNPs, Environmental Genome, Project, 
NIEHS ES15478, Department of Genome Sciences, Seattle, WA, (URL: http://egp.gs.washington.edu).]
RT : ;
OS : Homo sapiens (human)
RP : 1-44226