HGVS

Aus eCG-Wiki
Wechseln zu: Navigation, Suche

Herkunft und Erscheinungsjahr

Seit 1993 befassen sich Mikrobiologen mit der standardisierten Beschreibung von Sequenz Varianten.[1] Nach der Publikation einiger vorgeschlagener Richtlinien im Jahr 1998 entstand eine Arbeitsgruppe der Human Genom Variation Society (HGVS) zusammen mit der Human Genome Organisation (HUGO), um die Richtlinien für eine standardisierte Nomenklatur zu entwerfen.[2] Inzwischen ist die Nomenklatur der HGVS zur Beschreibung von Sequenzen international akzeptiert und genutzt.

Verwendungszweck

In der Gendiagnostik ist die genaue, standardisierte und gemeinsame Beschreibung und Nutzung der verschiedenen Genvariationen von zentraler Bedeutung. Die Nomenklatur der HGVS ermöglicht eine einheitliche und eindeutige Beschreibung von Variationen, also Veränderungen von DNA-, RNA- und Proteinsequenzen.

Aktuelle Version

Zur Kennzeichnung der aktuellen Version wird seit dem Jahr 2015 bei jeder Änderung der Empfehlungen eine neue Versionsnummer vergeben, welche auf das Datum der jeweiligen Änderung basiert. Bei der Vornahme von Korrekturen, das Ergänzen von Beispielen oder das Hinzufügen von Erläuterungen, wird die Versionsnummer allerdings nicht verändert. Die Version 0 beschäftigte sich mit Empfehlungen und wurde durch die Version 1 mit formellen Empfehlungen ergänzt. Die aktuelle Version der HGVS-Nomenklatur ist die Version 15.11.

Internationale und nationale Verwendung

Aufbau (mit Beispielen)

Ein HGVS Code ist in zwei Teile aufgeteilt: eine Referenz und eine Beschreibung.

Beispiel: NC_000023.9:g.32317682G>A

Der erste Teil „NC_000023.9“ ist die Referenz. Sie besteht aus einem Präfix (hier: „NC_“) der die Art des Moleküls bestimmt, z.B.:

  • NC_ = Chromosom
  • AC_ = Genom
  • NM_ = mRNA
  • NR_ = RNA
  • NP_ = Protein
  • Bis zu 15 Präfixe

Die ersten vier Zahlen („0000“) beschreiben das Gen oder die Genregion. Die nächsten beiden Zahlen („23“) geben das Chromosom an und die Zahl hinter dem Punkt („.9“) die verwendete Version. Die Beschreibung („g.32317682G>A“) wird durch ein „:“ von der Referenz getrennt. Das Präfix kann g. oder c. sein und bestimmt um was für eine Art von Referenz es sich handelt.

  • g. = Genomische Referenzsequenz
  • c. = Kodierende DNS Referenzsequenz

Die Zahlenabfolge bestimmt die Lokalisation des Genes („32317682“) und der letzte Teil, um welche Veränderung es sich handelt („G>A“). Die Veränderungen beziehen sich hauptsächlich auf die sich im Nukleotid befindlichen Basen, welche wie folgt abgekürzt werden: Adenin (A), Thymin (T), Guanin (G), Cytosin (C) und Uracil (U). Die jeweilige Abkürzung steht für folgende Sachverhalte:

  • Substitutions (Substitutionen): „Base1>Base2“ (Beispiel: „G>A“ G wird durch A ersetzt.)
  • Deletion (Löschung): „delBase“ (Beispiel: „delG“: G wird entfernt)
  • Duplication (Duplizierung): „dupBase“ (Beispiel: „dupG“ G wird dupliziert)
  • Insertion (Einfügung): „InsBase“ (Beispiel: „insT“ T wird eingefügt)
  • Repeat Sequence (Wiederholung) „[Wiederholungslänge]“ (Beispiel: „[6]“ die Referenz Sequenz hat eine Wiederholungslänge von 6 auf einem Chromosom)
  • Weitere Veränderungen wie: Inversion (Umkehrung), Conversion (Umwandlung), Translocation (Translokation), Complex (Komplex) und Miscellaneous (Sonstiges)


Lizenzkosten

Die Nutzung ist kostenlos. Es wird lediglich erwartet, bei der Benutzung auf das HGVS zu verweisen.

Einzelnachweis

  1. Beaudet, A. L. (1993). A Suggested Nomenclature for Designating Mutations. Human Mutation, S. 2:245-248.
  2. Antonarakis, S. E. (1998). Recommendations for a Nomenclature System for Human Gene Mutations. Geneva, Schweiz: Wiley-Liss, Inc.