Bereiche | Tage | Auswahl | Suche | Downloads | Hilfe
DY: Dynamik und Statistische Physik
DY 20: Neuronale Netze / Spinmodelle
DY 20.7: Vortrag
Dienstag, 12. März 2002, 11:15–11:30, H2
Berechnung von seltenen Ereignissen: Statistik von Sequenz-Alignment — •Alexander K. Hartmann — Ecole Normale Supérieure, 24 Rue Lhomond, 75231 Paris Cedex 05, Frankreich
Hier werden beliebige (eventuell sehr komplexen) Messgrößen S betrachtet, die über einem Ensemble einer eingefrorenen Unordnung definiert sind. Es wird ein Verfahren vorgestellt, mit dem sich die Wahrscheinlichkeitsverteilung p(S) in dem “rare-event tail” untersuchen lässt, beispielsweise dort wo p(S) ∼ 10−40. Die Grundidee ist es, das Ensemble als Phasenraum eines physikalischen Systems aufzufassen, die Messgröße S als Energie des Systems und numerisch eine Monte-Carlo Dynamik bei Temperatur T in dem Ensemble-Raum durchzuführen. Aus den bei verschiedenen Temperaturen gemessenen Verteilungen pT⋆(S) lässt sich die exakte Verteilung (der eingefrorenen Unordnung) p(S) leicht berechnen. Das Verfahren wird hier auf das Sequenz-Alignment Problem angewendet. Sequenz-Alignment ist ein grundlegendes Verfahren der Molekularbiologie. Es dient dazu Gen- und Aminosäure-Sequenzen in Datenbanken zu vergleichen; das Ergebnis eines Vergleichs ist der Score S. Bisher wurde angenommen, dass in biologisch relevanten Fällen die Verteilung p(S) über einem zufälligen Ensemble von Sequenzen der Extremwert- oder Gumbel-Verteilung gehorcht. Hier wird mit dem oben eingeführten Verfahren die Verteilung p(S) in dem “rare-event tail” berechnet, dort wo z.B. p(S)∼ 10−40. Es wurden dabei signifikante Abweichungen von mehreren Größenordnungen von der vorhergesagten Verteilung gefunden. Die tatsächliche Verteilung lässt sich sehr gut durch eine modifizierte Gumbel-Verteilung beschreiben.