Um Gene und ihre Funktion in der DNA Sequenz zu finden wird die Sequenz nach Open Reading Frames abgesucht. Der Open Reading Frame ist ein Stück DNA, welches von einem Start- und Stopcodon flankiert wird und dann in die Protein Sequenz übersetzt werden kann. Eine wichtige Aufgabe der Bioinformatik ist es diese DNA-Abschnitte zu finden.
Open Reading Frame Finder sind online als Hilfsprogramme schon verfügbar. Biopython, ein Zusatzmodul von Python wurde speziell für die Bearbeitung von biologischen Daten entwickelt. Die in diesen Programmen eingesetzten Algorithmen werden in dieser Arbeit genauer betrachtet.
Das Programm ist in Python geschrieben, die DNA Sequenz wird im FASTA Format geladen. Nachdem die Open Reading Frames lokalisiert sind können die einzelnen Frames, die Positionen der Start- und Stopcodons und die Länge der Frames ausgegeben werden.