Hallo Ich suche jemanden, der mir bei folgendem Problem helfen kann.
Ich forsche für meine Dissertation an HIV-Gen-Sequenzen und muß nun viele Sequenzen miteinander vergleichen. Dabei möchte ich herausfinden, wo es Gemeinsamkeiten gibt, und wie diese Gemeinsamkeiten aussehen.
Beispiel
Sequenz A
AATTGG---TCCGAATAACG---C---GCG
Sequenz B
AATTCG---GCCTAAGACCG---C---CCG
Gemeinsamkeiten:
AATTXG---XCCXAAXAXCG---C---XCG
Da es sich um etwa 1400 Sequenzen handelt, wird es kaum komplette Übereinstimmungen geben, aber bestimmte Kombinationen, die sehr typisch sind. Die will ich wissen.
eine komplette Sequenz sieht übrigens so aus:
; AF004885
; HIV-1 isolate Q23-17 from Kenya, complete genome.
; 94
;
AF004885
GCAG------TTGGA-------ATAGGA---GC---TG--T---CTTCCTTGG---GT---TCTTAGG----AG-CAGCA
GGAAG-CACTATGGGCGCAACGTCA------ATAACGCTGACGGTACAGGCCAGACA---ATTATTGTCTGGCATAGTGC
AACAGCAA---AACAATTTGCTGAGGGCTATAGAGGCTCAACAAC---ATC---TGTTGAAACTCACGGTCTGGGG---C
ATTAAACAGCTCCAGGCAAGAGTCCTGGCTGTGGAAAGATACCTAAGGGAT---CAACAGCTCCTAGGAATTTGGGGCTG
CTCTGGAAAACTCATCTGCACC---ACTAATGTGCCCTGGAA------------CTCTA---G---TTGG------AG--
-T---AAT---------------------AAA------TC------TCTGGA---TGAG---------ATAT---GG---
---A---ACAACATGACCTGGCTGCAATGGGATAAAGAAATTAACAATTACACACAACTAATATATAGACTAATTGAAGA
AT---CGCAGAACCAGCAGGAAAAGAATGAAAAGGAATTATTGGAGTTGGACAAGTGGGCAAATCTGTGGAGTTGGTTTG
ACATATCAAATTGGCTGTGGTATATAAAAATATTTATAATA---ATAGTAGGAGGCTTAATAGGATTAAGAATAGTTTT-
--TGCTGTGCTT---TCTGTAATAAATAGAGTTAGGCAGGGATA---CT---CACCTTTGTC---ATTTCAGACC---CA
TACCC------------------------------------------------------------CAAACCC---AAGGG
GT------CTCGACAGGCCCGAAAGAATCGAAGAAGAAGATGGAGAGCAAGGCAGAGGCAGATCGATTCGATTAGTGAGC
GGATT---CTTAGCACTTG---CTTGGGACGACCTACGGAGCCTGTGCCTCTTCAGCTACCACCGCTTGAGAGACTTC--
----------------------------ATCTT---G---A---T---------TGC---TGCGA---GGACTGTGGAAC
TTCTGGGA---CACAGC------AGTCTCA---AGGGGCTGAGACTGGGGTGGG--------------------------
----------------------AAGGCATC------------------------------------------------AA
GTATCT---GTGGAAT------------CTC---CTGTCATATTGGGGTCGGGAACTAAAAATTAGTGCTATTAATCTAG
TTGATA---CCATAGCAATAGCAGTAGCTGGCTGGACAGATAGGGTTATAGAAATAGCACAAAGAATTGGTAGAGCTATC
CTCCACATACCTGTAAGAATCAGACAGGGCTTAGAAAGGGCTTTGCTATAA
Für weitere Informationen kontaktiert mich einfach:
mrt.schwarz@web.de
Beachtet bitte bei Euren finanziellen Vorstellungen, daß ich Student bin - und die Geschichte selbst finanziere. Danke.
