Om DNA-matches – hvor langt tilbage kan du komme?

Opdateret oktober 2020 med udbedrede skemaer

Jeg har tidligere fortalt om hvordan man kan verificere de forskellige matches.
Men hvor stor er sandsynligheden for at finde et match fra en bestemt ane? Og hvor langt tilbage kan man overhovedet finde fælles aner via matches? Dét er jo ret interessant at vide, hvis man leder efter en bestemt ane, hvad enten det er for at finde frem til dennes hidtil ukendte forældre, få bekræftet at en udlagt barnefader nu rent faktisk var den rigtige fader, eller bare af nysgerrighed.

Følgende indlæg vil indehold en hel del statistik og teknik, men skulle gerne illustrere svarene på ovennævnte spørgsmål.
Det tager udgangspunkt i den autosomale test, der som den eneste af de tre typer DNA-fest viser den DNA, vi arver fra begge vores forældre.

For at finde DNA fra dine aner, er du afhængig af dine DNA-matches. Uden dem har du ingen DNA at sammenligne med. Først når du med sikkerhed kan fastslå det præcise slægtsskab – dvs. har verificeret den fælles ane – med et match, kan du med sikkerhed sige at den bid af din DNA er fra den pågældende ane.
De fleste af os har over tusind matches, og kan godt regne ud at jo mere DNA til fælles, jo større sandsynlighed og jo tættere slægtskab. Vi ved også, at vi deler forskellige segmenter med de forskellige matches.
Men hvor meget DNA og hvor mange segmenter arver man så fra de forskellige aner? Dét er jo nøglen til hvor sandsynligt det er at finde matches til hver af dine aner. Ca. hvor meget kan netop ses i nedenstående skema, der med lidt matematik netop viser hvor meget DNA, man vil arve fra de forskellige forfædre. Den del af din DNA, som den autosomale DNA-test kan måle, er lig med cirka 6800cM. Den ene halvdel er fra din mor, den anden fra din far.

Skema, der viser hvor mange procent – ca – der arves fra den nævnte ane
Kilde: Skema oversat til dansk fra artiklerne nævnt nederst i indlægget

Når der står “ca” i skemaet er det fordi tallet vil variere en smule. Jeg har f.eks. lidt flere centimorgans (måleenheden, der måler afstanden på to markører på kromosomet og dermed viser et segment) viser til fælles med min mor end med min far. Og der er ikke tvivl om at de begge er mine forældre 🙂
Er ovenstående skema så ensbetydende med at man kan finde segmenter fra alle dine f.eks. 5xtipoldeforældre? I princippet ja – du har jo arvet DNA fra dem. Men som nævnt, nedbrydes DNAen i segmenter for hver generation. Og DNAen nedbrydes i flere og flere segmenter, jo flere generationer, den nedarves af. Du vil derfor ikke finde et samlet segment på 425cM fra en tipoldemor, men i stedet for en række mindre segmenter på et samlet antal omkring de 425cM. Der vil med andre ord være DNA fra alle dine forfædre, men i så små segmenter, at det kan blive rigtig svært hvis ikke umuligt at skelne dem fra de mange andre små segmenter.
Er et segment ikke på mindst 15 cM, kan man ikke vide sig sikker på om det rent faktisk er nedarvet fra en ane, eller i virkeligheden bare “støj”. Med støj menes der at DNA kan ligne hinanden når ens aner stammer fra samme lille bitte område. Et segment på f.eks. 8cM kan derfor betyde at ens aner kom fra samme område, men også at I rent faktisk er beslægtede. Det sidste er bare svært at bevise.

Nu ved vi hvor meget DNA, vi arver fra de forskellige aner, sådan cirka.
Vi skal bruge tallene til et par statistiske udregninger senere. Men først er det vigtigt at forstå noget mere om hvordan segmenterne dannes.

Kromosompar, rekombinationer og segmenter

Vi har som nævnt 23 kromosompar. Et sæt fra hver af vores forældre. Det 23. par afgør hvilket køn, vi bliver, mens de 22 består af såkaldte autosomale kromosomer, som netop er de, der testes i den autosomale test og viser DNA fra begge dine forældre (mens de to øvrige typer tests fokuserer udelukkende på din mors eller fars DNA).

Det enkelte kromosom deler sig helt i starten, når det sammen med de øvrige kromosomer bliver til den celle, der udvikler sig til et foster. Eftersom hvert kromosom er ét ud af et par, er der nu – efter delingen – fire kromosomer i samme par. Kromosomet samles igen til et kromosompar, hvilket kaldes rekombination. To ting kan nu ske. Enten rekombineres dét kromosom samt kopien der stammer fra hver af forældrene i nøjagtigt samme kromosompar igen. Eller, en del af moderens kromosom kombineres med den tilsvarende del af faderes kromosom.
Kromosomparret kan altså være en præcis genskabelse af det, det var inden det blev delt; en kopi fra din mor og en fra din far.
Eller det kan være rekombineret, så hver kromosom i parret er den del af kromosomet arvet fra din far, og den resterende del arvet fra din mor.
Det kan illustreres i nedenstående grafik:

Deling og rekombination af det enkelte kromosom
Kilde: Eget skema

Kun det ene af de to ovennævnte par nedarves altså. Samtidig er rekombination forskellig fra kromosom til kromosom og køn til køn. Kvinder har en større hyppighed af rekombination end mænd. Hvor præcis, det enkelte kromosom rekombineres er også forskelligt. Mulighederne for hvordan ens DNA er sat sammen af forfædrenes er altså mange. Rigtigt mange!
Det er de forskellige mængder DNA fra henholdsvis din mor og far i det endelige kromosompar, der i virkeligheden udgør de forskellige segmenter. Og de segmenter, de hver især bidrager med, er dannet af de segmenter, deres forældre hver især har bidraget med.

De statistiske udregninger – sandsynligheden for at finde match efter en bestemt ane

Nogle dygtige folk (se kilderne nederst i indlægget) har udregnet sandsynligheden for hvornår, vi er sikre på at finde DNA-segmenter store nok fra den enkelte forfader til at vide os sikre på at kunne finde et match. En kvinde har 41 rekombinationer, mens en mand har 27. Gennemsnittet af de to er 34, og det er derfor det tal, der brugt til at regne muligheden for segmentstørrelsen ud for hver generation. Man arver altså, i gennemsnit, minimum 22+34 segmenter, fra sine forældre. 22 rene, i tilfælde af at alle kromosomer fra ens ene forældre blev rekombineret til præcis dét DNA, man har arvet fra samme forældre. Og 34, hvis kromosomerne fra ens anden forældre har rekombineret sig forskelligt end samme forældres DNA.

Når den samlede DNA deles af så mange segmenter, og man arver DNA fra alle aner, siger det sig selv at matches fra samme ane og samme generation som en selv, har mindre og mindre DNA til fælles. Skemaet nedenunder (der er en udvidet version af første skema) viser i sidste kolonne hvor meget, igen ca. og gennemsnitligt, DNA i cM man deler med et match fra samme anepar og samme generation. Og så er der kun tale om samme anepar og samme generation. Er du og dit match fra to den fælles anes henholdsvis første og andet ægteskab, er der jo endnu mindre fælles DNA. Sådan ca halvdelen! Og er der tale om de såkaldte forskudte generationer, dvs. du er tipoldebarn af den fælles ane, men dit match er tiptipoldebarn, skal det viste DNA i skemaet igen deles med to. Omvendt, er du tiptipoldebarn men dit match tipoldebarn, kan du gange den fælles DNA fra skemaet med to.

Skema, der viser sandsynligheden for at finde et match fra en fælles ane.
Kilde: Eget skema oversat til dansk fra artiklerne nævnt nederst i indlægget

Tre eksempler på hvordan, skemaet skal læses:

  • Et match med hvem du i alt deler ca. 425cM med, vil altså højst sandsynligt være efterkommer efter dine bedsteforældre og, hvis i samme generation som dig, din fætter eller kusine.
  • Et match med hvem du deler 210cM er cirka halvdelen af de førnævnte 425cM og dermed din fætter eller kusines barn. Men det kan også være det cirka dobbelte af 106,25 og dermed et match, der skal findes en generation længere tilbage; nemlig hos dine oldeforældre. Et match på ca. 210cM kan derfor også være dine oldeforældres barnebarn og dermed en af dine forældres fætre eller kusiner.
  • Et match med hvem du deler ca. 27cM skal findes endnu længere tilbage. Er I fra samme generation har I samme tipoldeforældre. Men det kan også være dine tiptipoldeforældres tipoldebarn, altså en generation ældre end dig og endnu længere tilbage.
  • Evt kan du også slå det op i DNA-painters Shared cM Tool. Nu ved du i hvert fald, at mulighederne er for forskellige slægtskaber er flere.

    Som nævnt er det ren statistik, og lige dét kan drille i denne sammenhæng. For det er værd at gøre opmærksom på, at ikke alle kromosompar er lige lange. Måske har du allerede set det i kromosombrowseren, ellers viser jeg her et udsnit af den:

    De første syv af de i alt 23 kromosompar der danner vores DNA.
    Kilde: MyHeritage

    Det betyder, at de segmenter, du har arvet fra dine bedsteforældre vil være noget større/længere i de første kromosompar end de segmenter, du har arvet fra dine bedsteforældre i de sidste kromosompar. Det har selvfølgelig så også indflydelse på vores statistik her, da der er tale om gennemsnitlige tal.
    Når vi så f.eks. ser på nedenstående skema at du arver ca. 3400cM i alt fra din mormor og at de skal fordeles på 57 segmenter, er det klart at udregningen giver et gennemsnitligt segment på 59,65cM. Men med den viden, at et segment vil være større i de første kromosompar og mindre i de sidste, ved vi nu også at det enkelte segment, vi har arvet fra vores mormor, kan være langt større eller mindre. Dette er kun for at illustrere, at tallene vil variere og ikke er et præcist udtryk for hvor præcist store segmenter, du kan forvente at finde fra hver af dine aner og dermed heller ikke hvad du præcist deler med et match.
    Men de er stadig en rigtig god pejlesnor!

    Skema, der viser sandsynligheden for at finde et match fra en fælles ane.
    Kilde: Eget skema oversat til dansk fra artiklerne nævnt nederst i indlægget

    Vi holder os til tommelfingerreglen om at et reelt match skal bestå at minimum 15cM, ellers kan vi ikke vide os sikre på at finde 100% sikre matches.
    Skemaet viser altså at vi burde kunne finde DNA fra alle aner til og med vores tipoldeforældre. For det er netop det, den sidste kolonne viser os; et match dér vil gennemsnitligt have et segment på 26,56 til fælles med os.
    Det er nu slet ikke usandsynligt at komme længere tilbage. Det er bare ikke sikkert at finde DNA fra alle 2xtipoldeforældre eller de ældre generationer. Faktisk siger de, der har flere års erfaring med DNA-slægtsforskning at man typisk kun finder DNA fra 14 af de 16 2xtipoldeforældre.
    Vi kan selvfølgelig også vælge at insistere på at der kan være tale om færrest mulige rekombinationer, nemlig 22+22. Og at vi har arvet segmenter fra alle 2xtipoldeforældrene blandt de første kromosompar. Dermed har vi forbedret statistikken og vil måske finde DNA-segmenter store nok til at bevise, at vi har arvet DNA fra alle 16 2xtipoldeforældre. Dét er nu nok for usandsynligt.
    Men! Legen stopper ikke ved 2xtipoldeforældrene. Mange af os vil også kunne verificere matches endnu længere tilbage. Hvor langt tilbage, kommer vi ind på i næste afsnit.

    Sandsynligheden for at finde matches DNA fra de forskellige aner

    Hvor stor er så sandsynligheden for at finde man matches med DNA fra den dér ane, der driller helt vildt (f.eks. ham soldaten, der blev hyret af den danske hær men ikke vides hvor, han er født – Tyskland, Ungarn…? Og som man håber på at eventuelle matches kan opklare). Dét er der selvfølgelig også nogen, nemlig den amerikanske professor Donnelly, der har regnet på.
    Eller rettere, han har regnet på hvor lille sandsynligheden er for at vi finder matches fra samme ane så og så langt tilbage, og med sikkerhed kan vide at der rent faktisk er tale om en slægtning. Vi udvider skemaet endnu en gang. Først med en kolonne, hvor usikkerheden vises. Og så med en kolonne, hvor sikkerheden for hvor langt tilbage, vi kan forvente at finde anesammenfald med vores mange matches, vises. Den er jeg personligt meget mere interesseret i.

    Skema, der viser hvor meget DNA – ca. – man har til fælles med et match fra samme ane og samme generation.
    Kilde: Eget skema oversat til dansk fra artiklerne nævnt nederst i indlægget

    Som det ses, anser Donelly det også for 100% sandsynligt at finde tilstrækkeligt DNA fra dine tipoldeforældre.
    Der er også stor sandsynlighed for at finde DNA fra dine 2xtipoldeforældre, men som vi regnede på ovenfor, er det ikke 100% sikkert.
    Det er heller ikke usandsynligt at finde matches, som er efterkommere efter de tre ældre generationer. Dog absolut heller ikke sikkert, og bestemt langt fra på dem alle. Det bliver i hvert fald svært at bevise, eftersom segmenter nu er ret små. Herefter kommer det virkelig til at knibe. Selv har jeg verificerede matches efter flere 4*tipoldeforældre, men heller ikke længere tilbage.
    Jeg har hørt om enkelte, der har fundet DNA helt tilbage fra deres 5*tipoldeforældre. Men så kommer man heller ikke længere tilbage med den autosomale test.

    Når jeg derfor gerne vil finde matches præcis fra dén anerække for at finde frem til hvor fra, min hyrede soldat stammer fra, er det ikke en helt umulig opgave, men dog svær. For nok er sandsynligheden der. Men et givent match vil sandsynligvis dele højst 14cM med mig. Og igen, der vil være 216 aner at skulle igennem før man kan vide sig sikker på, om det nu er den rigtige ane, begge matches stammer fra. Til gengæld vil jeg måske allerede have afskåret en del matches fra at være matches fra den ane, hvis jeg allerede, bl.a. ved hjælp af kromosom-browseren, har fastlagt hvor henne i slægtstræet jeg er beslægtet med det enkelte match.

    Det er vigtigt at understrege at alle ovennævnte tal er cirka og gennemsnitslige. Der er tale om statistik, men også sandsynlighedsregning! Du kan evt. læse professor Donnellys artikel om sandsynlighedsregning indenfor DNA
    Derudover har jeg hentet facts og tal fra blogindlæg på
    BeholdGenealogy,
    The Genetic Genealogist og
    Segment-ology.
    Både artikel og blogindlæg er på engelsk.

    (Visited 199 times, 1 visits today)
    Facebooktwitterredditpinterestlinkedinmailby feather

    Skriv et svar

    Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *