Markery molekularne
Autor tekstu:

Przegląd najbardziej popularnych technik

W ciągu ostatniego ćwierćwiecza nastąpił olbrzymi postęp w zrozumieniu wielu procesów zachodzących we wszystkich komórkach organizmu na poziomie molekularnym. Niewątpliwie do wyjaśnienia podstaw tych zjawisk przyczyniła się biologia molekularna. Dziedzina ta dostarczyła badaczom nowych, nieznanych dotąd narzędzi, dzięki którym możliwe stało się poznanie wielu, fundamentalnych dla życia procesów na ich podstawowym poziomie. Jednak szczególnie cennym materiałem badawczym okazał się być DNA, jego wysoka polimorficzność (zmienność). Polimorfizm ten został wykorzystany do analizy cech korzystnych z punktu widzenia hodowców. Praktycznym przejawem tych analiz są markery molekularne.

Współcześnie znane są liczne techniki umożliwiające badanie zmienności DNA na poziomie molekularnym. Niniejsza praca ma na celu opis kilku, obecnie najbardziej popularnych, technik służących wykrywaniu markerów molekularnych.

Współcześnie znane są liczne techniki umożliwiające identyfikację określonych alleli genów. Przełomem okazały się lata 1955 (Arthur Kornberg wraz z zespołem izoluje po raz pierwszy polimerazę DNA), 1966 (B. Weiss i C.C. Richardson izolują po raz pierwszy DNA ligazę) i 1968 kiedy to H.O. Smith, K.W. Wilcox, i T.J. Kelley izolują i charakteryzują pierwszą sekwencyjnie specyficzną restrykcyjną nukleazę. Odkrycia te zaważyły w sposób znaczący na dalszym rozwoju technik biologii molekularnej. Wczesnej znane były markery morfologiczne (marker fenotypowy tzn. przejawiający się w wyglądzie zewnętrznym) czy tez izoenzymatyczne (różne formy tego samego enzymu). Mają one jednak znaczącą wadę. Są zależne od warunków środowiska.

Markery oparte na DNA nie mają tej wady. Obecnie znane są liczne systemy markerowe umożliwiające identyfikację alleli. Możliwe jest łączenie kilku systemów markerowych ze sobą. Do najbardziej znanych systemów zalicza się RFLP (połowa lat 80-tych), RAPD (początek lat 90-tych), CAPS, APLF (opatentowana w 1993 roku), oraz SSR. Poszczególne techniki identyfikacji markerów molekularnych różnią się miedzy sobą. Podstawowe różnice wynikają z charakteru samego markera, tego czy pozwala on wykryć markery dominujące czy nie, jaki typ i poziom polimorfizmu (zmienności) potrafi zidentyfikować, jaka ilość i czystość DNA jest wymagana do analiz, jaki typ sondy potrzebny jest do detekcji (wykrycia) sygnału, czy wymagana jest znajomość sekwencji, trudności technicznych, wiarygodności, powtarzalności czy wreszcie kosztu analiz. Wszystkie te czynniki powinny być wzięte pod uwagę przed wyborem odpowiedniego systemu markerowego.

W niniejszej pracy chciałbym przedstawić jedynie 5 najczęściej używanych w laboratoriach całego świata systemów markerów molekularnych (RFLP, RAPD, CAPS, AFLP,SSR), oraz 3 stosunkowo nowe (SNP, Pyrosequencing, SAMPL), generujące wysoki polimorfizm, o wysokiej powtarzalności i wiarygodności.

Na początek chciałbym wyjaśnić, co rozumiemy pod pojęciem markera molekularnego w przedstawionej pracy. Markerem jest prążek o ściśle zdefiniowanej wielkości, otrzymany poprzez trawienie enzymem(-ami) restrykcyjnym(-ymi), amplifikację (PCR) lub też połączenie obydwu tych technik. Dodatkowo marker taki powinien dziedziczyć się w następnych pokoleniach i powinien być sprzężony (połączony) z badaną cechą selekcyjną. Niestety brak tutaj informacji o samej sekwencji markera. Należy wziąć pod uwagę fakt, że w obrębie sekwencji prążka może również dojść do mutacji, co może nie uwidocznić się w zmianie ruchliwości elektroforetycznej.

Należy również pamiętać o wrażliwości enzymów restrykcyjnych na metylację. Dzięki metylacji pewne rejony DNA mogą być niedostępne dla enzymów. Wynika z tego fakt, że wielu markerów nie może zostać wykrytych z powodu umiejscowienia ich w obszarach o wysokim stopniu metylacji. Wpływa to również na rozmieszczenie markerów wzdłuż chromosomu np. w AFLP markery generowane przez układ enzymów EcoRI/MseI grupują się w otaczającej centromery wysoce modyfikowanej heterochromatynie, natomiast markery generowane przez układ PstI/MseI ulokowane są w obszarach o niskiej metylacji, co powoduje bardziej równomierne rozmieszczenie wzdłuż całego chromosomu.

Aby dany typ markera uznać za ważny musi go cechować kilka, niezwykle istotnych cech:

  • szeroki polimorfizm (zmienność)
  • duża częstość występowania
  • dobra powtarzalność
  • łatwość użycia

Markery molekularne cechuje znacznie wyższy poziom polimorfizmu w porównaniu z markerami morfologicznymi. Ich liczba jest właściwie nieograniczona. Dodatkowo markery morfologiczne mogą wykazywać zmienną ekspresję uzależnioną od genotypu (organizmu) i warunków środowiska. Różnice te mogą być przyczyną kłopotów z powtarzalnością. W przypadku markerów molekularnych brak tych kłopotów, ponieważ są one niezależne od warunków środowiska. Ważne są natomiast warunki, w jakich przeprowadzana jest reakcja amplifikacji (powielenia): stężenie buforu, magnezu, dNTPs, użyte startery, jakość badanego DNA oraz temperatura wiązania startera (sztucznie syntetyzowany mały fragmentu DNA, od którego rozpoczyna się powielanie nici DNA) z matrycą. Wraz ze spadkiem temperatury maleje specyficzność wiązania startera do matrycy, przez co generowane są dodatkowe prążki, a to powodować może kłopoty z powtarzalnością. Markery molekularne można stosować do selekcji materiału hodowlanego (MAS — ang. Marker Assisted Selection). Marker taki jest wartościowy wtedy, gdy dziedziczy się w następnych pokoleniach oraz jest odpowiednio blisko sprzężony z badaną cechą. Wykorzystując markery blisko sprzężone (ok. 10 centymorganów) można selekcjonować cechy poligeniczne (kontrolowane przez kilka genów) i ilościowe (QTL — ang. Quantitive Trait Loci).

RFLP (ang. Restriction Fragments Lenght Polymorphism)

Technika ta została wykorzystana do badań nad DNA człowieka w 1980 roku. Do badań nad genomem roślin pierwszy raz użyta w połowie lat 80-tych. Zaletą tej techniki jest kodominacyjny charakter dziedziczenia markerów RFLP, co umożliwia rozróżnienie heterozygoty od homozygoty. Sama technika opiera się na trawieniu izolowanego DNA jednym lub kilkoma enzymami restrykcyjnymi. Do najczęściej używanych enzymów należą: EcoRI (GAATTC); EcoRV (GATATC); DraI (TTTAA); HindIII (AAGCTT) i XbaI (TCTAGA). DNA trawiony jest w ściśle określonych miejscach rozpoznawanych przez określony enzym. Produkt trawienia może być rozdzielony na żelu agarozowym. Z żelu następuje transfer prążków na membranę, hybrydyzacja ze znakowana radioaktywnie sondą i detekcja sygnału przez autoradiografię. Jednakże w ostatnich latach odchodzi się od pracy z radioaktywnymi izotopami i coraz częściej stosuje się detekcję poprzez fluorescencję. Obecność lub brak prążka o określonej wielkości świadczy o polimorfizmie. Polimorfizm może tutaj wynikać ze zmiany pojedynczego nukleotydu w obrębie miejsca restrykcyjnego lub bliskiej odległości od niego, ze zmiany większych fragmentów DNA lub też z metylacji niektórych zasad azotowych w DNA. Minusem tej analizy jest relatywnie wysoki koszt otrzymania wyniku oraz duża ilość DNA niezbędnego do trawienia restrykcyjnego. Zaletą markerów RFLP jest ich wysoka wiarygodność oraz kodominacyjny typ dziedziczenia.

RAPD (ang. Randomly Amplified Polymorphic DNA)

Technikę tę rozpoczęto stosować na początku lat 90-tych. Wykorzystuje ona reakcję PCR (ang. Polymerase Chain Reaction) do generowania markerów RAPD. Markery te wykazują dominujący charakter dziedziczenia, przez co niemożliwe jest odróżnienie homozygot od heterozygot. Do reakcji PCR używa się startera o długości 9-11 pz. Każdy taki starter zapoczątkowuje amplifikację w wielu rejonach genomu jednocześnie. Produkty reakcji amplifikacji rozdziela się na żelu agarozowym. Detekcja prążków odbywa się z użyciem znaczników fluoroscencyjnych lub srebra. Metoda ta jest szybsza, wydajniejsza i mniej pracochłonna od RFLP. Potrzeba również znacznie mniejszych ilości DNA, ponieważ jest on powielany w kolejnych rundach amplifikacji. DNA ten może pochodzić z surowego ekstraktu. Przy markerach RAPD możliwe jest rozróżnienie homozygot i heterozygot przez zastosowanie krzyżowania wstecznego i wsobnego. Powoduje to jednak znaczne wydłużenie czasu analiz. Drugim sposobem różnicowania alleli jest DGGE (ang. Denaturing Gradient Gel Electrophoresis). W wyniku elektroforezy we wzrastającym stężeniu czynnika denaturującego allele heterozygot denaturują inaczej niż homozygot, co przejawia się odmienną ruchliwością elektroforetyczną.

CAPS (ang. Clevaed Amplified Polymorphic Sequence)

Technika oparta na połączeniu dwóch reakcji: reakcji PCR z trawieniem restrykcyjnym. Pierwszym etap to klasyczna reakcja PCR. Startery do reakcji konstruowane są na podstawie znanych sekwencji. Amplifikowany produkt jest następnie trawiony enzymem lub enzymami restrykcyjnymi i rozdzielany na żelu agarozowym. Pozwala to na wykrycie alleli heterozygotycznych i homozygotycznych, tak więc markery CAPS dziedziczą się kodominacyjnie.

AFLP (ang. Amplification Fragment Lenght Polymorphism)

Opatentowana w 1993 roku. Technika ta, podobnie jak CAPS, łączy trawienie enzymami restrykcyjnymi z reakcją PCR. Następuje jednak odwrócenie kolejności. Pierwszy etap to trawienie enzymami, kolejny to dwie rundy amplifikacji: niespecyficzna i specyficzna. Enzymy trawiące są dobrane w ten sposób, że jeden rozpoznaje liczne miejsca trawienia w obrębie DNA, natomiast drugi trawi DNA w małej liczbie miejsc. Obydwa enzymy generują tzw. lepkie końce. Są one niezbędne do połączenia z odcinkami 20-30 nukleotydowymi — adaptorami. Połączenie możliwe jest dzięki T4 DNA ligazie. Po ligacji adaptorów prowadzona jest reakcja preamplifikacji. Sekwencje starterów dobrane są w ten sposób, że są one komplementarne do sekwencji adaptora i miejsca restrykcyjnego. Dodatkowo na swoim 3' końcu mają jeden selektywny nukleotyd. Po reakcji amplifikacji niespecyficznej prowadzi się amplifikację specyficzną z użyciem specyficznych starterów. W porównaniu ze starterami użytymi w amplifikacji niespecyficznej, te na końcu 3' posiadają 2-4 specyficzne nukleotydy. Częstość rozpoznawania specyficznego miejsca przez starter selekcyjny wynosi 42n, gdzie n określa liczbę zasad selekcyjnych. Prowadzenie dwóch reakcji amplifikacji, niespecyficznej i specyficznej, zwiększa powtarzalność metody. Rozdział produktu następuje na żelu poliakrylamidowym. Detekcja prążków odbywa się przez barwienie srebrem bądź autoradiograficznie, jeśli wcześniej użyto znakowane radioaktywnie adaptory. Jeśli chodzi o rozróżnienie homozygot i heterozygot, niekiedy jest to możliwe poprzez ocenę intensywności prążka. Jednakże metody tej nie zaleca się dla markerów dziedziczonych na zasadzie kodominacji. Markery AFLP wykazują szeroki polimorfizm, co objawia się dużą liczbą prążków przy małej liczbie analizowanych par starterów. Jest to ich dużą zaletą. Zaletą jest również krótki czas analiz. Duże doświadczenie i umiejętność analizy wyników można zaliczyć do wad metody.

SSR (ang. Simple Sequence Repeat)

Coraz częściej do analiz wykorzystuje się markery SSR, zwane również markerami mikrosatelitarnymi. Markery te wykorzystują obecność w genomie tzw. DNA mikrosatelitarnego. Jest to DNA, w którym motyw powtarzalny ma długość 1-4 nukleotydów. Różne allele tego samego locus mogą mieć zmienną liczbę powtórzeń elementu podstawowego. Liczba powtórzeń waha się w przedziale 10-50 a łączna długość odcinka mikrosatelity wynosi 100-400 pz. Sekwencje te zlokalizowane są częściej w euchromatynie, występują też w centromerach i telomerach. Elementem podstawowym może być dwunukleotyd [(AG)n; (AC)n; (AT)n; (CA)n; (CG)n i in.], trójnukleotyd [(TCT)n; (TTG)n; (ATT)n; (TAA)n i in.] lub czteronukleotyd [(TATG)n; (AGTG)n; (GACA)n i in.]. Dla genomu roślinnego najbardziej charakterystycznym powtórzeniem jest dwunukleotyd (AT)n oraz trójnukleotyd (TAT)n. Do analizy SSR niezbędna jest biblioteka genomowa. Z biblioteki tej, przy użyciu sondy mikrosatelitarnej, selekcjonuje się klony zawierające locus mikrosatelitarne. Wyselekcjonowane klony poddaje się sekwencjonowaniu. Na bazie sekwencji tworzy się startery oskrzydlające rejony mikrosatelitarnego DNA. Na kocu 3' lub 5' mogą one mieć dodatkowo 1-4 selekcyjnych nukleotydów. Startery te wykorzystuje się w reakcji PCR, w której powielana jest sekwencja DNA repetywnego. W zależności od liczby powtórzeń elementu podstawowego generowane są prążki o różnej długości. Olbrzymią zaletą markerów SSR jest wysoki polimorfizm oraz kodominacyjny sposób dziedziczenia. Wynika to z różnej liczby powtórzeń elementu podstawowego w allelach locus mikrosatelitarnego. Wysoki polimorfizm pozwala na rozróżnienie osobników blisko spokrewnionych. Bardzo niekorzystną cechą tego systemu jest brak możliwości wykorzystania tych samych starterów dla badań różnych gatunków. Startery można wykorzystać jedynie dla badań różnych populacji w obrębie jednego gatunku. Wysoki koszt analiz oraz trudności w znalezieniu odpowiedniego markera SSR są tutaj wysoce niekorzystne.

SNP (ang. Single Nucleotide Polymorphism)

System ten pozwala na wykrycie polimorfizmu pojedynczego nukleotydu w obrębie sekwencji DNA. Polimorfizm ten jest niezwykle szeroki w genomie roślin. Technika polega na amplifikacji fragmentu genomu za pomocą reakcji PCR a następnie sekwencjonowaniu powstałego produktu. Po sekwencjonowaniu fragmentów należących do różnych osobników porównuje się ich sekwencję nukleotydową w celu identyfikacji SNP. Analiza ta jest dość trudna i wymaga pewnej wprawy. Dodatkowym utrudnieniem jest dość wysoki koszt analiz. Za stosowaniem tej analizy przemawia ogromny polimorfizm obserwowany w analizowanej sekwencji.

PYROSEQUENCING

Pewnym postępem w kierunku analiz SNP jest Pyrosequencing. Jest to sekwencjonowanie przez syntezę. Technika ta pojawiła się na przełomie XX i XXI wieku i jest obecnie wykorzystywana w pewnej liczbie laboratoriów ze względu na dość wysoki koszt sprzętu niezbędnego do analiz. Na czym polega sekwencjonowanie przez syntezę?
Reakcję można podzielić na 4 etapy.
W pierwszym etapie starter sekwencyjny hybrydyzuje z jednoniciowym DNA, który jest amplifikowany reakcją PCR. Dodatkowo w mieszaninie reakcyjnej znajdują się enzymy: DNA polimeraza, ATP sulfurylaza, lucyferaza i apyraza oraz substraty: adenozyno-5'-fosfosiarczan (APS) i luceferyna.
W drugim etapie do mieszaniny dodawany jest pierwszy z trifosforanów deoksynukleotydów (dNTP). DNA polimeraza katalizuje inkorporację tego deoksynukleotydu w nić DNA pod warunkiem, że jest on do niej komplementarny. Każdy przypadek wbudowania nukleotydu wiąże się z uwolnieniem ekwimolarnej ilości pirofosforanu (PPi) zależnej od ilości włączonych deoksynukleotydów do nici DNA.
W trzecim etapie ATP sulfurylaza ilościowo przekształca PPi w ATP w obecności adenozyno-5'-fosfosiarczanu. Ten powstały ATP generuje lucyferynozależną konwersję lucyferyny do oksylucyferyny. Konwersja ta emituje światło widzialne w ilości proporcjonalnej do ilości ATP produkowanego przez ATP sulfurylazę. Światło emitowane w reakcji katalizowanej przez lucyferazę jest rejestrowane przez kamerę CCD i uwidaczniane w postaci piku na pyrogramie. Każdy sygnał świetlny jest proporcjonalny do ilości wbudowanych nukleotydów.
W czwartym etapie apyraza, enzym konstytutywnie degradujący nukleotydy, degraduje niewbudowane dNTP i nadmiar ATP. Kiedy degradacji ulegną wszystkie dNTP i nadmiar ATP, kolejny dNTP jest dodawany do mieszaniny reakcyjnej i cykl się powtarza. W czasie dodawania kolejnych deoksynukleotydów nić DNA będąca matrycą jest uzupełniana przez brakujące nukleotydy, natomiast pyrogram jest uzupełniany przez kolejne piki generowane sygnałem świetlnym.
Pyrosequencing jest niezwykle użytecznym narzędziem do poszukiwań SNP i jest wykorzystywany w tym celu na coraz większą skalę.

SAMPL (ang. Selectively Amplified Microsatelite Polimorphic Loci)

Znacznie tańszą i prostszą metodą poszukiwania markerów molekularnych, a tym samym identyfikacji alleli jest, SAMPL. Metoda ta narodziła się z połączenia dwóch technik: SSR i AFLP. Polega ona na trawieniu DNA genomowego jednym enzymem restrykcyjnym, przeważnie rzadko tnącym nić DNA. Do miejsca tego przyłączony jest adaptor przez T4 DNA ligazę. Miejsce to będzie miejscem hybrydyzacji startera AFLP. Drugi starter jest komplementarny do sekwencji mikrosatelitarnej. Amplifikowany fragment zawiera się pomiędzy miejscem restrykcyjnym a sekwencją mikrosatelitarną. Metoda ta ma szansę wyprzeć klasyczny AFLP, ponieważ generuje prążki o bardzo wysokim polimorfizmie i pozwala na wykrycie alleli kodominujących.

Prawdopodobnie następne lata przyniosą dalszy rozwój nowych, nieznanych dotąd technik pozwalających na jeszcze głębszą analizę struktury i funkcji DNA.

Tabela 1. Porównanie właściwości RFLP, RAPD, CAPS, AFLP, SSR [ 1 ]
RFLPRAPDCAPSAFLPSSR
oznaczenietrawienie endonukleazą, Southern blooting, hybrydyzacjaamplifikacja z wykorzystaniem losowych starterówPCR, trawienie endonukleazą produktu PCRtrawienie endonukleazami, ligacja adaptorów, PCR nie- i specyficznyPCR z użyciem odpowiednich starterów
typ polimorfizmumutacje punktowe, insercje, delecjemutacje punktowe, insercje, delecjemutacje punktowe, insercje, delecjemutacje punktowe, insercje, delecjezmiany długości sekwencji mikrosatelitarnych
poziom polimorfizmuśredniśredniśredniśredniwysoki
częstość występowania w genomiewysokawysokawysokawysokaśrednia
występowanieregiony kodującecały genomcały genomcały genomDNA repetatywny
typ dziedziczeniakodominacjadominacjakodominacjadominacjakodominacja
wykrywanie alleli genutaknietaknie/tak (żadko)tak
wymagana ilość DNA2-10 mg10-25 ng50-100 ng30-100 ng50-100 ng
wymagana czystość DNArelatywnie czystysurowy ekstraktsurowy ekstraktrelatywnie czystyczysty
typ sondygatunkowo specyficzny genomowy DNA o małej liczbie kopii lub klony cDNAoligonukleotydy 8-11 pz o losowej sekwencjigatunkowo specyficzny genomowy DNA o małej liczbie kopii lub klony cDNAoligonukleotydy komplementarne do adaptora i miejsca restrykcyjnego z 1-4 nukleotydani selekcyjnymi na 3' końcu oligonukleotydy komplementarne do sekwencji flankujących sekwencje powtórzone z 1-4 nukleotdami selekcyjnymi na 3' lub 5'
wymagana znajomość sekwencjinienietaknietak
radioaktywna detekcjatak/nienienietak/nienie
trudności techniczneumiarkowaneniewielkieumiarkowane/wysokieumiarkowanewysokie
wiarygodnośćwysokaumiarkowanaumiarkowanaumiarkowanawysoka
powtarzalnośćwysokaniskaumiarkowanawysokawysoka
koszt analizywysokiniskiwysokiumiarkowanywysoki

 Przypisy:
[ 1 ] Zmienione, na podstawie: B. Wolko, L. Irzykowska, W. Święcicki, 1999. AFLP i SSR- systemy markerowe przydatne w hodowli roślin, Postępy Nauk Rolniczych, nr 2/99.

Michał Łuczak
Biolog molekularny (specjalizacja na Uniwersytecie Adama Mickiewicza w Poznaniu). Tytuł magistra uzyskał w 2002 r. Obecnie jest doktorantem w Instytucie Genetyki Roślin Polskiej Akademii Nauk w Poznaniu. Zajmuje się markerami molekularnymi (AFLP, SSR, STS) oraz cytogenetyką (GISH, FISH). Przedmiotem jego badań są trawy.

 Oryginał.. (http://www.racjonalista.pl/kk.php/s,3411)
 (Ostatnia zmiana: 07-11-2005)