skrypt_badamyDNA.pdf

(1466 KB) Pobierz
79484905 UNPDF
Badamy DNA
Agata Rogowska, Jakub Urbański
Opracowanie merytoryczne treści zestawu:
Agata Rogowska, Jakub Urbański
Ilustracje:
Dean Madden
Korekta:
Joanna Lilpop
Zestaw opracowany w ramach projektu „Science of Modern Biology –
Exploratory Resources for Biology Teachers and Students” inansowanego
przez UNESCO.
Autorzy pragną serdecznie podziękować wszystkim osobom, które
przyczyniły się do powstania zestawu, w szczególności współpracownikom
Szkoły Festiwalu Nauki, Fundacji BioEdukacji oraz instytucjom
założycielskim Szkoły Festiwalu Nauki: Międzynarodowemu Instytutowi
Biologii Molekularnej i Komórkowej, Instytutowi Biochemii i Bioizyki PAN,
Instytutowi Biologii Doświadczalnej PAN, Szkole Głównej Gospodarstwa
Wiejskiego.
Osobne podziękowania należą się dyrektorowi MIBMiK, panu Profesorowi
Jackowi Kuźnickiemu.
Niniejsze materiały podlegają licencji Creative Commons:
Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 2.5 Polska.
1 4 3
Niniejsze materiały wolno kopiować i rozpowszechniać wyłącznie niekomercyjnie w celach edukacyjnych,
pod warunkiem umieszczenia na kopiach logo Funacji BioEdukacji i Szkoły Festiwalu Nauki oraz informacji
o autorach. Nie zezwala się na zmiany ani przekształcenia niniejszego skryptu. W przypadku innych
zastosowań lub zmian materiałów niezbędna jest zgoda Fundacji BioEdukacji (www.bioedukacja.org.pl).
79484905.014.png 79484905.015.png
Szkoła Festiwalu Nauki
Struktura i funkcja DNA
Kwas deoksyrybonukleinowy - DNA (skrót od angielskiego d e ox y r ib o n ucl eic a cid )
jest podstawowym nośnikiem informacji genetycznej u wszystkich organizmów prokario-
tycznych, eukariotycznych, archeonów i niektórych wirusów. W podwójnej nici DNA zapisane
są, przekazywane od tysięcy pokoleń, informacje o budowie i czynnościach życiowych
organizmów. Łańcuch DNA zbudowany jest tylko z czterech rodzajów cząsteczek – nukleo-
tydów, w skład których wchodzą zasady azotowe: g uanina (G), c ytozyna (C), a denina (A) i
t ymina (T). To właśnie sekwencja tych zasad w łańcuchu DNA ma fundamentalne znacze-
nie dla życia na naszej planecie. Sekwencję DNA można przyrównać do książki napisanej
czteroliterowym alfabetem, kolejne zdania tej książki – geny, zapisane są we wspólnym dla
wszystkich organizmów języku – uniwersalnym kodzie genetycznym. Każde trzy litery w
sekwencji genu odpowiadają jednemu znakowi – aminokwasowi. Jak łatwo policzyć, liczba
wszystkich możliwych trzyliterowych kombinacji zapisanych czteroliterowym alfabetem
wynosi 4 3 , a więc 64. Teoretycznie więc dałoby się zakodować 64 aminokwasy - ponieważ
jednak białka wszystkich organizmów żywych zbudowane są z dwudziestu aminokwasów,
niektórym aminokwasom przypisane może być kilka trzyliterowych kodonów. Oprócz tego
istnieją także oznaczające koniec genu kodony stop – można przyrównać je do kropek koń-
czących zdanie. Każdemu kodonowi kodującemu aminokwas odpowiada jedna cząsteczka
tRNA z komplementarnym antykodonem. tRNA, czyli transportowe RNA, bierze udział w
translacji i służy jako „przenośnik” aminokwasów.
Kod genetyczny jest uniwersalny - z kilkoma drobnymi odstępstwami, te same kodony
kodują te same aminokwasy u wszystkich organizmów żywych i wirusów. Organizmy różnią
się jednak częstotliwością wykorzystania poszczególnych kodonów – wynika to pośrednio
ze składu nukleotydowego DNA. Wiadomo, że u organizmów o niskiej zawartości par G:
C w genomie, kodony bogate w G i C wykorzystywane będą rzadziej niż kodony bogate
w A i T.
Tabela 1. Uniwersalny kod
genetyczny.
* W RNA uracyl odpowiada
tyminie – stąd U zamiast T
w tabeli.
U*
C
A
G
U*
UUU fenyloalanina
UUC fenyloalanina
UUA leucyna
UUG leucyna
UCU seryna
UCC seryna
UCA seryna
UCG seryna
UAU tyrozyna
UAC tyrozyna
UAA STOP
UAG STOP
UGU cysteina
UGC cysteina
UGA STOP
UGG tryptofan
CUU leucyna
CUC leucyna
CUA leucyna
CUG leucyna
CCU prolina
CCC prolina
CCA prolina
CCG prolina
CAU histydyna
CAC histydyna
CAA glutamina
CAG glutamina
CGU arginina
CGC arginina
CGA arginina
CGG arginina
C
A
AUU izoleucyna
AUC izoleucyna
AUA izoleucyna
AUG metionina
ACU treonina
ACC treonina
ACA treonina
ACG treonina
AAU asparagina
AAC asparagina
AAA lizyna
AAG lizyna
AGU seryna
AGC seryna
AGA arginina
AGG arginina
G
GUU walina
GUC walina
GUA walina
GUG walina
GCU alanina
GCC alanina
GCA alanina
GCG alanina
GAU kwas asparaginowy
GAC kwas asparaginowy
GAA kwas glutaminowy
GAG kwas glutaminowy
GGU glicyna
GGC glicyna
GGA glicyna
GGG glicyna
Niektóre aminokwasy kodowane są przez kilka różnych kodonów. Jeżeli chcemy wpro-
wadzić gen z jednego organizmu (np. gen kodujący ludzkie białko) i chcemy uruchomić jego
ekspresję w innym organizmie (np. w bakterii) musimy sprawdzić, czy kodony wykorzystane
w genomie ludzkim są równie często wykorzystywane w genomie bakteryjnym. Jeśli nie
są, to przed przystąpieniem do klonowania warto wprowadzić w sekwencji DNA zmiany
(precyzyjnie zlokalizowane mutacje), które nie wpłyną na sekwencję aminokwasową, ale
zamienią rzadziej używane przez bakterie kodony na „lepsze”.
Przyjrzyjmy się bliżej DNA. Ma on strukturę dwuniciową, nici skręcone są w helisę.
Każda z nici zbudowana jest z połączonych wiązaniami fosfodiestrowymi nukleotydów.
Na nukleotyd składa się zasada azotowa – puryna lub pirymidyna, cząsteczka cukru
– pentozy, w wypadku DNA jest to deoksyryboza, oraz reszta kwasu fosforowego. Reszta
kwasu fosforowego łączy się w łańcuchu DNA z pierścieniem cukru kolejnego nukleotydu.
www.sfn.edu.pl
2
79484905.016.png 79484905.017.png 79484905.001.png 79484905.002.png
Badamy DNA
Puryny
Rys. 1. Wzory zasad
azotowych wchodzących w
skład kwasów
nukleinowych: DNA i RNA
Pirimidyny
W związku z tym pojedyncza nić DNA wykazuje polaryzację - na jednym jej końcu zwanym
końcem 5’ znajduje się wolna reszta kwasu fosforowego, na drugim zaś, zwanym końcem
3’, wolna cząsteczka deoksyrybozy. Nici DNA połączone są wiązaniami wodorowymi między
parami zasad. Zgodnie z regułą komplementarności pirymidyna zawsze łączy się z puryną
– odpowiednio adenina z tyminą (dwoma wiązaniami) i cytozyna z guaniną (trzema wiąza-
niami). Aby mogło dojść do wytworzenia wiązań wodorowych między zasadami, nici DNA
muszą być względem siebie odwrotnie spolaryzowane – koniec 3’ jednej nici odpowiada
końcowi 5’ drugiej.
Podwójną helisę porównać można do skręconej spiralnie drabinki sznurowej, szczeble
drabinki odpowiadałyby kolejnym parom zasad, podczas gdy sznury boczne stanowiłyby
odpowiednik łańcuchów pentozofosforanowych.
Dzisiaj strukturę DNA zna chyba każdy. Aż trudno uwierzyć, że poznano ją dopiero w
drugiej połowie XX wieku. Jej model zaproponowali w 1953 roku naukowcy James Watson,
Francis Crick, Maurice Wilkins i Rosalind Franklin – pierwszych troje nagrodzono za to od-
krycie Nagrodą Nobla w 1962 roku, Rosalind Franklin nie było dane dożyć tego momentu.
Bez wątpienia było to jedno z najważniejszych odkryć w historii ludzkości. Umożliwiło
zrozumienie zasad zapisu informacji genetycznej i zapewniło dynamiczny rozwój genetyki
i biologii molekularnej. W niespełna pół wieku od rozwikłania struktury DNA genetyka
stała się jedną z najważniejszych gałęzi współczesnej nauki.
Łączna długość DNA każdej komórki somatycznej ludzkiego ciała wynosi około 2,5 me-
tra. Biorąc pod uwagę rozmiary komórki trudno uwierzyć, że tak długi łańcuch może się
tam zmieścić. Jest to możliwe dzięki upakowaniu DNA. Chromosomalne DNA występuje
w postaci chromatyny. Strukturę DNA eukariotycznego stabilizują silnie konserwowane
ewolucyjnie białka zasadowe – histony. Sekwencja aminokwasowa histonów jest niemal
identyczna u wszystkich organizmów eukariotycznych – histon H4 grochu różni się od
analogicznego histonu krowy tylko dwoma spośród 102 aminokwasów!!! Chromatyna
zbudowana jest z powtarzających się jednostek strukturalnych – nukleosomów. W skład
nukelosomu wchodzi oktamer histonowy – struktura złożona z ośmiu podjednostek biał-
kowych (po dwie cząsteczki histonów H2A, H2B, H3 i H4) oraz owinięta wokół niego nić
DNA o długości 200 par zasad. Nawinięcie na rdzeń histonowy pozwala na blisko 7-krotne
skrócenie wymiarów liniowych nici DNA. Kolejnym poziomem upakowania DNA jest solenoid
– helikalna struktura o średnicy 36 nm, złożona z nukleosomów. Na każdy obrót solenoidu
przypada 6 nukleosomów. Solenoidy z kolei upakowane są w struktury wyższego rzędu,
stabilizowane białkami niehistonowymi.
Ciekawostką jest, że najsilniej upakowane DNA znajduje się w plemnikach – tam białka
histonowe zastąpione są bogatymi w argininę protaminami.
W komórkach prokariotycznych DNA chromosomalne upakowane jest dzięki obecno-
ści zasadowych białek histonopodobnych, zbliżonych właściwościami chemicznymi do
histonów.
Kolejna ważna różnica między DNA prokariotycznym i eukariotycznym przejawia się nie
na poziomie struktury, ale sekwencji kodującej geny. U organizmów eukariotycznych sek-
Rys. 2. Model strukturalny
helisy DNA
Copyright © :
79484905.003.png 79484905.004.png 79484905.005.png 79484905.006.png
Szkoła Festiwalu Nauki
wencje kodujące (czyli te, na podstawie których powstaje mRNA, a później białko)
w obrębie jednego genu rozdzielone są sekwencjami niekodującymi. Fragmenty
kodujące nazywamy egzonami, a niekodujące intronami. Po syntezie pierwotnego
transkryptu RNA dochodzi do tzw. splicingu (czyt. splajsingu), w wyniku którego z
egzonów składane jest mRNA. U organizmów prokariotycznych geny pozbawione
są intronów – pierwotny transkrypt – mRNA, stanowi już gotową matrycę do
syntezy białka. Różnica ta ma duże znaczenie, jeżeli chcemy syntetyzować sklo-
nowane białka eukariotyczne w bakteriach – do bakterii musimy wprowadzić gen
eukariotyczny ze zmodyikowaną, czyli pozbawioną intronów sekwencją.
Genom człowieka
Informacja genetyczna organizmów eukariotycznych zapisana jest w genomach:
jądrowym, mitochondrialnym oraz chloroplastowym (u roślin). Ludzki genom ją-
drowy ma długość około 3 miliardów par zasad i jest podzielony na 24 cząsteczki
zwane chromosomami. 22 z nich to chromosomy autosomalne (autosomy), nato-
miast pozostałe, X i Y to chromosomy płci. Każda komórka somatyczna ludzkiego
ciała zawiera 23 pary chromosomów (22 pary autosomów oraz 2 chromosomy X
– w wypadku kobiet lub X i Y u mężczyzn). Szacuje się, że w genomie jądrowym
kodowanych jest od trzydziestu do pięćdziesięciutysięcy genów, które stanowią
zaledwie 2 % sekwencji jądrowego DNA. Reszta genomu to sekwencje niekodujące,
o nieznanej funkcji.
Mitochondrialny genom człowieka jest wielokrotnie mniejszy od jądrowego.
Liczy 16 569 par zasad, koduje 37 genów. Należy pamiętać, że w każdej komórce
znajduje się wiele mitochondriów, a każde mitochondrium może zawierać do 10
cząsteczek mtDNA.
Rys. 3. Porównanie
wysokości człowieka i
długości cząsteczki DNA
z jednej komórki.
Sekwencje powtórzone
Powszechne jest występowanie w genomie ludzkim sekwencji powtórzonych. Są to sek-
wencje rozproszone po całym genomie, zwykle niekodujące. Stanowią nawet do 20% całego
ludzkiego genomu. Istnieje kilka klas sekwencji powtórzonych - każda z klas charakteryzuje
się odmienną strukturą. Jedną z klas tych sekwencji są sekwencje satelitarne.
Na ogół są to zblokowane, wielokrotnie powtórzone, krótkie sekwencje nukleotydowe.
Można je przyrównać do sznura korali nanizanych na nitkę, przy czym każdy koralik może
zawierać od 1 do nawet 100 nukleotydów. W zależności od tego jaka liczba nukleotydów
przypada na jeden „koralik” wyróżniamy sekwencje minisatelitarne (10-100 nukleotydów)
lub mikrosatelitarne (1-10 nukleotydów).
Rys. 4. Sekwencje
powtórzone w DNA
CAG
CAG
CAG
CAG
CAG
CAG
sekwencja
mikrosatelitarna
sekwencja
minisatelitarna
CAGATGGATCTAGC CAGATGGATCTAGC
Podobnie jak geny, każda sekwencja powtórzona ma swoje „miejsce” w genomie, czyli
locus (l.mn. loci). Jeżeli weźmiemy dwie dowolne osoby i będziemy szukali w ich DNA kon-
kretnej sekwencji nukleotydowej, wszystko jedno czy jest to sekwencja kodująca (gen), czy
sekwencja niekodująca to, o ile nie doszło u którejś z tych osób do zaburzenia struktury
chromosomów, z pewnością znajdziemy szukaną sekwencję w obrębie tego samego frag-
mentu tego samego chromosomu (czyli w locus).
www.sfn.edu.pl
79484905.007.png 79484905.008.png 79484905.009.png 79484905.010.png
Badamy DNA
Jak już wspomniano, sekwencje powtórzone to zwykle sekwencje niekodujące. Zatem
występowanie w ich obrębie mutacji nie pociąga za sobą konsekwencji dla funkcjonowania
organizmu, a mutacje kumulują się, są utrwalane i przekazywane kolejnym pokoleniom.
Sekwencje powtórzone są więc polimoriczne (różnorodne).
Oznacza to, że każda sekwencja powtórzona może występować w populacji ludzkiej w
kilku lub nawet kilkunastu wariantach (allelach). Polimorizm sekwencji powtórzonej może
polegać np. na zmianie ilości powtórzeń, czyli liczby „koralików” nanizanych na nitkę.
Obecnie znanych jest bardzo wiele różnych sekwencji powtórzonych i ich loci.
ALLEL A
3 powtórzenia
Rys. 5. Przykładowe allele
sekwencji satelitarnych
ALLEL B
5 powtórzeń
ALLEL C
6 powtórzeń
Sekwencja minisatelitarna DS80
Każdy poznany gen ma swoja nazwę. Nazwa zwykle pochodzi od nazwy białka, które
powstaje na podstawie tego genu, funkcji którą owo białko pełni lub charakterystycznych
cech budowy białka lub genu. Sekwencje niekodujące natomiast nazwy zawdzięczają
swojemu położeniu w obrębie genomu. I tak, sekwencja powtórzona D1S80 znajduje się na
krótszym ramieniu pierwszego chromosomu (1 oznacza pierwszy chromosom, a S krótkie
ramię – od ang. short )
D1S80 jest sekwencją powtórzoną, polimoriczną, niekodującą. Jednostka powtórzenia
- „koralik”, zawiera 16 nukleotydów, jest to wobec tego sekwencja minisatelitarna. W po-
pulacji ludzkiej występuje 29 wariantów (alleli) tej sekwencji, ponieważ liczba „koralików”,
czyli jednostek powtórzenia, może mieścić się w granicach od 14 do 43. Ciekawostką jest,
że nie stwierdzono występowania u ludzi allelu o 15 powtórzeniach!
Populacje ludzkie różnią się między sobą częstością występowania poszczególnych alleli
sekwencji powtórzonych, np. w populacji ludzi rasy kaukaskiej (do tej populacji należą także
Polacy) najczęstszymi allelami sekwencji D1S80 są allele o 18 i 24 powtórzeniach.
Pamiętając o tym, że jesteśmy organizmami diploidalnymi, musimy sobie zdawać spra-
wę, że na obu naszych chromosomach pierwszej pary może znajdować się ten sam allel
sekwencji D1S80 (jesteśmy wtedy homozygotami względem D1S80) lub też różne allele
(wtedy mówimy o heterozygotyczności). Z badań nad częstością występowania alleli D1S80
wynika, że ponad 86% populacji ludzkiej jest heterozygotami w tym locus.
Jak bada się sekwencje powtórzone?
Najczęściej wykorzystywaną metodą badania polimorizmu sekwencji powtórzonych
różniących się długością jest rozdział elektroforetyczny produktów reakcji PCR w żelu
agarozowym lub poliakrylamidowym.
Co to jest PCR?
PCR (ang. P olymerase C hain R eaction), czyli łańcuchowa reakcja polimerazy jest jedną
z podstawowych technik biologii molekularnej. Wykorzystywana jest do namnażania kon-
kretnych fragmentów DNA. Jej podstawowym atutem jest szybkość oraz prostota.
W PCR wykorzystano podstawowe zasady replikacji DNA przez enzym zwany polimerazą
DNA. Enzym ten jest w stanie dołączyć nukleotyd tylko do wolnej grupy -OH na 3’końcu
nici, kierunek polimeryzacji jest wobec tego określony: 5’ -> 3’. Ponadto, polimeraza do
5
Copyright © :
79484905.011.png 79484905.012.png 79484905.013.png
Zgłoś jeśli naruszono regulamin