Mikromacierze DNA – zasady projektowania sond.pdf

(546 KB) Pobierz
274148162 UNPDF
PRACE PRZEGL¥DOWE
Mikromacierze DNA –
zasady projektowania sond
Piotr Formanowicz 1,2,* , Rados³aw Urbaniak 1 , Luiza Handschuh 2,3 ,
Dorota Formanowicz 4 , Marek Figlerowicz 2
1 Instytut Informatyki, Politechnika Poznañska, Poznañ
2 Instytut Chemii Bioorganicznej, Polska Akademia Nauk, Poznañ
3 Katedra i Klinika Hematologii i Chorób Rozrostowych Uk³adu
Krwiotwórczego, Uniwersytet Medyczny im. K. Marcinkowskiego, Poznañ
4 Katedra Chemii i Biochemii Klinicznej, Uniwersytet Medyczny
im. K. Marcinkowskiego, Poznañ
DNA microarray probe design
Summary
DNA microarrays are widely used in many areas of biological research. They
are an efficient tool for gene expression analysis due to a high level of parallel-
ism, what means that they allow for simultaneous measuring of the
transcriptional activity of all genes present in the studied genome. The quality
of the results obtained using microarrays depends among other factors on the
proper design of probes. Two general features which should characterize each
probe are sensitivity and specificity. Since designing a set of probes having both
of these properties is usually a complex task, many algorithms supporting this
process have been developed and implemented. However, the designing
method should be carefully chosen such that the results will match the require-
ments following from the nature of the biological problem to be solved. In this
paper the criteria used for DNA microarray design are described and some com-
puter based approaches are presented.
Adres do korespondencji
Piotr Formanowicz,
Instytut Informatyki,
Politechnika Poznañska,
ul. Piotrowo 2,
60-965 Poznañ;
e-mail:
piotr@cs.put.poznan.pl
Key words:
DNA micrarrays, probe selection, probe features, computer based methods.
1. Wstêp
Jednym z najwiekszych wyzwañ przed jakimi stoi obecnie
biologia molekularna i obliczeniowa jest dok³adne poznanie
struktury genomów oraz mechanizmów kontroluj¹cych sposób
4 (83) 54–67 2008
274148162.001.png 274148162.002.png 274148162.003.png
Mikromacierze DNA – zasady projektowania sond
ich funkcjonowania. W tym celu tworzone s¹ coraz bardziej doskona³e narzêdzia
umo¿liwiaj¹ce precyzyjn¹ analizê aktywnoœci transkrypcyjnej genomu oraz œledze-
nie zachodz¹cych w nim zmian. Jednym z takich narzêdzi s¹ mikromacierze DNA.
Mikromacierze s¹ miniaturowymi uk³adami hybrydyzacyjnymi sk³adaj¹cymi siê
z sond specyficznie rozpoznaj¹cych fragmenty poszczególnych genów lub tran-
skryptów. Mog¹ one s³u¿yæ zarówno do analizy strukturalnej jak i funkcjonalnej ge-
nomu, st¹d znajduj¹ liczne zastosowania w wielu dziedzinach biologii i medycyny.
Podstawowym problemem, jaki nale¿y rozwi¹zaæ przed przyst¹pieniem do w³aœ-
ciwych badañ jest odpowiednie zaplanowanie ca³ego eksperymentu. Je¿eli nie ko-
rzystamy z macierzy komercyjnej g³ównym zadaniem staje siê zaprojektowanie ze-
stawu sond, które bêd¹ nastêpnie umieszczone na macierzy. Warunkiem niezbêd-
nym uzyskania wiarygodnych wyników w eksperymencie mikromacierzowym jest
wysoka czu³oœæ oraz specyficznoœæ sond. Oznacza to, ¿e ka¿da z nich musi specy-
ficznie rozpoznawaæ fragment genomu lub transkryptomu powsta³ego podczas eks-
presji informacji genetycznej. Ze wzglêdu na z³o¿onoœæ problemu projektowania
mikromacierzy do jego rozwi¹zania stosowane s¹ metody informatyczne (1). W pra-
cy przedstawione zostan¹ podstawowe kryteria stosowane przy doborze sond oraz
przyk³ady wykorzystywanych w praktyce algorytmów.
2. Projektowanie sond
Dwie zasadnicze cechy, jakie powinny posiadaæ sondy, z których zbudowana jest
mikromacierz to wysoka czu³oœæ oraz specyficznoœæ. Pierwsza z tych cech oznacza,
¿e dana sonda z wysokim prawdopodobieñstwem hybrydyzuje z okreœlonym frag-
mentem DNA lub RNA, którego obecnoœæ w badanej próbie ma wykrywaæ. Jednym
z podstawowych warunków, jakie musi spe³niæ sonda jest zatem pe³na komplemen-
tarnoϾ do wybranego fragmentu sekwencji docelowej. Z kolei specyficznoϾ sondy
oznacza minimalizacjê prawdopodobieñstwa jej hybrydyzacji do sekwencji innej ni¿
docelowa. Poszukiwana sonda powinna zatem charakteryzowaæ siê jak najmniej-
szym stopniem komplementarnoœci do wszystkich sekwencji, które mog¹ znaleŸæ
siê w badanej próbie, z wyj¹tkiem sekwencji docelowej. Z algorytmicznego punktu
widzenia zapewnienie wysokiej czu³oœci jest zadaniem stosunkowo prostym – na-
le¿y dla ka¿dej sekwencji, która ma byæ wykrywana za pomoc¹ mikromacierzy za-
projektowaæ w pe³ni komplementarn¹ sondê – przy czym zarówno sonda, jak
i komplementarny do niej fragment sekwencji docelowej samodzielnie nie powinny
tworzyæ stabilnych struktur drugorzêdowych. O wiele bardziej skomplikowanym
problemem jest zapewnienie wysokiej specyficznoœci sond. Oczywiœcie, ka¿da
z nich musi posiadaæ obie w³aœciwoœci jednoczeœnie, dlatego jako sondê nale¿y wy-
braæ taki oligonukleotyd, który jest w pe³ni komplementarny do fragmentu wybra-
nego genu lub mRNA, a jednoczeœnie jak najmniej komplementarny do wszystkich
innych genów lub mRNA z badanej próby. Jest to zatem zadanie minimalizacji war-
BIOTECHNOLOGIA 4 (83) 54-67 2008
55
Piotr Formanowicz i inni
toœci pewnego kryterium. Mo¿e ono jednak zostaæ sformu³owane w inny sposób, tj.
mog¹ byæ poszukiwane sekwencje, których stopieñ komplementarnoœci do sekwen-
cji innych ni¿ docelowe nie przekracza pewnego progu, poni¿ej którego prawdopo-
dobieñstwo hybrydyzacji jest wystarczaj¹co ma³e.
Wspomniana pe³na komplementarnoœæ lub jej brak ma zapewniæ zachodzenie hy-
brydyzacji z jak najwiêkszym lub jak najmniejszym prawdopodobieñstwem. Jego wiel-
koœæ zale¿eæ bêdzie przede wszystkim od energii wi¹zañ wodorowych, jakie mog¹ siê
utworzyæ miêdzy cz¹steczkami DNA lub RNA. U¿ytecznym parametrem bêd¹cymmiar¹
tej energii jest temperatura topnienia dupleksu ( T m ) DNA/DNA, DNA/RNA lub RNA/RNA.
T m definiuje siê jako temperaturê, w której równo po³owa dupleksów ulega rozplece-
niu (przejœciu z formy dwuniciowej do jednoniciowej) (2-4). W rezultacie podstawo-
wym kryterium stosowanym przy projektowaniu sond nie jest komplementarnoϾ se-
kwencji (komplementarnoœæ dwóch ci¹gów znaków), lecz temperatura topnienia du-
pleksu tworzonego przez te sekwencje. Oczywiœcie istnieje zale¿noœæ pomiêdzy
ci¹gami znaków reprezentuj¹cymi sekwencje a temperatur¹ topnienia, ale zwi¹zek
ten nie jest do koñca jasny. Precyzyjne obliczenie temperatury topnienia dupleksu jest
z³o¿onym zagadnieniem termodynamicznym, które nie doczeka³o siê dot¹d dok³adne-
go rozwi¹zania. Niemniej jednak wiele badañ, w których d¹¿ono do okreœlenia zale-
¿noœci temperatury topnienia od sekwencji nukleotydowej cz¹steczek tworz¹cych du-
pleks zosta³o przeprowadzonych i pewne modele z nich wynikaj¹ce s¹ z powodze-
niem stosowane w praktyce. Ró¿ni¹ siê one oczywiœcie dok³adnoœci¹ wyznaczanej
temperatury i z³o¿onoœci¹ obliczeñ koniecznych do przeprowadzenia. Wed³ug naj-
prostszego z nich ka¿da para A-T wnosi 2°C do temperatury topnienia dupleksu, a para
C-G wnosi 4°C (2,3). Choæ bardzo uproszczony, model ten jest czêsto stosowany do
projektowania starterów do reakcji PCR. Najbardziej zbli¿one do rzeczywistoœci wyni-
ki daje metoda najbli¿szego s¹siada, w której, przynajmniej do pewnego stopnia,
uwzglêdniana jest nie tylko liczba poszczególnych nukleotydów w cz¹steczkach two-
rz¹cych dupleks, ale równie¿ ich sekwencje (4-6). Wad¹ standardowej wersji tej meto-
dy jest to, ¿e daje ona stosunkowo dok³adne wyniki dla sekwencji ca³kowicie komple-
mentarnych, natomiast zawodzi w przypadku wystêpowania ró¿nego typu niedopaso-
wañ. Dlatego model zosta³ rozszerzany przez wprowadzanie dodatkowych parame-
trów odpowiadaj¹cych ró¿nego rodzaju niedopasowaniom (7-12). Niezale¿nie jednak
od metody, jaka zosta³a wykorzystana do wyznaczenia temperatury topnienia, sondy
nale¿y zaprojektowaæ w taki sposób, by dupleksy jakie tworz¹ one z sekwencjami do-
celowymi charakteryzowa³y siê identycznymi lub zbli¿onymi wartoœciami T m . Jednak-
¿e dupleksy tworzone z sekwencjami innymi ni¿ docelowe powinny mieæ temperatury
topnienia na tyle niskie, by nie dochodzi³o do ich utworzenia.
Przedstawiliœmy jedynie ogólny zarys metody projektowania macierzy DNA,
w której zasadniczym kryterium przydatnoœci sond jest temperatura topnienia du-
pleksu. W praktyce sondy wybiera siê na podstawie szeregu ³atwych do sprawdze-
nia kryteriów cz¹stkowych, których suma stanowi przybli¿enie kryterium dok³adnej
temperatury topnienia. Najczêœciej stosowane s¹ nastêpuj¹ce regu³y (13-17):
56
PRACE PRZEGL¥DOWE
Mikromacierze DNA – zasady projektowania sond
– zawartoœæ danego nukleotydu w sondzie nie mo¿e stanowiæ wiêcej ni¿ 50% se-
kwencji,
– fragmenty sk³adaj¹ce siê z nukleotydów jednego rodzaju nie powinny przekra-
czaæ 25% d³ugoœci sondy,
– zawartoœæ nukleotydów GC powinna mieœciæ siê w granicach od 30 do 70%,
– oligonukleotydy bêd¹ce sondami oraz komplementarne do nich sekwencje do-
celowe nie powinny tworzyæ stabilnych struktur drugorzêdowych,
– d³ugoœæ ci¹g³ego fragmentu sondy (podci¹gu) komplementarnego do sekwen-
cji nie bêd¹cej sekwencj¹ docelow¹ nie powinna przekraczaæ 15 nukleotydów,
– stopieñ komplementarnoœci do sekwencji nie bêd¹cej sekwencj¹ docelow¹ nie
powinien przekraczaæ 75%.
Kryteria te zosta³y m. in. wykorzystane przy tworzeniu programu PICKY (18),
którego ciekaw¹ w³aœciwoœci¹ jest brak koniecznoœci okreœlenia dok³adnej d³ugoœci
projektowanych sond oraz temperatury topnienia. U¿ytkownik podaje jedynie pe-
wien zakres d³ugoœci sond oraz minimaln¹ ró¿nicê miêdzy temperaturami topnienia
dupleksów tworzonych z sekwencjami docelowymi i pozosta³ymi sekwencjami. Bio-
r¹c pod uwagê te ograniczenia program PICKY dobiera sondy tak, by wykazywa³y
one maksymaln¹ czu³oœæ i specyficznoœæ.
W jednej z metod projektowania mikromacierzy genomowych unikatowoϾ sond
sprawdzana jest na podstawie odleg³oœci Levensteina (18). Zgodnie z definicj¹ od-
leg³oœæ Levensteina miêdzy sekwencjami s i t , oznaczona przez L ( s , t ), równa jest naj-
mniejszej liczbie elementarnych operacji edycyjnych niezbêdnych do przekszta³ce-
nia s w t (lub odwrotnie) (19). Wspomnianymi operacjami jest zamiana, wstawienie
i usuniêcie pojedynczego znaku. Autorzy metody przyjmuj¹, ¿e oligonukleotyd
s jest unikatowy, je¿eli nie istnieje (w zbiorze rozwa¿anych sekwencji) oligonukle-
otyd t taki, ¿e L ( s , t )
BIOTECHNOLOGIA 4 (83) 54-67 2008
57
k , gdzie k jest przyjêtym progiem, a ponadto wyst¹pienia s i t
w analizowanych sekwencjach nie nak³adaj¹ siê na siebie. Autorzy przyjêli d³ugoœæ
sond równ¹ 25 nukleotydów, natomiast wartoœæ progu k ustalona zosta³a na 4.
Wyselekcjonowane w ten sposób sondy poddawane s¹ dalszej analizie, w której
zmierza siê do usuniêcia zarówno tych, które mog¹ hybrydyzowaæ same ze sob¹ jak
i tych, które tworz¹ z sekwencjami docelowymi dupleksy o zbyt niskiej temperatu-
rze topnienia. W tym celu zastosowano nastêpuj¹ce kryteria:
– oligonukleotyd mo¿e zawieraæ najwy¿ej 12 nukleotydów A, 12 nukleotydów T,
10 nukleotydówCi10nukleotydów G,
– ¿aden podci¹g o d³ugoœci 8 nukleotydów nie mo¿e zawieraæ wiêcej ni¿ 6 nu-
kleotydów A, 6 T,4Ci4G,
– sonda mo¿e zawieraæ najwy¿ej 6 kolejnych nukleotydów A, 6 nukleotydów T, 5
nukleotydówCi5nukleotydów G,
– koñce sondy nie powinny byæ wzajemnie komplementarne.
Warto zwróciæ uwagê na fakt, ¿e wymienione kryteria s¹ jedynym warunkiem
maj¹cym zapewniæ odpowiedni¹ temperaturê topnienia dupleksów tworzonych
przez sondy z sekwencjami z badanej próby.
Piotr Formanowicz i inni
Na podobnych zasadach oparty zosta³ program YODA (20). W tym przypadku pro-
ces projektowania ma zapewniæ odpowiedni¹ czu³oœæ, specyficznoœæ oraz spójnoœæ
sond. Za³o¿ona czu³oœæ sond osi¹gana jest poprzez eliminacjê oligonukleotydów, któ-
re mog¹ tworzyæ stabilne struktury drugorzêdowe b¹dŸ homodimery. Sondy posia-
daj¹ce takie w³aœciwoœci mia³yby ograniczon¹ zdolnoœæ do hybrydyzacji z sekwencj¹
docelow¹. Specyficznoœæ zapewniana jest przez eliminacjê z pocz¹tkowego zbioru oli-
gonukleotydów tych jego elementów, które wykazuj¹ wiêcej ni¿ 75% komplementar-
noœci do sekwencji innej ni¿ docelowa oraz tych, które zawieraj¹ podci¹g d³u¿szy ni¿
15 nukleotydów ca³kowicie komplementarny do sekwencji ró¿nej od docelowej. Po-
nadto eliminowane s¹ oligonukleotydy zawieraj¹ce d³ugie podci¹gi z³o¿one z nukle-
otydów jednego rodzaju. Spójnoœæ zapewniana jest poprzez dobór oligonukleotydów
o zbli¿onej temperaturze topnienia oraz takich, które s¹ komplementarne do okreœlo-
nego obszaru sekwencji docelowej, np. blisko koñca 3’ lub 5’, b¹dŸ blisko œrodka se-
kwencji – w zale¿noœci od sposobu przygotowania badanej próby.
Do okreœlenia temperatury topnienia stosowany jest model najbli¿szego s¹siada
z parametrami podanymi przez SantaLuciê (4). Najpierw wyznaczana jest œrednia
temperatura topnienia dupleksów tworzonych przez wszystkie oligonukleotydy
o podanej d³ugoœci, a nastêpnie u¿ytkownik podaje dopuszczalny zakres tempera-
tur. Na wstêpie sprawdza siê czy w obrêbie oligonukleotydów o zadanej d³ugoœci
wystêpuj¹ wczeœniej zdefiniowane przez u¿ytkownika tzw. sekwencje zabronione,
np. podci¹gi sk³adaj¹ce siê z nukleotydów jednego rodzaju. Oligonukleotydy zawie-
raj¹ce takie sekwencje s¹ eliminowane ze zbioru potencjalnych sond. Nastêpnie
sprawdzana jest temperatura topnienia dupleksów tworzonych przez oligonukle-
otydy, które przesz³y pozytywnie poprzedni test. Jeœli nie mieœci siê ona we wczeœ-
niej zdefiniowanym przedziale wartoœci, sonda jest odrzucana. W dalszej kolejnoœci
sprawdzana jest mo¿liwoœæ tworzenia przez oligonukleotydy stabilnych struktur
drugorzêdowych. W badaniu tym nie jest stosowane podejœcie termodynamiczne,
gdy¿ jego celem nie jest znalezienie najbardziej stabilnej struktury, lecz sprawdze-
nie, czy powstanie jakiejkolwiek struktury tego typu jest prawdopodobne.
Na tym etapie weryfikacji oligonukleotydów ka¿dej sekwencji docelowej mo¿na
przypisaæ wiele potencjalnych sond (mo¿e siê jednak równie¿ zdarzyæ, ¿e pewnej
sekwencji nie bêdzie mo¿na przypisaæ ¿adnej sondy). W celu zidentyfikowania naj-
lepszych sond, dla ka¿dej z sekwencji docelowych przeprowadzana jest dodatkowa
selekcja. Podstawowym jej celem jest wybór odpowiedniego podzbioru sond, które-
go elementy bêd¹ wykazywaæ jak¹œ charakterystyczn¹ cechê np. równomierny roz-
k³ad wzd³u¿ sekwencji docelowej. Innym kryterium selekcji mo¿e byæ po³o¿enie
sond blisko jednego z koñców lub œrodka sekwencji docelowej. Mo¿liwe jest te¿
za¿¹danie, by sondy nie nak³ada³y siê na siebie.
Koñcowa analiza potencjalnych sond, które przesz³y przez wszystkie poprzednie
etapy polega na sprawdzeniu mo¿liwoœci dimeryzacji oraz okreœleniu komplemen-
tarnoœci do sekwencji innych ni¿ docelowe. Domyœlny próg komplementarnoœci, po-
wy¿ej którego oligonukleotydy s¹ odrzucane wynosi 80%.
58
PRACE PRZEGL¥DOWE
Zgłoś jeśli naruszono regulamin