Bioinformatyka 2006/07 3.2007
EMBOSS @ TERMINAL
Dokumentacja wszystkich programów z pakietu EMBOSS znajduje się np. na stronie
http://emboss.sourceforge.net/apps/cvs
Zanim użyjesz jakiegokolwiek programu przeczytaj do czego służy i jak działa.
1. Ściągnijdo nowego podkatalogu sekwencje uniprot:ypt7_yeast i uniprot:lysc_chick. Użyj do tego programów seqret oraz entrez. Jaka jest różnica między nimi?
Każdy program jeśli zostanie uruchomiony z opcją –help (np. seqret -help) pokaże podstawowe informacje o sobie. Bardziej wyczerpujące informacje uzyskasz jeśli zastosujesz opcje –help – verbose (np.; seqret –help - verbose)
2. Podaj funkcje tych białek i znajdź numer EC, jeśli istnieje.
3. Ściągnij sekwencj nukleotydowe kodujące te białka. Obejrzyj je i znajdź miejsca inicjacji i terminacji transkrypsji (pole CDS)
4. Utwórz własną sekwencje nukleotydową (nie krótszą niż 100 nukleotydów) za pomocą dowolnego edytora (np. nano lub gedit). Zapisz swoją sekwencje w formacie FASTA (seqret). Przetłumacz swoją sekwencje na białko (transeq). Jak długie białko udało Ci się otrzymać?
5. Ściągnij do swojego katalogu sekwencje nukleotydową o identyfikatorze m21050. W której ramce odczytu ta sekwencja daje najdłuższy produkt w postaci białka? (showorf).
6. Przetłumacz sekwencje białka uniprot:ypt7_yeast na sekwencje nukleotydową? (backtranseq)
7. Czy białko opsd_xenla posiada regiony transmembranowe (tmap, jako „graph type” wpisz „png”). Obejrzyj powstały plik wybranym programem (np. Applications à Accessories à File Browser). Ile regionów zostało przewidzianych?
8. Znajdź program do przewidywania struktury drugorzędowej białka (np. poprzez dokumentacje w sieci lub specjalnym programem : wossname). Spróbuj przewidzieć strukturę II rzędową białka atf4_human. Policz ile jest helis o długości co najmniej 15 aa.
9. Znajdź potencjalne miejsca wiązania przeciwciał do białka atf4_human (antigenic). Przeczytaj co tak naprawdę robi metoda Kolaskar & Tongaonkar.
10. Zrób mapę restrykcyjną sekwencji j01749. Potraktuj sekwencje jako koliste DNA. Ile jest miejsc cięcia przez enzym BanI (-help – verbose pomogą znaleźć odpowiednią opcję)
11. Czy białko o identyfikatorze p17547 posiada motywy sekwencji związane z funkcją? Znajdź opcję programu umożliwiającą wyświetlanie opisu znalezionych motywów.
12. Ile białek ludzkich (uniprot:*_human) zawiera dokładnie dwa motywy „SPKK”? Ściągnij jedno ze znalezionych białek i zobacz, jakie inne funkcjonalne motywy są w nim obecne. Uwaga! Przeszukanie wszystkich białek w bazie UNIPROT może zająć nawet kilka minut.
13. Skonstruuj następujący wzór : glicyna, cysteina, od 1 do 3 dowolnych aminokwasów, cysteina, prolina, od 8 do 10 dowolnych aa, 2 cysteiny, 2 dowolne aa, jeden z nasjępujących : prolina, kwas asparaginowy, kwas glutaminowy, asparagina. (jednoliterowe nazwy aa znajdziesz np. w polskiej wiki www.pl.wikipedia.org ) . Ile białek posiada w/w motyw sekwencji? Jaka rolę funkcjonalną on pełni? Jeśli przeszukiwanie trwa bardzo długo przenieś je w tło i obejrzyj wynik na następnych ćwiczeniach.
biologia