Bioinf4.doc

(31 KB) Pobierz
EMBOSS @ TERMINAL

Bioinformatyka 2006/07  3.2007

 

EMBOSS @ TERMINAL

 

Dokumentacja wszystkich programów z pakietu EMBOSS znajduje się np. na stronie

http://emboss.sourceforge.net/apps/cvs

Zanim użyjesz jakiegokolwiek programu przeczytaj do czego służy i jak działa.

 

 

1.      Ściągnijdo nowego podkatalogu sekwencje uniprot:ypt7_yeast i uniprot:lysc_chick. Użyj do tego programów seqret oraz entrez. Jaka jest różnica między nimi?

Każdy program jeśli zostanie uruchomiony z opcją –help (np. seqret -help) pokaże podstawowe informacje o sobie. Bardziej wyczerpujące informacje uzyskasz jeśli zastosujesz opcje –help – verbose (np.; seqret –help - verbose)

 

2.      Podaj funkcje tych białek i znajdź numer EC, jeśli istnieje.

3.      Ściągnij sekwencj nukleotydowe kodujące te białka. Obejrzyj je i znajdź  miejsca inicjacji i terminacji transkrypsji (pole CDS)

4.      Utwórz własną sekwencje nukleotydową (nie krótszą niż 100 nukleotydów) za pomocą dowolnego edytora (np. nano lub gedit). Zapisz swoją sekwencje w formacie FASTA (seqret). Przetłumacz swoją sekwencje na białko (transeq). Jak długie białko udało Ci się otrzymać?

5.      Ściągnij do swojego katalogu sekwencje nukleotydową o identyfikatorze m21050. W której ramce odczytu ta sekwencja daje najdłuższy produkt w postaci białka? (showorf).

6.      Przetłumacz sekwencje białka uniprot:ypt7_yeast na sekwencje nukleotydową? (backtranseq)

7.      Czy białko opsd_xenla posiada regiony transmembranowe (tmap, jako „graph type” wpisz „png”). Obejrzyj powstały plik wybranym programem (np. Applications à Accessories à File Browser). Ile regionów zostało przewidzianych?

8.      Znajdź program do przewidywania struktury drugorzędowej białka (np. poprzez dokumentacje  w sieci lub specjalnym programem : wossname). Spróbuj przewidzieć strukturę II rzędową białka atf4_human. Policz ile jest helis o długości co najmniej 15 aa.

9.      Znajdź potencjalne miejsca wiązania przeciwciał do białka atf4_human (antigenic). Przeczytaj co tak naprawdę robi metoda Kolaskar & Tongaonkar.

10.  Zrób mapę restrykcyjną sekwencji j01749. Potraktuj sekwencje jako koliste DNA. Ile jest miejsc cięcia przez enzym BanI (-help – verbose pomogą znaleźć odpowiednią opcję)

11.  Czy białko o identyfikatorze p17547 posiada motywy sekwencji związane z funkcją? Znajdź opcję programu umożliwiającą wyświetlanie opisu znalezionych motywów.

12.  Ile białek ludzkich (uniprot:*_human) zawiera dokładnie dwa motywy „SPKK”? Ściągnij jedno ze znalezionych białek i zobacz, jakie inne funkcjonalne motywy są w nim obecne. Uwaga! Przeszukanie wszystkich białek w bazie UNIPROT może zająć nawet kilka minut.

13.  Skonstruuj następujący wzór : glicyna, cysteina, od 1 do 3 dowolnych aminokwasów, cysteina, prolina, od 8 do 10 dowolnych aa, 2 cysteiny, 2 dowolne aa, jeden z nasjępujących : prolina, kwas asparaginowy, kwas glutaminowy, asparagina. (jednoliterowe nazwy aa znajdziesz np. w polskiej wiki www.pl.wikipedia.org ) . Ile białek posiada w/w motyw sekwencji? Jaka rolę funkcjonalną on pełni? Jeśli przeszukiwanie trwa bardzo długo przenieś je w tło i obejrzyj wynik na następnych ćwiczeniach.

...
Zgłoś jeśli naruszono regulamin