PYT_EGZ.DOC

(367 KB) Pobierz
1

1.       Elementy przekazu multimedialnego
Multimedia – połączenie wielu mediów, interakcja z użytkownikiem
elementy – tekst, grafika (również 3D), animacja, video, dźwięk, Internet, hypertext, hotspots
interakcja z użytkownikiem - wybór (obiektu) i kontrola, np. obroty etc.

2.       Zastosowania multimediów
business: trening, prezentacje, komunikacja, informacja (kioski interaktywne),promocja
narzędzia edukacyjne, np. encyklopedie, atlasy książki, gazety interaktywne, muzea interaktywne i wirtualne
rozrywka – gry, filmy interaktywne, muzyka interaktywna, rzeczywistość wirytualna
komercyjne – telewizja interaktywna, sklepy wirtualne, telefon przez internet, wideokonferencje
Na pokładach samolotów – informacja o przebiegu lotu, gry, filmy na życzenie, zakupy telefony
Inteligentne urządzenia domowe

3.       Wzrok i słuch - podstawowe pojęcia: bodziec wzrokowy/słuchowy, wrażenie, percepcja
Bodziec wzrokowy/słuchowy – mierzalna cecha fizyczna: luminancja, długość fali, ciśnienie (dźwięk) etc.
Wrażenie – natychmiastowy efekt pobudzenia ficzycznego
Percepcja – efekt zjawiska zmysłowego; na efekt ten wpływają procesy wyższego rzędu, takie, jak pamięć, uwaga, doświadczenie
Psychofizyka – nauka wrażeniach i percepcji (np. jasność, głośność, kolor), wywoływanych przez bodźce fizyczne
Neurofizjologia – nauka o mechanizmach fizjologicznych, uczestniczących w przekazywaniu, kodowaniu i przetwarzaniu informacji uzyskanej w wyniku działania bodźców fizycznych

4.       Składowe przestrzeni koloru w terminach obserwatora i w terminach światła
kolor postrzegany w terminach obserwatora

Barwa – „kolor” widziany przez człowieka (żółty itp.)

Jasność/intensywność/luminancja – ilość światła emitowanego lub odbijanego – „ile czerni jest wmieszane w kolor”

Luminancja – achromatyczny składnik koloru (ilość światła emitowanego lub odbitego)

Intensywność dotyczy kolorów achromatycznych. Jest wielkością fizyczną (cd/m2), ale czasem używana jest zamiennie z terminami perceptualnymi, psychofizycznymi

Jasność:

lightness odnosi się do obiektów i jest związana z ilością odbijanego światła. Opisy słowne: bardzo jasny, jasny, średni, ciemny, bardzo ciemny

brightness odnosi się do źródeł światła i jest związana z ilością światła emitowanego. Opisy: bardzo przyćmiony, przyćmiony, średni, jasny, bardzo jasny

Nasycenie/chrominancja – określa czystość (w terminach zmieszania z bielą) lub żywość koloru. Jest to stopień zróżnicowania w stosunku do szarości dla różnych kolorów o tej samej jasności

Nasycenie dotyczy jasności koloru  - zwiększenie jasności jest postrzegane jako zmniejszenie nasycenia i na odwrót

Chrominancja – porównanie z bielą; nie zmienia się przy zmianie jasności. Opisy słowne: szarawy, średni, mocny, żywy
kolor specyfikowany w terminach światła

Dominująca długość fali – określa, jaki „kolor” widzimy. Odpowiada subiektywnemu wrażeniu barwy

Luminancja – określa ilość światła/światła odbitego. Dla światła achromatycznego jest to intensywność światła. Dla koloru chromatycznego odpowiada subiektywnemu pojęciu jasności

Czystość – określa rozkład widmowy, jaki powoduje powstanie światła o danym kolorze. Jest to proporcja dominującej długości fali i światła białego, niezbędnego do zdefiniowania tego koloru. Czystość odpowiada perceptualnemu pojęciu nasycenia.

5.       Budowa oka ???????????
od góry: Źrenica, siatkówka, soczewki (rogówka),plamka żółta (a w niej czopki), plamka ślepa, pałeczki, nerw wzrokowy

6.       Czułość wzroku i rozdzielczość wzroku ??????????
Czułość wzroku – zdolność ekstrakcji informacji przy niskich poziomach luminancji
Rozdzielczość wzroku – zdolność rozróżniania małych detali przestrzennych
!!!!! Połączenie 1-1 (one-to-one) czopków w plamce żółtej poprzez nerw wzrokowy z komórkami zwojowymi w mózgu daje dobrą rozdzielczość wzroku, ale przy dostatecznie dużych poziomach jasności
Połączenie many-to-one  pręcików na obrzeżach siatkówki poprzez nerw wzrokowy z komórkami zwojowymi w mózgu daje najwyższą czułość.
Stąd znacznie silniejsza czułość wzroku na zmiany „jasno-ciemno” w widzeniu peryferyjnym, kosztem zdolności rozróżniania detali.
Widzenie peryferyjne charakteryzuje się również większą czułością czasową, tj. na zmiany luminancji w czasie.

7.                                                                                                                                                          

Najważniejsze elementy ucha
małżowina, przewód słuchowy, błona bębenkowa, młoteczek, kowadełko, strzemiączko, kanały półkuliste, ślimak, nerw słuchowy






 

8.       Co to jest próg słyszalności i od czego zależy?
Próg słyszalności (próg absolutny, próg detekcji sygnału) jest najmniejszym poziomem ciśnienia akustycznego dźwięku, który wywołuje zaledwie spostrzegane wrażenie słuchowe wobec braku innych dźwięków, próg słyszalności zależy od częstotliwości sygnału

9.       Jak definiowana jest skala decybelowa poziomu dźwięku?
Skala decybelowa:

                   Liczba decybeli = 10 log10 I1/I0

                   I1 – natężenie (porównywane z I0)
I0 – natężenie odniesienia; powszechnie stotowane jest 10-12 W/m2, co jest ekwiwalentem ciśnienia 20 mikropaskali

10.   Co to są izofony?
Krzywe jednakowej głośności, dla różnych poziomów głośności

11.   Jakie zakresy częstotliwości słyszane są lepiej, a jakie gorzej?
!!!!!!!!!!!!!!!!!!
najlepiej mowa
 

12.   Co to jest son?
Percypowana głośność [son] L = k I0.3
Głośność 1 son =głośność tonu o częstotliwości 1kHz i poziomie 40 dB SPL

13.   Prawo Webera-Fechnera i odstępstwa od niego
Przyrost wrażenia jest logarytmicznie proporcjonalny do przyrostu bodźca
odstępstwa: Od strony dużych częstotliwości pobudzenie wzrasta nieliniowo ze wzrostem natężenia

14.   Co to jest pasmo krytyczne?
Pasmo krytyczne jest to elementarne pasmo częstotliwości o szerokości wydzielone z ciągłego pasma szumów i zawierające w sobie moc akustyczną równą mocy akustycznej tonu prostego o częstotliwości f położonej w środku tego pasma, przy czym rozpatrywany ton prosty ma taką intensywność, że zagłuszany przez nieograniczone widmo szumów ciągłych znajduje się dokładnie na granicy słyszalności
Jeśli ton prosty o częstotliwości f jest słyszany na tle równomiernego i nieograniczonego szumu, to efekt zagłuszania tonu przez szum wywołany jest jedynie działaniem szumów mieszczących się w paśmie krytycznym
wg Zwickera są 24 pasma, wg Fletchera 12 !
przykłady: Nr_pasma/częstotliwośćśrodkowa/szerokość pasma;
1/50/100; 5/450/110; 10/1170/190; 20/5800/1100; 24/13500/3500

15.   Formant - maksimum charakterystyki, wyraźnie przekraczające założony poziom średni tej charakterystyki, przy zapewnieniu warunku odpowiedniej rozległości tej charakterystyki
I formant odpowiada tonowi krtaniowemu

16.   Rola ruchów głowy w słyszeniu
lokalizacja dźwięku źródłowego

17.   Wymienić wielowymiarowe struktury danych i krótko je scharakteryzować
k-d trees używane są do przechowywania k-wymiarowego punktu danych, np. punktów mapy Każdy węzeł ma strukturę rekordu
nodetype=record;INFO: infotype;XVAL: real; YVAL: real; LLINK: nodetype; RLINK:               nodetype;end
Point Quadtrees Stosowane do reprezentowania punktów danych w przestrzeni 2D Zawsze dzieli region na 4 cześci
MX-Quadtrees Kształt drzewa (i jego wysokość) jest niezależna od liczby węzłów w drzewie
Zakłada się, że na mapę naniesiona jest siatka 2k x 2k
R-Trees Stosowane do przechowywania prostokątnych regionów na mapie/obrazie Szczególnie przydatne przy przechowywaniu wielkich ilości danych na dysku
Każde R-tree ma przyporządkowany rząd K; każdy węzeł nie będący liściem zawiera co najwyżej K prostokątów i co najmniej prostokątów (wyjątek może stanowić korzeń)
Intuicyjnie, każdy wierzchołek nie będący liściem musi być co najmniej w połowie pełny
Wysokość drzewa jest zwykle niewielka, Prostokąt jest albo rzeczywistym prostokątem, albo grupą prostokątów

18.   Miary podobieństwa obrazów
Metric approach -znajdowanie najbardziej podobnego w bazie obrazu do zadanego obrazu na podstawie metryki
Transformation approach - użytkownik powinien wyspecyfikować, jakie obrazy uważa za podobne dla danych 2 obiektów o1, o2, poziom niepodobieństwa o1 i o2 jest proporcjonalny do (minimalnego) kosztu przekształcenia o1 w o1 lub odwrotnie
 

19.   Elementy opisu zawartości wideo
Zawartość video v jest opisywana przez:
OBJ - zbiór obiektów zainteresowania w v
AC - zbiór czynności zainteresowania w v
- funkcja opisująca, które obiekty i które czynności są związane z daną ramką video
Przykład: Bazy edukacyjne: wykładowcy, tematy, Wykład, pytania studentów, odpowiedzi

20.   Podziały filtrów
I) FIR – o skończonej odpowiedzi impulsowej
IIR – o nieskończonej odp. Impulsowej
II) Górnoprzepustowy,Dolnoprzepustowy,Pasmowoprzepustowy, Pasmowozaporowy,Grzebieniowy,Wszechprzepustowy (korektor fazy)

21.   Co to jest transmitancja filtru i pasmo 3dB
Transmitancja filtru (charakterystyka częstotliwościowa) – transformata Fouriera odpowiedzi impulsowej filtru



Pasmo 3dB - pasmo pomiędzy 2 granicznymi wartościami częstotliwości (np.: fg i fd, fg>=fd), dla których moc sygnału spada o połowę. W przełożeniu na transmitancję, H(f), interpretacja pasma 3dB jest nastepująca:
moc jest proporcjonalna do kwadratu amplitudy sygnału harmonicznego, a zatem moc spada o połowę gdy amplituda sygnału spada o sqrt(2).

22.   Wymienić metody analizy widmowej dźwięku
-transformata Fouriera
-analiza falkowa, pozwalająca na jednoczesną analizę czasowo-częstotliwościową,
-filtracyjne metody określania składu widmowego dźwięku

23.  

Transformacja Fouriera
Transformata Fouriera sygnału ciągłego f(t):
gdzie t – czas ciągły
Transformacja przekształca dziedzinę czasu w dziedzinę widma Możliwe jest przekształcenie odwrotne, tj. przejście z dziedziny widma w dziedzinę czasu

24.  

Na czym polega okienkowanie sygnału i w jakim celu jest stosowane? Wymienić najpopularniejsze funkcje okienkowe
Wybranie fragmentu danych o długości N oznacza, że sygnał na tym odcinku został przemnożony przez 1, zaś na pozostałych przez 0.  Jest to równoważne przemnożeniu sygnału przez sygnał prostokątny o szerokości N i wysokości 1. Operację tę nazywamy okienkowaniem
Operację okienkowania można zapisać jako:
gdzie:              s(n) –  sygnał wejściowy, v(n) – sygnał wynikowy otrzymany poprzez okienkowanie,             w(n) – funkcja okna.

25.   Różnice między transformatą Fouriera i falkową
!!!!!!!!!wyk mm5

26.   Wymienić najpopularniejsze falki stosowane w analizie falkowej
Haara, Daubechies, Meyera, Shannona, Morleta, „kapelusz meksykański”

27.   Wymienić najważniejsze metody analizy obrazu
Transformacja Fouriera, Transformacja cosinusowa, Analiza falkowa

28.  

Sklasyfikować metody syntezy dźwięku
Monofoniczna (homofoniczna) – w starszych syntezatorach analogowych, lub przy dużej złożoności obliczeniowej syntezy
Polifoniczna
 

29.  

Obwiednia ADSR
                                                         A – narastanie (attack)
                                                         D – opadanie (docay)
                                                         S - trwanie, poziom (sustain)
                                                         R – wybrzmiewanie (releasue)
  





 

30.   Na czym polega synteza addytywna i subtraktywna dźwięku?
Addytywna - Dźwięki instrumentów akustycznych są poddawane analizie widmowej (FFT), na podstawie której przeprowadzana jest resynteza
Widmo dźwięku „budowane” jest z pojedynczych składowych harmonicznych (są dodawane kolejne składowe), z których każda może być modulowana amplitudowo i fazowo
Rzadko stosowana w elektronicznych instrumentach muzycznych
subtraktywna -  Stosowana zarówno w syntezatorach analogowych, jak i cyfrowych
Polega na odejmowaniu określonych składowych widma z szumu lub sygnału szerokopasmowego w układzie filtracyjnym

31.   Na czym polega synteza dźwięku metodą modelowania fizycznego? Wymienić rodzaje tej syntezy
Syntezatory działające w oparciu o modele fizyczne instrumentów akustycznych symulują zjawiska fizyczne zachodzące w tych instrumentach, przy uwzględnieniu modelowania procesów artykulacyjnych
Szczególnie przydatne do syntezy gitary, saksofonu, trąbki, fletu, piszczałek organowych
Rodzaje: Synteza komórkowa; Modelowanie matematyczne; Modelowanie falowodowe

32.   Na czym polega synteza dźwięku metodą modelowania matematycznego oraz falowodowego? Podać postać równania struny nieskończonej oraz równania fali płaskiej w nieskończonym cylindrze
!!!!!!!mm7!!!

33.   Podać nazwy węzłów opisujących proste i złożone obiekty geometryczne w VRML
Węzeł Appearance – pola
material, texture,textureTransform – przekształcenia tekstury nałożonej na obiekt
diffuseColor – kolor obiektu R G B
ambientIntensity – poziom odbijania światła przez obiekt
specularColor – kolor refleksów świetlnych
emmisiveColor – kolor światła emitowanego przez obiekt (nie oświetla innych obiektów)
shininess – stopień pochłaniania światła przez obiekt (0-matowy, 1-lśniący)
transparency – poziom przezroczystości
Wartościami mogą być węzły opisujące kształty geometryczne: Box, Cone, Sphere, Cylinder, Extrusion, PointSet, ElevationGrid, IndexedLineSet, IndexedFaceSet, Text
Domyślne umieszczenie w początku układu współrzędnych (oś x , oś y, oś z prostopadle do ekranu, w kierunku użytkownika)
zaawansowane:
Extrusion - tworzenie obiektu przez poprowadzenie wielokąta (przekroju figury) wzdłuż pewnego toru
ElevationGrid - modelowanie powierzchni rozpiętej na siatce punktów
IndexedLineSet, IndexedFaceSet, PointSet - operowanie na zbiorach punktów w przestrzeni 3D
Obwiednia przekroju oraz trajektoria – odcinkami liniowe
Pole crossSection – definicja przekroju tworzonej figury za pomocą zbioru punktów na płaszczyźnie XZ
Pole spine – definicja toru (ciąg punktów w przestrzeni 3D)
Przekrój jest umieszczany prostopadle do odcinka toru tak, ze tor przechodzi przez środek przekroju
Możliwość skalowania przekroju w różnych punktach toru i obrotu wokół toru
Pole scale – ciąg par liczb będących współczynnikami skalowania względem osi X i Z odpowiednio
Jeśli podana jest tylko jedna para, stosowana jest wzdłuż całego toru
Pole orientation – lista kolejnych obrotów (obrót - 4 liczby – jak w węźle Transform) Możliwość skalowania przekroju w różnych punktach toru i obrotu wokół toru
Pole scale – ciąg par liczb będących współczynnikami skalowania względem osi X i Z odpowiednio Jeśli podana jest tylko jedna para, stosowana jest wzdłuż całego toru
Pole orientation – lista kolejnych obrotów (obrót - 4 liczby – jak w węźle Transform)

34.   Podać nazwy węzłów opisujących sensory w VRML
Cylindryczny (CylinderSensor)– przekazuje ruch myszy jako obrót walca lub dysku 3D
Płaszczyznowy (PlaneSensor) – przemieszczanie przedmiotów || do płaszczyzny XY
Pozycyjny (ProximitySensor) – odczyt pozycji w równoległoboku, w którym porusza się użytkownik (śledzenie położenia osoby)
S. Widoczności (VisibilitySensor) – umożliwia wyzwolenie jakiejś akcji, gdy wirtualnie zobaczymy dany obiekt
Sferyczny (SphereSensor) – oddaje ruch myszy jako kuli 3D
Czasowy (TimeSensor) – umożliwia wyzwolenie akcji w określonej chwili
S. dotyku (TouchSensor) - informuje o kliknięciu na węzeł lub grupę węzłów

35.   Wymienić kilka częstotliwości próbkowania stosowanych w cyfrowych systemach audio
5500 Hz (Macintosh)(=44100/8);7333 Hz(=44100/6)
8000 Hz – standard telefoniczny do kodowania
8012.8210513 – standard NeXT, używany z kodekiem Telco
11025(=22050/2); 16000 standard telefoniczny G.722
16726.8 Hz – NTSC TV = 7159090.5/(214 2)
18900 Hz – standard CD-ROM; 22050 – standard Macintosh, CD/2 22254.[54] – standard złącza monitora MacIntosha 128k
32000 DAB (Digital Audio Bradcasting), NICAM (Nearly-Instantaneous Companded Audio Multiplex) – np. BBC; inne systemy TV, HDTV, R-DAT
32768 Hz(32 1024); 37800 Hz – high quality CD-ROM
44056 Hz – częstotilwość próbkowania używana w sprzęcie profesjonalnym (kompat. z NTSC)
44100 Hz – CD audio – najpopularniejsza częstotliwość w aplikacjach profesjonalnych i domowych
48000 Hz – R-DAT; 49152 Hz(48 1024)
>50000 Hz – używane niekiedy w profesjonalnych systemach cyfrowego przetwarzania sygnałów
96000 – high resolution R-DAT

36.   Na czym polega procedura przepróbkowania i w jakim celu jest stosowana
Procedura dwuetapowa:
Nadpróbkowanie (ang. oversampling) – generowanie dodatkowych próbek
Usuwanie nadmiarowych próbek
Częstotliwość nadpróbkowania powinna być NWW źródłowej i docelowej częstotliwości próbkowania
???????












 

37.  



Jak zapobiegać występowaniu aliasingu?
Aby uniknąć aliasingu (nakładania widma), nadpróbkowany sygnał nie może zawierać częstotliwości > cz. Nyquista (połowa docelowej cz. próbkowania)
Nadpróbkowany sygnał Xa(t) należy poddać filtracji dolnoprzepustowej z częstotliwością odcięcia

38.   Wymienić najpopularniejsze sposoby kodowania dzwieku
PCM; ADPCM;
Kodeki kompandorowe: Mu-law (standard amerykańsko-japoński), A-law (standard europejski)
Kodeki źródła: Wokodery
Kodeki hybrydowe: kodek = koder + dekoder

39.   Co to jest wokoder i do czego jest stosowany?
Kodek źródła tworzy model źródła dźwięku i dokonuje rekonstrukcji sygnału na podstawie tego modelu
Wokoder (Voice Coder) – kodek źródła, przewidziany do transmisji sygnału mowy
Używane są 2 podstawowe modele sygnału:
Dźwięczny (pobudzenie tonowe), Bezdźwięczny (pobudzenie szumowe)
Zaleta: Sygnał przekazywany jest w bardzo małym pliku
Wada: Nadaje się do kodowania jedynie określonego typu sygnałów
Nie nadaje się do kodowania np. muzyki

40.   Wymienić najważniejsze formaty plików dźwiękowych
.snd, .au (NeXT, Sun),.wav (Microsoft, IBM), .mp3, .mid (MIDI)

41.  

Wymienić najważniejsze sposoby kodowania zastosowane w kompresji wg standardu JPEG
Przekształcenie obrazu RGB w YCrCb:
Kolory RGB skwantowane na 220 poziomach zostają zamienione na luminancję (jaskrawość) Y i chrominancję (kolorowość) CrCb, również 220 poziomów
Kodowana jest 1 para wartości chrominancji na każde 2 wartości luminancji
Zastosowanie DCT (Discrete Cosinus Transform) dla bloków 8x8 pikseli
Kwantyzacja, zależna od częstotliwości przestrzennej
RLE (Run Length Encoding) i metoda Huffmana, w oparciu o obliczanie entropii i przewidywanie oczekiwanego wzorca danych.
JPEG wykorzystuje względną niewrażliwość ludzkiego oka na kontrasty koloru (odcienie), tj. zmiany chrominancji, w porównaniu z luminancją. Możliwa jest więc zmiana kroku kwantyzacji dla każdego składnika częstotliwości, tj. większy krok może reprezentować mniej znaczące częstotliwości

42.   Jakie są główne zalety i wady kompresji JPEG? Co jest ich przyczyną?
Efekt zablokowania pikseli
efekt zniekształcenia krawędzi
mały rozmiar pliku, sterowany stopniem kompresjki, mozliwisc dostosowania do potrzeb !!!!!!

!!!!!!!!!!!!!!!!

43.   Na czym polega kompresja fraktalna?
Oparta na lokalnym samopodobieństwie obrazu
I etap - segmentacja obrazu i wyszukanie lokalnego samopodobieńs...

Zgłoś jeśli naruszono regulamin