1. Elementy przekazu multimedialnegoMultimedia – połączenie wielu mediów, interakcja z użytkownikiemelementy – tekst, grafika (również 3D), animacja, video, dźwięk, Internet, hypertext, hotspotsinterakcja z użytkownikiem - wybór (obiektu) i kontrola, np. obroty etc.
2. Zastosowania multimediówbusiness: trening, prezentacje, komunikacja, informacja (kioski interaktywne),promocjanarzędzia edukacyjne, np. encyklopedie, atlasy książki, gazety interaktywne, muzea interaktywne i wirtualnerozrywka – gry, filmy interaktywne, muzyka interaktywna, rzeczywistość wirytualnakomercyjne – telewizja interaktywna, sklepy wirtualne, telefon przez internet, wideokonferencjeNa pokładach samolotów – informacja o przebiegu lotu, gry, filmy na życzenie, zakupy telefonyInteligentne urządzenia domowe
3. Wzrok i słuch - podstawowe pojęcia: bodziec wzrokowy/słuchowy, wrażenie, percepcjaBodziec wzrokowy/słuchowy – mierzalna cecha fizyczna: luminancja, długość fali, ciśnienie (dźwięk) etc.Wrażenie – natychmiastowy efekt pobudzenia ficzycznegoPercepcja – efekt zjawiska zmysłowego; na efekt ten wpływają procesy wyższego rzędu, takie, jak pamięć, uwaga, doświadczeniePsychofizyka – nauka wrażeniach i percepcji (np. jasność, głośność, kolor), wywoływanych przez bodźce fizyczneNeurofizjologia – nauka o mechanizmach fizjologicznych, uczestniczących w przekazywaniu, kodowaniu i przetwarzaniu informacji uzyskanej w wyniku działania bodźców fizycznych
4. Składowe przestrzeni koloru w terminach obserwatora i w terminach światłakolor postrzegany w terminach obserwatora
Barwa – „kolor” widziany przez człowieka (żółty itp.)
Jasność/intensywność/luminancja – ilość światła emitowanego lub odbijanego – „ile czerni jest wmieszane w kolor”
Luminancja – achromatyczny składnik koloru (ilość światła emitowanego lub odbitego)
Intensywność dotyczy kolorów achromatycznych. Jest wielkością fizyczną (cd/m2), ale czasem używana jest zamiennie z terminami perceptualnymi, psychofizycznymi
Jasność:
lightness odnosi się do obiektów i jest związana z ilością odbijanego światła. Opisy słowne: bardzo jasny, jasny, średni, ciemny, bardzo ciemny
brightness odnosi się do źródeł światła i jest związana z ilością światła emitowanego. Opisy: bardzo przyćmiony, przyćmiony, średni, jasny, bardzo jasny
Nasycenie/chrominancja – określa czystość (w terminach zmieszania z bielą) lub żywość koloru. Jest to stopień zróżnicowania w stosunku do szarości dla różnych kolorów o tej samej jasności
Nasycenie dotyczy jasności koloru - zwiększenie jasności jest postrzegane jako zmniejszenie nasycenia i na odwrót
Chrominancja – porównanie z bielą; nie zmienia się przy zmianie jasności. Opisy słowne: szarawy, średni, mocny, żywykolor specyfikowany w terminach światła
Dominująca długość fali – określa, jaki „kolor” widzimy. Odpowiada subiektywnemu wrażeniu barwy
Luminancja – określa ilość światła/światła odbitego. Dla światła achromatycznego jest to intensywność światła. Dla koloru chromatycznego odpowiada subiektywnemu pojęciu jasności
Czystość – określa rozkład widmowy, jaki powoduje powstanie światła o danym kolorze. Jest to proporcja dominującej długości fali i światła białego, niezbędnego do zdefiniowania tego koloru. Czystość odpowiada perceptualnemu pojęciu nasycenia.
5. Budowa oka ??????????? od góry: Źrenica, siatkówka, soczewki (rogówka),plamka żółta (a w niej czopki), plamka ślepa, pałeczki, nerw wzrokowy
6. Czułość wzroku i rozdzielczość wzroku ??????????Czułość wzroku – zdolność ekstrakcji informacji przy niskich poziomach luminancjiRozdzielczość wzroku – zdolność rozróżniania małych detali przestrzennych!!!!! Połączenie 1-1 (one-to-one) czopków w plamce żółtej poprzez nerw wzrokowy z komórkami zwojowymi w mózgu daje dobrą rozdzielczość wzroku, ale przy dostatecznie dużych poziomach jasnościPołączenie many-to-one pręcików na obrzeżach siatkówki poprzez nerw wzrokowy z komórkami zwojowymi w mózgu daje najwyższą czułość.Stąd znacznie silniejsza czułość wzroku na zmiany „jasno-ciemno” w widzeniu peryferyjnym, kosztem zdolności rozróżniania detali.Widzenie peryferyjne charakteryzuje się również większą czułością czasową, tj. na zmiany luminancji w czasie.
7. Najważniejsze elementy ucha małżowina, przewód słuchowy, błona bębenkowa, młoteczek, kowadełko, strzemiączko, kanały półkuliste, ślimak, nerw słuchowy
8. Co to jest próg słyszalności i od czego zależy?Próg słyszalności (próg absolutny, próg detekcji sygnału) jest najmniejszym poziomem ciśnienia akustycznego dźwięku, który wywołuje zaledwie spostrzegane wrażenie słuchowe wobec braku innych dźwięków, próg słyszalności zależy od częstotliwości sygnału
9. Jak definiowana jest skala decybelowa poziomu dźwięku?Skala decybelowa:
– Liczba decybeli = 10 log10 I1/I0
– I1 – natężenie (porównywane z I0)I0 – natężenie odniesienia; powszechnie stotowane jest 10-12 W/m2, co jest ekwiwalentem ciśnienia 20 mikropaskali
10. Co to są izofony?Krzywe jednakowej głośności, dla różnych poziomów głośności
11. Jakie zakresy częstotliwości słyszane są lepiej, a jakie gorzej?!!!!!!!!!!!!!!!!!!najlepiej mowa
12. Co to jest son?Percypowana głośność [son] L = k I0.3Głośność 1 son =głośność tonu o częstotliwości 1kHz i poziomie 40 dB SPL
13. Prawo Webera-Fechnera i odstępstwa od niegoPrzyrost wrażenia jest logarytmicznie proporcjonalny do przyrostu bodźcaodstępstwa: Od strony dużych częstotliwości pobudzenie wzrasta nieliniowo ze wzrostem natężenia
14. Co to jest pasmo krytyczne?Pasmo krytyczne jest to elementarne pasmo częstotliwości o szerokości wydzielone z ciągłego pasma szumów i zawierające w sobie moc akustyczną równą mocy akustycznej tonu prostego o częstotliwości f położonej w środku tego pasma, przy czym rozpatrywany ton prosty ma taką intensywność, że zagłuszany przez nieograniczone widmo szumów ciągłych znajduje się dokładnie na granicy słyszalnościJeśli ton prosty o częstotliwości f jest słyszany na tle równomiernego i nieograniczonego szumu, to efekt zagłuszania tonu przez szum wywołany jest jedynie działaniem szumów mieszczących się w paśmie krytycznymwg Zwickera są 24 pasma, wg Fletchera 12 !przykłady: Nr_pasma/częstotliwośćśrodkowa/szerokość pasma;1/50/100; 5/450/110; 10/1170/190; 20/5800/1100; 24/13500/3500
15. Formant - maksimum charakterystyki, wyraźnie przekraczające założony poziom średni tej charakterystyki, przy zapewnieniu warunku odpowiedniej rozległości tej charakterystykiI formant odpowiada tonowi krtaniowemu
16. Rola ruchów głowy w słyszeniulokalizacja dźwięku źródłowego
17. Wymienić wielowymiarowe struktury danych i krótko je scharakteryzowaćk-d trees używane są do przechowywania k-wymiarowego punktu danych, np. punktów mapy Każdy węzeł ma strukturę rekordunodetype=record;INFO: infotype;XVAL: real; YVAL: real; LLINK: nodetype; RLINK: nodetype;endPoint Quadtrees Stosowane do reprezentowania punktów danych w przestrzeni 2D Zawsze dzieli region na 4 cześciMX-Quadtrees Kształt drzewa (i jego wysokość) jest niezależna od liczby węzłów w drzewieZakłada się, że na mapę naniesiona jest siatka 2k x 2kR-Trees Stosowane do przechowywania prostokątnych regionów na mapie/obrazie Szczególnie przydatne przy przechowywaniu wielkich ilości danych na dyskuKażde R-tree ma przyporządkowany rząd K; każdy węzeł nie będący liściem zawiera co najwyżej K prostokątów i co najmniej prostokątów (wyjątek może stanowić korzeń)Intuicyjnie, każdy wierzchołek nie będący liściem musi być co najmniej w połowie pełnyWysokość drzewa jest zwykle niewielka, Prostokąt jest albo rzeczywistym prostokątem, albo grupą prostokątów
18. Miary podobieństwa obrazówMetric approach -znajdowanie najbardziej podobnego w bazie obrazu do zadanego obrazu na podstawie metrykiTransformation approach - użytkownik powinien wyspecyfikować, jakie obrazy uważa za podobne dla danych 2 obiektów o1, o2, poziom niepodobieństwa o1 i o2 jest proporcjonalny do (minimalnego) kosztu przekształcenia o1 w o1 lub odwrotnie
19. Elementy opisu zawartości wideoZawartość video v jest opisywana przez:OBJ - zbiór obiektów zainteresowania w vAC - zbiór czynności zainteresowania w v- funkcja opisująca, które obiekty i które czynności są związane z daną ramką videoPrzykład: Bazy edukacyjne: wykładowcy, tematy, Wykład, pytania studentów, odpowiedzi
20. Podziały filtrówI) FIR – o skończonej odpowiedzi impulsowejIIR – o nieskończonej odp. ImpulsowejII) Górnoprzepustowy,Dolnoprzepustowy,Pasmowoprzepustowy, Pasmowozaporowy,Grzebieniowy,Wszechprzepustowy (korektor fazy)
21. Co to jest transmitancja filtru i pasmo 3dBTransmitancja filtru (charakterystyka częstotliwościowa) – transformata Fouriera odpowiedzi impulsowej filtru
Pasmo 3dB - pasmo pomiędzy 2 granicznymi wartościami częstotliwości (np.: fg i fd, fg>=fd), dla których moc sygnału spada o połowę. W przełożeniu na transmitancję, H(f), interpretacja pasma 3dB jest nastepująca: moc jest proporcjonalna do kwadratu amplitudy sygnału harmonicznego, a zatem moc spada o połowę gdy amplituda sygnału spada o sqrt(2).
22. Wymienić metody analizy widmowej dźwięku-transformata Fouriera -analiza falkowa, pozwalająca na jednoczesną analizę czasowo-częstotliwościową,-filtracyjne metody określania składu widmowego dźwięku
23. Transformacja FourieraTransformata Fouriera sygnału ciągłego f(t):gdzie t – czas ciągłyTransformacja przekształca dziedzinę czasu w dziedzinę widma Możliwe jest przekształcenie odwrotne, tj. przejście z dziedziny widma w dziedzinę czasu
24. Na czym polega okienkowanie sygnału i w jakim celu jest stosowane? Wymienić najpopularniejsze funkcje okienkoweWybranie fragmentu danych o długości N oznacza, że sygnał na tym odcinku został przemnożony przez 1, zaś na pozostałych przez 0. Jest to równoważne przemnożeniu sygnału przez sygnał prostokątny o szerokości N i wysokości 1. Operację tę nazywamy okienkowaniemOperację okienkowania można zapisać jako:gdzie: s(n) – sygnał wejściowy, v(n) – sygnał wynikowy otrzymany poprzez okienkowanie, w(n) – funkcja okna.
25. Różnice między transformatą Fouriera i falkową!!!!!!!!!wyk mm5
26. Wymienić najpopularniejsze falki stosowane w analizie falkowejHaara, Daubechies, Meyera, Shannona, Morleta, „kapelusz meksykański”
27. Wymienić najważniejsze metody analizy obrazuTransformacja Fouriera, Transformacja cosinusowa, Analiza falkowa
28. Sklasyfikować metody syntezy dźwiękuMonofoniczna (homofoniczna) – w starszych syntezatorach analogowych, lub przy dużej złożoności obliczeniowej syntezyPolifoniczna
29. Obwiednia ADSR A – narastanie (attack) D – opadanie (docay) S - trwanie, poziom (sustain) R – wybrzmiewanie (releasue)
30. Na czym polega synteza addytywna i subtraktywna dźwięku?Addytywna - Dźwięki instrumentów akustycznych są poddawane analizie widmowej (FFT), na podstawie której przeprowadzana jest resynteza Widmo dźwięku „budowane” jest z pojedynczych składowych harmonicznych (są dodawane kolejne składowe), z których każda może być modulowana amplitudowo i fazowoRzadko stosowana w elektronicznych instrumentach muzycznychsubtraktywna - Stosowana zarówno w syntezatorach analogowych, jak i cyfrowych Polega na odejmowaniu określonych składowych widma z szumu lub sygnału szerokopasmowego w układzie filtracyjnym
31. Na czym polega synteza dźwięku metodą modelowania fizycznego? Wymienić rodzaje tej syntezySyntezatory działające w oparciu o modele fizyczne instrumentów akustycznych symulują zjawiska fizyczne zachodzące w tych instrumentach, przy uwzględnieniu modelowania procesów artykulacyjnychSzczególnie przydatne do syntezy gitary, saksofonu, trąbki, fletu, piszczałek organowychRodzaje: Synteza komórkowa; Modelowanie matematyczne; Modelowanie falowodowe
32. Na czym polega synteza dźwięku metodą modelowania matematycznego oraz falowodowego? Podać postać równania struny nieskończonej oraz równania fali płaskiej w nieskończonym cylindrze!!!!!!!mm7!!!
33. Podać nazwy węzłów opisujących proste i złożone obiekty geometryczne w VRMLWęzeł Appearance – polamaterial, texture,textureTransform – przekształcenia tekstury nałożonej na obiektdiffuseColor – kolor obiektu R G BambientIntensity – poziom odbijania światła przez obiektspecularColor – kolor refleksów świetlnychemmisiveColor – kolor światła emitowanego przez obiekt (nie oświetla innych obiektów)shininess – stopień pochłaniania światła przez obiekt (0-matowy, 1-lśniący)transparency – poziom przezroczystościWartościami mogą być węzły opisujące kształty geometryczne: Box, Cone, Sphere, Cylinder, Extrusion, PointSet, ElevationGrid, IndexedLineSet, IndexedFaceSet, TextDomyślne umieszczenie w początku układu współrzędnych (oś x , oś y, oś z prostopadle do ekranu, w kierunku użytkownika)zaawansowane:Extrusion - tworzenie obiektu przez poprowadzenie wielokąta (przekroju figury) wzdłuż pewnego toruElevationGrid - modelowanie powierzchni rozpiętej na siatce punktówIndexedLineSet, IndexedFaceSet, PointSet - operowanie na zbiorach punktów w przestrzeni 3DObwiednia przekroju oraz trajektoria – odcinkami liniowePole crossSection – definicja przekroju tworzonej figury za pomocą zbioru punktów na płaszczyźnie XZPole spine – definicja toru (ciąg punktów w przestrzeni 3D)Przekrój jest umieszczany prostopadle do odcinka toru tak, ze tor przechodzi przez środek przekrojuMożliwość skalowania przekroju w różnych punktach toru i obrotu wokół toruPole scale – ciąg par liczb będących współczynnikami skalowania względem osi X i Z odpowiednioJeśli podana jest tylko jedna para, stosowana jest wzdłuż całego toruPole orientation – lista kolejnych obrotów (obrót - 4 liczby – jak w węźle Transform) Możliwość skalowania przekroju w różnych punktach toru i obrotu wokół toruPole scale – ciąg par liczb będących współczynnikami skalowania względem osi X i Z odpowiednio Jeśli podana jest tylko jedna para, stosowana jest wzdłuż całego toruPole orientation – lista kolejnych obrotów (obrót - 4 liczby – jak w węźle Transform)
34. Podać nazwy węzłów opisujących sensory w VRMLCylindryczny (CylinderSensor)– przekazuje ruch myszy jako obrót walca lub dysku 3DPłaszczyznowy (PlaneSensor) – przemieszczanie przedmiotów || do płaszczyzny XYPozycyjny (ProximitySensor) – odczyt pozycji w równoległoboku, w którym porusza się użytkownik (śledzenie położenia osoby)S. Widoczności (VisibilitySensor) – umożliwia wyzwolenie jakiejś akcji, gdy wirtualnie zobaczymy dany obiektSferyczny (SphereSensor) – oddaje ruch myszy jako kuli 3DCzasowy (TimeSensor) – umożliwia wyzwolenie akcji w określonej chwiliS. dotyku (TouchSensor) - informuje o kliknięciu na węzeł lub grupę węzłów
35. Wymienić kilka częstotliwości próbkowania stosowanych w cyfrowych systemach audio5500 Hz (Macintosh)(=44100/8);7333 Hz(=44100/6)8000 Hz – standard telefoniczny do kodowania8012.8210513 – standard NeXT, używany z kodekiem Telco11025(=22050/2); 16000 standard telefoniczny G.72216726.8 Hz – NTSC TV = 7159090.5/(214 2)18900 Hz – standard CD-ROM; 22050 – standard Macintosh, CD/2 22254.[54] – standard złącza monitora MacIntosha 128k32000 DAB (Digital Audio Bradcasting), NICAM (Nearly-Instantaneous Companded Audio Multiplex) – np. BBC; inne systemy TV, HDTV, R-DAT32768 Hz(32 1024); 37800 Hz – high quality CD-ROM44056 Hz – częstotilwość próbkowania używana w sprzęcie profesjonalnym (kompat. z NTSC)44100 Hz – CD audio – najpopularniejsza częstotliwość w aplikacjach profesjonalnych i domowych48000 Hz – R-DAT; 49152 Hz(48 1024)>50000 Hz – używane niekiedy w profesjonalnych systemach cyfrowego przetwarzania sygnałów96000 – high resolution R-DAT
36. Na czym polega procedura przepróbkowania i w jakim celu jest stosowanaProcedura dwuetapowa:Nadpróbkowanie (ang. oversampling) – generowanie dodatkowych próbekUsuwanie nadmiarowych próbekCzęstotliwość nadpróbkowania powinna być NWW źródłowej i docelowej częstotliwości próbkowania???????
37. Jak zapobiegać występowaniu aliasingu?Aby uniknąć aliasingu (nakładania widma), nadpróbkowany sygnał nie może zawierać częstotliwości > cz. Nyquista (połowa docelowej cz. próbkowania)Nadpróbkowany sygnał Xa(t) należy poddać filtracji dolnoprzepustowej z częstotliwością odcięcia
38. Wymienić najpopularniejsze sposoby kodowania dzwiekuPCM; ADPCM; Kodeki kompandorowe: Mu-law (standard amerykańsko-japoński), A-law (standard europejski)Kodeki źródła: WokoderyKodeki hybrydowe: kodek = koder + dekoder
39. Co to jest wokoder i do czego jest stosowany?Kodek źródła tworzy model źródła dźwięku i dokonuje rekonstrukcji sygnału na podstawie tego modeluWokoder (Voice Coder) – kodek źródła, przewidziany do transmisji sygnału mowyUżywane są 2 podstawowe modele sygnału:Dźwięczny (pobudzenie tonowe), Bezdźwięczny (pobudzenie szumowe)Zaleta: Sygnał przekazywany jest w bardzo małym plikuWada: Nadaje się do kodowania jedynie określonego typu sygnałów Nie nadaje się do kodowania np. muzyki
40. Wymienić najważniejsze formaty plików dźwiękowych.snd, .au (NeXT, Sun),.wav (Microsoft, IBM), .mp3, .mid (MIDI)
41. Wymienić najważniejsze sposoby kodowania zastosowane w kompresji wg standardu JPEGPrzekształcenie obrazu RGB w YCrCb:Kolory RGB skwantowane na 220 poziomach zostają zamienione na luminancję (jaskrawość) Y i chrominancję (kolorowość) CrCb, również 220 poziomówKodowana jest 1 para wartości chrominancji na każde 2 wartości luminancjiZastosowanie DCT (Discrete Cosinus Transform) dla bloków 8x8 pikseliKwantyzacja, zależna od częstotliwości przestrzennejRLE (Run Length Encoding) i metoda Huffmana, w oparciu o obliczanie entropii i przewidywanie oczekiwanego wzorca danych.JPEG wykorzystuje względną niewrażliwość ludzkiego oka na kontrasty koloru (odcienie), tj. zmiany chrominancji, w porównaniu z luminancją. Możliwa jest więc zmiana kroku kwantyzacji dla każdego składnika częstotliwości, tj. większy krok może reprezentować mniej znaczące częstotliwości
42. Jakie są główne zalety i wady kompresji JPEG? Co jest ich przyczyną?Efekt zablokowania pikseliefekt zniekształcenia krawędzimały rozmiar pliku, sterowany stopniem kompresjki, mozliwisc dostosowania do potrzeb !!!!!!
!!!!!!!!!!!!!!!!
43. Na czym polega kompresja fraktalna?Oparta na lokalnym samopodobieństwie obrazuI etap - segmentacja obrazu i wyszukanie lokalnego samopodobieńs...
Phoob