Komputery Okna Internet

Systemy przetwarzania i odtwarzania informacji audio. Instalowanie systemu operacyjnego Windows 7 Funkcje systemu dźwiękowego

System dzwiękowy komputer osobisty służy do odtwarzania efektów dźwiękowych i mowy towarzyszących odtwarzanym informacjom wideo i obejmuje:

  • moduł nagrywania/odtwarzania;
  • syntezator;
  • moduł interfejsu;
  • mikser;
  • system głośników.

Komponenty systemu dźwiękowego (z wyjątkiem systemu głośnikowego) są konstrukcyjnie zaprojektowane jako oddzielna karta dźwiękowa lub są częściowo zaimplementowane jako mikroukłady na płycie głównej komputera.

Zazwyczaj sygnały wejściowe i wyjściowe jednostki nagrywającej / odtwarzającej są analogowe, ale przetwarzanie sygnały dźwiękowe dzieje się cyfrowo. Dlatego główne funkcje modułu nagrywania/odtwarzania sprowadzają się do konwersji analogowo-cyfrowych i cyfrowo-analogowych.

W tym celu wejściowy sygnał analogowy poddawany jest modulacji impulsowo-kodowej (PCM), której istotą jest próbkowanie czasu i reprezentacja (pomiar) amplitud sygnału analogowego w dyskretnych czasach w postaci liczb binarnych. Konieczne jest dobranie częstotliwości próbkowania i głębi bitowej tak, aby dokładność konwersji analogowo-cyfrowej spełniała wymagania jakości odtwarzania dźwięku.

Zgodnie z twierdzeniem Kotelnikowa, jeżeli krok próbkowania czasu oddzielający sąsiednie próbki (amplitudy mierzone) nie przekracza połowy okresu oscylacji wyższej składowej w widmie częstotliwości konwertowanego sygnału, to próbkowanie czasowe nie wprowadza zniekształceń i nie prowadzi do informacji strata. Jeżeli dla wysokiej jakości dźwięku wystarczy odtworzyć szerokie widmo 20 kHz, to częstotliwość próbkowania powinna wynosić co najmniej 40 kHz. W systemach dźwiękowych komputerów osobistych (PC) częstotliwość próbkowania wynosi zwykle 44,1 lub 48 kHz.

Ograniczona szerokość bitowa liczb binarnych reprezentujących amplitudy sygnału powoduje dyskretyzację amplitud sygnału. W kartach dźwiękowych w większości przypadków używane są 16-bitowe liczby binarne, co odpowiada 216 poziomom kwantyzacji lub 96 dB. Czasami stosuje się 20- lub nawet 24-bitową konwersję A/D.

Oczywistym jest, że poprawa jakości dźwięku poprzez zwiększenie częstotliwości próbkowania f i liczby k poziomów kwantyzacji prowadzi do znacznego wzrostu objętości S wynikowych danych cyfrowych, ponieważ

S = f t log2k / 8,

gdzie t jest czasem trwania fragmentu dźwięku, S, f i t są mierzone odpowiednio w MB, MHz i sekundach. W dźwięku stereo dane są podwojone. Tak więc, przy częstotliwości 44,1 kHz i 216 poziomach kwantyzacji, ilość informacji do reprezentowania fragmentu stereofonicznego dźwięku o czasie trwania 1 min wynosi około 10,6 MB. Aby zmniejszyć wymagania dotyczące zarówno pojemności pamięci do przechowywania informacji dźwiękowych, jak i przepustowości kanałów transmisji danych, stosowana jest kompresja (kompresja) informacji.

Moduł interfejsu służy do przesyłania zdigitalizowanych informacji audio do innych urządzeń PC (pamięć, system dźwiękowy) za pośrednictwem magistral komputerowych. Przepustowość magistrali ISA z reguły jest niewystarczająca, dlatego używane są inne magistrale - PCI, specjalny interfejs MIDI dla instrumentów muzycznych lub inne interfejsy.

Za pomocą miksera można miksować sygnały dźwiękowe, tworząc dźwięk polifoniczny, dodawać akompaniament muzyczny do mowy towarzyszącej fragmentom multimedialnym itp.

Syntezator przeznaczony jest do generowania sygnałów dźwiękowych, najczęściej symulujących dźwięk różnych instrumentów muzycznych. Do syntezy wykorzystuje się modulację częstotliwości, tablice falowe, modelowanie matematyczne. Dane wejściowe dla syntezatorów (kody nut i typy instrumentów) są zwykle prezentowane w formacie MIDI (rozszerzenie MID w nazwach plików). Tak więc, stosując metodę modulacji częstotliwości, kontrolowana jest częstotliwość i amplituda zsumowanych sygnałów z głównego generatora i generatora nadtonów. Zgodnie z metodą tabeli fal wynikowy sygnał jest uzyskiwany przez połączenie zdigitalizowanych próbek dźwiękowych z rzeczywistych instrumentów muzycznych. W metodzie modelowania matematycznego zamiast eksperymentalnie uzyskanych próbek wykorzystuje się matematyczne modele dźwięków.

Profesjonalne karty dźwiękowe pozwalają na kompleksowe przetwarzanie dźwięku, zapewniają dźwięk stereo, posiadają własną pamięć ROM z zapisanymi w niej setkami dźwięków różnych instrumentów muzycznych. Pliki dźwiękowe są zwykle bardzo duże. Tak więc trzyminutowy plik audio z dźwiękiem stereo zajmuje około 30 MB pamięci. Dlatego karty Sound Blaster zapewniają automatyczną kompresję plików oprócz ich podstawowej funkcjonalności.

Elementy płyty

Karta dźwiękowa komputera osobistego zawiera kilka systemów sprzętowych związanych z produkcją i gromadzeniem danych audio, dwa główne podsystemy audio przeznaczone do cyfrowego „przechwytywania dźwięku”, syntezy i odtwarzania muzyki. Historycznie podsystem syntezy i odtwarzania muzyki generuje fale dźwiękowe na jeden z dwóch sposobów:

  • przez wewnętrzny syntezator FM (syntezator FM);
  • odtwarzanie zsamplowanego dźwięku.

Sekcja cyfrowego zapisu dźwięku karty dźwiękowej zawiera parę 16-bitowych konwerterów - cyfrowo-analogowy (DAC) i analogowo-cyfrowy (ADC) oraz programowalny generator częstotliwości próbkowania, który synchronizuje konwertery i sterowany centralny procesor . Komputer przesyła zdigitalizowane dane audio do lub z konwerterów. Częstotliwość konwersji to zwykle wielokrotność (lub część) 44,1 kHz.

Większość tablic korzysta z jednego lub więcej kanałów dostęp bezpośredni do pamięci, niektóre karty zapewniają również bezpośrednie wyjście cyfrowe za pomocą optycznego lub koncentrycznego połączenia S/PDIF (Sony/Philips Digital Interface).

Wbudowany generator dźwięku wykorzystuje cyfrowy procesor sygnału (DSP), który odtwarza żądane nuty, łącząc odczyty z różnych regionów tabeli dźwiękowej z różnymi częstotliwościami, aby uzyskać pożądaną wysokość dźwięku. Maksymalna liczba dostępnych nut jest związana z mocą procesora DSP i nazywana jest „polifonią” płyty.

Procesory DSP wykorzystują zaawansowane algorytmy do tworzenia efektów, takich jak pogłos, chorus i opóźnienie. Reverb sprawia wrażenie, jakby instrumenty grały w dużych salach koncertowych. Refren służy do sprawiania wrażenia, że ​​kilka instrumentów gra razem, podczas gdy w rzeczywistości jest tylko jeden. Na przykład dodanie opóźnienia do partii gitary może dać efekt przestrzenności i dźwięku stereo.

Modulacja częstotliwości

Pierwszą szeroko rozpowszechnioną technologią stosowaną w kartach dźwiękowych jest modulacja częstotliwości (FM), opracowana na początku lat 70. przez J. Chowninga (Uniwersytet Stanforda). Syntezator FM (syntezator FM) wytwarza dźwięk poprzez generowanie czystej fali sinusoidalnej (nośnik) i mieszanie jej z drugim sygnałem (modulator). Gdy dwa przebiegi mają zbliżoną częstotliwość, powstaje złożony przebieg. Kontrolując nośną i modulator, możesz tworzyć różne brzmienia lub instrumenty.

Każdy głos syntezatora FM wymaga co najmniej dwóch generatorów sygnału, powszechnie zwanych „operatorami”. Różne konstrukcje syntezatora FM mają różne stopnie kontroli nad parametrami operatora. Złożone systemy FM mogą używać czterech lub sześciu operatorów na głos, a operatorzy mogą mieć regulowane parametry, które umożliwiają dostosowanie szybkości pojawiania się i zanikania.

Yamaha była pierwszą firmą, która zainwestowała w badania nad teorią Chowninga, które doprowadziły do ​​opracowania legendarnego syntezatora DX7. Yamaha szybko zdała sobie sprawę, że miksowanie szerszej gamy nośników i modulatorów stworzy bardziej złożone głosy, w wyniku czego instrumenty będą brzmieć realistycznie.

Chociaż systemy FM zostały zaimplementowane jako analogowe we wczesnych syntezatorach klawiszowych, później wydajność syntezy FM została wykonana w formie cyfrowej. Techniki syntezy FM są bardzo przydatne do tworzenia nowych, ekspresyjnych dźwięków. Jeśli jednak celem systemu syntezy jest odtworzenie dźwięku istniejącego instrumentu, najlepiej zrobić to cyfrowo z próbkowanych sygnałów, tak jak w przypadku syntezy WaveTable.

Synteza WaveTable

Do tworzenia dźwięku tabela dźwiękowa nie wykorzystuje nośników i modulatorów, ale próbki dźwięków z rzeczywistych instrumentów. Próbkowanie to cyfrowa reprezentacja kształtu dźwięku wytwarzanego przez instrument. Płyty używające ISA zwykle przechowują próbki w pamięci ROM, chociaż nowsze produkty PCI wykorzystują główną pamięć RAM komputera osobistego, która jest ładowana podczas uruchamiania systemu operacyjnego (na przykład Windows) i może zawierać nowe dźwięki.

Chociaż wszystkie karty dźwiękowe FM brzmią podobnie, karty z tablicami dźwiękowymi różnią się znacznie jakością. Na jakość dźwięku instrumentów składają się czynniki:

  • jakość oryginalnego nagrania;
  • częstotliwość, z jaką próbki były rejestrowane;
  • liczba próbek użytych dla każdego instrumentu;
  • metody kompresji stosowane do zachowania próbki.

Większość sampli instrumentalnych jest napisana w standardzie

16 bitów i 44,1 kHz, ale wielu producentów kompresuje dane, dzięki czemu w ograniczonej ilości pamięci można zapisać więcej próbek lub instrumentów. Jednak kompresja często powoduje utratę zakresu dynamicznego lub jakości.

Kiedy kaseta magnetofonowa jest odtwarzana zbyt szybko lub zbyt wolno, zmienia się jej wysokość, co dotyczy również cyfrowych nagrań dźwiękowych. Odtworzenie sampla z większą prędkością niż jego oryginalna daje w rezultacie bardziej odtwarzalny dźwięk, dzięki czemu instrumenty mogą grać więcej niż kilka oktaw. Jeśli jednak niektóre brzmienia są grane szybko, brzmią zbyt słabo i słabo; podobnie, gdy próbka jest odtwarzana zbyt wolno, brzmi mrocznie i nienaturalnie. Aby przezwyciężyć te efekty, producenci dzielą klawiaturę na wiele regionów i stosują w każdym regionie odpowiednie próbki dźwięków instrumentów.

Każdy instrument brzmi z inną barwą, w zależności od stylu gry. Na przykład podczas cichej gry na pianinie nie słychać dźwięku młotków uderzających w struny. Im bardziej intensywnie grasz, tym nie tylko dźwięk staje się bardziej wyraźny, ale także można zauważyć zmiany w tonie.

Dla każdego instrumentu, wiele próbek i ich wariacji musi być zarejestrowanych, aby syntezator dokładnie odtworzył ten zakres dźwięków, a to nieuchronnie wymaga więcej pamięci. Typowa karta dźwiękowa może pomieścić do 700 próbek instrumentów w 4 MB ROM. Dokładne odtworzenie pianina solo wymaga jednak od 6 do 10 MB danych, dlatego nie ma porównania między dźwiękiem zsyntetyzowanym a rzeczywistym.

Aktualizacja tablicy dźwiękowej nie zawsze oznacza konieczność zakupu nowej karty dźwiękowej. Większość 16-bitowych kart dźwiękowych ma złącze, które można podłączyć do opcjonalnej płyty-córki. Jakość dźwięku instrumentów zapewnianych przez te płyty jest bardzo zróżnicowana i zwykle zależy to od ilości pamięci na płycie. Większość płyt zawiera od 1 do 4 MB próbek i oferuje szereg cyfrowych efektów dźwiękowych.

Złącza karty dźwiękowej

W 1998 roku firma Creative Technology wypuściła bardzo udaną kartę dźwiękową SoundBlaster Live!, która później stała się de facto standardem.

Wersja Platinum 5.1 karty Creative SoundBlaster Live!, która pojawiła się pod koniec 2000 roku, miała następujące gniazda i złącza:

  • wyjście analogowo-cyfrowe: albo skompresowany sygnał w formacie Dolby AC-3 SPDIF z 6 kanałami do podłączenia zewnętrznych urządzeń cyfrowych lub głośników systemów cyfrowych, albo analogowy system głośników 5.1;
  • wejście liniowe - umożliwia podłączenie zewnętrznego urządzenia takiego jak kaseta magnetofonowa, magnetofon cyfrowy, odtwarzacz i inne;
  • gniazdo mikrofonowe - łączy się z mikrofon zewnętrzny do wprowadzania głosowego;
  • wyjście liniowe - łączy się z głośnikami lub zewnętrznym wzmacniaczem dla wyjścia audio lub słuchawek;
  • Złącze Joystick / MlDI - łączy się z joystickiem lub urządzeniem MIDI i może być skonfigurowane do łączenia się z obydwoma jednocześnie;
  • złącze CD/SPDIF - łączy się z pinem SPDIF (digital audio) znajdującym się na napędzie DVD lub CD-ROM;
  • dodatkowe wejście audio - łączy się z wewnętrznymi źródłami audio, takimi jak tuner, MPEG lub inne podobne karty;
  • Złącze Audio CD — łączy się z analogowym wyjściem audio na płycie CD-ROM lub DVD-ROM za pomocą kabla Audio CD;
  • złącze automatycznej sekretarki — zapewnia komunikację monofoniczną ze standardowym modemem głosowym i przesyła sygnały mikrofonowe do modemu.

  • a - płatność audio;
  • b - blok na żywo! Prowadzić samochód.

Rozszerzenie audio (cyfrowe I/O) — łączy się z cyfrową płytą I/O (umieszczoną w wolnej wnęce na napęd 5,25 cala, która przechodzi z przodu komputera), czasami nazywaną Live! Drive. Zapewnia następujące połączenia:

  • Gniazdo RCA SPDIF - do podłączania cyfrowych rejestratorów audio, takich jak cyfrowa taśma i mini-dyski;
  • gniazdo słuchawkowe - łączy się z parą wysokiej jakości słuchawek, wycisza wyjście głośnikowe;
  • regulacja poziomu słuchawek - kontroluje głośność sygnału słuchawkowego;
  • drugie wejście (liniowe / mikrofonowe) - łączy się z wysokiej jakości mikrofonem dynamicznym lub źródłem dźwięku (gitara elektryczna, dźwięk cyfrowy lub minidysk);
  • przełącznik drugiego wejścia (linia/mikrofon);
  • Złącza MIDI - podłącz do urządzeń MIDI za pomocą kabla Mini DIN-Standard DIN;
  • port podczerwieni (czujnik) - pozwala zorganizować zdalne sterowanie komputerem osobistym;
  • pomocnicze gniazda RCA - podłącz do sprzętu elektroniki użytkowej(VCR, telewizor lub odtwarzacz CD);
  • optyczne wejście-wyjście SPDIF - łączy się z cyfrowymi rejestratorami audio, takimi jak cyfrowa taśma lub mini-dyski.

Nowoczesne karty dźwiękowe obsługują również szereg standardowych możliwości modelowania, generowania i przetwarzania dźwięku:

  • DirectX - system poleceń do sterowania pozycjonowaniem wirtualnego źródła dźwięku zaproponowany przez Microsoft (modyfikacje - DirectX 3.5, 6);
  • A3D - Opracowany w 1997 roku przez NASA (National Aeronautics and Space Administration) i Aureal do użytku w symulatorach lotu, standard generowania efektów takich jak gęsta mgła czy podwodne dźwięki. A3D2 pozwala na symulację konfiguracji pomieszczenia, w którym dźwięki są słyszane i rozprzestrzeniają się, obliczając do 60 odbić dźwięku (zarówno w hangarze, jak i w studni);
  • EAX (Environmental Audio Extensions), model zaproponowany przez Creative Technology w 1998 r. w celu dodania pogłosu do A3D, z uwzględnieniem przeszkód dźwiękowych i pochłaniania dźwięku;
  • MIDI (Musical Instrument Digital Interface), opracowany w latach 80. Polecenia przez standardowy interfejs są przesyłane zgodnie z protokołem MIDI. Komunikat MIDI nie zawiera nagrania samej muzyki, ale odniesienia do nut. W szczególności, gdy karta dźwiękowa odbiera taki komunikat, jest on dekodowany (które dźwięki jakie instrumenty powinny brzmieć) i przetwarzany w syntezatorze. Z kolei komputer osobisty może sterować różnymi „interaktywnymi” instrumentami za pośrednictwem interfejsu MIDI. W systemie Windows pliki MIDI mogą być odtwarzane przez dedykowane oprogramowanie MIDI Sequencer. Ten obszar syntezy dźwięku również ma swój standard. Głównym z nich jest standard MT-32, opracowany przez firmę Roland i nazwany na cześć modułu generowania dźwięku o tej samej nazwie. Norma ta dotyczy również kart dźwiękowych LAPC i określa podstawowe sposoby kontrolowania rozmieszczenia instrumentów, głosów oraz podziału na grupy instrumentów (klawisze, bębny itd.).

Format kompresji audio MP3

Oparty na oryginalnym MPEG-1, standard MP3 (skrót od audio MPEG, warstwa 3) jest jednym z trzech schematów kodowania (Warstwa 1, Warstwa 2 i Warstwa 3) do kompresji sygnałów audio. Ogólna struktura procesu kodowania jest taka sama dla wszystkich poziomów. Każdy poziom ma swój własny format nagrywania strumienia bitów i własny algorytm dekodowania. Algorytmy MPEG opierają się generalnie na zbadanych właściwościach percepcji sygnałów dźwiękowych przez aparat słuchowy człowieka (czyli kodowanie odbywa się za pomocą tzw. „modelu psychoakustycznego”). Ponieważ ludzki słuch nie jest doskonały, a czułość słuchu na różnych częstotliwościach jest różna w różnych kompozycjach, stosuje się to przy budowaniu modelu psychoakustycznego, który uwzględnia, które dźwięki, częstotliwości można wykluczyć bez szkody dla słuchacza kompozycji.

Wejściowy sygnał cyfrowy jest najpierw rozkładany na składowe częstotliwościowe widma. Standard MP3 dzieli widmo częstotliwości na 576 pasm częstotliwości i niezależnie kompresuje każde pasmo. Wtedy to widmo zostaje oczyszczone z elementów oczywiście niesłyszalnych – szumów o niskiej częstotliwości i najwyższych harmonicznych, czyli jest filtrowane. W kolejnym etapie wykonywana jest znacznie bardziej złożona analiza psychoakustyczna widma częstotliwości słyszalnych. Odbywa się to między innymi w celu identyfikacji i usunięcia częstotliwości „zamaskowanych” (częstotliwości, które nie są odbierane przez ucho ze względu na ich tłumienie przez inne częstotliwości). Jeśli dwa dźwięki pojawią się w tym samym czasie, MP3 nagra tylko ten, który faktycznie będzie odbierany. Cichy dźwięk zaraz po głośnym można również usunąć, ponieważ ucho dostosowuje się do głośności. Jeśli dźwięk jest identyczny na obu kanałach stereo, sygnał ten jest zapisywany 1 raz, ale odtwarzany na obu kanałach podczas dekompresji i odtwarzania pliku MP3.

Następnie, w zależności od poziomu złożoności zastosowanego algorytmu, można również przeprowadzić analizę przewidywalności sygnału. Na domiar złego gotowy strumień bitów jest kompresowany uproszczonym analogiem algorytmu Huffmana, co również znacznie zmniejsza objętość zajmowaną przez strumień.

Jak wspomniano powyżej, standard MPEG-1 składa się z trzech warstw (Warstwa 1, 2 i 3). Poziomy te różnią się pod względem zapewnianego współczynnika kompresji i jakości dźwięku strumieni wynikowych. Warstwa 1 umożliwia przechowywanie sygnałów 44,1 kHz / 16-bitowych bez zauważalnej utraty jakości przy szybkości strumienia 384 Kb/s, co stanowi 4-krotny wzrost zajmowanej przestrzeni; Warstwa 2 zapewnia tę samą jakość przy 194 Kbps, a warstwa 3 - przy 128. Warstwa 3 ma oczywistą przewagę, ale jej szybkość kompresji jest najniższa (należy zauważyć, że to ograniczenie jest już niewidoczne przy nowoczesnych szybkościach procesora).

Systemy odtwarzania dźwięku przestrzennego

Odtworzenie środowiska dźwiękowego rozpoczęło się od nagrań stereofonicznych i radia UKF FM. Powszechnie stosowano magnetofony i tunery stereo FM z wysokiej jakości dwukanałowym dźwiękiem. W kinach widzowie mogli cieszyć się dźwiękiem Dolby Stereo Optical. Pierwsze kasety wideo zakładały jedynie dźwięk monofoniczny o przeciętnej jakości, jednak kasety z dźwiękiem dwukanałowym wkrótce zaczęły być powielane. Na początku były po prostu oddzielne ścieżki dźwiękowe, a następnie technologia Hi-Fi. Płyty laserowe od samego początku były produkowane z wysokiej jakości dwukanałowym dźwiękiem stereo. Wkrótce większość standardów telewizji nadawczej została przystosowana do transmisji wideo z dwukanałową ścieżką dźwiękową drogą radiową i kablową. W ten sposób popularny dwukanałowy format audio stał się banalną opcją dla domowego wideo. Jako pierwsze na rynku pojawiły się proste dekodery Dolby Surround, które umożliwiły wybór i odsłuch trzeciego, przestrzennego kanału, kanału surround, na sprzęcie domowym. Następnie opracowano bardziej inteligentny dekoder, Dolby Surround Pro Logic, w którym podkreślono i kanał centralny- kanał centralny. Rezultatem jest „kino domowe” – zestaw sprzętu do odtwarzania dźwięku i wideo wysokiej jakości z dekoderem Dolby Pro Logic Surround Sound.

W przeciwieństwie do sprzętu quad, sprzęt Dolby Surround był i jest produkowany na masową skalę i jest stale ulepszany. Po pierwsze, technologia Dolby Pro Logic z powodzeniem łączy optymalną konfigurację kanałów przestrzennych (R, L, C, S) z możliwościami nagrywania i transmisji (dwa kanały fizyczne), które posiada prawie każdy sprzęt konsumencki. Po drugie, możliwości i jakość Dolby Pro Logic spełniają aktualne wymagania współczesnego użytkownika. I po trzecie, stosowane są jednolite standardy dotyczące sprzętu i oprogramowania.

Koder Dolby Surround nie jest przeznaczony do przesyłania czterech niezależnych sygnałów dźwiękowych, z których każdy musi być odsłuchiwany osobno (np. dźwięk jednego programu telewizyjnego na inne języki). W takim przypadku izolacja pomiędzy dowolnymi dwoma kanałami musiałaby być maksymalna, a amplitudy i fazy sygnałów mogłyby być całkowicie niepowiązane ze sobą. Wręcz przeciwnie, zadaniem Dolby Surround jest przesyłanie czterech kanałów dźwięku (ścieżki dźwiękowej), które będą odsłuchiwane jednocześnie i jednocześnie odtwarzają w umyśle słuchacza przestrzenny obraz dźwiękowy (pole dźwiękowe). Obraz ten składa się z kilku obrazów dźwiękowych (obrazów dźwiękowych) - dźwięków, które odbiera słuchacz, powiązanych z obrazami wizualnymi na ekranie. Obraz dźwiękowy charakteryzuje się nie tylko treścią i siłą dźwięku, ale także kierunkiem w przestrzeni.

Na wejściu enkodera Dolby Surround znajdują się sygnały czterech kanałów - L, C, R i S, a na wyjściach - dwa kanały L (lewy łącznie) i R (prawy łącznie). Słowo „total” oznacza, że ​​kanały zawierają nie tylko własny sygnał (lewy i prawy), ale także zakodowane sygnały innych kanałów - C i S. Schemat funkcjonalny enkodera pokazano na rysunku.

Sygnały z kanałów L i R są wysyłane do wyjść L i R bez żadnych modyfikacji. Sygnał kanału C jest dzielony równo i dodawany do sygnałów kanałów L i R. Sygnał C jest wstępnie tłumiony o 3 dB (aby utrzymać niezmienioną moc akustyczną sygnału po dodaniu jego „połówek” w matrycy dekodera). Sygnał kanału S jest również tłumiony o 3 dB, ale dodatkowo przed dodaniem do sygnałów L i R przechodzi następujące przekształcenia:

  • szerokość pasma ograniczona przez filtr pasmowy (BPF) od 100 Hz do 7 kHz;
  • sygnał jest przetwarzany przez tłumik szumów - procesor Dolby B-type Noise Reduction;
  • sygnał S jest przesunięty w fazie o +90 i -90 lat, tak że składowe sygnału S przeznaczone do dodania do L i R są w przeciwfazie względem siebie.

Jest całkiem jasne, że sygnały L i R nie wpływają na siebie nawzajem, są całkowicie niezależne. Na pierwszy rzut oka nie jest to takie oczywiste, ale faktem jest, że izolacja między sygnałami C i S również jest teoretycznie idealna. Rzeczywiście: w dekoderze sygnał S jest uzyskiwany jako różnica między sygnałami L i R. Ale te sygnały zawierają dokładnie te same składowe sygnału C, które po odjęciu znoszą się nawzajem. Wręcz przeciwnie, sygnał C jest wyodrębniany przez dekoder jako suma L i R. Ponieważ składowe sygnału S obecne w tych sygnałach są w przeciwfazie, gdy są dodawane, również wzajemnie się znoszą.

Takie kodowanie umożliwia przesyłanie sygnałów S i C o wysokim stopniu izolacji pod jednym warunkiem: jeśli charakterystyka amplitudy i fazy kanałów fizycznych, przez które przesyłane są sygnały L i R, są absolutnie identyczne. W przypadku braku równowagi między kanałami izolacja jest zmniejszona. Na przykład, jeśli składowe sygnału C w kanałach R i L nie są takie same z powodu różnych charakterystyk kanałów transmisyjnych, wystąpi niepożądany przesłuch części sygnału C w kanale S.

nagłośnienie PC jako karta dźwiękowa pojawił się w 1989 roku, znacznie rozszerzając możliwości komputera PC jako technicznego środka informatyzacji.

PC system dźwiękowy- kompleks oprogramowania i sprzętu realizujący następujące funkcje:

· Nagrywanie sygnałów audio ze źródeł zewnętrznych, takich jak mikrofon lub magnetofon, poprzez konwersję wejściowych analogowych sygnałów audio na cyfrowe, a następnie zapisanie ich na dysku twardym;

· Odtwarzanie nagranych danych dźwiękowych za pomocą zewnętrznego systemu głośników lub słuchawek (słuchawek);

· Odtwarzanie płyt audio CD;

· Miksowanie (miksowanie) podczas nagrywania lub odtwarzania sygnałów z kilku źródeł;

Jednoczesne nagrywanie i odtwarzanie sygnałów dźwiękowych (tryb Pełny dupleks);

· Przetwarzanie sygnałów dźwiękowych: edycja, łączenie lub dzielenie fragmentów sygnału, filtrowanie, zmiana jego poziomu;

Przetwarzanie sygnału dźwiękowego zgodnie z algorytmami surround (trójwymiarowy - Dźwięk 3D) dźwięk;

· Generowanie za pomocą syntezatora dźwięku instrumentów muzycznych, mowy ludzkiej i innych dźwięków;

· Sterowanie pracą zewnętrznych elektronicznych instrumentów muzycznych poprzez specjalny interfejs MIDI.

System dźwiękowy komputera PC to konstruktywne karty dźwiękowe, zainstalowane w gnieździe płyty głównej lub zintegrowane z płytą główną lub kartą rozszerzeń innego podsystemu komputera, a także urządzenia do nagrywania i odtwarzania informacji dźwiękowych (system akustyczny). Oddzielne moduły funkcjonalne systemu dźwiękowego mogą być realizowane w postaci kart-córek instalowanych w odpowiednich złączach karty dźwiękowej.

Klasyczny system nagłaśniający, jak pokazano na ryc. 4.23, zawiera:

Moduł nagrywania i odtwarzania dźwięku;

Moduł syntezatora;

Moduł interfejsu;

Moduł miksera;

System akustyczny.

Ryż. 4.23. Struktura nagłośnienia PC.

Pierwsze cztery moduły są zwykle instalowane na karcie dźwiękowej. Ponadto istnieją karty dźwiękowe bez modułu syntezatora lub modułu cyfrowego zapisu/odtwarzania dźwięku. Każdy z modułów może być wykonany jako oddzielny mikroukład lub być częścią mikroukładu wielofunkcyjnego. Tak więc chipset systemu dźwiękowego może zawierać zarówno kilka, jak i jeden mikroukład.

Projekt systemu dźwiękowego PC przechodzi znaczące zmiany; są płyty główne z zainstalowanym chipsetem do przetwarzania dźwięku.

Jednak przeznaczenie i funkcje modułów nowoczesnego nagłośnienia (niezależnie od jego konstrukcji) nie ulegają zmianie. Rozważając funkcjonalne moduły karty dźwiękowej, zwyczajowo używa się terminów „system dźwiękowy komputera” lub „karta dźwiękowa”.

Urządzenia dźwiękowe stają się integralną częścią każdego komputera osobistego. W trakcie konkursu uniwersalny, szeroko obsługiwany standard oprogramowania dźwiękowego i sprzęt komputerowy... Urządzenia audio ewoluowały od drogich egzotycznych dodatków do znanej części systemu w niemal każdej konfiguracji.

We współczesnych komputerach sprzętowa obsługa dźwięku realizowana jest w jednej z następujących form:

  • adapter audio pasujący do złącza magistrali PCI lub ISA;
  • mikroukład na płycie głównej wyprodukowany przez Crystal, Analog Devices, Sigmatel, ESS i inne;
  • urządzenia audio zintegrowane z chipsetem płyty bazowej, który obejmuje najbardziej zaawansowane chipsety firm Intel, SiS i VIA Technologies przeznaczone dla tanich komputerów.

Oprócz głównego urządzenia audio istnieje wiele dodatkowych urządzeń audio: głośniki, mikrofon itp. W tym rozdziale opisano funkcjonalność i cechy wszystkich elementów komputerowego systemu audio.

Pierwsze karty dźwiękowe pojawiły się pod koniec lat 80-tych. obsługiwane przez AdLib, Roland i Creative Labs i były używane tylko w grach. W 1989 roku Creative Labs wypuściło stereofoniczną kartę dźwiękową Game Blaster; później wprowadzono płytę Sound Blaster Pro.

Do stabilnego działania płyty wymagane było określone oprogramowanie (MS DOS, Windows) oraz zasoby sprzętowe (IRQ, DMA i adresy portów I/O).

W związku z problemami pojawiającymi się w procesie używania kart dźwiękowych, które nie są kompatybilne z systemem Sound Blaster Pro, w grudniu 1995 roku pojawił się nowy rozwój Microsoft DirectX, który jest serią interfejsów programowych aplikacji (API) do bezpośredniej interakcji z urządzeniami sprzętowymi.

Prawie każdy komputer jest obecnie wyposażony w jakiś rodzaj adaptera audio i CD-ROM lub

Napęd zgodny z CD-ROM. Po przyjęciu standardów MRS-1-MRS-3, które definiują klasyfikację komputerów, systemy wyposażone w kartę dźwiękową i napęd kompatybilny z CD-ROM nazwano komputerami multimedialnymi. Pierwszy standard MPC-1 został wprowadzony w 1990 roku; standard MRS-3, który zastąpił go w czerwcu 1995 r., określał, co następuje minimalne wymagania do sprzętu i oprogramowania:

  • procesor - Pentium, 75 MHz;
  • RAM - 8 MB;
  • dysk twardy - 540 MB;
  • napęd CD-ROM - czterobiegowy (4x);
  • Rozdzielczość VGA - 640 x 480;
  • głębia kolorów - 65 536 kolorów (16-bitowy kolor);
  • minimalnym systemem operacyjnym jest Windows 3.1.

Wszelkie komputery zbudowane po 1996 roku, które zawierają:

adapter dźwięku i napęd kompatybilny z CD-ROM, w pełni spełniają wymagania standardu MPC-3.

Obecnie kryteria przynależności komputera do klasy multimediów nieco się zmieniły ze względu na postęp techniczny w tej dziedzinie:

  • procesor - Pentium III, Celeron, Athlon, Duron lub dowolny inny procesor klasy Pentium 600 MHz;
  • pamięć RAM - 64 MB;
  • dysk twardy - 3,2 GB;
  • dyskietka- 1,44 MB (dysk 3,5" o dużej gęstości);
  • napęd CD-ROM - 24-biegowy (24x);
  • częstotliwość próbkowania dźwięku - 16-bit;
  • Rozdzielczość VGA - 1024 x 768;
  • głębia kolorów - 16,8 mln kolorów (kolor 24-bitowy);
  • urządzenia wejścia-wyjścia - równoległy, szeregowy, MIDI, port gier;
  • minimalnym systemem operacyjnym jest Windows 98 lub Windows Me.

Chociaż głośniki lub słuchawki nie są technicznie częścią specyfikacji MPC ani powyższej listy, są one wymagane do odtwarzania dźwięku. Ponadto mikrofon jest wymagany do wprowadzania informacji głosowych używanych do nagrywania dźwięku lub komputerowej kontroli mowy. Systemy wyposażone w adapter dźwięku zazwyczaj zawierają również niedrogie głośniki pasywne lub aktywne (można je zastąpić słuchawkami zapewniającymi wymaganą charakterystykę jakościową i częstotliwościową odtwarzanego dźwięku).

Komputer multimedialny wyposażony w głośniki i mikrofon ma szereg możliwości i zapewnia:

  • dodawanie dźwięku stereo do programów rozrywkowych (gier);
  • zwiększenie efektywności programów edukacyjnych (dla małych dzieci);
  • dodawanie efektów dźwiękowych do dem i samouczków;
  • tworzenie muzyki przy użyciu sprzętu i narzędzia programowe MIDI;
  • dodawanie komentarzy dźwiękowych do plików;
  • realizacja konferencji sieci dźwiękowych;
  • dodawanie efektów dźwiękowych do zdarzeń systemu operacyjnego;
  • odtwarzanie dźwięku tekstu;
  • odtwarzanie płyt audio CD;
  • odtwarzanie plików w formacie .mp3;
  • odtwarzanie klipów wideo;
  • odtwarzanie filmów DVD;
  • wsparcie dla sterowania głosowego.

Komponenty systemu audio. Wybierając system audio, należy wziąć pod uwagę parametry jego elementów.

Złącza karty dźwiękowej. Większość kart dźwiękowych ma te same miniaturowe (1/8") złącza, które przesyłają sygnały z płyty do głośników, słuchawek i wejść stereo, a także do mikrofonu, odtwarzacza CD i magnetofonu. Rysunek 5.4 przedstawia cztery typy złączy które muszą być zainstalowane jako minimum na karcie dźwiękowej. Kodowanie kolorami dla każdego typu złącza jest zdefiniowane w Przewodniku Projektowania PC99 i różni się w zależności od różnych adapterów dźwiękowych.

Ryż. 5.4.

Wymieńmy najpopularniejsze złącza:

  • wyjście liniowe płyty. Sygnał z tego złącza podawany jest do urządzeń zewnętrznych - systemów akustycznych, słuchawek lub na wejście wzmacniacza stereo, za pomocą którego sygnał jest wzmacniany do wymaganego poziomu;
  • tablica z wejściem liniowym. Używany podczas miksowania lub nagrywania sygnału audio z zewnętrznego systemu audio na dysk twardy;
  • gniazdo głośnikowe i słuchawkowe. Niedostępne we wszystkich planszach. Sygnały głośnikowe są dostarczane z tego samego gniazda (wyjście liniowe), co wejście wzmacniacza stereo;
  • wejście mikrofonowe lub wejście sygnału mono. Służy do podłączenia mikrofonu. Nagrywanie mikrofonowe jest monofoniczne. Poziom sygnału wejściowego jest utrzymywany na stałym poziomie i optymalny do konwersji. Do nagrywania najlepiej używać mikrofonu elektrodynamicznego lub pojemnościowego o impedancji obciążenia od 600 omów do 10 kiloomów. Niektóre tanie karty dźwiękowe podłączają mikrofon do wejścia liniowego;
  • Złącze joysticka (port MIDI) Jest to 15-stykowe złącze w kształcie litery D. Jego dwa piny mogą służyć do sterowania urządzeniem MIDI, takim jak syntezator klawiszowy. W takim przypadku musisz kupić kabel w kształcie litery Y;
  • złącze MIDI. Podłączany do portu joysticka, posiada dwa okrągłe 5-pinowe złącza DIN służące do podłączania urządzeń MIDI oraz złącze joysticka;
  • wewnętrzne złącze pinowe — dedykowane złącze do podłączenia do wewnętrznego napędu CD-ROM. Umożliwia odtwarzanie dźwięku z płyt CD przez głośniki podłączone do karty dźwiękowej. To złącze różni się od złącza do podłączenia kontrolera CD-ROM do karty dźwiękowej, ponieważ dane nie są przez nie przesyłane do magistrali komputera.

Dodatkowe złącza. Większość nowoczesnych adapterów audio obsługuje odtwarzanie DVD, przetwarzanie dźwięku itp., dlatego ma kilka dodatkowych złączy, których cechy podano poniżej:

  • Wejście i wyjście MIDI. To złącze, niezwiązane z portem gier, umożliwia jednoczesne korzystanie z joysticka i zewnętrznych urządzeń MIDI;
  • Wejście i wyjście SPDIF (Sony / Philips Digital Interface - SP / DIF). Złącze służy do przesyłania cyfrowych sygnałów audio między urządzeniami bez konwertowania ich do postaci analogowej. SPDIF jest czasami określany jako Dolby Digital;
  • CD SPDIF. Złącze jest przeznaczone do podłączenia napędu CD-ROM do karty dźwiękowej za pomocą interfejsu SPDIF;
  • Wejście TAD. Złącze dla modemów z obsługą automatycznej sekretarki (Telephone Answering Device) do karty dźwiękowej;
  • wyjście cyfrowe DIN. Złącze jest przeznaczone do podłączenia wielokanałowych cyfrowych systemów głośnikowych;
  • wejście Aih. Zapewnia połączenie z kartą dźwiękową innych źródeł sygnału, takich jak tuner telewizyjny;
  • Wejście I2S. Umożliwia podłączenie wyjścia cyfrowego źródeł zewnętrznych, takich jak DVD, do karty dźwiękowej.

Dodatkowe złącza są zwykle umieszczone bezpośrednio na karcie dźwiękowej lub podłączone do jednostki zewnętrznej lub karty-córki. Na przykład Sound Blaster Live! Platinum 5.1 to urządzenie dwuczęściowe. Sam adapter audio jest podłączony przez gniazdo PCI, a dodatkowe złącza są podłączone do zewnętrznego bloku rozgałęźnego LiveDrive IR, który jest zainstalowany w nieużywanej wnęce napędu.

Kontrola głośności. V niektóre karty dźwiękowe zapewniają ręczną regulację głośności; na bardziej rozbudowanych planszach regulacja głośności odbywa się programowo za pomocą kombinacji klawiszy, bezpośrednio podczas gry w system Windows lub w jakiejś aplikacji.

Syntezatory. Obecnie wszystkie produkowane płytki są stereofoniczne, obsługujące standard MIDI.

Stereofoniczne karty dźwiękowe jednocześnie odtwarzają (i nagrywają) wiele sygnałów z dwóch różnych źródeł. Im więcej sygnałów dostarcza adapter, tym bardziej naturalny dźwięk. Każdy układ syntezatora umieszczony na płytce, najczęściej firmy Yamaha, pozwala na odbiór 11 (chip YM3812 lub OPL2) sygnałów lub więcej. Aby symulować ponad 20 sygnałów (mikroukład YMF262 lub OPL3), zainstalowany jest jeden lub dwa mikroukłady syntezatora częstotliwości.

Karty dźwiękowe Wavetable wykorzystują cyfrowe nagrania prawdziwych instrumentów i efektów dźwiękowych zamiast zsyntetyzowanych dźwięków generowanych przez chip FM. Na przykład, gdy taki adapter audio odtwarza dźwięk trąbki, dźwięk trąbki jest słyszalny bezpośrednio, a nie jego imitacja. Pierwsze karty dźwiękowe obsługujące tę funkcję zawierały do ​​1 MB bitów dźwiękowych przechowywanych w układach pamięci adaptera. Jednak w wyniku pojawienia się szybkiej magistrali PCI i zwiększenia ilości pamięci RAM w komputerach, większość kart dźwiękowych wykorzystuje obecnie tak zwaną metodę programowalnych fal tabeli, która umożliwia załadowanie 2-8 MB krótkiego dźwięku fragmenty różnych instrumentów muzycznych do pamięci RAM komputera.

W nowoczesnym gry komputerowe ah Dźwięk MIDI praktycznie nie jest używany, ale mimo to zmiany wprowadzone w karcie dźwiękowej DirectX 8 sprawiają, że jest to akceptowalna opcja dla ścieżek dźwiękowych do gier.

Kompresja danych. V jakość dźwięku większości płyt zbliżona do płyt CD z częstotliwością próbkowania

44,1 kHz, kiedy na każdą minutę dźwięku przy nagrywaniu nawet normalnego głosu zużywane jest około 11 MB miejsca na dysku. W celu zmniejszenia rozmiaru plików audio w wielu kartach stosowana jest kompresja danych. Na przykład karta Sound Blaster ASP 16 kompresuje dźwięk w czasie rzeczywistym (podczas nagrywania) ze współczynnikiem kompresji 2:1, 3:1 lub 4: 1.

Ponieważ dźwięk wymaga dużej ilości miejsca na dysku do jego przechowywania, jest kompresowany przy użyciu Adaptive Differential Pulse Code Modulation (ADPCM), co może zmniejszyć rozmiar pliku o około 50%. Pogarsza to jednak jakość dźwięku.

Wielofunkcyjne procesory sygnałowe. Wiele kart dźwiękowych wykorzystuje cyfrowe procesory sygnałowe (DSP). Dzięki nim płyty stały się bardziej „inteligentne” i uwolniły jednostkę centralną komputera od wykonywania tak czasochłonnych zadań, jak czyszczenie sygnałów z szumu i kompresowanie danych w czasie rzeczywistym.

Procesory można znaleźć w wielu kartach dźwiękowych ogólnego przeznaczenia. Na przykład programowalny cyfrowy procesor sygnałowy EMU10K1 (DSP) karty Sound Blaster Live! kompresuje dane, zamienia tekst na mowę i syntetyzuje tzw. dźwięk trójwymiarowy, tworząc efekt odbicia dźwięku i akompaniamentu chóralnego. Z takim procesorem karta dźwiękowa zamienia się w urządzenie wielofunkcyjne. Na przykład w karcie komunikacyjnej IBM WindSurfer procesor cyfrowy działa jako modem, faks i cyfrowa automatyczna sekretarka.

Sterowniki kart dźwiękowych. Większość płyt jest dostarczana z ogólnymi sterownikami dla aplikacji DOS i Windows. Windows 9x i Windows NT mają już sterowniki do popularnych kart dźwiękowych; sterowniki do innych płyt można dokupić osobno.

Aplikacje DOS zwykle nie mają szerokiego wyboru sterowników, ale gry na komputery PC obsługują karty Sound Blaster Pro.

W ostatnich latach znacznie wzrosły wymagania dotyczące urządzeń audio, co z kolei doprowadziło do wzrostu mocy sprzętu. Współczesnego zunifikowanego sprzętu multimedialnego nie można w pełni uznać za doskonały system multimedialny, charakteryzujący się następującymi cechami:

  • realistyczny dźwięk przestrzenny w grach komputerowych;
  • wysokiej jakości dźwięk w filmach DVD;
  • rozpoznawanie mowy i sterowanie głosem;
  • tworzenie i nagrywanie plików audio w formatach MIDI, MP3, WAV i CD-Audio.

Dodatkowe wymagania dotyczące sprzętu i oprogramowania wymaganego do osiągnięcia powyższych cech przedstawia tabela. 5.3.

Tabela 5.3. Dodatkowe cechy i właściwości adapterów audio

Spotkanie

Niezbędny

możliwości

Dodatkowy sprzęt

Dodatkowe oprogramowanie

Port gier; dźwięk trójwymiarowy; przyspieszenie dźwięku

Kontroler gry; tylne głośniki

filmy DVD

Dekodowanie Dolby 5.1

Głośniki z adapterem audio, kompatybilne z Dolby 5.1

Oprogramowanie do dekodowania MPEG

Kompatybilny z oprogramowaniem adapter audio

Mikrofon

Oprogramowanie do dyktowania

Tworzenie plików MIDI

Adapter audio z wejściem MIDI

Kompatybilny z MIDI

musical

klawiatura

Oprogramowanie do tworzenia plików MIDI

Twórz pliki MP3

Digitalizacja plików audio

napęd CD-R lub CD-RW

Program do tworzenia plików MP3

Tworzenie plików WAV

Mikrofon

Program do nagrywania dźwięku

Tworzenie plików CDAudio

Zewnętrzne źródło dźwięku

Konwerter plików WAV lub MP3 na CD-Audio

Minimalne wymagania dla kart dźwiękowych.

Zastąpienie poprzedniej karty dźwiękowej Sound Blaster Pro ISA kartą dźwiękową PCI znacznie poprawiło wydajność systemu, ale zaleca się korzystanie ze wszystkich funkcji kart dźwiękowych, do których w szczególności należą:

  • Obsługa dźwięku 3D zaimplementowana w chipsecie. Wyrażenie „dźwięk trójwymiarowy” oznacza, że ​​dźwięki odpowiadające temu, co dzieje się na ekranie, słychać dalej lub bliżej, za plecami lub gdzieś z boku. Interfejs Microsoft DirectX 8.0 obejmuje obsługę dźwięku 3D, ale w tym celu lepiej jest użyć adaptera audio ze sprzętową obsługą dźwięku 3D;
  • Korzystaj z DirectX 8.0 wraz z innymi interfejsami API audio 3D, takimi jak Creative EAX, Sensaura 3D Positional Audio oraz nieistniejąca już technologia Aureal A3D;
  • Przyspieszenie dźwięku ZO. Karty dźwiękowe z chipsetami obsługującymi tę funkcję mają dość niski stopień wykorzystania procesora, co powoduje ogólny wzrost wydajności w grach. Aby uzyskać najlepsze wyniki, użyj chipsetów, które mogą przyspieszyć większość strumieni 3D; w przeciwnym razie przetwarzanie dźwięku trójwymiarowego przez procesor centralny będzie trudne, co ostatecznie wpływa na szybkość gry;
  • porty gier obsługujące kontrolery gier z wymuszeniem sprzężenia zwrotnego.

Obecnie istnieje wiele kart dźwiękowych klasy średniej, które obsługują co najmniej dwie z tych funkcji. Jednocześnie cena detaliczna adapterów audio nie przekracza 50-100 dolarów Nowe chipsety audio 3D dostarczane przez różnych producentów pozwalają fanom gier komputerowych 3D na modernizację systemu zgodnie z ich życzeniami.

Filmy DVD na ekranie komputera. Aby oglądać filmy DVD na komputerze, potrzebujesz następujących komponentów:

  • oprogramowanie do odtwarzania płyt cyfrowych, które obsługuje wyjście Dolby Digital 5.1. Jedną z bardziej akceptowalnych opcji jest PowerDVD;
  • adapter audio, który obsługuje wejście Dolby Digital do napędu DVD i wysyła dane do sprzętu audio zgodnego z Dolby Digital 5.1. W przypadku braku odpowiedniego sprzętu wejście Dolby 5.1 jest skonfigurowane dla czterech głośników; dodatkowo można dodać wejście S/PDIF ACS (Dolby Surround) dla głośników czterogłośnikowych;
  • Odbiornik i głośniki zgodne z Dolby Digital 5.1. Większość wysokiej jakości kart dźwiękowych obsługujących Dolby Digital 5.1 jest podłączona do dedykowanego analogowego odbiornika wejściowego, ale inne, takie jak Creative Labs Sound Blaster Live! Platinum, obsługuje głośniki z wejściem cyfrowym, dodając do płyty dodatkowe złącze Digital DIN.

Rozpoznawanie mowy. Technologia rozpoznawania mowy wciąż jest niedoskonała, ale dziś istnieją programy, które pozwalają wydawać polecenia komputerowi za pomocą głosu, wywoływać niezbędne aplikacje, otwierać pliki i niezbędne okna dialogowe a nawet podyktować mu teksty, które musiałby być napisany wcześniej.

Dla typowego użytkownika aplikacje tego typu są bezużyteczne. Na przykład Compaq przez jakiś czas dostarczał komputery z mikrofonem i aplikacją do sterowania głosowego, a aplikacja była bardzo tania. Chociaż fajnie było patrzeć, jak wielu użytkowników w biurze rozmawia ze swoimi komputerami, wydajność nie uległa poprawie, ale zmarnowano dużo czasu, ponieważ użytkownicy byli zmuszeni do eksperymentowania oprogramowanie a poza tym w biurze zrobiło się bardzo głośno.

Jednak dla użytkowników niepełnosprawnych tego typu oprogramowanie może być interesujące, dlatego technologia rozpoznawania mowy stale się rozwija.

Jak wspomniano powyżej, istnieje inny rodzaj oprogramowania do rozpoznawania mowy, które umożliwia konwersję mowy na tekst. Jest to niezwykle trudne zadanie, przede wszystkim ze względu na różnice w wzorcach mowy różnych osób, dlatego prawie całe oprogramowanie, w tym niektóre aplikacje do wydawania poleceń głosowych, zawiera etap „uczenia się” technologii rozpoznawania głosu konkretnego użytkownika. W trakcie takiego szkolenia użytkownik odczytuje tekst (lub słowa) wyświetlany na ekranie komputera. Ponieważ tekst jest zaprogramowany, komputer szybko dostosowuje się do sposobu mówienia mówcy.

W wyniku eksperymentów okazało się, że jakość rozpoznawania zależy od indywidualnych cech mowy. Ponadto niektórzy użytkownicy są w stanie dyktować całe strony tekstu bez dotykania klawiatury, podczas gdy inni się tym męczą.

Na jakość rozpoznawania mowy wpływa wiele parametrów. Wymieńmy główne:

  • dyskretne i ciągłe programy rozpoznawania mowy. Ciągła (lub spójna) mowa, która pozwala na bardziej naturalny „dialog” z komputerem, jest obecnie standardem, ale z drugiej strony istnieje szereg nierozwiązywalnych problemów w osiągnięciu akceptowalnej dokładności rozpoznawania;
  • programy możliwe do przeszkolenia i nie do przeszkolenia. „Uczenie” programu do poprawnego rozpoznawania mowy daje dobre wyniki nawet w tych aplikacjach, które pozwalają pominąć ten etap;
  • świetne słowniki aktywne i ogólne. Programy z dużym aktywnym słownictwem reagują znacznie szybciej na język mówiony, a programy z większym słownictwo ogólne pozwalają zachować unikalne słownictwo;
  • wydajność sprzętu komputerowego. Wzrost szybkości procesorów i ilości pamięci RAM prowadzi do wymiernego wzrostu szybkości i dokładności programów rozpoznawania mowy, a także pozwala programistom wprowadzać dodatkowe funkcje do nowych wersji aplikacji;
  • wysokiej jakości karta dźwiękowa i mikrofon: słuchawki z wbudowanym mikrofonem nie są przeznaczone do nagrywania muzyki lub efektów dźwiękowych, ale do rozpoznawania mowy.

Pliki dźwiękowe. Istnieją dwa główne typy plików do przechowywania nagrań dźwiękowych na komputerze osobistym. Pliki pierwszego typu, zwane zwykłymi plikami dźwiękowymi, używają formatów .wav, .voc, .au i .aiff. Plik audio zawiera dane o kształcie fali, to znaczy jest cyfrowym zapisem analogowych sygnałów audio, które można przechowywać na komputerze. Zdefiniowano trzy poziomy jakości nagrywania dźwięku stosowane w systemach operacyjnych Windows 9x i Windows Me, a także poziom jakości nagrywania dźwięku o charakterystyce 48 kHz, 16-bitowe stereo i 188 Kb/s. Ten poziom jest przeznaczony do obsługi odtwarzania dźwięku ze źródeł takich jak DVD i Dolby AC-3.

Aby osiągnąć kompromis między wysoką jakością dźwięku a małym rozmiarem pliku, możesz przekonwertować pliki .wav do formatu .mp3.

Kompresja danych dźwiękowych. Istnieją dwa główne obszary, w których stosowana jest kompresja dźwięku:

  • wykorzystanie bitów dźwiękowych na stronach internetowych;
  • zmniejszenie głośności wysokiej jakości plików muzycznych.

Dedykowane programy do edycji dźwięku, takie jak RealProducer firmy Real lub Microsoft Windows Media Encoder 7, pozwalają zmniejszyć głośność bitów dźwiękowych przy minimalnej utracie jakości.

Najpopularniejszym formatem plików audio jest .mp3. Te pliki są zbliżone do jakości dźwięku CD i są znacznie mniejsze niż zwykłe pliki .wav. Na przykład, 5-minutowy plik dźwiękowy .wav o jakości CD ma około 50 Mb, podczas gdy ten sam plik dźwiękowy .mp3 ma około 4 Mb.

Jedyną wadą plików .mp3 jest brak ochrony przed nieautoryzowanym użyciem, czyli każdy może swobodnie pobrać taki plik z Internetu (na szczęście istnieje bardzo wiele serwisów oferujących takie „pirackie” nagrania). Opisany format plików, pomimo niedociągnięć, stał się dość rozpowszechniony i doprowadził do masowej produkcji odtwarzaczy TR3.

Pliki MIDI. Plik audio MIDI różni się od formatu .wav w taki sam sposób, w jaki grafika wektorowa różni się od rastrowego. Pliki MIDI mają rozszerzenie .mid lub .rmi i są całkowicie cyfrowe, nie zawierają nagrania dźwiękowego, ale raczej polecenia używane przez sprzęt audio do jego utworzenia. Podobnie jak karty wideo używają poleceń do tworzenia obrazów obiektów 3D, karty dźwiękowe MIDI współpracują z plikami MIDI w celu syntezy muzyki.

MIDI to potężny język programowania, który rozpowszechnił się w latach 80. XX wieku. i jest specjalnie zaprojektowany do elektronicznych instrumentów muzycznych. Standard MIDI stał się nowym słowem w dziedzinie muzyki elektronicznej. Dzięki MIDI możesz tworzyć, nagrywać, edytować i odtwarzać pliki muzyczne na komputerze osobistym lub na elektronicznym instrumencie muzycznym zgodnym z MIDI podłączonym do komputera.

Pliki MIDI, w przeciwieństwie do innych typów plików audio, wymagają stosunkowo niewielkiej ilości miejsca na dysku. Nagranie 1 godziny muzyki stereo zapisanej w formacie MIDI wymaga mniej niż 500 KB. Wiele gier korzysta z nagrywania MIDI, a nie z samplowanego nagrywania analogowego.

Plik MIDI jest w rzeczywistości cyfrowym wyświetlaczem partytury muzycznej składającym się z kilku dedykowanych kanałów, z których każdy reprezentuje inny dokument muzyczny lub rodzaj dźwięku. Częstotliwości i czas trwania nut są zdefiniowane w każdym kanale: w rezultacie plik MIDI, na przykład dla kwartetu smyczkowego, zawiera cztery kanały, które reprezentują dwoje skrzypiec, alt i wiolonczelę.

Wszystkie trzy specyfikacje MPC, a także PC9x zapewniają obsługę MIDI we wszystkich kartach dźwiękowych. Standard General MIDI dla większości kart dźwiękowych dopuszcza do 16 kanałów w jednym pliku MIDI, ale niekoniecznie ogranicza to dźwięk do 16 instrumentów. Jeden kanał może reprezentować dźwięk grupy instrumentów; dlatego można zsyntetyzować pełną orkiestrę.

Ponieważ plik MIDI składa się z poleceń cyfrowych, edycja jest znacznie łatwiejsza niż plik audio .wav. Odpowiednie oprogramowanie pozwala wybrać dowolny kanał MIDI, nagrywać nuty i dodawać efekty. Niektóre pakiety oprogramowania są przeznaczone do nagrywania muzyki do pliku MIDI przy użyciu standardowego systemu notacji muzycznej. W efekcie kompozytor zapisuje muzykę bezpośrednio na komputerze, w razie potrzeby edytuje, a następnie drukuje zapis nutowy dla wykonawców. Jest to bardzo wygodne dla profesjonalnych muzyków, którzy muszą poświęcać dużo czasu na przepisywanie nut.

Odtwarzanie plików MIDI. Uruchomienie pliku MIDI na komputerze osobistym nie oznacza odtworzenia nagrania. Komputer faktycznie tworzy muzykę zgodnie z nagranymi poleceniami: system odczytuje plik MIDI, syntezator generuje dźwięki dla każdego kanału zgodnie z poleceniami w pliku, aby nadać dźwiękowi nut pożądany ton i czas trwania. Aby wytworzyć dźwięk określonego instrumentu muzycznego, syntezator wykorzystuje predefiniowany wzór, czyli zestaw poleceń, które tworzą dźwięk podobny do tego, który gra konkretny instrument.

Syntezator na karcie dźwiękowej jest podobny do elektronicznego syntezatora klawiszowego, ale ma ograniczone możliwości. Zgodnie ze specyfikacją MPC karta dźwiękowa musi być wyposażona w syntezator częstotliwości, który może jednocześnie grać co najmniej sześć nut melodycznych i dwa bębny.

Synteza częstotliwości. Większość kart dźwiękowych generuje dźwięki za pomocą syntezatora częstotliwości; technologia ta została opracowana w 1976 roku. Używając jednej fali sinusoidalnej do zmiany drugiej, syntezator częstotliwości wytwarza sztuczny dźwięk przypominający konkretny instrument. Standard MIDI definiuje zestaw wstępnie zaprogramowanych dźwięków, które można odtwarzać na większości instrumentów.

Niektóre syntezatory częstotliwości wykorzystują cztery fale, a odtwarzane dźwięki są całkiem normalne, aczkolwiek nieco sztuczne. Na przykład zsyntetyzowany dźwięk trąbki jest niewątpliwie podobny do jej brzmienia, ale nikt nigdy nie rozpozna go jako dźwięku prawdziwej trąbki.

Synteza fali tablicowej. Osobliwością syntezy częstotliwości jest to, że odtwarzany dźwięk, nawet w najlepszym przypadku, nie pokrywa się całkowicie z rzeczywistym dźwiękiem instrumentu muzycznego. Niedroga technologia zapewniająca bardziej naturalne brzmienie została opracowana przez firmę Ensoniq w 1984 roku. Umożliwia ona nagrywanie dźwięku dowolnego instrumentu (w tym fortepianu, skrzypiec, gitary, fletu, trąbki i bębna) oraz przechowywanie zdigitalizowanego dźwięku w specjalnym stole. Ta tabela jest zapisywana albo na chipach ROM, albo na dysku, a karta dźwiękowa może wyodrębnić z tabeli zdigitalizowany dźwięk wymaganego instrumentu.

Za pomocą syntezatora table-wave można wybrać instrument, wydać jedyną potrzebną nutę i w razie potrzeby zmienić jej częstotliwość (czyli zagrać daną nutę z odpowiedniej oktawy). Niektóre adaptery wykorzystują wiele tonów tego samego instrumentu, aby poprawić odtwarzanie dźwięku. Najwyższa nuta na fortepianie różni się od najniższej, więc aby uzyskać bardziej naturalny dźwięk, wybierz próbkę, która jest najbliższa (dźwiękiem) syntezowanej nuty.

Tak więc jakość i różnorodność dźwięków, które syntezator może odtworzyć, w dużej mierze zależy od wielkości stołu. Najlepszej jakości adaptery wavetable zwykle mają na pokładzie kilka megabajtów pamięci do przechowywania próbek. Niektóre z nich zapewniają możliwość podłączenia dodatkowych kart w celu zainstalowania dodatkowej pamięci i nagrywania próbek dźwięków w tabeli.

Podłącz inne urządzenia do złącza MIDI. Interfejs MIDI karty dźwiękowej służy również do podłączania do komputera instrumentów elektronicznych, generatorów dźwięku, bębnów i innych urządzeń MIDI. W rezultacie pliki MIDI są odtwarzane przez wysokiej jakości syntezator muzyczny, a nie przez syntezator karty dźwiękowej, i możesz tworzyć własne pliki MIDI, grając nuty na dedykowanej klawiaturze. Właściwe oprogramowanie pozwoli Ci skomponować symfonię na komputerze, nagrywając nuty każdego instrumentu osobno na osobnym kanale, a następnie umożliwiając jednoczesne brzmienie wszystkich kanałów. Wielu profesjonalnych muzyków i kompozytorów używa urządzeń MIDI do komponowania muzyki bezpośrednio na swoich komputerach, bez tradycyjnych instrumentów.

Istnieją również wysokiej jakości karty MIDI, które działają w trybie dwukierunkowym, to znaczy odtwarzają nagrane wcześniej ścieżki dźwiękowe podczas nagrywania nowej ścieżki do tego samego pliku MIDI. Jeszcze kilka lat temu można było to zrobić tylko w studiu przy użyciu profesjonalnego sprzętu, który kosztował setki tysięcy dolarów.

Urządzenia MIDI podłączane są do dwóch okrągłych 5-stykowych złączy DIN adaptera audio, używanych do przesyłania sygnałów wejściowych (MIDI-IN) i wyjściowych (MIDI-OUT). Wiele urządzeń ma również port MIDI-THRU, który przesyła sygnały z wejścia urządzenia bezpośrednio do jego wyjścia, ale karty dźwiękowe zwykle tego nie robią. Co ciekawe, zgodnie ze standardem MIDI dane przesyłane są tylko przez piny 1 i 3 złączy. Pin 2 jest ekranowany, a piny 4 i 5 nie są używane.

Główną funkcją interfejsu MIDI karty dźwiękowej jest konwersja (konwersja) strumienia bajtów (tj. 8 bitów równolegle) danych przesyłanych przez magistralę systemową komputera na szeregowy strumień danych w formacie MIDI. Urządzenia MIDI wyposażone są w asynchroniczne porty szeregowe pracujące z prędkością 31,25 Kbaud. Przy wymianie danych zgodnie ze standardem MIDI wykorzystuje się osiem bitów informacyjnych z jednym bitem startu i jednym bitem stopu, a transmisja szeregowa 1 bajtu trwa 320 ms.

Zgodnie ze standardem MIDI, sygnały przesyłane są specjalną nieekranowaną skrętką, która może mieć do 15 m długości (chociaż większość sprzedawanych kabli ma 3 lub 6 m). Możesz także połączyć szeregowo wiele urządzeń MIDI, aby połączyć ich możliwości. Całkowita długość łańcucha urządzeń MIDI nie jest ograniczona, ale długość każdego pojedynczego kabla nie może przekraczać 15m.

Systemy Legacy-free nie mają złącza portu gier (port MIDI) - wszystkie urządzenia są podłączone do magistrali typu USB.

Oprogramowanie dla urządzeń MIDI. Systemy operacyjne Windows 9x, Windows Me i Windows 2000 są dostarczane z oprogramowaniem Media Player, które odtwarza pliki MIDI. Aby wykorzystać wszystkie możliwości MIDI, zaleca się zakup specjalistycznego oprogramowania do wykonywania różnych operacji edycji plików MIDI (ustawianie tempa odtwarzania, wycinanie i wstawianie różnych wcześniej nagranych utworów muzycznych).

Wiele kart dźwiękowych jest dostarczanych z oprogramowaniem, które umożliwia edycję plików MIDI. Ponadto wiele narzędzi (programów) freeware i shareware jest swobodnie rozpowszechnianych przez Internet, ale naprawdę potężne oprogramowanie, które pozwala na tworzenie i edycję plików MIDI, należy zakupić osobno.

Nagranie. Prawie wszystkie karty dźwiękowe wyposażone są w złącze wejściowe, poprzez podłączenie mikrofonu, do którego można nagrywać swój głos. Korzystając z oprogramowania Sound Recorder w systemie Windows, możesz odtwarzać, edytować i nagrywać plik dźwiękowy w specjalnym formacie .wav.

Oto główne zastosowania plików .wav:

  • utrzymanie określonych zdarzeń w systemie Windows. Aby to zrobić, użyj opcji Dźwięki w Panelu sterowania systemu Windows;
  • dodawanie adnotacji głosowych za pomocą kontrolek Windows OLE i ActiveX dla dokumentów różnego typu;
  • Wprowadzanie tekstu towarzyszącego w prezentacjach utworzonych za pomocą programu PowerPoint, grafiki niezależnej, prezentacji Corel lub innych.

W celu zmniejszenia rozmiaru i dalszego wykorzystania w Internecie, pliki .wav są konwertowane na pliki .mp3 lub .wma.

Płyty CD audio. Korzystanie z dysku CD-ROM możesz słuchać płyt audio CD nie tylko przez głośniki, ale także przez słuchawki podczas pracy z innymi programami. Wiele kart dźwiękowych jest dostarczanych z programami do odtwarzania płyt CD, które często są pobierane z Internetu za darmo. Programy te zwykle mają wyświetlacz, który symuluje przedni panel odtwarzacza CD do sterowania klawiaturą lub myszą.

Mikser dźwięku (mikser). Jeśli masz wiele źródeł dźwięku i tylko jeden głośnik, musisz użyć miksera dźwięku. Większość kart dźwiękowych jest wyposażona we wbudowany mikser dźwięku (mikser), który umożliwia miksowanie dźwięku ze źródeł audio, MIDI i WAV, wejścia liniowego i odtwarzacza CD, odtwarzając go na jednym wyjściu liniowym. Zazwyczaj interfejsy oprogramowania do miksowania dźwięku na ekranie wyglądają jak standardowy panel miksera dźwięku. Ułatwia to sterowanie głośnością każdego źródła.

Karty dźwiękowe: podstawowe pojęcia i terminy. Aby zrozumieć, czym są karty dźwiękowe, musisz najpierw zrozumieć terminy. Dźwięk to wibracje (fale) rozchodzące się w powietrzu lub innym medium ze źródła wibracji we wszystkich kierunkach. Kiedy fale docierają do ucha, znajdujące się w nim elementy sensoryczne odbierają wibracje i słychać dźwięk.

Każdy dźwięk charakteryzuje się częstotliwością i intensywnością (głośnością).

Częstotliwość - jest to liczba wibracji dźwięku na sekundę; jest mierzony w hercach (Hz). Jeden cykl (okres) to jeden ruch źródła drgań (w przód iw tył). Im wyższa częstotliwość, tym wyższy ton.

Ucho ludzkie odbiera tylko niewielki zakres częstotliwości. Bardzo niewiele osób słyszy dźwięki poniżej 16 Hz i powyżej 20 kHz (1 kHz = 1000 Hz). Najniższa nuta fortepianu to 27 Hz, a najwyższa nieco ponad 4 kHz. Najwyższa częstotliwość dźwięku, jaką mogą transmitować nadawcy FM, to 15 kHz.

Tom dźwięk zależy od amplitudy drgań, która zależy przede wszystkim od mocy źródła dźwięku. Na przykład struna fortepianu brzmi miękko po lekkim uderzeniu, ponieważ jej zakres wibracji jest niewielki. Jeśli uderzysz w klawisz mocniej, amplituda drgań struny wzrośnie. Głośność dźwięku jest mierzona w decybelach (dB). Na przykład szelest liści ma głośność około 20 dB, zwykły hałas uliczny to około 70 dB, a pobliski grzmot 120 dB.

Ocena jakości adaptera dźwięku. Do oceny jakości adaptera dźwięku służą trzy parametry:

  • zakres częstotliwości;
  • współczynnik zniekształceń nieliniowych;
  • stosunek sygnału do szumu.

Charakterystyka częstotliwościowa określa zakres częstotliwości, w którym poziom rejestrowanych i odtwarzanych amplitud pozostaje stały. W przypadku większości kart dźwiękowych zakres ten wynosi od 30 Hz do 20 kHz. Im szerszy zakres, tym lepsza deska.

Współczynnik zniekształceń nieliniowych charakteryzuje nieliniowość karty dźwiękowej, to znaczy różnicę między rzeczywistą krzywą pasma przenoszenia a idealną linią prostą lub, prościej, współczynnik charakteryzuje czystość reprodukcji dźwięku. Każdy element nieliniowy powoduje zniekształcenia. Im niższy ten stosunek, tym wyższa jakość dźwięku.

Wyższy stosunek sygnału do szumu (w decybelach) skutkuje lepszą reprodukcją dźwięku.

Próbowanie. Jeżeli komputer posiada kartę dźwiękową, możliwe jest nagrywanie dźwięku w postaci cyfrowej (zwanej również dyskretną), w którym to przypadku komputer służy jako urządzenie nagrywające. Karta dźwiękowa zawiera mały mikroukład - przetwornik analogowo-cyfrowy lub ADC (przetwornik analogowo-cyfrowy - ADC), który konwertuje sygnał analogowy na postać cyfrową, którą komputer może zrozumieć podczas nagrywania. Podobnie, podczas odtwarzania, przetwornik cyfrowo-analogowy (DAC) konwertuje dźwięk na dźwięk, który słyszą nasze uszy.

Proces konwersji oryginalnego sygnału audio na postać cyfrową (rys.5.5), w której jest przechowywany do późniejszego odtworzenia, nazywa się próbkowaniem lub digitalizacją. Jednocześnie wartości chwilowe sygnału dźwiękowego są zapisywane w określonych punktach czasowych, zwanych wyborem


Ryż. 5.5. Obwód konwersji audio-cyfrowej Kami. Im częściej pobierane są próbki, tym bardziej cyfrowa kopia dźwięku pasuje do oryginału.

Pierwszy standard MPC przewidziany dla 8-bitowego dźwięku. Głębia bitowa charakteryzuje liczbę bitów używanych do cyfrowej reprezentacji każdej próbki.

Osiem bitów definiuje 256 dyskretnych poziomów sygnału audio, a jeśli użyjesz 16 bitów, to ich liczba sięga 65 536 (oczywiście jakość dźwięku jest znacznie poprawiona). Reprezentacja 8-bitowa jest wystarczająca do nagrywania i odtwarzania głosu, podczas gdy reprezentacja 16-bitowa jest wymagana do muzyki. Większość starszych płyt obsługuje tylko dźwięk 8-bitowy, wszystkie nowoczesne płyty obsługują 16-bitowy lub więcej.

Jakość nagrywanego i odtwarzanego dźwięku wraz z rozdzielczością określa częstotliwość próbkowania (liczba próbek na sekundę). Teoretycznie powinna być 2 razy wyższa niż maksymalna częstotliwość sygnału (tj. górna granica częstotliwości) plus 10% margines. Próg słyszalności ludzkiego ucha wynosi 20 kHz. Nagrania CD odpowiadają 44,1 kHz.

Dźwięk próbkowany z częstotliwością 11 kHz (11 000 próbek na sekundę) jest bardziej rozmyty niż dźwięk próbkowany z częstotliwością 22 kHz. Ilość miejsca na dysku wymagana do nagrania 16-bitowego dźwięku z częstotliwością próbkowania 44,1 kHz przez 1 minutę wyniesie 10,5 MB. Dzięki prezentacji 8-bitowej, dźwiękowi monofonicznemu i częstotliwości próbkowania 11 kHz wymagana przestrzeń dyskowa jest zmniejszona 16-krotnie. Dane te można sprawdzić za pomocą programu „Sound Recorder”: nagraj fragment dźwięku z różnymi częstotliwościami próbkowania i spójrz na rozmiar wynikowych plików.

Dźwięk trójwymiarowy. Jednym z najtrudniejszych wyzwań dla kart dźwiękowych w systemie do gier jest obsługa zadań związanych z dźwiękiem 3D. Istnieje kilka czynników, które komplikują rozwiązanie tego rodzaju problemów:

  • różne standardy pozycjonowania dźwięku;
  • sprzęt i oprogramowanie używane do przetwarzania dźwięku 3D;
  • Problemy z obsługą DirectX.

Dźwięk pozycyjny. Pozycjonowanie dźwięku jest powszechną technologią dla wszystkich kart dźwiękowych 3b i obejmuje regulację pewnych parametrów, takich jak pogłos lub odbicie, wyrównanie (balans) i wskazanie „lokalizacji” źródła dźwięku. Wszystkie te elementy tworzą iluzję dźwięków dochodzących z przodu, z prawej, z lewej strony użytkownika, a nawet za jego plecami. Najważniejszym elementem dźwięku pozycyjnego jest Head Related Transfer Function (HRTF), która określa zmianę percepcji dźwięku w zależności od kształtu ucha i kąta obrotu głowy słuchacza. Parametry tej funkcji opisują warunki, w których „realistyczny” dźwięk jest odbierany zupełnie inaczej, gdy głowa słuchacza jest zwrócona w jedną lub drugą stronę. Zastosowanie systemów wielogłośnikowych, które otaczają użytkownika ze wszystkich kierunków, a także wyrafinowanych algorytmów dźwiękowych, które uzupełniają odtwarzany dźwięk o kontrolowany pogłos, sprawiają, że dźwięk zsyntetyzowany komputerowo jest jeszcze bardziej realistyczny.

Przetwarzanie dźwięku 3D. Ważnym czynnikiem wysokiej jakości dźwięku są różne sposoby przetwarzania dźwięku trójwymiarowego w kartach dźwiękowych, a w szczególności:

  • scentralizowany (centralny procesor służy do przetwarzania dźwięku trójwymiarowego, co prowadzi do spadku ogólnej wydajności systemu);
  • Przetwarzanie karty dźwiękowej (akceleracja 3 D) z potężnym cyfrowym procesorem sygnału (DSP) przetwarzającym bezpośrednio w karcie dźwiękowej.

Karty dźwiękowe, które zapewniają scentralizowane przetwarzanie dźwięku 3D, mogą być głównym powodem niższej szybkości klatek (liczby klatek animacji na sekundę) podczas korzystania z dźwięku 3D. W kartach dźwiękowych z wbudowanym procesorem dźwięku szybkość klatek pozostaje prawie niezmieniona po włączeniu lub wyłączeniu dźwięku 3D.

Jak pokazuje praktyka, średnia liczba klatek na sekundę w realistycznej grze komputerowej powinna wynosić co najmniej 30 klatek na sekundę (klatek na sekundę). Dzięki szybkiemu procesorowi, na przykład Pentium III 800 MHz, i dowolnej nowoczesnej karcie dźwiękowej ZE, tę częstotliwość można osiągnąć dość łatwo. Jeśli użyjesz wolniejszego procesora, powiedzmy, Celerona 300A działającego z częstotliwością 300 MHz i płyty ze scentralizowanym przetwarzaniem dźwięku 3D, liczba klatek na sekundę będzie znacznie niższa niż 30 fps. Aby zobaczyć, jak przetwarzanie dźwięku 3D wpływa na szybkość gier komputerowych, w większości gier jest wbudowana funkcja śledzenia szybkości klatek. Szybkość klatek jest bezpośrednio związana z wykorzystaniem procesora; wyższe wymagania dotyczące zasobów procesora doprowadzą do zmniejszenia liczby klatek na sekundę.

Technologie trójwymiarowego dźwięku i trójwymiarowego obrazu wideo cieszą się największym zainteresowaniem przede wszystkim twórców gier komputerowych, ale ich wykorzystanie w środowisku komercyjnym również nie jest odległe.

Podłączanie systemu stereo do karty dźwiękowej. Proces podłączania systemu stereo do karty dźwiękowej polega na połączeniu ich kablem. Jeśli karta dźwiękowa ma wyjście na system głośnikowy lub słuchawki i wyjście liniowe stereo, lepiej jest użyć tego drugiego do podłączenia systemu stereo. W tym przypadku uzyskuje się lepszy dźwięk, ponieważ sygnał dociera do wyjścia liniowego bez przechodzenia przez obwód wzmacniający, a zatem praktycznie nie podlega zniekształceniom, a tylko system stereo wzmocni sygnał.

Podłącz to wyjście do wejścia pomocniczego systemu stereo. Jeśli twój zestaw stereo nie ma wejść pomocniczych, powinieneś użyć innych, takich jak wejście dla odtwarzacza CD. Wzmacniacz stereo i komputer nie muszą być ustawione obok siebie, więc kabel połączeniowy może mieć kilka metrów długości.

Wiele odbiorników stereo i radia posiada złącze na tylnym panelu dla tunera, magnetofonu i odtwarzacza CD. Za pomocą tego złącza, a także wejścia i wyjścia liniowego karty dźwiękowej, możesz słuchać dźwięku z komputera, a także audycji radiowych przez system głośników stereo.

Zasada 2. Przed podłączeniem urządzenia do sieci sprawdź, co jest napisane z tyłu urządzenia.

Sprawdź napięcie na wyjściu autotransformatora na biegu jałowym przed podłączeniem do niego urządzenia.

Sprawdź napięcie dostarczane do urządzenia podczas wykonywania kopii.

Po zakończeniu pracy odłącz wtyczkę autotransformatora od sieci. Nie pozostawiaj autotransformatora pod napięciem!

Zasada 3. Bardzo ważne jest, aby wziąć pod uwagę wymagania dotyczące instalacji kopiarki. Urządzenie musi być zainstalowane na płaskiej, poziomej powierzchni. Odchylenie od pozycji poziomej powoduje ponowne rozprowadzenie tonera i nośnika w kasecie urządzenia w kierunku pochyłości. W związku z tym ich mieszanie staje się trudne i zaburzona jest równomierność pokrycia wałka magnetycznego tonerem.

Praca laboratoryjna. Nauka działania urządzeń do przetwarzania dźwięku

cel pracy

Sprawdź schemat blokowy systemu dźwiękowego PC, który tworzy system dźwiękowy.

7.2 Postęp prac:

1) Zapoznaj się ze schematem blokowym systemu dźwiękowego PC.

2) Przestudiuj główne komponenty (moduły) systemu dźwiękowego.

3) Zapoznać się z zasadą działania modułu syntezatora.

4) Zapoznać się z zasadą działania modułu interfejsu.

5) Zapoznać się z zasadą działania modułu mieszacza.

1) Temat, cel, postęp prac;

2) sformułowanie i opis zadania indywidualnego;

7.4 Pytania testowe

1) Jakie są główne moduły klasycznego nagłośnienia?

2) Jaka jest istota syntezy.

3) Nazwij fazy sygnału audio.

4) Jakie znasz metody syntezy dźwięku?

5) Wymień nowoczesne interfejsy urządzeń audio.

Instrukcje metodyczne.

Struktura systemu dźwiękowego PC

System dźwiękowy komputera PC to konstruktywnie karty dźwiękowe, zainstalowane w gnieździe płyty głównej lub zintegrowane z płytą główną lub kartą rozszerzeń innego podsystemu komputera.

Klasyczny system dźwiękowy, jak pokazano na rysunku 23, zawiera:

1. moduł do nagrywania i odtwarzania dźwięku;

2. moduł syntezatora;

3. moduł interfejsu;

4. moduł mieszacza;

5. system głośników.

Rysunek 23 - Struktura systemu dźwiękowego komputera PC

Moduł syntezatora

Cyfrowy syntezator muzyki elektronicznej nagłośnienia pozwala na generowanie niemal dowolnego dźwięku, w tym dźwięku prawdziwych instrumentów muzycznych. Zasadę działania syntezatora ilustruje rysunek 24.

Synteza to proces odtwarzania struktury tonu muzycznego (nuty). Sygnał dźwiękowy dowolnego instrumentu muzycznego ma kilka faz czasowych. Na rysunku 24 a pokazuje fazy sygnału dźwiękowego, który pojawia się po naciśnięciu przycisku ml fortepianu. Dla każdego instrumentu muzycznego rodzaj sygnału będzie unikalny, ale można w nim wyróżnić trzy fazy: atak, wsparcie i zanik. Połączenie tych faz nazywa się obwiednia amplitudy, którego kształt zależy od rodzaju instrumentu muzycznego. Czas trwania ataku na różne instrumenty muzyczne waha się od jednostek do kilkudziesięciu, a nawet setek milisekund. W fazie zwanej wsparciem amplituda sygnału pozostaje prawie niezmieniona, a wysokość tonu muzycznego powstaje podczas podtrzymania. Ostatnia faza, tłumienie, odpowiada odcinkowi dość gwałtownego spadku amplitudy sygnału.

W nowoczesnych syntezatorach dźwięk powstaje w następujący sposób. Urządzenie cyfrowe wykorzystujące jedną z metod syntezy generuje tzw. sygnał wzbudzenia o zadanym tonie (dźwięku), który powinien mieć charakterystykę spektralną jak najbardziej zbliżoną do charakterystyk symulowanego instrumentu muzycznego w fazie podtrzymania, jak pokazano na rysunku 24. b. Następnie sygnał wzbudzenia jest podawany do filtra, który symuluje pasmo przenoszenia prawdziwego instrumentu muzycznego. Sygnał obwiedni amplitudy tego samego instrumentu podawany jest na drugie wejście filtra. Ponadto zestaw sygnałów jest przetwarzany w celu uzyskania specjalnych efektów dźwiękowych, na przykład echa (pogłosu), wykonania chóralnego. Następnie konwersja cyfrowo-analogowa i filtrowanie sygnału realizowane są za pomocą filtra dolnoprzepustowego (LPF).

Najważniejsze cechy modułu syntezatora:

metoda syntezy dźwięku;

Pamięć;

Możliwość sprzętowej obróbki sygnału w celu tworzenia efektów dźwiękowych;

Polifonia - maksymalna liczba jednocześnie odtwarzanych elementów dźwiękowych.

metoda syntezy dźwięku, zastosowany w systemie nagłośnienia PC decyduje nie tylko o jakości dźwięku, ale także o składzie systemu. W praktyce na kartach dźwiękowych instalowane są syntezatory, które generują dźwięk następującymi metodami.

Rysunek 24 - Zasada działania nowoczesnego syntezatora: a - fazy sygnału audio; b - obwód syntezatora

Metoda syntezy FM ( Synteza modulacji częstotliwości - Synteza FM) polega na wykorzystaniu co najmniej dwóch generatorów sygnałów o skomplikowanych kształtach do generowania głosu instrumentu muzycznego. Generator częstotliwości nośnej generuje podstawowy sygnał tonu, modulowany częstotliwościowo sygnałem dodatkowych harmonicznych, alikwotów, które określają barwę danego instrumentu. Generator obwiedni kontroluje amplitudę sygnału wynikowego Generator FM zapewnia akceptowalną jakość dźwięku, jest niedrogi, ale nie zapewnia efektów dźwiękowych. Dlatego karty dźwiękowe korzystające z tej metody nie są zalecane zgodnie ze standardem PC99.

Synteza dźwięku na podstawie tabeli fal (Synteza Wave Table - Synteza WT) jest wytwarzana przy użyciu wstępnie zdigitalizowanych próbek dźwięków rzeczywistych instrumentów muzycznych i innych dźwięków przechowywanych w specjalnej pamięci ROM, wykonanych w postaci układu pamięci lub zintegrowanych z układem pamięci generatora WT. Syntezator WT zapewnia wysokiej jakości generowanie dźwięku. Ta metoda syntezy jest zaimplementowana w nowoczesnych kartach dźwiękowych.

Pamięć na kartach dźwiękowych z syntezatorem WT można go zwiększyć, instalując dodatkowe elementy pamięci (ROM) do przechowywania banków z instrumentami.

Efekty dźwiękowe są tworzone za pomocą procesora efektów specjalnych, który może być niezależnym elementem (mikroukładem) lub zintegrowanym z syntezatorem WT. W przypadku zdecydowanej większości kart z syntezą WT efekty pogłosu i chorusa stały się standardem.

Synteza dźwięku oparta na modelowaniu fizycznym polega na wykorzystaniu modele matematyczne produkcja dźwięku prawdziwych instrumentów muzycznych do generowania w postaci cyfrowej i do dalszej konwersji na sygnał audio za pomocą przetwornika cyfrowo-analogowego. Karty dźwiękowe wykorzystujące modelowanie fizyczne nie są jeszcze powszechnie stosowane, ponieważ wymagają do działania wydajnego komputera.

Moduł interfejsu

Moduł interfejsu zapewnia wymianę danych pomiędzy nagłośnieniem a innymi urządzeniami zewnętrznymi i wewnętrznymi.

Interfejs ISA w 1998 został wyparty w kartach dźwiękowych przez interfejs PCI.

Interfejs PCI zapewnia szerokie pasmo (np. wersja 2.1 - ponad 260 Mb/s), co pozwala na równoległą transmisję strumieni audio. Korzystanie z magistrali PCI pozwala poprawić jakość dźwięku, zapewniając stosunek sygnału do szumu powyżej 90 dB. Ponadto magistrala PCI umożliwia wspólne przetwarzanie danych audio, gdzie zadania przetwarzania i transmisji są dzielone między system audio i procesor.

MIDI (cyfrowy interfejs instrumentów muzycznych)- cyfrowy interfejs instrumentu muzycznego) reguluje specjalny standard zawierający specyfikacje interfejsu sprzętowego: typy kanałów, kable, porty, przez które są ze sobą połączone urządzenia MIDI, a także opis procedury wymiany danych - protokół wymiany informacje między urządzeniami MIDI. W szczególności za pomocą poleceń MIDI można sterować sprzętem oświetleniowym, sprzętem wideo podczas występu zespołu muzycznego na scenie. Urządzenia z interfejsem MIDI są połączone szeregowo, tworząc rodzaj sieci MIDI, w skład której wchodzi kontroler - urządzenie sterujące, które może pełnić rolę zarówno komputera PC, jak i syntezatora klawiatury muzycznej, a także urządzenia podrzędne (odbiorniki) nadające informacje do administratora na jego żądanie. Całkowita długość łańcucha MIDI nie jest ograniczona, ale maksymalna długość kabla pomiędzy dwoma urządzeniami MIDI nie powinna przekraczać 15 metrów.

Podłączenie komputera PC do sieci MIDI odbywa się za pomocą specjalnego adaptera MIDI, który posiada trzy porty MIDI: wejście, wyjście i pass-through oraz dwa złącza do podłączenia joysticków.

Karta dźwiękowa zawiera interfejs do podłączenia napędów CD-ROM.

7.5.4 Moduł mieszacza

Moduł miksera karty dźwiękowej wykonuje:

Przełączanie (podłączanie/rozłączanie) źródeł i odbiorników sygnałów dźwiękowych, a także regulowanie ich poziomu;

Miksowanie (miksowanie) kilku sygnałów audio i dostosowywanie poziomu sygnału wynikowego.

Główne cechy modułu mieszacza to:

Liczba zmiksowanych sygnałów w kanale odtwarzania;

Regulacja poziomu sygnału w każdym mieszanym sygnale;

Regulacja całkowitego poziomu sygnału;

Moc wyjściowa wzmacniacza;

Obecność złącz do podłączenia zewnętrznych i wewnętrznych odbiorników / źródeł sygnałów audio.

Źródła i odbiorniki sygnału audio są połączone przez moduł miksera za pomocą złączy zewnętrznych lub wewnętrznych. Zewnętrzne złącza audio znajdują się zwykle z tyłu obudowy. Jednostka systemowa: Joystick/MIDI- do podłączenia joysticka lub adaptera MIDI; Wejście mikrofonowe- podłączyć mikrofon; Wyrysować- wejście liniowe do podłączenia dowolnych źródeł sygnałów audio; Zakreślać- wyjście liniowe do podłączenia dowolnych odbiorników sygnałów audio; Głośnik do podłączenia słuchawek (słuchawek) lub pasywnego systemu głośnikowego.

Programowe sterowanie mikserem odbywa się za pomocą systemu Windows lub programu miksera dostarczanego z oprogramowaniem karty dźwiękowej

Zgodność nagłośnienia z jednym ze standardów kart dźwiękowych oznacza, że ​​nagłośnienie zapewni wysoką jakość odtwarzania dźwięku. Kwestie zgodności są szczególnie ważne w przypadku aplikacji DOS. Każda z nich zawiera listę kart dźwiękowych, z którymi aplikacja DOS ma pracować.

Standardowy Sound Blaster obsługuje aplikacje do gier DOS, w których ścieżka dźwiękowa jest zaprogramowana dla rodziny kart dźwiękowych Sound Blaster.

Standard systemu dźwiękowego Windows (WSS) Microsoft zawiera kartę dźwiękową i pakiet oprogramowania skoncentrowany głównie na aplikacjach biznesowych.

Przykłady zadań indywidualnych

Model 1 — karta dźwiękowa SB PCI CMI 8738

Rysunek 25 - Widok zewnętrzny karty dźwiękowej SB PCI CMI 8738

Opis: Karta dźwiękowa z możliwością odtwarzania dźwięku w formacie 5.1

Typ sprzętu: Multimedialna karta dźwiękowa

Chip: C-Media 8738

Wejścia analogowe: 2

Wyjścia analogowe: 3

Złącza: Zewnętrzne: wejście liniowe, wejście mikrofonowe, wyjście na głośnik przedni, wyjście na głośnik tylny, wyjście centralne/subwoofer; wewnętrzne: wejście liniowe, wejście CD

Możliwość podłączenia 4 głośników: Tak

Obsługa Dolby Digital 5.1: Tak

Obsługa EAX: EAX 1.0 i 2.0

Interfejs: PCI

Możliwość podłączenia 6 głośników: Tak


Model 2 — karta dźwiękowa PCI SB PCI Terratec Aureon 5.1

Rysunek 26 — Widok zewnętrzny karty dźwiękowej SB PCI Terratec Aureon 5.1 PCI

Opis: 6-kanałowa karta dźwiękowa.

Dźwięk 3D: EAX 1.0, EAX 2.0, Sensaura, Aureal A3D 1.0, Environment FX, Multi Drive, Zoom FX, I3DL2, DirectSound 3D

Chip: С-media CMI8738 / PCI-6ch-MX

DAC: 16 bitów / 48 kHz

ADC: 16 bitów / 48 kHz

Liczba głośników: 5,1

Wejścia analogowe: 1x niezbalansowane złącze miniJack, wejście mikrofonowe miniJack, złącza wewnętrzne: AUX, CD-in.

Wyjścia analogowe: Wyjścia audio MiniJack do podłączenia głośników 5.1 (przód, tył, sub / senter-out).

S/PDIF: 16 ​​bitów / 48 kHz

Cyfrowe we/wy: wyjście optyczne (TOSLINK), wejście optyczne (TOSLINK).

Częstotliwość próbkowania: 44,1, 48 kHz

Wymagania systemowe (minimalne): Intel PentiumIII, AMD K6-III 500 MHz 64 MB pamięci

Interfejs: PCI 2.1, 2.2