Czasami zdarza się, że nie dysponując profesjonalnym sprzętem czy warunkami pragniemy stworzyć dobrze brzmiący podkład tekstowy do filmu instruktażowego. Okazuje się, że nawet w najtrudniejszych warunkach przy odrobinie samozaparcia taki cel jest możliwy do zrealizowania, co więcej jakość nagrania po obróbce nie będzie odstawać zbytnio od tej uzyskanej w studio. Z pomocą przychodzi program Audacity.
Audacity jest darmowym, wieloplatformowym oprogramowaniem do nagrywania i edycji dźwięku. Więcej możesz dowiedzieć się na stronie projektu. Tutaj skupimy się na uzyskaniu co najmniej zadowalającej jakości zarejestrowanego materiału audio. Znęcać będziemy się nad fragmentem bezpłatnego kursu „Specyfika świec japońskich” autorstwa Michała Bednarza z portalu https://swiecejaponskie.com.pl/.
Nagranie wejściowe:
Etap 1 – redukcja szumów
Po zaimportowaniu pliku audio do programu Audacity dokonujemy sklonowania ścieżki poprzez zaznaczenie jej i wciśnięcie Ctrl + D lub poprzez wybór z menu Edytuj >> Duplikuj. Ścieżkę z zaimportowanym plikiem wyciszamy, natomiast na duplikacie zaznaczamy kilkusekundowy fragment, w którym słyszalne jest jedynie tło nagrania.
W następnym kroku uruchamiamy Efekty >> Odszumianie i klikamy Pobierz próbkę szumu. Okno znika, a my możemy zaznaczyć obrabiany ślad (cały czas pracujemy na duplikacie) i ponownie uruchomić mechanizm odszumiania.
Wraz z pojawieniem się okna zaczyna się cała zabawa – należy tak dobrać położenia trzech suwaków, aby przy odsłuchu poprzez Podgląd, głos był wyraźny i możliwie bez zniekształceń. Eksperymenty z wartością redukcji szumów można śmiało zacząć od 12dB, pamiętając jednak, aby nie przesadzić. Wyższe wartości tego parametru skutkują stłumieniem wyższych rejestrów. Odwrotnie sytuacja ma się z wygładzaniem częstotliwości – tutaj niższe liczby owocują „ćwierkaniem” w głośnikach. Czas reakcji również dobieramy eksperymentalnie, skupiając się w niższym zakresie położeń suwaka.
Przed:
Po:
Etap 2 – korekcja graficzna
Teraz skoncentrujemy się na wydobyciu z nagrania przyjemniejszego brzmienia. Po odszumieniu okazało się, że głos jest nieco dudniący, jakby zapuszkowany. Ograniczeniu uległy też najwyższe częstotliwości przez co dźwięk jest nienaturalnie ciepły. Ponownie wykonujemy duplikację ścieżki, poprzednią wyciszamy, natomiast zaznaczamy obecną.
Dudniący dźwięk świadczy o powstawaniu rezonansów w górnym zakresie niskich i dolnym średnich częstotliwości. Podejścia przy ich wykrywaniu mamy w zasadzie dwa (oczywiście można je stosować równolegle): albo przemiatamy korektorem/filtrem wywyższe zakresy szukając nieprawidłowości, albo od razu robimy analizę spektralną całego regionu. Żeby było prościej zaczniemy od FFT. Wybieramy Analiza >> Wykres spektrum. Wyskakuje okienko z prążkami widma ale to jeszcze nie to co chcieliśmy. Maksymalizujemy je i zmieniamy ustawienia: Rozmiar – 16384, Skala logarytmiczna otrzymując widok podobny do tego na obrazku poniżej.
Zaznaczają się tu trzy szczyty o częstotliwościach: 123Hz, 231Hz i 400Hz. Dokładne wartości wyświetlane są poniżej wykresu, po najechaniu nań kursorem. Te nierównomierności pasma należy stłumić, więc przechodzimy do Efekty >> Korekcja graficzna, zaznaczamy pole Korektor graficzny i spłaszczamy wykres poprzez wciśnięcie Flatten.
Zaczynamy operować suwakami z przedziału 100 – 500Hz, podnosząc je pojedynczo o 6 – 12dB i wsłuchując się, przy których z nich pojawi się wyraźne wzmocnienie dźwięku (rezonans). Gdy już ustalimy częstotliwości, spokojnie obniżamy wybrane suwaczki o 3 – 12dB, sprawdzając w której konfiguracji głos zabrzmi najprzyjemniej. Dla polepszenia prezencji podciągamy jeszcze zakres wysokich rejestrów utracony podczas odszumiania. Przykładowa korekcja widnieje na rysunku poniżej. Dajemy OK.
Przed:
Po:
Etap 3 – kompresja dynamiki
Mamy już nagranie odszumione, po korekcji. Teraz sprawimy, aby mowa była bardziej zrozumiała, zwłaszcza podczas odtwarzania w samochodzie czy słuchawkach na ulicy pośród zgiełku, za co na pewno będą nam wdzięczni słuchacze. Do tego m.inn. służy kompresja dynamiki, którą znajdziemy w Efekty >> Kompresor. Oczywiście wszystko z umiarem. Najpierw klonujemy ślad, a potem eksperymentujemy na kopii. W tym przypadku wystarczyło ustawienie Ratio na poziomie 2:1, Próg (Threshold) na -18dB. Niestety wzrósł trochę poziom szumu.
Przed:
Po:
Etap 4 – normalizacja
Jest to już ostatni etap poprawy brzmienia nagrania. Po zaznaczeniu zduplikowanego regionu z menu wybieramy Efekty >> Normalizuj. Domyślne wartości będą bardzo dobre – nastąpi wzmocnienie nagrania do wartości -0,1dB oraz usunięcie składowej stałej (spójrz jeszcze raz na obrazek w nagłówku tego artykułu; szary przebieg to dżwięk ze składową, pomarańczowy już bez).
Przed:
Po:
W ten sposób dobrnęliśmy do końca całej obróbki audio. W czterech nieskomplikowanych krokach uzyskaliśmy dobrze brzmiące, zrozumiałe, prawie pozbawione szumów nagranie, które może zostać użyte jako podkład w filmie czy screencaście (do podcastu też się nada). Podsumowując, działania które podjęliśmy to:
- redukcja szumów
- korekcja graficzna
- kompresja dynamiki
- normalizacja audio
Poniżej możesz ocenić jaka przepaść dzieli nagranie po obróbce od nagrania pierwotnego.
Surowe nagranie:
Nagranie po obróbce:
Dwa słowa do…
Dlaczego tak męczę z tym duplikowaniem/klonowaniem śladów? Chodzi o to, aby mieć stały podgląd co udało nam się zdziałać do tej pory. Mimo iż zwiększa to rozmiar sesji to jednak korzyść płynąca z możliwości monitorowania całości obróbki jest nie do przecenienia. Na koniec zawsze można usunąć zbędne ścieżki.
Pamiętaj o częstym zapisywaniu sesji – nic tak nie boli jak utrata efektów, niekiedy wielogodzinnej, pracy.
A może macie jeszcze jakieś inne techniki poprawy brzmienia?
Twoje wskazówki okazały się niezbędne. Dzięki wielkie. Pomysłów póki co nie mam.
Czy ktoś potrafi odczytac czrny tekst na czarnym tle?
Ctrl+A? 😉 A tak na serio to jakiej wersji przeglądarki używasz? W najnowszych wersjach Firefoxa, Opery i Chrome wyświetla się poprawnie. Postaram się naprawić tę wadę jeśli będę miał więcej informacji.
U mnie wyswietla sie poprawnie 🙂 Firefox 8.01
Bedac szczerym to mocno przegiales z odszumianiem. Material brzmi mocno „cyfrowo” – co swiadczy o fakcie zbyt mocnego wplywu filtracji szumow.
Dzięki za szczerość 🙂 Może faktycznie przesadziłem. Rzeczywiście materiał brzmi silnie cyfrowo i niestety tak będzie praktycznie zawsze przy tak znacznym odszumieniu. Nagranie było wykonane mikrofonem komputerowym i w niekorzystnych warunkach stąd nie chciałem „puszczać” szumu powyżej akceptowalnego dla mnie poziomu zwłaszcza tuż przed/po mówionych frazach. Oczywiście każdy może dopasować parametry odszumiania pod siebie tak żeby być zadowolonym z efektu. Wystarczy poeksperymentować. Po to jest ten poradnik 🙂
Wlasciwie roznica jest znikoma. Mam wrazenie ze metoda „odszumiania” zostala niewlasciwie zastosowana stad taki marny efekt. Ponad to material utracil na wysokich. Jest bardziej gluchy.
Odszumianie ma niestety wpływ na utratę informacji w zakresie wysokich rejestrów co warto w pewnym stopniu skompensować później ustawieniami korektora. O wiele istotniejszą sprawą odpowiedzialną za „głuche” brzmienie jest praktycznie całkowite wycięcie pogłosu pomieszczenia pomiędzy frazami gdzie szczególnie dokuczliwie słyszalny jest też szum. Oczywiście można otoczenie dodać sztucznie ale nie taki cel przyświeca nagraniom lektorskim, które powinny być możliwie płaskie i rzeczowe.
Olbrzymi wplyw na jakosc ma samo oprogramowanie, korzystajac z cooledit czy adobe audition mozna uzyskac o wiele lepsze efekty – mam wrazenie, ze odszumianie fft jest tam o wiele lepiej zaimplementowane
Akurat jeśli się nie mylę to Adobe Audition jest kontynuacją Cool Edit Pro. Możemy wymienić jeszcze Gold Wave czy Pro Tools + różnej maści wtyczki VST co nie zmienia niestety faktu, że te świetne narzędzia są w większości płatne, a Audacity jest za darmo, dość intensywnie rozwijane i właśnie dlatego warto się nim zainteresować.
Witam ! Jaka to wersja Audacity ? ważne !
Wersja 1.3.12-beta
dobre
fajny, ale ciekawe, że nigdzie nie mogę dotrzeć do poradnika, który umożliwiłby mi wyodrębnić sam dźwięk syreny policyjnej z tego nagrania https://www.youtube.com/watch?v=1Az7Y067wkY. Próbuję odszumić w celu uzyskania choć 3 sekund czystej syreny i jest to niewykonalne bo w całym nagraniu słyszę cichy trzask, ale nie mogę go wyodrębnić :/
Zaproponowałbym Ci inne rozwiązanie – poszukaj próbki dżwięku na freesound.org. Jest tam sporo dźwięków syren bardzo dobrej jakości. Może coś Ci podpasuje 🙂
Dzięki, za poradnik. Dobra robota.
Cieszę się, że się przydaje 🙂
Hmm właśnie robię odszumianie koszmarnie starego nagrania z kasety,
doszły mi dźwięki jakby bulgocącego echa słów.. jest to prelekcja nie muzyka, biały szum łatwo było ograniczyć… było coś o echu… popróbuje więcej dróg. skąd masz pełne polskie tłumaczenie, która to wersja programu i taka czarną skórę ? najbardziej annoing jest UI… czy projektanci programu nigdy nie używali komputerów z graficznym interfejsem przedtem?
Która to była wersja programu i tłumaczenia już niestety nie pamiętam, ponieważ ten poradnik odszumiania pisałem niemal 6 lat temu. Polska lokalizacja trochę kulała, ale dało się Audacity używać, niemniej interfejs bywa frustrujący po dziś dzień 😉
Może mi ktoś pomóc jak wyciszyć dźwięki otoczenia jest to nagranie rozmowy podczas jazdy samochodem rozmowę bardzo słabo słychać trzaski i włączone radio itd. Proszę o pomoc.