Audacity – odszumianie ścieżek i nie tylko

..:: 2011|08|30 ::..

Czasami zdarza się, że nie dysponując profesjonalnym sprzętem czy warunkami pragniemy stworzyć dobrze brzmiący podkład tekstowy do filmu instruktażowego. Okazuje się, że nawet w najtrudniejszych warunkach przy odrobinie samozaparcia taki cel jest możliwy do zrealizowania, co więcej jakość nagrania po obróbce nie będzie odstawać zbytnio od tej uzyskanej w studio. Z pomocą przychodzi program Audacity.

Audacity jest darmowym, wieloplatformowym oprogramowaniem do nagrywania i edycji dźwięku. Więcej możesz dowiedzieć się na stronie projektu. Tutaj skupimy się na uzyskaniu co najmniej zadowalającej jakości zarejestrowanego materiału audio. Znęcać będziemy się nad fragmentem bezpłatnego kursu „Specyfika świec japońskich” autorstwa Michała Bednarza z portalu https://swiecejaponskie.com.pl/.

Nagranie wejściowe:

Etap 1 – redukcja szumów

Po zaimportowaniu pliku audio do programu Audacity dokonujemy sklonowania ścieżki poprzez zaznaczenie jej i wciśnięcie Ctrl + D lub poprzez wybór z menu Edytuj >> Duplikuj. Ścieżkę z zaimportowanym plikiem wyciszamy, natomiast na duplikacie zaznaczamy kilkusekundowy fragment, w którym słyszalne jest jedynie tło nagrania.

W następnym kroku uruchamiamy Efekty >> Odszumianie i klikamy Pobierz próbkę szumu. Okno znika, a my możemy zaznaczyć obrabiany ślad (cały czas pracujemy na duplikacie) i ponownie uruchomić mechanizm odszumiania.

Wraz z pojawieniem się okna zaczyna się cała zabawa – należy tak dobrać położenia trzech suwaków, aby przy odsłuchu poprzez Podgląd, głos był wyraźny i możliwie bez zniekształceń. Eksperymenty z wartością redukcji szumów można śmiało zacząć od 12dB, pamiętając jednak, aby nie przesadzić. Wyższe wartości tego parametru skutkują stłumieniem wyższych rejestrów. Odwrotnie sytuacja ma się z wygładzaniem częstotliwości – tutaj niższe liczby owocują „ćwierkaniem” w głośnikach. Czas reakcji również dobieramy eksperymentalnie, skupiając się w niższym zakresie położeń suwaka.

Przed:

Po:

Etap 2 – korekcja graficzna

Teraz skoncentrujemy się na wydobyciu z nagrania przyjemniejszego brzmienia. Po odszumieniu okazało się, że głos jest nieco dudniący, jakby zapuszkowany. Ograniczeniu uległy też najwyższe częstotliwości przez co dźwięk jest nienaturalnie ciepły. Ponownie wykonujemy duplikację ścieżki, poprzednią wyciszamy, natomiast zaznaczamy obecną.

Dudniący dźwięk świadczy o powstawaniu rezonansów w górnym zakresie niskich i dolnym średnich częstotliwości. Podejścia przy ich wykrywaniu mamy w zasadzie dwa (oczywiście można je stosować równolegle): albo przemiatamy korektorem/filtrem wywyższe zakresy szukając nieprawidłowości, albo od razu robimy analizę spektralną całego regionu. Żeby było prościej zaczniemy od FFT. Wybieramy Analiza >> Wykres spektrum. Wyskakuje okienko z prążkami widma ale to jeszcze nie to co chcieliśmy. Maksymalizujemy je i zmieniamy ustawienia: Rozmiar – 16384, Skala logarytmiczna otrzymując widok podobny do tego na obrazku poniżej.

Zaznaczają się tu trzy szczyty o częstotliwościach: 123Hz, 231Hz i 400Hz. Dokładne wartości wyświetlane są poniżej wykresu, po najechaniu nań kursorem. Te nierównomierności pasma należy stłumić, więc przechodzimy do Efekty >> Korekcja graficzna, zaznaczamy pole Korektor graficzny i spłaszczamy wykres poprzez wciśnięcie Flatten.

Zaczynamy operować suwakami z przedziału 100 – 500Hz, podnosząc je pojedynczo o 6 – 12dB i wsłuchując się, przy których z nich pojawi się wyraźne wzmocnienie dźwięku (rezonans). Gdy już ustalimy częstotliwości, spokojnie obniżamy wybrane suwaczki o 3 – 12dB, sprawdzając w której konfiguracji głos zabrzmi najprzyjemniej. Dla polepszenia prezencji podciągamy jeszcze zakres wysokich rejestrów utracony podczas odszumiania. Przykładowa korekcja widnieje na rysunku poniżej. Dajemy OK.

Ciekawostka

Podbijanie wybranych pasm przed kompresją dynamiki nie jest zalecane ponieważ może ją znacznie utrudniać lub wręcz uniemożliwić (mając na względzie brzmienie nagrania). Najczęściej warto korekcję rozbić na dwa etapy: tłumienie przed kompresją i wzmacnianie po. W tym przypadku zdecydowano inaczej przede wszystkim dlatego, że wzmacniamy wyższe częstotliwości, które nie niosą tak wielkiej energii jak niższe rejestry. Ponadto dokonując całościowej korekcji na tym etapie oszczędzamy czas.

Przed:

Po:

Etap 3 – kompresja dynamiki

Mamy już nagranie odszumione, po korekcji. Teraz sprawimy, aby mowa była bardziej zrozumiała, zwłaszcza podczas odtwarzania w samochodzie czy słuchawkach na ulicy pośród zgiełku, za co na pewno będą nam wdzięczni słuchacze. Do tego m.inn. służy kompresja dynamiki, którą znajdziemy w Efekty >> Kompresor. Oczywiście wszystko z umiarem. Najpierw klonujemy ślad, a potem eksperymentujemy na kopii. W tym przypadku wystarczyło ustawienie Ratio na poziomie 2:1, Próg (Threshold) na -18dB. Niestety wzrósł trochę poziom szumu.

Przed:

Po:

Etap 4 – normalizacja

Jest to już ostatni etap poprawy brzmienia nagrania. Po zaznaczeniu zduplikowanego regionu z menu wybieramy Efekty >> Normalizuj. Domyślne wartości będą bardzo dobre – nastąpi wzmocnienie nagrania do wartości -0,1dB oraz usunięcie składowej stałej (spójrz jeszcze raz na obrazek w nagłówku tego artykułu; szary przebieg to dżwięk ze składową, pomarańczowy już bez).

Przed:

Po:

W ten sposób dobrnęliśmy do końca całej obróbki audio. W czterech nieskomplikowanych krokach uzyskaliśmy dobrze brzmiące, zrozumiałe, prawie pozbawione szumów nagranie, które może zostać użyte jako podkład w filmie czy screencaście (do podcastu też się nada). Podsumowując, działania które podjęliśmy to:

redukcja szumów
korekcja graficzna
kompresja dynamiki
normalizacja audio

Poniżej możesz ocenić jaka przepaść dzieli nagranie po obróbce od nagrania pierwotnego.

Surowe nagranie:

Nagranie po obróbce:

Ważne

Opisane powyżej kroki prawdopodobnie w żaden sposób nie pomogą jeśli nagranie prowadzone było w koszmarnych warunkach, np. nagrywaliśmy na telefon komórkowy położony na wirującej pralce stojącej w pustej łazience wyłożonej kafelkami. Nie ma się co oszukiwać – akustyka pomieszczenia i sprzęt odgrywają znaczącą rolę. Jeśli chcemy robić bardzo profesjonalne nagrania musimy zainwestować w dobry mikrofon wraz z akcesoriami a niekiedy adaptację akustyczną otoczenia. Przede wszystkim jednak warto popracować nad emisją głosu.

Dwa słowa do…

Dlaczego tak męczę z tym duplikowaniem/klonowaniem śladów? Chodzi o to, aby mieć stały podgląd co udało nam się zdziałać do tej pory. Mimo iż zwiększa to rozmiar sesji to jednak korzyść płynąca z możliwości monitorowania całości obróbki jest nie do przecenienia. Na koniec zawsze można usunąć zbędne ścieżki.

Pamiętaj o częstym zapisywaniu sesji – nic tak nie boli jak utrata efektów, niekiedy wielogodzinnej, pracy.

A może macie jeszcze jakieś inne techniki poprawy brzmienia?

Ważne

Nie zajmuję się komercyjnym „odszumianiem” nagrań. Jeśli ten poradnik Ci nie pomógł, wątpię, abym mógł z nagraniem zdziałać coś więcej. W Internecie znajdziesz całkiem sporo firm, które trudnią się poprawą jakości nagrań. Zamiast pisać maila – poszukaj.

20 odpowiedzi na: „Audacity – odszumianie ścieżek i nie tylko”

Michał pisze:

30 sierpnia 2011 o 16:50

Twoje wskazówki okazały się niezbędne. Dzięki wielkie. Pomysłów póki co nie mam.
dureń pisze:

22 grudnia 2011 o 10:59

Czy ktoś potrafi odczytac czrny tekst na czarnym tle?
- Vibender pisze:
  
  22 grudnia 2011 o 11:18
  
  Ctrl+A? 😉 A tak na serio to jakiej wersji przeglądarki używasz? W najnowszych wersjach Firefoxa, Opery i Chrome wyświetla się poprawnie. Postaram się naprawić tę wadę jeśli będę miał więcej informacji.
Wiesiek pisze:

22 grudnia 2011 o 11:41

U mnie wyswietla sie poprawnie 🙂 Firefox 8.01
Anonim pisze:

22 grudnia 2011 o 13:26

Bedac szczerym to mocno przegiales z odszumianiem. Material brzmi mocno „cyfrowo” – co swiadczy o fakcie zbyt mocnego wplywu filtracji szumow.
- Vibender pisze:
  
  22 grudnia 2011 o 13:50
  
  Dzięki za szczerość 🙂 Może faktycznie przesadziłem. Rzeczywiście materiał brzmi silnie cyfrowo i niestety tak będzie praktycznie zawsze przy tak znacznym odszumieniu. Nagranie było wykonane mikrofonem komputerowym i w niekorzystnych warunkach stąd nie chciałem „puszczać” szumu powyżej akceptowalnego dla mnie poziomu zwłaszcza tuż przed/po mówionych frazach. Oczywiście każdy może dopasować parametry odszumiania pod siebie tak żeby być zadowolonym z efektu. Wystarczy poeksperymentować. Po to jest ten poradnik 🙂
Mikey pisze:

22 grudnia 2011 o 15:48

Wlasciwie roznica jest znikoma. Mam wrazenie ze metoda „odszumiania” zostala niewlasciwie zastosowana stad taki marny efekt. Ponad to material utracil na wysokich. Jest bardziej gluchy.
- Vibender pisze:
  
  22 grudnia 2011 o 17:25
  
  Odszumianie ma niestety wpływ na utratę informacji w zakresie wysokich rejestrów co warto w pewnym stopniu skompensować później ustawieniami korektora. O wiele istotniejszą sprawą odpowiedzialną za „głuche” brzmienie jest praktycznie całkowite wycięcie pogłosu pomieszczenia pomiędzy frazami gdzie szczególnie dokuczliwie słyszalny jest też szum. Oczywiście można otoczenie dodać sztucznie ale nie taki cel przyświeca nagraniom lektorskim, które powinny być możliwie płaskie i rzeczowe.
Anonim pisze:

30 grudnia 2011 o 12:00

Olbrzymi wplyw na jakosc ma samo oprogramowanie, korzystajac z cooledit czy adobe audition mozna uzyskac o wiele lepsze efekty – mam wrazenie, ze odszumianie fft jest tam o wiele lepiej zaimplementowane
- Vibender pisze:
  
  2 stycznia 2012 o 14:13
  
  Akurat jeśli się nie mylę to Adobe Audition jest kontynuacją Cool Edit Pro. Możemy wymienić jeszcze Gold Wave czy Pro Tools + różnej maści wtyczki VST co nie zmienia niestety faktu, że te świetne narzędzia są w większości płatne, a Audacity jest za darmo, dość intensywnie rozwijane i właśnie dlatego warto się nim zainteresować.
PRzemkoza pisze:

20 stycznia 2012 o 18:03

Witam ! Jaka to wersja Audacity ? ważne !
- Vibender pisze:
  
  22 stycznia 2012 o 23:39
  
  Wersja 1.3.12-beta
ka pisze:

27 kwietnia 2013 o 22:13

dobre
Junior pisze:

7 sierpnia 2013 o 01:55

fajny, ale ciekawe, że nigdzie nie mogę dotrzeć do poradnika, który umożliwiłby mi wyodrębnić sam dźwięk syreny policyjnej z tego nagrania https://www.youtube.com/watch?v=1Az7Y067wkY. Próbuję odszumić w celu uzyskania choć 3 sekund czystej syreny i jest to niewykonalne bo w całym nagraniu słyszę cichy trzask, ale nie mogę go wyodrębnić :/
- Vibender pisze:
  
  7 sierpnia 2013 o 11:09
  
  Zaproponowałbym Ci inne rozwiązanie – poszukaj próbki dżwięku na freesound.org. Jest tam sporo dźwięków syren bardzo dobrej jakości. Może coś Ci podpasuje 🙂
Wojciech pisze:

27 marca 2017 o 16:36

Dzięki, za poradnik. Dobra robota.
- Vibender pisze:
  
  11 lipca 2017 o 13:31
  
  Cieszę się, że się przydaje 🙂
MrT pisze:

19 czerwca 2017 o 11:51

Hmm właśnie robię odszumianie koszmarnie starego nagrania z kasety,
doszły mi dźwięki jakby bulgocącego echa słów.. jest to prelekcja nie muzyka, biały szum łatwo było ograniczyć… było coś o echu… popróbuje więcej dróg. skąd masz pełne polskie tłumaczenie, która to wersja programu i taka czarną skórę ? najbardziej annoing jest UI… czy projektanci programu nigdy nie używali komputerów z graficznym interfejsem przedtem?
- Vibender pisze:
  
  11 lipca 2017 o 13:30
  
  Która to była wersja programu i tłumaczenia już niestety nie pamiętam, ponieważ ten poradnik odszumiania pisałem niemal 6 lat temu. Polska lokalizacja trochę kulała, ale dało się Audacity używać, niemniej interfejs bywa frustrujący po dziś dzień 😉
MC pisze:

18 lipca 2017 o 10:28

Może mi ktoś pomóc jak wyciszyć dźwięki otoczenia jest to nagranie rozmowy podczas jazdy samochodem rozmowę bardzo słabo słychać trzaski i włączone radio itd. Proszę o pomoc.

VIBENDER

ponad muzykę

Audacity – odszumianie ścieżek i nie tylko

Etap 1 – redukcja szumów

Etap 2 – korekcja graficzna

Etap 3 – kompresja dynamiki

Etap 4 – normalizacja

Dwa słowa do…

20 odpowiedzi na: „Audacity – odszumianie ścieżek i nie tylko”