Specjalista systemów rozpoznawania mowy

Print Drukuj
 
Specjalista systemów rozpoznawania mowy tworzy, wykorzystuje i bada oprogramowanie dla systemów rozpoznawania mowy (automatic speech recognition – ASR), które pozwalają odpowiednio zaprogramowanym komputerom przetwarzać odbierane sygnały dźwiękowe na tekst. Efekty jego pracy mają szerokie zastosowanie: od głosowego sterowania komputerem i urządzeniami zainstalowanymi w pracy, domach, samochodach, po kontrolę dostępu do strzeżonych obiektów.
 

Zadania zawodowe:

 
  • tworzenie i rozwijanie oprogramowania do rozpoznawania mowy z wykorzystaniem języków programowania (np. C++ i Python) i technologii wykorzystywanych w uczeniu maszynowym (np. TensorFlow, Scikit-Learn);
  • ewaluacja oraz udoskonalanie systemów rozpoznawania lub kodowania mowy;
  • kodowanie mowy z wykorzystaniem narzędzi z zakresu rozpoznawania mowy;
  • tworzenie transkrypcji fonetycznych i modeli akustycznych;
  • projektowanie, doskonalenie i wdrażanie nowych algorytmów rozpoznawania mowy;
  • modelowanie prozodii, tj. działania mające na celu nadanie cech brzmieniowych wypowiedzi dla syntetyzowanego sygnału;
  • przetwarzanie tekstu (nagrywanie, dyktowanie, spisywanie);
  • opracowywanie i przeprowadzanie testów skuteczności rozpoznawania lub kodowania mowy,
  • zarządzanie dużymi zbiorami danych głosowych oraz trenowanie systemów uczących się;
  • prezentowanie działania i skuteczności technologii rozpoznawania lub kodowania mowy;
  • opracowywanie i weryfikacja dokumentacji technologicznej systemów rozpoznawania lub kodowania mowy.

Warunki podjęcia pracy w zawodzie:

 
Obecnie w ramach systemu nauczania zawodowego w Polsce nie prowadzi się kształcenia kandydatów do pracy w tym zawodzie, a pracodawcy zatrudniają przede wszystkim osoby posiadające wykształcenie wyższe na kierunkach: informatyka (specjalności: technologie programowania, programowanie aplikacji), elektronika, inżynieria akustyczna, lingwistyka lub pokrewnych. Dodatkowym atutem jest wykształcenie związane z technologiami multimedialnymi oraz muzyczne (akustyczne).
Przydatne jest ukończenie kursów i szkoleń z zakresu technologii mowy. W wielu organizacjach praca wymaga dobrej znajomości języka angielskiego, który zwykle jest niezbędny do sprawnego korzystania z dokumentacji oraz bibliotek językowych wykorzystywanych w codziennej pracy.
Ze względu na ciągłe zmiany w technologiach multimedialnych i komunikacyjnych zawód ten wymaga dokształcania, podnoszenia kwalifikacji poprzez uczestnictwo w konferencjach i spotkaniach branżowych oraz śledzenia zmian w dziedzinie rozpoznawania i przetwarzania mowy.

Wymagania psychofizyczne:

 
  • uzdolnienia techniczne,
  • umiejętność analitycznego myślenia,
  • kreatywne podejście do problemów,
  • otwartość i elastyczność,
  • dociekliwość,
  • sumienność i systematyczność,
  • gotowość do pracy pod presją czasu i w stresie,
  • umiejętność skupienia się na pracy,
  • umiejętność pracy zespołowej,
  • łatwość wypowiadania się w mowie i w piśmie,
  • gotowość do ustawicznego uczenia się i dzielenia się wiedzą.

Przeciwwskazania do wykonywania zawodu:

 
Przeciwwskazaniami do wykonywania zawodu są m.in.: poważne schorzenia wzroku uniemożliwiające zapoznawanie się z dokumentami i pracę przy komputerze, wady słuchu, wady wymowy. Funkcjonowanie w warunkach ciągłego stresu, pod presją czasu, utrudnia pracę osobom z chorobami układu krążenia i układu nerwowego.

Możliwości i szanse zatrudnienia:

 
Specjalista systemów rozpoznawania mowy może być zatrudniony w:
  • firmach i instytucjach usługowych, handlowych, produkcyjnych w zakresie informatyki (zajmujących się m.in. systemami operacyjnymi, oprogramowaniem, grami komputerowymi, materiałami interaktywnymi oraz multimedialnymi),
  • uczelniach,
  • firmach branży telekomunikacyjnej,
  • firmach konsultingowych IT,
  • działach badawczo-rozwojowych związanych z technologią rozpoznawania mowy,
  • mediach elektronicznych (radio, telewizja, internet),
  • studiach nagraniowych,
  • organach państwowych: sądach, instytucjach zarządzania bezpieczeństwem publicznym (policja, wojsko).
Możliwe jest też świadczenie usług w ramach własnej działalności gospodarczej, zwłaszcza w zakresie tworzenia i sprzedaży oprogramowania (narzędzia programistyczne i aplikacje do rozpoznawania mowy).

Szkoły:

Akademia Humanistyczno-Ekonomiczna w Łodzi

kierunek: informatyka, specjalność: technologie programowania (studia I stopnia)
ul. dr. S. Sterlinga 26, 90-212 Łódź
tel. 42 299 55 00
e-mail: rekrutacja@ahe.lodz.pl
https://www.ahe.lodz.pl/
 

Akademia Górniczo-Hutnicza w Krakowie, Wydział Inżynierii Mechanicznej i Robotyki

kierunek: inżynieria akustyczna (studia I i II stopnia)
al. A. Mickiewicza 30, 30-059 Kraków
tel. 12 617 30 50
e-mail: wkr-imir@agh.edu.pl
https://imir.agh.edu.pl/
 

Politechnika Wrocławska, Wydział Elektroniki, Fotoniki i Mikrosystemów

kierunki: inteligentna elektronika, elektronika specjalność: inżynieria akustyczna (studia I stopnia)
ul. Z. Janiszewskiego 11/17, 50-372 Wrocław
tel. 71 320 25 94
e-mail: sekretariat.wefim@pwr.edu.pl
https://wefim.pwr.edu.pl/
 

Uniwersytet im. Adama Mickiewicza w Poznaniu, Wydział Neofilologii

kierunek: lingwistyka stosowana, specjalność: lingwistyka komputerowa (studia I stopnia)
al. Niepodległości 4, 61-874 Poznań
tel. 61 829 35 00
e-mail: BOWneo@amu.edu.pl
https://wn.amu.edu.pl/
 

Dane kontaktowe do urzędu:

 
WOJEWÓDZKI URZĄD PRACY W ŁODZI
Centrum Informacji i Planowania Kariery Zawodowej w Łodzi
Oddział w Piotrkowie Trybunalskim
ul. J. Dąbrowskiego 13, 97-300 Piotrków Trybunalski
tel. 44 649 60 87
e-mail: piotrkow@wup.lodz.pl
 

Ulotka w wersji do wydruku dostępna w załączniku poniżej.

Załączniki

Informacje o publikacji dokumentu