Tłumaczenia maszynowe przyspieszają przekład treści z jednego języka na drugi. Potencjał tej technologii wzrasta z dekady na dekadę. Początkowo algorytmy stosowano do tłumaczeń prostych formularzy, obecnie – dzięki sztucznej inteligencji – pomagają w translacji tekstów biznesowych, prawnych i naukowych. Co przyniesie przyszłość? Przeczytaj!

Tłumaczenie maszynowe

Czym jest tłumaczenie maszynowe?

Tłumaczenie maszynowe (ang. Machine Translation) polega na automatycznym przekształcaniu tekstu z języka źródłowego na docelowy za pomocą algorytmów komputerowych. Technologia umożliwia szybkie tłumaczenie dużych ilości tekstu bez udziału profesjonalnego tłumacza (lub z jego niewielką asystą).

To właśnie szybkość i moce przerobowe są głównymi zaletami, które przyczyniają się do rosnącej popularności tłumaczeń maszynowych, m.in. w biznesie, medycynie czy prawie.

Krótka historia tłumaczenia maszynowego

Początki

Historia tłumaczeń maszynowych rozpoczęła się w 1933 roku. Wtedy to powstały pierwsze maszyny tłumaczące, które zastosowano w wojsku. Narzędzia wspierały tam głównie analizę informacji wywiadowczych.

W 1954 roku przeprowadzono przełomowy eksperyment GeorgeTown IBM, w którym komputer przetłumaczył 60 zdań z języka rosyjskiego na angielski. Imponujący jak na tamte czasy pokaz udowodnił ogromny potencjał tłumaczeń maszynowych. Z tego powodu w latach 60. skupiono się na doskonaleniu i dalszej optymalizacji procesu. Dzięki temu już w następnej dekadzie wprowadzono na rynek pierwsze oprogramowanie wspierające tłumaczy tzw. CAT (ang. Computer Aided Translation).

Boom lat 90.

Lata 90. XX wieku były okresem intensywnego rozwoju statystycznych metod tłumaczenia maszynowego. Jednak prawdziwym przełomem okazało się wprowadzenie na rynek programów do tłumaczeń maszynowych bazujących na systemach sieci neuronowych (ang. Neural Machine Translation – NMT), które wykorzystują techniki głębokiego uczenia (ang. Deep Lerning) do analizy i generowania przekładów. Wzorem dla tych systemów są rzeczywiste struktury ludzkiego układu nerwowego (biologiczne neurony). Szczególnie ważną cechą tych modelów jest zdolność do uogólniania (generalizacji) wiedzy, którą poszerzają, masowo analizując przykłady.

Niedługo później pojawiły się też pierwsze darmowe usługi tłumaczenia maszynowego. Pionierem w tej dziedzinie była firma Altavista, która w 1995 roku opracowała program Babel Fish, umożliwiający translacje stron internetowych. Kolejnym rewolucyjnym narzędziem było  wprowadzone na rynek w 2006 roku Google Translate. Rozwiązanie pozwala na szybkie i darmowe tłumaczenia (obecnie obsługuje 100 języków) za pomocą przeglądarki.d

Metody tłumaczenia maszynowego

W tłumaczeniach maszynowych stosuje się różne metody:

Tłumaczenie bezpośrednie

Tłumaczenia bezpośrednie polegają na dosłownym przekładzie słów z języka źródłowego na język docelowy. Są najprostszą metodą tłumaczeń maszynowych, jednak brak analizy kontekstu oraz składni, sprawia, że licznie występują tu kalki językowe (np. zadzwonię do Ciebie w wersji angielskiej dziedziczy zbędny przyimek do – I will call to you). Z tego względu metoda sprawdza się raczej w translacji prostych formularzy, aneksów itd. Najlepiej sporządzonych w językach należących do jednej rodziny, np. słowiańskich (z polskiego na czeski) czy germańskich (z angielskiego na niemiecki).

Tłumaczenie składniowe

Tłumaczenia składniowe analizują strukturę zdania. Technologia wyciąga z tekstu źródłowego drzewo składniowe, które przedstawia sieć relacji między występującymi w tekście zdaniami i wypowiedziami niezdaniowymi (oznajmienia i zawiadomienia). Analiza kluczowego elementu gramatyki – składni – sprawia, że tłumaczenia te są mniej mechaniczne, niż tłumaczenia bezpośrednie.

Statystyczne tłumaczenie maszynowe

W tym przypadku maszyna analizuje wcześniej przetłumaczone teksty (dostępne w tzw. pamięci tłumaczeniowej – korpusach równoległych par języków), oblicza najbardziej prawdopodobny wariant przekładu, bazując na statystykach (współwystępowanie wyrazów w konkretnym korpusie). Ten model tłumaczenia maszynowego zaimplementowano np. w rozwiązaniach Deepl oraz Google Translate. Ten drugi produkt korzysta z potężnych zasobów stron internetowych.

Tłumaczenie oparte na przykładach

Tłumaczenie oparte na przykładach działa podobnie jak tłumaczenie statystyczne. Z tym że zamiast słów, algorytm uwzględnia całe zdania. Źródłem materiałów szkoleniowych dla takich narzędzi również są duże zbiory danych tekstowych. Im większe i bardziej zróżnicowane, tym lepsza jakość tłumaczonych treści. W związku z tym przygotowując bazy, stosuje się szerokie spektrum tekstów, w tym: artykuły prasowe, dokumenty biznesowe, beletrystykę i wiele innych. Dzięki temu systemy tłumaczeniowe mogą odczytywać różnorodne konteksty i generować wysokiej jakości przekłady.

Tłumaczenie maszynowe bazujące na sieciach neuronowych (NMT)

W systemach NMT stosuje się sztuczną inteligencję i metodę głębokiego uczenia (ang. Deep Learning). Programy z zaszytą technologią NMT uwzględniają całą, ponadzdaniową strukturę treści (tzw. aktualne rozczłonkowanie zdania). Dzięki temu analizują pełny sens komunikatu (rozpoznają punkt wyjścia i cel wypowiedzi), a nie wyłącznie strukturę zdania. Działają tu modele językowe złożone z kilku połączonych warstw (wejściowej, ukrytej i wyjściowej), które odwzorowują pracę ludzkiego mózgu.

Gdzie sprawdzają się tłumaczenia maszynowe?

E-commerce i handel nowoczesny

W firmach e-commerce tłumaczy się wiele treści. W pełni maszynowo przekłada się m.in.: opisy produktów, kategorii (np. kurtki zimowe), a także krótkie i proste powiadomienia wysyłane do klientów w formie SMS-ów lub e-maili (np. potwierdzenie doręczenia produktu do salonu stacjonarnego). Treści marketingowe, które uwzględniają kontekst kulturowy oraz są pełne wyszukanych, kreatywnych gier słownych (slogany, nazwy produktów, hasła przewodnie marki itd.), wymagają zazwyczaj udziału profesjonalisty.

Medycyna

Tłumaczenia maszynowe są coraz częściej stosowane do przekładu dokumentacji medycznej, m.in. orzeczeń, czy zaświadczeń lekarskich. Usprawniają komunikację między lekarzem a pacjentem oraz pomiędzy członkami międzynarodowych zespołów medycznych. Warto jednak podkreślić, że ze względu na wymagany poziom precyzji, dobrze uzyskać również wsparcie profesjonalnego tłumacza, który potrafi głęboko wejść w tekst źródłowy i przeanalizować materiał, a jeśli trzeba, precyzyjnie omówić z lekarzem złożoną terminologię.

Technika, nauka, prawo

Tłumaczenie maszynowe przydaje się również w przekładzie instrukcji technicznych, tekstów naukowych (np. artykuły) czy prawnych (m.in.: ekspertyzy, patenty, akty notarialne, umowy). W takich przypadkach, podobnie jak w medycynie, warto postawić na kompleksowy pakiet: maszyny +  profesjonalny tłumacz, który doprecyzuje fachową terminologię.

Co ciekawe, w 2015 roku Unia Europejska zapoczątkowała projekt The EU Presidency Translator Project, który usprawnił komunikację  w dziedzinie prawno-administracyjnej między członkami wielojęzycznych społeczności UE. W ramach projektu zaprzęgnięto do pracy modele sieci neuronowych, które obecnie tłumaczą duże ilości dokumentów prawnych w krótkim czasie.

Komunikacja

Tłumaczenia maszynowe sprawdzają się również w komunikacji. Algorytmy technologii implementuje się np. w aplikacjach czatowych i komunikatorach firmowych, żeby umożliwić translację treści rozmów w czasie rzeczywistym. Dzięki temu odbiorca od razu otrzymuje wiadomość w języku, w którym porozumiewa się na co dzień.

Ponieważ cały proces odbywa się ad hoc, to angażuje się tu wyłącznie maszyny. W tym przypadku to wystarczy, bo częściej niż o precyzyjne wyjaśnienie terminu, chodzi o ogólne zrozumienie kontekstu wiadomości. A z tym maszyny radzą sobie coraz lepiej.

Tłumaczenia maszynowe - zalety i wyzwania

Zalety

  • Szybkość – automatyczne tłumaczenia przekładają duże ilości tekstu o wiele krócej, niż ludzie
  • Oszczędność kosztów – tłumaczenie maszynowe może być tańszą alternatywą dla usług profesjonalnego tłumacza, zwłaszcza jeśli celem jest translacja dużej ilości  prostych tekstów.
  • Dostępność – z wielu narzędzi tłumaczeniowych można korzystać za darmo, są więc łatwo dostępne dla szerokiego grona użytkowników.

Wyzwania

  • Brak wrażliwości na środki stylistyczne i wyrazy wieloznaczne – tłumaczenia maszynowe słabiej radzą sobie z przekładem złożonych tekstów o bogatej semantyce i stylistyce, np. pełnych gier słownych. Widać to szczególnie w tłumaczeniach literatury pięknej bogatej w metafory, ironię czy symbole, ale też twórczych tekstach reklamowych, w których gra się np. aliteracją czy innowacją frazeologiczną.
  • Brak rozumienia kontekstu kulturowego – tłumaczenia maszynowe rzadko uwzględniają niuanse kulturowe i różnice obyczajowe zakodowane w języku. Dotyczy to również zaawansowanych modeli językowych opartych na sztucznej inteligencji, które choć odczytują cel wypowiedzi (sieci neuronowe), to nie rozumieją kontekstu kulturowego.
  • Problemy ze specyficzną terminologią – teksty techniczne, naukowe czy prawnicze pełne są fachowej terminologii i zwrotów zrozumiałych wyłącznie dla ekspertów. Oznacza to, że w tych przypadkach efekt tłumaczeń maszynowych może być niewystarczający.

Popularne narzędzia do tłumaczenia maszynowego

Na rynku dostępne są różnorodne narzędzia wspierające tłumaczenia maszynowe, w tym:

  • Google Translate – popularne dzięki prostocie i bezpłatnemu dostępowi, działa w przeglądarce internetowej
  • Deepl – cenione za dokładność i zaawansowaną technologię sieci neuronowych, udostępnione w 2017 roku.
  • Microsoft Translate – dobre dla firm ze względu na integrację z innymi narzędziami Microsoft.

Jak wygląda przyszłość tłumaczeń maszynowych?

Zaawansowane modele NMT mogą generować tłumaczenia zbliżone do ludzkich pod względem jakości. Dostrzegają subtelne różnice składniowe i semantyczne. Co w takim razie z rolą tłumacza? Czy w przyszłości technologia zastąpi ich w pracy?

Niezupełnie.

Wraz z rozwojem tłumaczenia maszynowego wzrasta rola postedycji, czyli korekty treści generowanych przez AI. Ludzie odgrywają w tym procesie kluczową rolę. Wychwytują niuanse językowe, analizują kontekst kulturowy i usuwają pomniejsze błędy interpunkcyjne, składniowe, ortograficzne czy stylistyczne. Dzięki takiemu połączeniu zalet: z jednej strony mocy i szybkości technologii, z drugiej ludzkiego krytycznego podejścia, możliwe jest tworzenie tłumaczeń wysokiej jakości w krótkim czasie.