piątek, 6 marca 2020

Automatyczni tłumacze

Widziałem ostatnio prześmiewczy obrazek na mistrzowie.org:

Jak widać na nim, alternatywny dla Google'a translator DeepL wykłada się na nawet tak prostej rzeczy. Stwierdziłem jednak, że to nie może być do końca prawda i postanowiłem sprawdzić w ogóle sprawność współczesnych algorytmów tłumaczących.

W pierwszym teście kazałem sprawdzić słowo "cześć" translatorowi DeepL. I rzeczywiście dostałem taki wynik, jak na obrazku powyżej. Czyżby jednak klapa? Nie do końca, ale krótkie sprawdzanie doprowadziło mnie do następującego wniosku: DeepL jest bardzo czuły na poszczególne znaki. Wystarczyło zamiast "cześć" wpisać "Cześć" i od razu pokazał się oczekiwany wynik "Hello" z wymienionymi niżej alternatywami: honour, honor, praise, worship - czyli dobrze. Prawdopodobnie winniśmy my sami, Polacy, którym nie chce się wpisywać polskich znaków i nagminnie piszemy na forach czy w komentarzach "czesc", co pokrywa się z tak samo wpisywanym słowem oznaczającym "część" (czyli owo "part"). DeepL uczy się na tekstach znalezionych w sieci, samodzielnie i stąd "wie", że "czesc" może oznaczać "część".

Recenzja mikrofonu

No dobrze, to była ciekawostka, ale jak sobie radzą translatory z dłuższymi tekstami? Do zawodów stanęły DeepL, Yandex oraz Google, bo chociaż sprawdzałem też translator Bing od firmy Microsoft, to wypadł on tak słabo, że zdecydowałem się go pominąć. Z bardziej znanych PONS daje praktycznie takie same wyniki jak DeepL, zaś PROMT.One nie oferuje tłumaczenia na język polski. Na pierwszy ogień wziąłem początek tekstu recenzji mikrofonu WarmAudio WA87 ze strony SoundOnSound.

Tekst oryginalny: Warm Audio’s new mic is claimed to offer the sound of an original Neumann U87 at a fraction of the price. Does it succeed?
Demand for items of classic studio hardware is high and supplies are low, meaning that the originals are out of reach to many home and project-studio owners. This situation has created a niche for companies like Warm Audio and Golden Age, who use low-cost Far Eastern manufacturing to bring replicas of this gear to market at much more affordable prices. Thus far, Warm Audio have focused mainly on studio outboard, but the WA‑87 is their first foray into the world of microphones.

DeepL: Nowy mikrofon Warm Audio ma oferować dźwięk oryginalnego Neumanna U87 za ułamek ceny. Czy to się uda?
Zapotrzebowanie na klasyczny sprzęt studyjny jest wysokie, a zapasy niskie, co oznacza, że oryginały są poza zasięgiem wielu właścicieli domów i projektów studyjnych. Ta sytuacja stworzyła niszę dla takich firm jak Warm Audio i Golden Age, które wykorzystują tanią dalekowschodnią produkcję, aby wprowadzić na rynek repliki tego sprzętu po znacznie bardziej przystępnych cenach. Do tej pory Warm Audio koncentrowało się głównie na studyjnym outboardzie, ale WA-87 to ich pierwszy wjazd w świat mikrofonów.

Yandex: Twierdzi się, że nowy mikrofon Warm Audio oferuje dźwięk oryginalnego Neumanna U87 za ułamek ceny. Czy to działa?
dla wielu właścicieli domów i studiów projektowych. Ta sytuacja stworzyła niszę dla firm takich jak Warm Audio i Golden Age, które wykorzystują tanią produkcję dalekowschodnią, aby wprowadzić kopie tego sprzętu na rynek po znacznie bardziej przystępnych cenach. Do tej pory Warm Audio skupiały się głównie na studiach outboard, ale WA‑87 to ich pierwsza wyprawa do świata mikrofonów.

Google:Nowy mikrofon Warm Audio ma brzmieć oryginalnego Neumanna U87 za ułamek ceny. Czy to się udaje
Zapotrzebowanie na elementy klasycznego sprzętu studyjnego jest wysokie, a zapasy niskie, co oznacza, że oryginały są poza zasięgiem wielu właścicieli domów i studiów projektowych. Ta sytuacja stworzyła niszę dla firm takich jak Warm Audio i Golden Age, które używają taniej produkcji Dalekiego Wschodu, aby wprowadzić repliki tego sprzętu na rynek w znacznie bardziej przystępnych cenach. Do tej pory Warm Audio koncentrowało się głównie na zewnętrznych silnikach studyjnych, ale WA ‑ 87 to ich pierwsza wyprawa w świat mikrofonów.

Tłumaczenie moje: Nowy mikrofon Warm Audio ma oferować dźwięk oryginalnego Neumanna U87 za ułamek jego ceny. Czy to się może udać?
Zapotrzebowanie na klasyczny sprzęt studyjny jest wysokie, jednak zapasy tegoż sprzętu - niskie, co oznacza, że oryginalne urządzenia są poza zasięgiem finansowym właścicieli domowych i projektowych studiów. Sytuacja ta wytworzyła niszę dla firm takich jak Warm Audio czy Golden Age, które wykorzystując tanią produkcję dalekowschodnią, wprowadzają na rynek repliki w znacznie przystępniejszych cenach. Jak dotąd Warm Audio koncentrowało się na studyjnym osprzęcie, ale WA-87 jest ich pierwszą wyprawą w świat mikrofonów.

Widać wyraźnie, że choć tekst tłumaczeń jest raczej zrozumiały, to jednak roi się od dziwnych sformułowań w rodzaju: "na studyjnym outboardzie" czy "ma brzmieć oryginalnego Neumanna U87". Moim zdaniem żadne z tłumaczeń nie jest wyraźnie lepsze - np. DeepL zgrabniej przełożył "dalekowschodnią produkcję", ale za to Google poradziło sobie lepiej z "to ich pierwsza wyprawa", aczkolwiek najbardziej spodobała mi się wersja od Yandex. Nawet moje kulawe tłumaczenie nie wygląda źle na tym tle. Niemniej dla kogoś zupełnie nie znającego angielskiego oba tłumaczenia spełnią swoją rolę i pozwolą się choćby domyślić, o co chodziło w tekście.

Literatura piękna

Czy translatory pozwalają zapoznać się w miarę bezboleśnie z literaturą piękną w obcym języku? Tu miałem już od początku spore wątpliwości i rzeczywiście, złożone zdania i nie do końca ścisłe sformułowania poskutkowały dość trudnym do czytania językiem. Za przykład posłużył mi fragment "Pięciorga dzieci i czegoś" Edith Nesbit:

Oryginał: The children had explored the gardens and the outhouses thoroughly before they were caught and cleaned for tea, and they saw quite well that they were certain to be happy at the White House. They thought so from the first moment, but when they found the back of the house covered with jasmine, an in white flower, and smelling like a bottle of the most expensive scent that is ever given for a birthday present; and when they had seen the lawn, all green and smooth, and quite different from the brown grass in the gardens at Camden Town; and when they had found the stable with a loft over it and some old hay still left, they were almost certain; and when Robert had found the broken swing and tumbled out of it and got a lump on his head the size of an egg, and Cyril had nipped his finger in the door of a hutch that seemed made to keep rabbits in, if you ever had any, they had no longer any doubts whatever.

DeepL: Dzieci dokładnie zwiedziły ogrody i oficyny, zanim zostały złapane i posprzątane na herbatę, i całkiem dobrze widziały, że na pewno będą szczęśliwe w Białym Domu. Myślały tak od pierwszej chwili, ale kiedy znalazły tył domu pokryty jaśminem, białym kwiatem i pachnący jak butelka najdroższego zapachu, jaki kiedykolwiek dostały w prezencie urodzinowym, i kiedy zobaczyły trawnik, cały zielony i gładki, i zupełnie inny niż brązowa trawa w ogrodach w Camden Town; a gdy znaleźli stajnię z poddaszem nad nią i jeszcze trochę starego siana, byli prawie pewni; a gdy Robert znalazł złamaną huśtawkę i wywrócił się z niej i dostał na głowie grudę wielkości jajka, a Cyryl zerwał mu palec w drzwiach chaty, która wydawała się być stworzona, by trzymać w niej króliki, jeśli kiedykolwiek je miał, nie mieli już żadnych wątpliwości.

Yandex: Dzieci dokładnie badały ogrody i oficyny, zanim zostały złapane i umyte na herbatę, i doskonale zdawały sobie sprawę, że w Białym Domu na pewno będzie im dobrze. Myśleli tak od samego początku, ale kiedy zobaczyli tył domu pokryty jaśminem, białym kwiatem i pachniał jak fiolka najdroższego zapachu, jaki kiedykolwiek dali na urodziny; a kiedy zobaczyli trawnik, cały zielony i gładki, zupełnie inny niż brązowa trawa w ogrodach Camden Town, od razu zrozumieli, że tak nie jest.; a kiedy znaleźli stajnię ze strychem, gdzie pozostało jeszcze trochę starego siana, byli prawie pewni; a kiedy Robert znalazł złamaną huśtawkę i wypadł z nich, i dostał guza na głowie wielkości jajka, a Cyril ugryzł go palcem w drzwiach klatki, które wydawały się być zrobione, by trzymać króliki, jeśli kiedykolwiek je miałeś, nie mieli już żadnych wątpliwości.

Google: Dzieci dokładnie zbadały ogrody i wychodki, zanim zostały przyłapane i posprzątane na herbatę, i całkiem dobrze zobaczyły, że z pewnością będą szczęśliwe w Białym Domu. Myśleli tak od pierwszej chwili, ale kiedy znaleźli tylną część domu pokrytą jaśminem, białym kwiatem i pachnącej butelką najdroższego zapachu, jaki kiedykolwiek był prezentowany na prezent urodzinowy; a kiedy zobaczyli trawnik, zielony i gładki, zupełnie inny niż brązowa trawa w ogrodach Camden Town; a kiedy znaleźli stajnię z poddaszem i wciąż zostało trochę starego siana, byli prawie pewni; a kiedy Robert znalazł złamaną huśtawkę, wypadł z niej i dostał guzek wielkości jaja, a Cyryl wcisnął palec w drzwi budy, która zdawała się utrzymywać króliki, jeśli kiedykolwiek miałeś nie mieli już żadnych wątpliwości.

Dla porównania przeczytajcie tłumaczenie Ireny Tuwim do polskiego wydania. Translatory muszą się naprawdę jeszcze wiele, wiele nauczyć, choć wcale nie jestem przekonany, że kiedyś osiągną choćby porównywalny poziom (przynajmniej dla języka polskiego).

Irena Tuwim: Zanim udało się schwycić całą piątkę i skłonić ją do umycia się przed podwieczorkiem, dzieci zbadały dokładnie ogród i sad, i wszystko naokoło i wiedziały już z całą pewnością, że w Białym Domku będzie im bardzo dobrze. Pomyślały to sobie już od pierwszej chwili. Ale gdy zobaczyły, że z tyłu za domem rośnie mnóstwo jaśminu, pokrytego całą masą białych kwiatów pachnących jak flakon najdroższych perfum, które się dostaje na urodziny; kiedy obejrzały trawnik zielony i gładki, zupełnie inny niż pożółkła trawa w ogródkach londyńskich; kiedy się przekonały, że za domem jest stajnia ze stryszkiem, gdzie było jeszcze trochę zeszłorocznego siana - były już prawie pewne, że niczego im nie zabraknie do szczęścia. A kiedy Robert znalazł połamaną huśtawkę i zleciał z niej, i nabił sobie na czole guza wielkości jajka, a Cyryl przygniótł palec w drzwiczkach jakiegoś kojca, który był jakby stworzony dla królików - rozwiały się resztki wszelkich wątpliwości, że będzie tu świetnie.

Konkluzja

Jaki wniosek można wyciągnąć po takim zgrubnym teście? Otóż nie jest źle, jeśli chodzi o rozumienie automatycznego przekładu, więc wszędzie, gdzie chodzi głównie o zorientowanie się w treści, automatyczne translatory dają sobie jako tako radę. Jeśli jednak chcielibyśmy przeczytać tekst z przyjemnością, bez zastanawiania się w co drugim zdaniu, jak ono POWINNO wyglądać, to nic - póki co - nie zastąpi kompetentnego tłumacza.

0 komentarze:

Prześlij komentarz