Przejdź do głównej zawartości

Ciekawostki. Jak działa tłumacz automatyczny?


Tłumaczenie automatyczne jest ciekawą sprawą. Problem "pomieszania języków" ma bardzo stare korzenie i mocne reperkusje w sprawach życia codziennego. Chociaż w Biblii geneza różnorodności języków jest przedstawiona całkowicie fałszywie, to opis budowania wieży Babel i konsekwencji tych zdarzeń, w rzeczy samej, dotyka ważnego problemu. Już dawno, dawno temu ludzie napotykali na problemy w porozumiewaniu się na szerszej płaszczyźnie, jeśli nie posługiwali się żadnym językiem obcym. Wymiana myśli pomiędzy grupami ludzi z różnych kultur wzbogaca społeczeństwa. Tłumaczenia zawsze jednak były orzechem twardym do zgryzienia. Nauka języka obcego jest zadaniem na lata - jeśli chcemy poznać go dogłębnie. A przenoszenie niuansów znaczeniowych z jednej kultury do drugiej jest dodatkowym utrudnieniem. Dlatego pomimo ogromnego postępu technologii komputerowych, automatyczne tłumaczenia są jeszcze w stadium próbnym. Za to jest to dziedzina, która bardzo szybko się rozwija. Warto jednak przyjrzeć się nieco bliżej zagadnieniu, żeby wiedzieć co nas czeka w najbliższej przyszłości.


Wiele firm stworzyło własne programy do automatycznych tłumaczeń. Poczesne miejsce wśród nich zajmuje Tłumacz Google - szeroko znany, ceniony i używany w wielu sytuacjach. Jest to bardzo inteligentnie skonstruowany program komputerowy. Podczas tłumaczenia znajduje podobne frazy i zbitki wyrazów w milionach dokumentów tłumaczonych przez ludzi. Bazą dla tych tłumaczeń są na przykład oficjalne dokumenty Organizacji Narodów Zjednoczonych. Porównując tłumaczenia w wielu dokumentach algorytm dopasowuje najlepsze możliwe tłumaczenie w danej sytuacji.




Drugą bardzo ciekawą formą budowania bazy tłumaczonych fraz jest społeczność bezinteresownych tłumaczy. W grudniu 2015 liczba osób wspomagających przekroczyła 50 milionów. Czuję się zaszczycony, że jestem jedną z nich. Mój wkład jest skromny, nie mogę poświęcić zbyt wiele czasu na te działania. Ale traktuję je jako relaks. Sama forma tłumaczeń przypomina grę komputerową, lub quiz. Tłumaczenia są podliczane i przechodzi się na różne poziomy. Jeśli ktoś zna obce języki, to zachęcam do spróbowania.




Bariery językowe to ogromna przeszkoda w rozwoju biedniejszych państw. Problem jest jednak rozpoznany i trwają prace nad jego rozwiązaniem. Google, a w właściwie założyciele firmy, Larry Page i Sergey Brin, za cel postawili udostępnienie całej wiedzy ludzkości - każdemu człowiekowi na Ziemi. Jest to bardzo ambitne zamierzenie, a kroki już poczynione wzbudzają szacunek. Google uczestniczy w projektach mających na celu udostępnienie Internetu we wszystkich zakątkach Ziemi, całkowite zwalczenie analfabetyzmu we wszystkich krajach świata, przekształcenie wszystkich drukowanych książek w formę cyfrową i inne tym podobne.


Jednym z kierunków działań jest dostarczanie darmowych tłumaczeń komputerowych. Tworzonych automatycznie. Jeszcze niedawno to wydawało się po prostu niemożliwe. Teraz jest już wykonalne, chociaż jeszcze niedoskonałe. Trzeba jednak wziąć pod uwagę, że komputer nie rozumie kontekstu. Jest bardziej upośledzony niż ktoś niewidomy.

Na przykład zdanie: Jak wspaniała jest konstrukcja tego zamku. Osoba niewidząca, ale będąca w danym otoczeniu, kontekście od razu będzie wiedziała o jaki zamek chodzi. Czy ten który właśnie zwiedza, czy ten do drzwi, który chce kupić w sklepie. Brak kontekstu jest ogromną przeszkodą w tłumaczeniach. Dlatego ważne jest, aby program komputerowy mógł bazować na dużej ilości przykładów. Spośród nich wybiera te najbardziej odpowiednie - zgodnie z założeniami algorytmu.

Miejmy więc nadzieję, że niedługo doczekamy się możliwości szybkiego, łatwego i przede wszystkim dobrego tłumaczenia. Przydadzą się one w wielu dziedzinach. W rozrywce i nauce. Na stronach tekstowych i w serwisach filmowych takich jak YouTube. Rozwój automatycznych tłumaczeń ułatwi poznawanie innych ludzi z różnych krajów poprzez serwisy społecznościowe. Umożliwi też lepsze podróżowanie. Przykładem mogą być aplikacje na smartfony, które tłumaczą napisy widziane przez kamerę. Tutaj z kolei podstawą jest tzw. OCR (Optical Character Recognition), czyli rozpoznawanie pisma na obrazie. Ale chociaż niezmiernie ciekawa to kwestia, jednak jest to osobne, ogromne zagadnienie - wykraczające poza ramy tego omówienia.


Komentarze

Popularne posty z tego bloga

Ciekawostki. Rzeki Babilonu Boney M 1979 Sopot

Rivers of Babylon  Boney M Większość popularnych piosenek krąży tematycznie wokół miłości. Dlatego słuchając przebojów w oryginalnej wersji czasem trudno skojarzyć, że teksty niektórych mogą być naprawdę zaskakujące. Kiedy przetłumaczyłem mojej znajomej tekst piosenki Leonarda Cohena "Who by fire" i okazało się, że słowa nie są wcale o miłości, tylko o umieraniu, to stwierdziła, że jest rozczarowana. Zauroczona wpadającą w ucho melodią i głosem Cohena, była przekonana, że w piosence są wątki dotyczące uczucia pomiędzy mężczyzną i kobietą. Okazało się, że nic z tych rzeczy. Zapraszam do wysłuchania wersji Boney M - Sopot 1979, a podczas słuchania można przeczytać tekst poniżej, wyjaśniający o czym właściwie jest ta piosenka.   Podobnie jest z piosenką Rivers of Babylon w wykonaniu Boney M. Zespół ten kojarzy się raczej z muzyką lekką i dyskotekową. Słuchając piosenki zawsze miałem skojarzenia bardzo przyjemne, w nastrojach gorącego lata i wakacji.  Nie przywodziła na myśl jaki

Technologie. Klawiatura komputera - podstawowe fakty

Niedoświadczonym użytkownikom komputera warto się zapoznać ze sprawami, które nie są intuicyjne i łatwe do samodzielnego odkrycia podczas klikania. Klawiatura jako urządzenie, jest tego przykładem. W swojej praktyce spotkałem się z osobami, którym najprostsze funkcje klawiatury były nieznane. Gwoli sprawiedliwości, trzeba powiedzieć, że nie odnosi się to jedynie do osób starszych. Zdarzyło mi się zaobserwować sytuacje, kiedy osoby w wieku lat dwudziestu kilku do napisania wielkiej litery włączały caps lock. Wbrew pozorom jednak obsługa klawiatury komputera jest nieskomplikowana. Trzeba zapamiętać dosłownie garstkę informacji, żeby usprawnić użytkowanie tego urządzenia. Komputer jest maszyną przetwarzającą informację. Musi być więc wyposażony w urządzenia do przyjmowania informacji i oddawania informacji. W dodatku te urządzenia muszą być przyjazne dla użytkownika. Zbiorczo do tych urządzeń używana jest nazwa interfejs, od angielskiego interface (wym. interfejs) Jest kilka rodzaj

Gify na świąteczne laurki

Gify to małe ruchome obrazki wyświetlane najczęściej na stronach internetowych. Zasada działania gifu polega na złożeniu kilku zdjęć – każde różni się nieco od pozostałych – i wyświetlaniu po kolei w krótkich odstępach czasu.  Być może pamiętacie z dzieciństwa zabawki z kartką i ołówkiem, gdzie poruszając szybko ołówkiem tak, żeby raz była widoczna, raz druga karteczka uzyskać wrażenie ruchu.