Sukces naukowców z Wydziału Matematyki i Informatyki Uniwersytetu im. Adama Mickiewicza w Poznaniu w najważniejszym na świecie konkursie z dziedziny tłumaczenia automatycznego. Doktoranci: Artur Nowakowski, Gabriela Pałka oraz dwóch magistrantów: Mikołaj Pokrywka i Kamil Guttmann zajęli pierwsze miejsca w dwóch kierunkach tłumaczenia: ukraiński-czeski i czeski-ukraiński, zostawiając w tyle m.in. translatory firm Google i Microsoft.
Konkurs o nazwie “General MT Shared Task” odbył się w ramach konferencji Workshop for Machine Translation 2022 (Conference on Machine Translation — https://statmt.org/wmt22), która jest najbardziej prestiżową konferencją z dziedziny tłumaczenia maszynowego. Zadanie naukowców polegało na stworzeniu jak najlepszego translatora, będącego w stanie tłumaczyć teksty z różnych dziedzin.
– W tym roku głównymi dziedzinami, na których skupiony był konkurs, były: newsy, social media, konwersacje ludzkie (np. czat) oraz e-commerce – wyjaśnia Artur Nowakowski, który kierował zespołem. – Wzięliśmy udział w kierunkach tłumaczenia czeski-ukraiński oraz ukraiński-czeski. Zgodnie z opublikowanymi wynikami opartymi na automatycznej ewaluacji (gdzie maszyna ocenia jakość tłumaczenia), zajęliśmy pierwsze miejsce w obydwu kierunkach – dodaje naukowiec.
Warto wspomnieć, że zespół wykorzystał tylko dane udostępnione przez organizatorów konkursu, w przeciwieństwie do systemów, które mogły wykorzystywać dowolne zasoby, co zazwyczaj prowadzi do uzyskania znacznie lepszej jakości tłumaczenia, jak w przypadku systemów Google czy Microsoft.
Tworzenie systemu tłumaczenia trwało około 2 miesiące.
– W tym czasie próbowaliśmy różnych metod opartych na sieciach neuronowych, które byłyby w stanie uzyskać jak najlepsze tłumaczenie. Do stworzenia systemu konieczny był wydajny serwer obliczeniowy, który zakupiliśmy w ramach Centrum Sztucznej Inteligencji UAM – mówi Artur Nowakowski. Zarówno on, jak i Gabriela Pałka, współpracują z CSI.
W dniach 7-8 grudnia w Abu Dhabi (Zjednoczone Emiraty Arabskie) odbędzie się konferencja podsumowująca tegoroczne wyniki. Do tego czasu wszystkie systemy tłumaczenia biorące udział w konkursie zostaną również poddane ewaluacji ludzkiej, gdzie profesjonalni tłumacze manualnie będą oceniać jakość tłumaczeń wygenerowanych przez system.