Menü Bezárás

“Az MI / gépi fordítások emberi áldozata” – Cikkfordítás 2025.05.16.

Ezt a cikket eredetileg Lucile Danilov írta a Loc’d and Loaded weboldalra, forrás: https://locdandloaded.net/2025/05/13/human-cost-ai/

A cikket jómagam csak magyarra fordítottam, helyenként és a legvégén saját szavaimmal kiegészítve, kék betűszínt használva.

 

Pár évvel ezelőtt egy jó barátom valóra váltotta egyik nagy álmát: Egy évtizednyi kemény gürizés után végre sikerült bejutnia hivatalos fordítóként egy céghez egy általa kedvelt játékhoz. Ez egy nagyon felkapott pozíció volt, mivel stabil munkát és jövedelmet biztosított egy egyébként bizonytalanságokkal teli terepen.

Sajnos egy nap mindez csúfos véget ért, mikor a cég kitalálta, hogy a fordítási folyamataikba bevon egy MI alapú gépi fordításos rendszert. A teljes részlegben kavarodást okozott, mivel a fordítók, akiket korábban arra kértek, hogy lenyűgöző narratívákat írjanak a nemzetközi közösség számára, hirtelen azon kapták magukat, hogy kényszerből “lektorálniuk” (ez helyesebben fogalmazva inkább “átírniuk”) kell a gép által generált szövegeket, és erre egyre szűkösebb határidőt kaptak. Mivel nem tudtak alkalmazkodni az új paradigmához és nem akartak alábbhagyni a minőségi munkájukból, így a barátomat pár hónappal ezen változtatások után lazán kitették.

A videójátékok fordításával kapcsolatban számos ehhez hasonló történetet hallunk. Az elmúlt pár év során egyre gyakrabbá váltak, mivel a Szilícium-völgy óriásai kitartanak azon küldetésük mellett, hogy csökkentsék a kreatív megnyilvánulásokat és helyette ész nélküli szógyártásba kezdjenek. Mivel egyre szorosabb a büdzsé és több profitot szeretnének, így elvárják, hogy sokkal többet, sokkal gyorsabban és sokkal olcsóbban készítsenek ezt-azt, a videójáték ipart ezzel eldobható “tartalmak” kavalkádjává változtatva.

Az automatizálás ígérete

Persze ez az új aranybányának tekinthető dolog számos “ásóárust” bevonzott, köztük a DMM Games nevű kiadót, akik a 2025-ös GDC beszédjüket azzal a merész kijelentéssel kezdték, hogy az “MI ügynökök ‘forradalmasítani’ fogják azt, hogy hogyan fordítjuk le a játékokat.” Mivel jómagam professzionális szinten közel 10 éve fordítok és elég sokat tanulmányoztam az MT (TRC: Machine Translation, gépi fordítás), valamint az LLM (TRC: Language Learning Model, nyelvi tanulás modell) modelleket, azt hiszem kijelenthetem, hogy ezeket a kijelentéseket érdemes kritikusan kezelni.

Ha valaha is beszéltél profi fordítóval, tudhatod, hogy a legtöbbünknek ellenséges viszonya van a gépi fordításokkal kapcsolatban, különös tekintettel a videójátékok és egyéb kreatív tartalmak esetében, amihez nagyfokú művésziesség / művészi érzék szükséges. A Babel Fish és a Google Translate kezdetén a cégek már azon töprengtek, hogy milyen módon tudják a gépi fordítási technológiákat bevezetni, hogy ezzel időt és pénzt spóroljanak, gyakran a minőség rovására. És habár a gépi fordításoknak valóban van praktikus és valid használatuk, történelmileg is bizonyítható, hogy ezek arra kényszerítik a fordítókat, hogy egyre rosszabbodó körülményeket kelljen elfogadniuk, mint ahogy manapság egyre több kreatív munkába nyomást gyakorolnak arra, hogy valahogy beletegyék a ChatGPT-t és a Midjourney-t a munkájukba.

A gépiesített rész – átalakítva egy szöveget “A” nyelvből “B” nyelvbe – többnyire automatizálható.

A DMM által képviselt vita egyik része az volt, hogy a hagyományos gépi fordítás + az utómunkálatos modellek (MTPE) egyértelműen nem használhatók és fenntarthatók a játékok fordításaihoz, mivel túl sok változó szerepel bennük (szó szerint és átvitt értelemben is), összekapcsolt elemekkel vannak tele, nyelvújításokkal…stb. Legalább ebben egyet értek velük.

De erre érkezett tőlük egy lehetséges megoldás, ami eléggé kétségesnek hangzik: Mi lenne, ha megpróbálnánk annyira kiszorítani az emberi tényezőt amennyire csak lehetséges?

Ennek értelmében a fordítók a kimenetelt felügyelnék, mint egyfajta “rendező” (így szó szerint), vagyis az alantas munkát, hogy “az ‘A’ nyelvből átkonvertáljuk a szöveget ‘B’ nyelvbe”, pedig az MI ügynökre bízzák. Ha netán volt közöd fordításokhoz vagy ilyen munkában dolgozol, akkor ezt a kijelentést kétféleképpen lehet értelmezni:

  1. Te egy vezetői posztban vagy, és a szemeid előtt dollárjelek villognak
  2. Te egy olyan szerepben vagy, ami közvetlenül a tartalommal foglalkozik (pl. fordítók, szerkesztők és így tovább), és most kétségbeesetten a legközelebbi kijáratot keresed

Ez talán túlságosan leegyszerűsíti a dolgot? Abszolút. Ugyanakkor azt is mutatja, hogy évtizedeken át hogyan működött ez az iparág – Az új technológiák bevezetése, ami a “hadifronton” lévőknek kellett volna, hogy segítsen, a legvégén arra használtatott, hogy megfossza őket. Ezúttal sincs másképp, és az, hogy ezt pozitív evolúcióként próbálják bemutatni, teljes mértékben alattomos.

Először is, a fordítás fogalma nem arról szól, hogy szavakat alakítunk át, hanem jelentést. És bár az LLM-ek képesek kísérteties pontossággal utánozni az emberi beszédsémákat, fontos megjegyezni, hogy ezek se nem gondolkoznak, se nem értik a dolgokat úgy, ahogy az emberi agy. Továbbá a legtöbb fordító nem akar folyamatos próbálkozósdit játszani, hogy azt érje el egy MI ügynöknél, hogy úgy fordítson ami természetesnek hangzik ahelyett, hogy logikusnak hangozna. Annyi idő alatt, amennyivel újra kell írni a fordítást, addig többször is egyszerűen csak beírhatják azt.

Egy másik vita, amit DMM-ék felhoztak, hogy bízzuk az MI-t az “alap, ismétlődő sorok” kezelésére, így a fordítók olyan lényeges dolgokra koncentrálhatnak a játékoknál, mint például a karakterizálás vagy a nagyon kreatív tartalmak (pl. versek, szójátékok, főbb átvezetők és így tovább). Én három főbb problémát látok ezzel a megközelítéssel kapcsolatban:

  • Először is, egyetlen játékszöveg sem létezik vákuumban, és sok ilyen ismétlődő sor egyéb narratív / játékbeli elemekhez kapcsolódik, vagyis ugyanannyi figyelmet igényelnek, mint a játék többi része (És minden modern CAT eszköz /TRC: fordítástámogató program/ már képes elbánni az ismétlődő dolgokkal úgynevezett Fuzzy egyező rendszer segítségével, amit érdekes módon kihagytak).
  • Másodszor, a nagyon kreatív fordításoknak van egy bizonyos mértékű intellektuális erőfeszítése, ami hosszú távon, napi szinten nem túl jó. Tételezzük fel, hogy ehhez a megközelítéshez a szokásos szavankénti árazási modellt nézzük (és úgy tűnik erről van szó, mert a DMM prezentációja szerint akár 3 ¢/szó /TRC: Kb. 10 Ft szavanként/ is lehet a legalacsonyabb ár), akkor nem lenne anyagi értelme a fordítóknak kizárólag ilyen típusú tartalmakon dolgozniuk.
  • Harmadjára pedig az alap tartalmak fordítása kritikus a továbbképzés szempontjából: Tudom, hogy az MI cégeket ritkán érdeklik a hosszútávú dolgok, de akár azt az optimista helyzetet feltételezve, hogy minden tapasztalt fordító rákap a témára, akkor hol maradnak a kezdők? Ők hogyan fogják megtanulni az alapokat és a lebilincselő párbeszédek írását vagy azt, hogyha korlátozott karakterszámban kell fordítaniuk valamit, amikor az LLM-ek nem működnek?

DMM-ék szerint “Hat hónap alatt nagyjából 50 címet fordítottunk le 10 különböző nyelvre, és egyes kliensek az MI által kiadott szöveget minimális vagy semmilyen módosítás nélkül tették közzé”. Ha ez igaz, akkor ez egy lenyűgöző teljesítmény, kétségkívül olyasvalami, ami az elkövetkezendő évek során sokkalta előrébb fogja helyezni őket a “hagyományos” versenytársaikkal szemben. Habár ha ennyire megbíznak a dologban, akkor biztosan nem bánnák azt, ha a közönség előtt bemutatnák a nyersen kapott eredményt, hogy mi magunk ítélkezzünk felette, nem?

Vagy… lehet, hogy ez az egész MI máz egy sokkal mocskosabb valóságot rejt?

Teszteljük az állításokat

Miután ilyen sokat beszéltünk az elméletről, szeretném illusztrálni pár esettanulmánnyal az ügyet. Mivel én nem férek hozzá azon fejlett termékekhez amivel ezen MI cégek (és ha mégis lenne, sohase bíznám meg őket senki termékével az ő tudásuk vagy beleegyezésük nélkül), én most egyszerű promptokat fogok használni Claude és Gemini használatával. Fontos tudni, hogy bár ennek a módszernek vannak hibái, ez nagyjából bemutatja, hogy számos fordító cég milyen MI munkafolyamattal él.

A példámban egy kivonat szerepel a Cyberpunk 2077-ből, ami tematikusan is ideillik (a játék corpo-tech disztópiája egyre inkább kezd a saját valóságunkhoz hasonlítani), és mivel a francia fordítását mind a rajongók, mind a média dicsérte. A példámhoz egy olyan információt használtam, ami a játékban “braindance” néven fut, aminek segítségével a játékosok felvehetik és visszajátszhatják valakinek az emlékeit, beleértve a fizikai érzést, az érzelmeket és a gondolatukat. Mivel ezt a szöveget szerkesztői stílusban írták, az eredménynek jobbnak kell lennie az átlagnál, mivel a legtöbb LLM-et nagy mennyiségű szerkesztői típusú tartalommal edzették.

Mindkét LLM-nek az alábbi szöveget adtam: “Fordítsd le az alábbi videójátékbeli szöveget, ami egy disztópikus világban játszódik, angolról franciára. Bizonyosodj meg róla, hogy a szöveg természetesnek hasson a francia anyanyelvűek számára, miközben megőrzöd az eredeti angol szöveg pontosságát és szándékát.

Csak a pontosság kedvéért itt van egy nyers diffcheck (TRC: összehasonlítva a két szöveget és különbségeiket) az eredeti fordítás első bekezdése, és Claude eredménye között:

Önmagában ez semmit se bizonyít, mert akár két nagyszerű ember által készített fordítást is összehasonlíthatunk és nem kapnánk túl sok különbséget. Ugyanakkor nagy eltérést lehet látni abban, hogy hogyan épülnek fel a mondatok, beleértve a terminológiákat, a melléknevek elhelyezkedését, a különböző záradékok használatát…stb., csupa olyan dolog, ami hatással van az olvasó felfogására. Lehet vitatkozni, hogy az MI által generált szöveg “olvasható”, de az biztos, hogy nem kellemes az olvasása. És ha egy ilyen szöveget küldenénk valakinek egy fordítási tesztre válaszként, 99%, hogy el lenne utasítva.

Térjünk rá magára a tartalomra, és már kezdhetjük is az elefánt méretű problémával: Sem Claude, sem Gemini nem tudta, hogy mi az a “braindance”, így angolul hagyták a szót. Összehasonlításként a hivatalos fordításban “érzékekre tartozó tánc” lett, ami tökéletesen leírja a “braindance” koncepcióját.

És itt is van az első valódi problémája annak, amikor MI-vel fordítunk: Alapesetben az LLM-ek nem tesznek fel kérdéseket – Csak azzal dolgoznak amit kapnak, és mikor nem adsz nekik túl sokat, akkor nem várhatsz tőlük csodákat. Szóval akkor egyszerűen több tartalmat kell nekik adni, ugye? A probléma az, hogy még az emberi fordítóknak se jut gyakran bármiféle referenciaanyag a fordításaikhoz (aminek megvan az oka, de ezt nem most fejtjük ki). Ettől persze adódik a kérdés: Mégis mitől lenne másabb a dolog, ha az MI-t is belekeverjük a dolgokba?

Itt van pár egyéb nagyobb hiba a kiadott, automatizált szövegekkel kapcsolatban:

  • Már a legelső sorban a “GUEST EDITORIAL” kifejezést szóról szóra fordította le (ÉDITORIAL INVITÉ), aminek franciául semmi értelme nincs, míg a hivatalos fordításban “INVITÉ DE LA RÉDACTION” szerepel, aminek a jelentése “GUEST OF THE EDITORIAL [TEAM]”, ami egy átlagos újságírói kifejezés. Feltételezhetjük, hogy a fordító megkérdezte a fejlesztőket, hogy erősítsék meg J.A. kilétét, mivel a „guest” szónak a hímnemű változatát használták. Kizárt dolog, hogy bármilyen LLM összefüggést találna “J.A.” és a “GUEST” szó között, mivel annyira távol állnak egymástól.
  • “The more heavily processed the material, the more abstracted the pathways”, szerepel a szövegben, és ez a braindance azon módszerére utal, ami a felhasználók rögzített emlékeit használja fel, és ezt ismét szóról szóra fordította Claude és Gemini is. Sőt, a Gemini még a “pathways” szót is “roads”-nak fordította (tehát az útvonalakra a fizikai utakat használta), ami további félreértést okoz. Összességében ezt a részt extrém nehéz elemezni, mivel ugyanazt a felépítést használja, mint az angol változat (pontosvesszőt is használva, ami a franciában nagyon szokatlan). Eközben a hivatalos fordítás ezt a részt két mondatra szedte, javítva az olvashatóságát és sokkal természetesebb kifejezést használt, mint például a “connexions dissociées”, ami az “absract pathways”-re utal.
  • A “… point of pride in the quality of their production” rész olyan fordítást kapott, hogy “point de fierté dans la qualité de leur production”, ami túlságosan szó szerintinek hangzik és kontextus nélkül is mesterkéltnek. A hivatalos fordítás szerint “a selling point in regard of the quality of their product”. Ha ez most túl furának hat az eredeti, angol szöveghez képest (visszafele fordítva), annak pont ez a lényege – Minden nyelv másképp működik, ezért is fontos, hogy a szándékot ragadjuk meg és ne a pontos szavakat (TRC: vagyis ne tükörfordítást készítsünk)

És én itt most ezeket a hatalmas hibákat pusztán az ELSŐ bekezdés alapján mutattam be, ami mindösszesen 91 szóból áll… Most akkor képzeljük el azt a mentális gimnasztikát, amit több millió szóról szóra, napról napra kell végeznünk. Már annak a gondolata is, hogy ilyesmivel kell foglalkoznunk eléggé lelombozó és demoralizáló, nemde? Nos, most már nagyjából el tudjátok képzelni, hogy milyen lehet egy MI fordítást utószerkeszteni.

Természetesen azért választottam a francia nyelvet példaként, mert én arra a nyelvre szoktam fordítani, ugyanakkor ez egy olyan nyelv, ami szemantikailag is közel áll az angolhoz. A hasonló szövegek oroszra, japánra vagy kínaira (TRC: a magyarra meg pláne) való fordítása minden kulturális nüánszukkal együtt teljesen más játszmát jelent. Ha beszéled ezen nyelvek bármelyikét, javaslom, hogy futtass le hasonló tesztet és oszd meg velünk az eredményt!

És ha azt hiszed, hogy szőrszálhasogató vagyok, itt van egy teljesen független példa, amit egy német kolléga jelzett, ahol egy fantasy játék új képességeit kellett lefordítani. Ezúttal a kimenetelt állítólag a játék dizájn dokumentumain edzett MI fordította le, plusz egy egyedi stílusú leírás / szószedet is tartozott hozzá. A vörössel jelzett szöveget újra kellett írni, a kékkel jelzett szöveg pedig teljesen más helyre / sorrendbe került (Megjegyzés: A fordítási szerződés miatt pár rész ki lett takarva)

Most tételezzük fel, hogy a játékod minden egyes kulcsszavát a fordítás előtt beraktad egy szószedetbe, tele kibővített definíciókkal, beleértve minden egyes karakter nemével, korával és miegymással. Igen, elméletileg jobb eredményt kaphatsz. De alapos emberi szerkesztés nélkül még mindig középszerű lesz az egész – mert az LLM-ek eredendően nem értik azt, hogy mitől fog egy szöveg “gördülékeny” lenni. Nem próbálják meg azt, hogy egy kérdést átfogalmazzanak akár felkiáltó mondattá, mert az jobban illik az adott kultúrába vagy kontextusba. Nem tudnak egy mondatot több kisebb részre vágni és felcserélni, hogy javítsák az olvashatóságot. Nem tudják, hogy mikortól kezdenek a karakterek egymással tegező viszonyban társalogni, ahogy a kapcsolatuk fejlődik. Vagyis egyszerűbben fogalmazva nem képesek fordítani, hanem pusztán átalakítják a szavakat, amitől merev, lélektelen eredményt kapunk.

És itt jönnek képbe az “MI-alapú” fordítási cégek, akik egy állítólagos profi fordítóhadsereggel bírnak, akik ugrásra képesek, hogy azt bizonyítgassák vagy a képedbe hazudják, mint ügyfélnek, hogy rekordidő alatt a lehető legjobb eredményt képesek elérni. De ez demonstrálhatóan hamis dolog: Azon túl, hogy fentebb tényszerű hibákat mutattam, az MTPE-nek nevezett gyakorlat messze nem olyan népszerű a fordító specialisták körében, ami azt jelenti, hogy ezeket a feladatokat általában olyan fordítók használják, akik tapasztalatlanok, elkeseredettek vagy mindkettő.

Nemrég volt egy kutatás, amiben 160 fordítót és szerkesztőt kérdeztek meg, 57%-uk vagy utálja vagy megveti ezt a gyakorlatot, míg 33%-uk közömbös volt ezzel kapcsolatban. Az MTPE-re gyakran fárasztó, unalmas munkaként tekintenek, ami megfosztja a fordítókat a kreativitásuktól és az irányítástól, miközben arra kényszeríti őket, hogy minél gyorsabban végezzék el a feladatot. Ennek ellenére a cégek az MTPE-re építik a teljes üzleti modelljüket, így gyakran “fordítói rabszolgaműhelynek” nevezik őket.

Eközben pár fejlesztő teljesen kihagyja ezeket a cégeket és átadják a ChatGPT-nek a kormányt, tele mindenféle hallucinációkkal, amik általában nevetségesen katasztrofális eredményt produkálnak:


TRC megjegyzése: Az jelenik meg a Wuthering Waves HIVATALOS német fordításában egy leírásnál, hogy „Sajnálom, de a ‘Xunwei’ szó nem angol eredetű, így nem tudom lefordítani. Kérlek bizonyosodj meg arról, hogy az általad választott beviteli nyelv az angol”. Tehát NEM a szöveget, képességet vagy egyebet fordították le, hanem gondolkodás nélkül bemásolták azt, amit a gép kiadott. Gratula hozzá!

Jövőbetekintés

Azt gondolhatnád, hogy minden olyan fordító, aki megveti az MI használatát, valószínűleg elégedetlen és zsémbes gépromboló, technofób és miegymás. És valamilyen módon igazad is lehet – személy szerint én megvetem azt a gondolatot, hogy az én kritikus gondolkodási képességeimet egy valószínűségre alapuló, automatikus kitöltő szerkezetre bízzam, ami lopott adatokra épül. Ez nem azt jelenti, hogy egyáltalán nem használunk ilyen eszközöket (lásd hányféle makrót és programot írtam a weboldalamhoz), vagy hogy nem használjuk néha inspirációként mondjuk a DeepL-t (TRC: Ezt majd biztos sokan kiragadják a kontextusból, de én is használok inspirációra DeepL-t és Google Translate-et, csak elég elenyésző arányban / ha nagyon elbizonytalanodnék, és nem másolom be a szöveget, lásd miket írt a cikkíró fentebb).

De akárcsak bármilyen eszközt, ha ezt is lehet elnyomásként használni, akkor fogják is. A fordítók pusztán kanárik voltak a kreatív szénbányában, és sajnálatos módon sokan mások fogják követni őket. Ez az MI használatának valódi emberi áldozata. Ezt az áldozatot nem lehet dollárban mérni, és lehet manapság még nem érzed ennek a hatását, vagy akár holnap, esetleg évek múlva sem. De miután minden apró morzsányi értékes adatot leszívtak és több ezerszer kiöklendeztek, akkor marad bármilyen fogyasztható dolog is utána?

Mindezek ellenére az agyunknak hihetetlen felfogóképessége van arra, hogy a furcsaságokat és a szokatlan mintázatokat észrevegye, ami az MI-k főbb jellegzetessége. Bármit is készítenek gyorsan vagy felületesen, az taszító számunkra, még ha csak tudat alatt is. Ezek alól a fordítások se kivételek. És abba gondolva, hogy manapság mennyi mosléknak vagyunk kitéve online, én úgy vélem, hogy az emberek idővel jobban meggondolják majd, hogy mire költik a drága idejüket és pénzüket.


Ezen generáció legjobb játékait 100%-ban emberek írták (és így fordították), más embereknek. Végtére is ki akarna olyan szöveget olvasni, amit senki se akart megírni?

Ha egy fejlesztő vagy, aki le akarja fordítani a játékait, akkor biztos tonnaszámra kerestek már olyan cégek, akik mindenféle “MI-asszisztált” vagy hasonló megoldást kínáltak neked. De tudnod kell, hogy ezek a cégek soha nem a te érdekeidet nézik – Csak az érdekli őket, hogy mennyire tudják az alvállalkozóik hátán növelni az árrésüket, azt remélve, hogy nem veszed észre, hogy mennyire vágnak át téged. Hacsak nem értesz anyanyelvi szinten minden olyan nyelven, amire lefordítanád a játékodat, akkor csak a hírnévre és a jóhiszeműségre hagyatkozhatsz… és a mai világban ez a legjobb esetben is kockázatos lépés.

 

 

 

INNENTŐL MÁR CSAK A SAJÁT, AVAGY TRC VÉLEMÉNYE JÖN:

Szóval a lényeg, hogy megláttam ezt a cikket (pontosabban ajánlották nekem), és úgy gondoltam tök jó lenne lefordítani, hátha mások elolvassák és ők is érdekesnek találják / elgondolkoznak pár dolgon. Láttam már nem egy helyen azt hangoztatva, hogy „a gépi fordításoké a jövő”, illetve „mennyi munka van bennük”, és voltak akik folyton azt próbálták cáfolni, hogy „bármit is fordítasz, egy fordítás nem lehet művészi / nem kell igényesnek lennie, mert nem irodalmi szöveget fordítasz”, valamint „alig kell átírni egy gép által fordított szöveget” / „kizárt dolog, hogy kézzel lefordítva jobb eredményt kapsz”, vagyis „nincs is olyan sok munka egy szöveg átnézésében és javításában” és a többi.

A háttérben még mindig készítgetek és tesztelgetek fordításokat (amiket továbbra is kézzel készítek), és az egyik fordításról szeretnék videót készíteni, vagy annak hiányában egy naaagyon hosszú, technikai dolgokkal megfűszerezett leírást. Pusztán azért, hogy megmutassam nem merül ki annyiban egy játék fordítása, hogy berakom a gépbe, kiad valamit és csókolom (meg különben is, azt nem ember, hanem a gép fordítja /a cikk szerint helyesebben átalakítja/, ergo az ilyet készítő egyén max. technikus lehet, de fordító sohasem). Aztán meglátjuk, hogy mi sül ki belőle.

 

Legközelebb valószínűleg akkor jelentkezem, ha elkészültem az aktuális fordításom tesztelésével / lefordítottam a Nightreign-t. Addig is mindenkinek kitartást!