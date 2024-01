Uživatelská přístupnost e-shopu a interface produktů jeho nabídky v jazykové formě tak, jak ji zákazník očekává a zná, vládne e-commerce sektorem ve většině států východní Evropy. Důkazem je i lokální příklad, kdy přes úspěch amerického Amazonu v zámoří na něm v anglické verzi nakupovali Češi a Slováci jen výjimečně. Z psychologického hlediska je totiž pro zákazníky obchod v rodném jazyce přirozenější a více se ztotožní s rutinními názvy produktů, které denně používají. Zkomolené nebo nepřesné názvy produktů a špatné překlady jsou pak spíše než k pousmání něčím, co zákazníky od nákupu odradí.

Příčinou jsou obvykle automatické překlady prostřednictvím Google Translator, velkou roli však hraje i to, když ve finální testovací fázi e-shop neprojde jazykovou kontrolou. Například z naší zkušenosti se české internetové obchody, které expandují na Slovensko, někdy mylně domnívají, že kontrola rodilým mluvčím není potřeba. Výsledkem je pak web s množstvím jazykových chyb, který nepotěší ani jednu národnost. Problematika správných jazykových variant se ale netýká jen zákazníků, paseku může nadělat i třeba při vyhledávání, analytice či správě databází.

Jazykové modely jako součást programátorské architektury

Zásadní složkou při expanzi je překlad samotného portfolia zboží. Druhou a neméně důležitou částí je však i zajištění správné funkčnosti jazykových tvarů v rámci vyhledávání a doporučování produktů. Není to každopádně jen překladatel nebo lingvista, který v tomto procesu má hlavní slovo. Softwaroví inženýři i v našem týmu Luigi’s Box jsou specializovaní v segmentu informatiky, která se jazykovými modely do hloubky zabývá. Jednak v rámci takzvaného stemování, kdy jsou hledaná slova ořezána na jejich kmenovou formu a vyhledávač je tak schopný produkt najít bez ohledu na konkrétní tvar slova, ale také skrze obdobnou metodu lematizace, kdy je slovo redukováno místo kmene na základní tvar slova. Díky nim je technologie schopna jazykové formy oříznout a skloňovat, aby byly lehce dohledatelné i mimo svůj základní tvar.

Při vyhledávání se tak kombinuje kvalita shody se zadaným produktem, ve kterém se daná fráze nachází. A nezáleží přitom, jak je do vyhledávacího pole napsaná. Z pohledu klienta, který tyto pokročilejší nástroje využívá, jsou nastavení skryta a e-shop bez větších problémů nabízí své produkty bez trhliny v nákupním procesu. Například košík pomerančů nabídne při vyhledávání slova pomeranč, nebo využívá synonyma a klíčová slova, která jsou v daném jazykovém kontextu typická.





Pokud však e-shop nezohlední specifika daného jazyka a implementuje stejné rozhraní, které má v Česku nebo na Slovensku, může tím způsobit nižší kvalitu výsledků vyhledávání. Mnoho zemí má ve svém jazyce specifické tvary a slang, který závisí na kontextu, v němž se používá. Proto je důležité mít nastavenou implementaci přímo pro daný konkrétní jazyk.

Strojové pochopení jazyka ve finále zlepší nákupní zážitek

Na základní úrovni je možné se sofistikovaným nástrojem na základě hlubší analýzy implementovat e-shop na jazykovou mutaci poměrně jednoduše. Složitější strukturou se však vyznačují některé komplexnější jazyky, kterým je potřeba věnovat zvláštní pozornost. Například němčina je komplikovaná ve stavbě slov, kdy dvě nezávislá slova svým spojením vytvoří třetí. V praxi je v tomhle jazyce také mnoho anglicismů a používají se přímo v anglickém tvaru. Dalším specifickým jazykem je maďarština, pro kterou je typické připínání koncovek k základnímu tvaru v různých gramatických konstrukcích. Anebo například řečtina, pro svoji odlišnou abecedu.

Nákup v rodném jazyce je přitom pro koncového zákazníka zcela zásadní. Prohlížení a vyhledávání produktů na e-shopu je pro přibližně tři čtvrtiny zákazníků v Evropě klíčové pro to, aby vůbec svůj nákup online zvažovali. Další poměr tvoří míra nalezení hledaného zboží v rámci vyhledávání a zadávání hledaných frází. To představuje kromě hledání konkrétního produktu podle produktového čísla také hledání entity bez hlubší znalosti toho, co hledám – například podle typu produktu a značky –, a přibližné hledání opisem použitím klíčového slova.

Specifika dobře zvolené struktury překladu tak představují pro e-shop klíčovou vlastnost, na kterou se pak může vázat ranking výsledků pomocí umělé inteligence a další užitečné nástroje pro optimalizaci. Relevance výsledků se tak přímo odráží v tom, jak moc si daný obchod dává při expanzi záležet na jazykových modelech do hloubky namísto toho, aby je šil horkou jehlou.

Roli hraje skloňování, segmentace i synonyma

Existuje mnoho způsobů, jak se dá napsat hledaná fráze. Podle dat Luigi’s Boxu tvoří až 80 procent hledání na e-shopu unikátní slovní spojení. Čím méně generických frází se ale ve vyhledávání objevuje, tím vyšší je možnost konverze. Proto je i v jazykových mutacích třeba hlubokého pochopení na úrovni jazyka, jinak budou výsledky vyhledávání neúplné.

Nenalezené produkty se mohou objevovat ve větší míře, když e-shop nezohlední skloňování a časování hledaných frází, které umožní vyhledat výsledky v různých hledaných tvarech. Podstatnou částí je taky segmentace obsahu, to znamená párování primárního produktu s nejčastějším vyhledáváním jeho přívlastků a hledání jazykových shod. Analýza slovních druhů se rovněž postará o zařazení hledaných frází na úroveň podstatného a přídavného jména a slovesa. To umožní internetovému obchodu zařadit úpravu frází na jejich zjednodušenou verzi. Důležitou součástí optimalizace při expanzi je proto také navržení a zabudování synonym pro daný jazyk a znalost slangu a alternativních výrazů, které jsou pro jeho užívání typické.

V online prostoru je jazyková blízkost pro uživatele signál, že technologie a strojové pochopení jazyka jsou na takové úrovni, kterou pro nákup potřebují, a proto je pro ně taky e-shop důvěryhodný. Myslet o několik kroků dopředu se tudíž v případě expanze a transformace online obchodu do cizího jazyka skutečně vyplácí.