A | B | C | D | E | F | G | H | CH | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
Apertium | |
Logo | |
Základné informácie | |
---|---|
Posledná stabilná verzia | 3.4.2 (15. máj 2016 ) |
Vyvinutý v | C++ |
Operačný systém | POSIX kompatibilné |
Lokalizácia | viacjazyčný |
Typ softvéru | Strojový preklad |
Licencia | GNU General Public License |
Ďalšie odkazy | |
Webová stránka | www.apertium.org |
Pozri aj Informačný portál |
Apertium je rule-based platforma pre strojový preklad. Apertium je otvorený softvér vydaný pod GNU General Public License licenciou.
História
Apertium vzniklo ako jeden z engine-ov pre strojový preklad v projekte OpenTrad, ktorý bol sponzorovaný španielskou vládou. Pôvodne bolo navrhnuté na preklad úzko súvisiacich jazykov, aj keď nedávno expandovalo, aby obsiahlo aj navzájom odlišnejšie jazyky. Pre vytvorenie nového systému pre strojový preklad je potrebné len vyvinúť lingvistické dáta (slovníky, pravidlá) v dobre špecifikovanom XML formáte.
Jazykové dáta vyvinuté pre Apertium (v spolupráci s Universidade de Vigo, Universitat Politècnica de Catalunya a Universitat Pompeu Fabra) momentálne podporujú (v stabilnej verzii) astúrčinu, baskitčinu, bretónčinu, bulharčinu, katalánčinu, dánčinu, angličtinu, Esperanto, francúzštinu, galčinu, islandčinu, macedónčinu, nórčinu (Bokmål a Nynorsk), okcitánčinu, portugalčinu, románčinu, španielčinu, švédčinu a waleštinu. Úplný zoznam jazykov je uvedený nižšie. Vo vývoji projektu Apertium je zapojených aj niekoľko spoločností, vrátane Prompsit Language Engineering, Imaxin Software a Eleka Ingeniaritza Linguistikoa.
Apertium je shallow-transfer systém pre strojový preklad, ktorý používa finite state transducery na všetky lexikálne transformácie, a skrytý Markovov model na part-of-speech tagging (t. j. gramatickú analýzu slovných druhov) alebo rozoznávanie slovných druhov. Pre niektoré dvojice jazykov (napr. bretónčina-francúzština) sú použité taktiež Constraint Grammar tagger-e.
Projekt sa zúčastnil v programe Google Summer of Code 2009 a 2010, a taktiež v Google Code-in 2010.[1]
Dvojice jazykov
Zoznam momentálne stabilných dvojíc jazykov; ukázanie kurzorom na kód jazyka zobrazí jazyk, ktorý daný kód reprezentuje.