Meta uvádza multimodálny model umelej inteligencie (AI) na prekladanie reči aj textu. SeamlessM4T je podľa nej prvý viacjazyčný multimodálny model prekladu a transkripcie AI typu všetko v jednom. Dokáže vykonávať preklady reči na text, reči na reč, textu na reč aj textu na text až pre 100 jazykov v závislosti od úlohy. Jednotný systémový prístup znižuje chyby a oneskorenia, čím zvyšuje efektivitu a kvalitu procesu prekladu. To umožňuje ľuďom, ktorí hovoria rôznymi jazykmi komunikovať medzi sebou efektívnejšie.
SeamlessM4T konkrétne podporuje:
- Rozpoznávanie reči pre takmer 100 jazykov.
- Preklad reči do textu pre takmer 100 vstupných a výstupných jazykov.
- Preklad reči do reči s podporou takmer 100 vstupných jazykov a 36 výstupných jazykov (vrátane angličtiny).
- Preklad textu do textu pre takmer 100 jazykov.
- Preklad textu na reč s podporou takmer 100 vstupných jazykov a 35 (vrátane angličtiny) výstupných jazykov.
V súlade s prístupom spoločnosti otvorenej vedy verejne sprístupňuje SeamlessM4T na základe výskumnej licencie pre výskumníkov a vývojárov. Zverejnila tiež metadáta SeamlessAlign, doteraz najväčšieho otvoreného multimodálneho prekladového súboru údajov s 270.000 hodinami vydolovaných zarovnaní reči a textu.