Syntezator mowy Voicebox od Meta
Voicebox oparty o model językowy LlaMA i jest przeszkolony na niefiltrowanym dźwięku. Syntezator mowy uczył się m.in. na ogólnodostępnych audiobookach w różnych językach (angielskim, francuskim, hiszpańskim, niemieckim, polskim i portugalskim). Twórcy twierdzą, że dzięki temu jest on w stanie wyprodukować bardziej konwersacyjne treści.
Voicebox posiada typowe podstawowe funkcje, takie jak zamiana tekstu na mowę czy odczytanie fragmentu w różnych wariantach głosowych. Ciekawą opcją jest możliwość edytowania dźwięku, np. usunięcia niepotrzebnych dźwięków nagranych w tle za pomocą wydania odpowiedniej komendy. Jest on również przydatny w tłumaczeniach, ponieważ bez większego problemu może odczytać dany fragment tekstu w kilku różnych językach.
Tego typu narzędzie może być niezwykle przydatne do szybkiego tworzenia np. audiobooków w różnych wersjach językowych, które przeczytane zostaną wygenerowanym komputerowo głosem ulubionego lektora.
Meta na ten moment nie udostępnia modelu, ponieważ zdaje sobie sprawę z ryzyka związanego z użyciem go w niewłaściwym celu.