Dataocean AI ha partecipato alla creazione del set di dati open source GigaSpeech 2, un corpus ASR multidominio su grande scala per lingue con ridotte risorse

Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI pe...

Autore: Business Wire

IRVINE, California: Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI per sviluppare GigaSpeech 2, un’iniziativa coronata dal successo. I set di sviluppo e test di GigaSpeech 2 vengono etichettati da un’équipe di professionisti Dataocean AI.

Panoramica su GigaSpeech 2

GigaSpeech 2 è un corpus di riconoscimento del discorso multilingue e multidominio, su grande scala, in continua espansione, progettato per promuovere la ricerca e lo sviluppo nel riconoscimento del discorso in lingue a ridotte risorse. La versione grezza di GigaSpeech 2 contiene 30.000 ore di audio trascritto automaticamente per le lingue della Thailandia, dell’Indonesia e del Vietnam.

Fonte: Business Wire


Visualizza la versione completa sul sito

Informativa
Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, acconsenti all’uso dei cookie.