Μελέτη Περίπτωσης: Συλλογή Ομιλιών

Παρέδωσε 7 εκατομμύρια εκφωνήσεις για τη δημιουργία πολυγλωσσικών ψηφιακών βοηθών σε 13 γλώσσες

Συλλογή εκφώνησης

Λύση πραγματικού κόσμου

Δεδομένα που τροφοδοτούν τις παγκόσμιες συνομιλίες

Η ανάγκη για εκπαίδευση στο Utterance προκύπτει επειδή δεν χρησιμοποιούν όλοι οι πελάτες τις ακριβείς λέξεις ή φράσεις ενώ αλληλεπιδρούν ή κάνουν ερωτήσεις στους βοηθούς φωνής τους σε μορφή σεναρίου. Γι' αυτό συγκεκριμένες εφαρμογές φωνής πρέπει να εκπαιδεύονται σε δεδομένα αυθόρμητης ομιλίας. Π.χ., "Πού βρίσκεται το πλησιέστερο νοσοκομείο;" "Βρείτε ένα νοσοκομείο κοντά μου" ή "Υπάρχει νοσοκομείο κοντά;" Όλα δείχνουν την ίδια πρόθεση αναζήτησης αλλά διατυπώνονται διαφορετικά.

Συλλογή ρητορικών 1

Πρόβλημα

Για να εκτελέσει τον οδικό χάρτη ομιλίας του Digital Assistant των πελατών για γλώσσες σε όλο τον κόσμο, η ομάδα χρειάστηκε να αποκτήσει μεγάλο όγκο δεδομένων εκπαίδευσης για το μοντέλο AI αναγνώρισης ομιλίας. Οι κρίσιμες απαιτήσεις του πελάτη ήταν:

  • Αποκτήστε μεγάλο όγκο δεδομένων εκπαίδευσης (προτροπές εκφώνησης ενός ομιλητή διάρκειας όχι μεγαλύτερης από 3-30 δευτερόλεπτα) για υπηρεσίες αναγνώρισης ομιλίας σε 13 παγκόσμιες γλώσσες
  • Για κάθε γλώσσα, ο προμηθευτής θα δημιουργήσει μηνύματα κειμένου για εγγραφή στους ομιλητές (εκτός εάν
    προμήθειες πελάτη) και μεταγράψτε τον ήχο που προκύπτει.
  • Παρέχετε δεδομένα ήχου και μεταγραφή εγγεγραμμένων εκφωνήσεων με αντίστοιχα αρχεία JSON
    που περιέχει τα μεταδεδομένα για όλες τις εγγραφές.
  • Εξασφαλίστε έναν ποικίλο συνδυασμό ομιλητών ανά ηλικία, φύλο, εκπαίδευση και διάλεκτο
  • Εξασφαλίστε έναν ποικίλο συνδυασμό περιβαλλόντων εγγραφής σύμφωνα με τις Προδιαγραφές.
  • Κάθε εγγραφή ήχου πρέπει να είναι τουλάχιστον 16 kHz αλλά κατά προτίμηση 44 kHz

Επιταχύνετε το Conversational AI σας
ανάπτυξη εφαρμογών κατά 100%

«Μετά την αξιολόγηση πολλών προμηθευτών, ο πελάτης επέλεξε τη Shaip λόγω της εξειδίκευσής του σε έργα τεχνητής νοημοσύνης συνομιλίας. Ήμασταν εντυπωσιασμένοι με την ικανότητα εκτέλεσης έργου του Shaip, την τεχνογνωσία του στην πηγή, τη μεταγραφή και την παράδοση των απαιτούμενων δηλώσεων από ειδικούς γλωσσολόγους σε 13 γλώσσες μέσα σε αυστηρά χρονοδιαγράμματα και με την απαιτούμενη ποιότητα».

Λύση

Με τη βαθιά μας κατανόηση της τεχνητής νοημοσύνης συνομιλίας, βοηθήσαμε τον πελάτη να συλλέξει, να μεταγράψει και να σχολιάσει τα δεδομένα με μια ομάδα ειδικών γλωσσολόγων και σχολιαστών για να εκπαιδεύσουν την πολυγλωσσική Σουίτα Φωνής Επεξεργασίας Λόγου που υποστηρίζεται από AI.

Το εύρος εργασίας για το Shaip περιελάμβανε, αλλά δεν περιοριζόταν στην απόκτηση μεγάλου όγκου δεδομένων εκπαίδευσης ήχου για την αναγνώριση ομιλίας, τη μεταγραφή ηχογραφήσεων σε πολλές γλώσσες για όλες τις γλώσσες στον οδικό χάρτη γλωσσών Tier 1 και Tier 2 και την παράδοση των αντίστοιχων JSON αρχεία που περιέχουν τα μεταδεδομένα. Ο Shaip συνέλεξε εκφράσεις 3-30 δευτερολέπτων σε κλίμακα, διατηρώντας τα επιθυμητά επίπεδα ποιότητας που απαιτούνται για την εκπαίδευση μοντέλων ML για πολύπλοκα έργα.

  • Συλλογή ήχου, μεταγραφή και σχολιασμός: 22,250 ώρες
  • Υποστηριζόμενες γλώσσες: 13 (Δανικά, Κορεάτικα, Αραβικά Σαουδικής Αραβίας, Ολλανδικά, Κινέζικα ηπειρωτικής χώρας & Ταϊβάν, Γαλλικά Καναδά, Μεξικανικά Ισπανικά, Τουρκικά, Χίντι, Πολωνικά, Ιαπωνικά, Ρωσικά)
  • Αριθμός εκφωνήσεων: 7M +
  • Χρονολόγιο: 7-8 μήνες

Πολυγλωσσική σουίτα φωνητικής επεξεργασίας ομιλίας με τροφοδοσία AI

Κατά τη συλλογή ηχητικών εκφωνήσεων στα 16 kHz, εξασφαλίσαμε έναν υγιή συνδυασμό ομιλητών ανά ηλικία, φύλο, εκπαίδευση και διαλέκτους σε διαφορετικά περιβάλλοντα εγγραφής.

Αποτέλεσμα

Τα υψηλής ποιότητας ηχητικά δεδομένα εκφώνησης από ειδικούς γλωσσολόγους έδωσαν τη δυνατότητα στον πελάτη να εκπαιδεύσει με ακρίβεια το πολύγλωσσο μοντέλο αναγνώρισης ομιλίας του σε 13 γλώσσες Global Tier 1 & 2. Με σύνολα δεδομένων εκπαίδευσης χρυσού προτύπου, ο πελάτης μπορεί να προσφέρει έξυπνη και ισχυρή ψηφιακή βοήθεια για την επίλυση μελλοντικών προβλημάτων του πραγματικού κόσμου.

Δεδομένα ήχου εκφώνησης υψηλής ποιότητας

Η εξειδίκευσή μας

Συγκεντρώθηκαν Ώρες Ομιλίας
0 +
Ομάδα Συλλεκτών Φωνητικών Δεδομένων
0
Συμβατό με PII
0 %
Εντυπωσιακός αριθμός
0 +
Αποδοχή & Ακρίβεια Δεδομένων
> 0
Fortune 500 Clientele
0 +

Πείτε μας πώς μπορούμε να βοηθήσουμε με την επόμενη πρωτοβουλία σας για AI.