Συλλογή δεδομένων εκπαίδευσης Wake Word

Δημιουργήστε εφαρμογές φωνής που ακούνε πάντα με προσαρμοσμένα δεδομένα εκπαίδευσης λέξεων αφύπνισης.
Συλλογή δεδομένων εκπαίδευσης Wake word

Επιλεγμένοι πελάτες

Ενδυνάμωση των ομάδων για τη δημιουργία κορυφαίων παγκοσμίως προϊόντων AI.

Amazon
Google
Microsoft
Γνωστική

Δημιουργία μιας πύλης μεταξύ εσάς και των φωνητικών προϊόντων σας με ακριβείς και προσαρμοσμένες λέξεις αφύπνισης και ενισχύοντας τις δυνατότητες ανίχνευσης λέξεων των βοηθών φωνής που θα σας βοηθήσουν να παραμείνετε μπροστά από τον ανταγωνισμό.

Οι βοηθοί φωνής έχουν αλλάξει δραματικά τον τρόπο με τον οποίο οι πελάτες αλληλεπιδρούν με τις συσκευές τους. Έχουν καταστήσει ευκολότερο για τους χρήστες να εξερευνήσουν προϊόντα και υπηρεσίες – γρήγορα και αποτελεσματικά. Ωστόσο, η εφαρμογή φωνής ακούει; Για να βάλετε αυτές τις εφαρμογές σε υψηλή ταχύτητα, πρέπει να ξυπνήσουν και να περάσουν από την παθητική στην ενεργητική ακρόαση με τη βοήθεια του WAKE WORDS. Το «Alexa» και το «Hey Siri» είναι δύο από τις πιο δημοφιλείς λέξεις αφύπνισης στον κόσμο.

Statista

Μέχρι το 2024, προβλέπεται ότι θα φτάσει ο αριθμός των ψηφιακών φωνητικών βοηθών 8.4 δις μονάδες – περισσότερες από τον παγκόσμιο πληθυσμό. 

Αγορές & Αγορές

Το μέγεθος της αγοράς εφαρμογών φωνητικού βοηθού προβλέπεται να αυξηθεί από 2.8 δισεκατομμύρια δολάρια το 2021 σε 11.2 δισεκατομμύρια δολάρια το 2026, με CAGR 32.4%. 

Τι είναι το Wake Word και τα παραδείγματά του 

Μια λέξη αφύπνισης είναι μια συγκεκριμένη λέξη ή φράση όπως "Hey Siri", "Okay Google" και "Alexa". έχει σχεδιαστεί για να ενεργοποιεί μια συσκευή που ενεργοποιείται με φωνή για να ανταποκρίνεται όταν εκφωνείται. Ωστόσο, μια λέξη αφύπνισης που ακούει πάντα και είναι τοπικά ενσωματωμένη στη συσκευή μειώνει δραστικά τον χρόνο απόκρισης και αυξάνει την ακρίβεια αναγνώρισης και επεξεργασίας της αφύπνισης ακόμη και χωρίς σύνδεση στο διαδίκτυο.

Πώς μπορεί να βοηθήσει ο Shaip;

Με τις προσφορές της Shaip που ακούγονται πάντα σε αφύπνιση, τα μοντέλα φωνητικών βοηθών σας είναι πάντα συντονισμένα ώστε να ακούν τη λέξη αφύπνισης, αλλά χωρίς να καταγράφουν ή να μεταδίδουν δεδομένα στο σύννεφο. Η συνεργασία με τη Shaip σας δίνει το πλεονέκτημα της συνεργασίας με ειδικούς. Με την εκτεταμένη εμπειρία μας στη χρήση της τεχνολογίας AI και ML στην ανάπτυξη εκπαίδευσης φωνητικών βοηθών, σας βοηθάμε να εξαλείψετε τους κινδύνους απορρήτου, να βελτιώσετε την εμπειρία χρήστη, να μειώσετε το κόστος ανάπτυξης και να βελτιώσετε την επεκτασιμότητα.

Συλλογή εκφώνησης κειμένου

Πολύτιμες συμβουλές για το πώς να επιλέξετε τις σωστές λέξεις αφύπνισης / να ενεργοποιήσετε τις λέξεις

Επιλέξτε Λέξεις με διαφορετικούς ήχους

Τα διαφορετικά φωνήματα γενικά δημιουργούν μια πιο ευδιάκριτη υπογραφή και εξασφαλίζουν καλύτερη ακρίβεια στα αποτελέσματα. Ως εκ τούτου, επιλέξτε φράσεις στα δεδομένα σας που παράγουν διάφορους ήχους.

Χρησιμοποιήστε ένα κατάλληλο πρόθεμα με τις λέξεις σας

Κάντε τις αφυπνιστικές λέξεις πιο αποτελεσματικές τοποθετώντας τις με προθέματα όπως «Γεια», «Γεια», «Γεια» ή «ΟΚ». Θα διατηρήσει τη λέξη αφύπνισης σαφής και θα διασφαλίσει ότι δεν θα συμβεί τυχαία αντιστοίχιση κατά τη χρήση λέξης ενεργοποίησης σε κανονική ομιλία.

Χρησιμοποιήστε τηλέφωνα για να δημιουργήσετε τις λέξεις ενεργοποίησης σας

Κάντε τις αφυπνιστικές σας λέξεις έναν συνδυασμό τουλάχιστον έξι φωνημάτων που διακρίνονται εύκολα από μια μηχανή και λέγονται εύκολα από τον άνθρωπο. Για παράδειγμα, το "Alexa" έχει έξι φαινόμενα ενώ το "Ok Google" έχει οκτώ φαινόμενα.

Αποφύγετε τη χρήση μιας λέξης

Μην κάνετε το λάθος να χρησιμοποιήσετε μια λέξη ως αφυπνιστική λέξη. Οι λέξεις αφύπνισης πρέπει να είναι αρκετά μεγάλες για να είναι διακριτές.

Απλές & Μοναδικές Λέξεις

Βεβαιωθείτε ότι οι λέξεις ενεργοποίησης που δημιουργείτε πρέπει να είναι απλές και μοναδικές, ώστε να μπορούν να απομνημονεύονται εύκολα.

Αποφύγετε τις μεγάλες φράσεις

Οι μεγαλύτερες φράσεις αφύπνισης πολλών λέξεων είναι δύσκολο να προφέρονται και κάνουν τη διαδικασία αδικαιολόγητα πιο δύσκολη.

Περιορισμοί των δεδομένων εκπαίδευσης του Wake Word

Σύγχυση λόγω χρήσης πολλαπλών εκφωνήσεων

Ένα μοντέλο λέξεων αφύπνισης είναι γενικά εκπαιδευμένο να αναγνωρίζει ένα όχι. διαφορετικών εκφωνήσεων, ώστε να μπορεί να ανταποκρίνεται σε διαφορετικές επικλήσεις. Ωστόσο, η ύπαρξη υπερβολικά πολλών ευδιάκριτων λέξεων αφύπνισης μπορεί απλώς να ενεργοποιήσει τη γραμμή ομιλίας χωρίς να γνωρίζετε ποια έκφραση μίλησε ο χρήστης.

Λιγότερο ακριβή αποτελέσματα λόγω εξωτερικού περιβάλλοντος

Παράγοντες όπως ο θόρυβος, η απόσταση και οι παραλλαγές στις προφορές και τη γλώσσα καθιστούν τον ακριβή εντοπισμό λέξεων-κλειδιών πιο δύσκολο και περίπλοκο για το μοντέλο τεχνητής νοημοσύνης σας.

Δημιουργήστε ακριβείς λέξεις για την επωνυμία σας

Τρένο Τρένο

Η εμπειρία μας στην τεχνολογία φωνής μας βοηθά να αναπτύξουμε γρήγορα προσαρμοσμένες λέξεις αφύπνισης και επώνυμες φράσεις αφύπνισης που ακούγονται πάντα. Με τη φωνητική αναγνώριση σε συνδυασμό με την κατανόηση επεξεργασίας φυσικής γλώσσας, οι αλγόριθμοι ML βοηθούν στη μεταγραφή της ομιλίας και στην αποτελεσματική εκτέλεση φωνητικών εντολών.

Ανάπτυξη
Ανάπτυξη

Εστιάζουμε στην ταχεία ανάπτυξη πρωτότυπων λέξεων αφύπνισης για να διασφαλίσουμε την προσαρμογή της επώνυμης λέξης. Ένα πρωτότυπο λειτουργεί ως απόδειξη της ιδέας και βοηθά στην ακριβή εκπαίδευση, στον ταχύτερο χρόνο διάθεσης στην αγορά, στην επιτάχυνση των δοκιμών και στην εξάλειψη των κινδύνων.

Grow Grow

Ζήστε την αδιάκοπη ανάπτυξη και την απρόσκοπτη αφοσίωση των πελατών με έναν εξαιρετικό φωνητικό βοηθό. Παρέχουμε πολύγλωσσες δυνατότητες αναγνώρισης ομιλίας, έτσι ώστε η εφαρμογή να μπορεί να εντοπίζει με ακρίβεια λέξεις και φράσεις ακόμα και σε περιβάλλοντα υψηλού θορύβου.

Γρήγορη σχεδίαση, ανάπτυξη και ανάπτυξη

Η εκπαίδευση, η ανάπτυξη και η ανάπτυξη προσαρμοσμένων λέξεων αφύπνισης που ακούγονται πάντα δεν χρειάζεται να είναι κουραστική και χρονοβόρα. Με τη σωστή βοήθεια από τους ειδικούς σε θέματα τεχνολογίας της Shaip, μπορείτε να απλοποιήσετε και να μειώσετε αποτελεσματικά τον χρόνο διάθεσης στην αγορά. Επιπλέον, η συλλογή δεδομένων, η επισήμανση και η εμπειρία σχολιασμού μας λειτουργούν προς όφελός σας για να σας προσφέρουν αφυπνιστικές λέξεις εντός εβδομάδων.

Χαρακτηριστικά του Wake Words Training and Deployment 

Προσαρμοσμένες λέξεις αφύπνισης επωνυμίας

Προσαρμοσμένες λέξεις επωνυμίας

Μια επώνυμη λέξη αφύπνισης συνδέεται συχνά με την αξία και την απόδοση. Είναι καιρός να αξιοποιήσετε τα τεράστια πλεονεκτήματα του να λειτουργούν υπέρ σας προσαρμοσμένες επώνυμες λέξεις αφύπνισης. Κατέχετε την επωνυμία σας και αναπτύξτε μια προσαρμοσμένη λέξη αφύπνισης ή μια φράση που προβάλλει την επωνυμία σας με τον καλύτερο δυνατό τρόπο. Στη Shaip, μπορούμε να βοηθήσουμε τους πελάτες σας να χρησιμοποιούν την επωνυμία σας σε κάθε αλληλεπίδραση με επώνυμα ξόρκια με τους βοηθούς φωνής τους.

Εντολή ή φράσεις Spotting

Πέρα από τη λέξη αφύπνισης είναι ο εντοπισμός φράσεων, που επιτρέπει στους χρήστες να χρησιμοποιούν φυσική γλώσσα για να ελέγχουν τις συσκευές τους που ενεργοποιούνται με φωνή. Η Shaip έχει εκτενή εμπειρία βοηθώντας μικρές έως μεγάλες επιχειρήσεις να αναπτύξουν εφαρμογές που μπορούν να επεξεργάζονται μεγάλες φράσεις με μηδενικό λανθάνοντα χρόνο και αυξημένη ακρίβεια.

Εντολή ή φράσεις εντοπισμός
Ενσωματωμένη ανίχνευση φράσεων

Ενσωματωμένη ανίχνευση λέξεων ή φράσεων

Οι προγραμματιστές της Shaip βοηθούν τις επωνυμίες να παρέχουν βελτιωμένη φωνητική εμπειρία στους πελάτες τους παρέχοντας ενσωματωμένο εντοπισμό λέξεων-κλειδιών ή φράσεων. Διασφαλίζουμε απόρρητο, μηδενικό λανθάνον χρόνο και υψηλή ακρίβεια, αφού η τεχνολογία μηχανής wake word επεξεργάζεται τις πολλαπλές λέξεις αφύπνισης μέσα στο πρόγραμμα περιήγησης και όχι στο cloud.

Κατανόηση της Έννοιας της Ποικιλομορφίας Δεδομένων

Τι είναι η Ποικιλομορφία Δεδομένων;

Είναι ένας τρόπος συλλογής κρίσιμων δεδομένων χρήστη, όπως η ταυτότητά τους, η χώρα προέλευσης, η ηλικία, το φύλο, η γλώσσα, οι προφορές κ.λπ. Η ποικιλομορφία δεδομένων χρησιμοποιείται για τη βελτίωση αλγορίθμων προσανατολισμένων στον χρήστη για την επίτευξη πιο ακριβών αποτελεσμάτων.

Τα δεδομένα συνήθως τείνουν να δημιουργούν ενσωματωμένες προκαταλήψεις. Επομένως, όταν συλλέγουμε δεδομένα από διαφορετικές πηγές, η μεροληψία στα αποτελέσματα μειώνεται σημαντικά. 

Ακολουθούν μερικές παράμετροι της ποικιλομορφίας δεδομένων που αντιμετωπίζει ο Shaip κατά τη δημιουργία λέξεων αφύπνισης και άλλων εντολών συνομιλίας.

Ποικιλομορφία δεδομένων
Φυλή και εθνικότηταΙνδουιστές, Μουσουλμάνοι, Χριστιανοί, Αφρικανοί, Ευρωπαίοι
Επίπεδο ΕκπαίδευσηςΠροπτυχιακό, Μεταπτυχιακό, Διδακτορικό, Μεταπτυχιακό
ΧώραΚίνα, Ιαπωνία, Ινδία, Κορέα, Ντουμπάι, Νιγηρία, ΗΠΑ, Καναδάς
ΦύλοΑρσενικό θηλυκό
Ηλικίακάτω από 10 ετών, 10-15, 15-25, 25-45, 45 ετών και άνω
ΓλώσσαΑγγλικά, Ιαπωνικά, Τουρκικά, Κινέζικα, Ταϊλανδέζικα, Χίντι
ΠεριβάλλονΑθόρυβο, Θόρυβο, Μουσική στο παρασκήνιο, Ήχος ή ομιλία στο παρασκήνιο, Εσωτερικός χώρος, Υπαίθριος, Θέατρο, Στάδιο, Καφετέρια, Στο αυτοκίνητο, Γραφείο, Εμπορικό Κέντρο, Θόρυβος στο σπίτι, Σκάλα, Δρόμος/Δρόμος, Παραθαλάσσια (Ανεμώδης)
Προφορές (Αγγλικά)Αγγλικά Σκωτίας, Αγγλικά Ουαλίας, Αγγλικά Χιμπέρνο, Αγγλικά Καναδά, Αγγλικά Αυστραλίας, Αγγλικά Νέας Ζηλανδίας.
Στυλ ομιλίαςγρήγορη / κανονική / αργή ταχύτητα, υψηλή / κανονική / απαλή ένταση, επίσημο / casual κ.λπ.
Θέσεις συσκευώνΧειροκίνητο, Επιτραπέζιο

Βασικές περιπτώσεις χρήσης

Φωνητική αναζήτηση

Προσθέστε φωνητική αναζήτηση σε εφαρμογές για κινητά, ιστότοπους και συσκευές. Βρείτε λέξεις-κλειδιά και φράσεις σε ήχο, βίντεο και ροές.

Αναζήτηση hands-free

Ενεργοποιήστε το λογισμικό σας να παρέχει αποτελέσματα αναζήτησης χωρίς χέρια χρησιμοποιώντας φωνητικές εντολές για να ολοκληρώσετε την επιδιωκόμενη ενέργεια.

φωνητικές εντολές

Προσθέστε φωνητικές εντολές σε συσκευές, κινητές συσκευές ή εφαρμογές ιστού για να βελτιώσετε την εμπειρία του πελάτη.

Ανάλυση ομιλίας

Η end-to-end πλατφόρμα Voice AI τροφοδοτεί το λογισμικό με έξυπνα εργαλεία για να προσφέρει μια εξαιρετική εμπειρία πελάτη.

Γιατί Shaip

Για να αναπτύξετε αποτελεσματικά την πρωτοβουλία AI σας, θα χρειαστείτε μεγάλους όγκους εξειδικευμένων συνόλων δεδομένων εκπαίδευσης. Η Shaip είναι μία από τις ελάχιστες εταιρείες στην αγορά που διασφαλίζει παγκόσμιας κλάσης, αξιόπιστα δεδομένα εκπαίδευσης σε κλίμακα που συμμορφώνονται με τις κανονιστικές απαιτήσεις/ απαιτήσεις του GDPR.

Δυνατότητες συλλογής δεδομένων

Δημιουργήστε, επιμελήστε και συλλέξτε προσαρμοσμένα σύνολα δεδομένων (κείμενο, ομιλία, εικόνα, βίντεο) από 100+ έθνη σε όλο τον κόσμο με βάση προσαρμοσμένες οδηγίες.

Ευέλικτο εργατικό δυναμικό

Αξιοποιήστε το παγκόσμιο εργατικό δυναμικό μας με 30,000+ έμπειρους και διαπιστευμένους συνεργάτες. Ευέλικτη ανάθεση εργασιών και ικανότητα εργατικού δυναμικού σε πραγματικό χρόνο, αποτελεσματικότητα και παρακολούθηση προόδου.

Ποιότητα

Η ιδιόκτητη πλατφόρμα μας και το εξειδικευμένο εργατικό δυναμικό μας χρησιμοποιούν πολλαπλές μεθόδους ποιοτικού ελέγχου για να πληρούν ή να υπερβαίνουν τα πρότυπα ποιότητας που ορίζονται για τη συλλογή συνόλων δεδομένων εκπαίδευσης AI.

Ποικιλόμορφο, ακριβές και γρήγορο

Η διαδικασία μας απλοποιεί, τη διαδικασία συλλογής μέσω της ευκολότερης διανομής εργασιών, διαχείρισης και λήψης δεδομένων απευθείας από τη διεπαφή εφαρμογής και ιστού.

Ασφάλεια Δεδομένων

Διατηρήστε την πλήρη εμπιστευτικότητα των δεδομένων, θέτοντας το απόρρητο προτεραιότητά μας. Διασφαλίζουμε ότι οι μορφές δεδομένων ελέγχονται και διατηρούνται από πολιτική.

Ειδικότητα Τομέα

Επιμελημένα δεδομένα για συγκεκριμένο τομέα που συλλέγονται από πηγές ειδικού κλάδου με βάση τις οδηγίες συλλογής δεδομένων πελατών.

Χρήση τεχνητής νοημοσύνης για τη βελτίωση της επιχειρηματικής απόδοσης μέσω της εμπειρίας των πελατών

Οι λέξεις αφύπνισης είναι οι φράσεις που ενεργοποιούν τα συστήματά σας με δυνατότητα φωνής και τα τοποθετούν σε λειτουργία ακρόασης για να λαμβάνουν οδηγίες από τους χρήστες.

Το όνομα επίκλησης είναι η λέξη-κλειδί που χρησιμοποιείται για να ενεργοποιήσει μια συγκεκριμένη «δεξιότητα» του λογισμικού. Το όνομα επίκλησης μπορεί επίσης να είναι ονόματα ατόμων ή τοποθεσιών και μπορεί να συνδυαστεί με μια ενέργεια, εντολή ή ερώτηση. Όλες οι προσαρμοσμένες δεξιότητες θα πρέπει να έχουν ένα όνομα επίκλησης για να ξεκινήσουν.

Οι εκφωνήσεις είναι φράσεις που χρησιμοποιούνται από τους χρήστες για να υποβάλουν αίτημα στο λογισμικό φωνητικών εντολών σας. Το λογισμικό προσδιορίζει την πρόθεση του χρήστη από τη συγκεκριμένη έκφραση και ανταποκρίνεται περαιτέρω ανάλογα.

Η επεξεργασία φυσικής γλώσσας ή NLP είναι μια σύγκλιση της τεχνητής νοημοσύνης και της υπολογιστικής γλωσσολογίας που είναι υπεύθυνη για τις αλληλεπιδράσεις μεταξύ μηχανών και φυσικών γλωσσών των ανθρώπων. Αξιοποιώντας τους αλγόριθμους NLP, το λογισμικό αναλύει, κατανοεί, αλλάζει ή δημιουργεί φυσική γλώσσα για το μοντέλο AI σας.

Λέξη αφύπνισης, εκφωνήσεις, λέξεις ενεργοποίησης, καυτές λέξεις, λέξεις επίκλησης

 Μια πρόταση είναι μια ομάδα λέξεων που εκφράζει πλήρες νόημα ή μεταφέρει μια ολόκληρη ιδέα. Μια πρόταση θα μπορούσε να είναι απλή, σύνθετη ή σύνθετη στη φύση και μπορεί να εκφραστεί σε γραπτή ή προφορική μορφή. 

Μια εκφορά, από την άλλη πλευρά, είναι μια μονάδα λόγου που συνήθως δεν μεταφέρει ολόκληρο το νόημα ή τη σκέψη και είναι γεμάτη με παύσεις και σιωπές.

Παραδείγματα ομιλιών: 

  1. «Επιτρέψτε μου να σας παρουσιάσω… αυτά είναι τα στατιστικά στην περιοχή»
  2. «Δείξε μου την τελευταία ταινία……αυτή που κυκλοφόρησε την περασμένη εβδομάδα».
  3. «Είναι ανοιχτό τώρα το κατάστημα στην 22η οδό……αυτό που βρίσκεται δίπλα στην τράπεζα;»

Η Alexa διαθέτει πολλά ενσωματωμένα μικρόφωνα που ανιχνεύουν και αναγνωρίζουν τη λέξη αφύπνισης αγνοώντας τους θορύβους του φόντου. Για να αποφευχθούν τα ψευδώς αρνητικά και τα ψευδώς θετικά, η Alexa είναι προγραμματισμένη να ενεργοποιεί την ακοή μόνο αφού εντοπίσει την αφυπνιστική λέξη «Alexa».

Μια λέξη αφύπνισης είναι οποιαδήποτε προγραμματισμένη φράση που αναγκάζει τον βοηθό ομιλίας να αρχίσει να ακούει και να επεξεργάζεται τα αιτήματα του χρήστη. Οποιοσδήποτε βοηθός ομιλίας εκπαιδεύεται σε πραγματικές αλληλεπιδράσεις χρησιμοποιώντας Τεχνητή Νοημοσύνη και επεξεργασία φυσικής γλώσσας στην οποία η ομιλία μετατρέπεται σε φράσεις, λέξεις και ήχους.