Εβραϊκό σύνολο δεδομένων
ערכת נתונים עברית
Σύνολο δεδομένων γενικής συνομιλίας και podcast Εβραϊκού υψηλής ποιότητας για μοντέλα τεχνητής νοημοσύνης και ομιλίας
Επισκόπηση
Τίτλος (Γλώσσα)
Σύνολο δεδομένων εβραϊκής γλώσσας
Τύποι συνόλων δεδομένων
Γενική Συζήτηση, Δεδομένα Πολυμέσων
Χώρα
Ισραήλ
Περιγραφή
Διατίθενται τηλεφωνικές συνομιλίες χωρίς σενάριο μεταξύ δύο ατόμων στα εβραϊκά από το Ισραήλ, διάρκειας από 15 έως 60 λεπτά, μαζί με αδειοδοτημένα αρχεία ήχου ή βίντεο δημόσιου τομέα, όπως συνεντεύξεις και podcast με 1 έως 5 συμμετέχοντες, διάρκειας επίσης από 15 έως 60 λεπτά.
Χρήση θήκης
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modelling
Λεπτομέρειες συνόλου δεδομένων
| Τύπος συνόλου δεδομένων | Ρυθμός δειγματοληψίας | Ηχεία | Κανάλι | Συνολικές ώρες | Συνολικός αριθμός ομιλητών |
|---|---|---|---|---|---|
| Γενική Συνομιλία | 8 kHz | 2 Ηχεία | Διπλός | 398:47:10 | 814 |
| Δεδομένα πολυμέσων | 16 kHz | Πολλαπλά ηχεία | Mono | 426:14:16 | 885 |
Επιλεγμένοι πελάτες
Ενδυνάμωση των ομάδων για τη δημιουργία κορυφαίων παγκοσμίως προϊόντων AI.
Δεν βρίσκεις αυτό που ψάχνεις?
Νέα σύνολα δεδομένων εκτός ραφιού συλλέγονται σε όλους τους τύπους δεδομένων
Επικοινωνήστε μαζί μας τώρα για να απαλλαγούμε από τις ανησυχίες σας για τη συλλογή δεδομένων εκπαίδευσης ήχου/ομιλίας
Επισκόπηση
Τίτλος
Εβραϊκά Σύνολο δεδομένων γλώσσας
Τύπος συνόλου δεδομένων
Γενική Συνομιλία
Περιγραφή
Μη σενάριο τηλεφωνική συνομιλία μεταξύ δύο ατόμων. Περίπου Διάρκεια ήχου (Εύρος) – 15-60 λεπτά, Εβραϊκά στο Ισραήλ.
Χρήση θήκης
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modelling
Λεπτομέρειες συνόλου δεδομένων
Συνολικές ώρες
399
Ρυθμός δειγματοληψίας
8 kHz
Κανάλι ήχου
Διπλός
Πλατφόρμα ηχογράφησης
Υπολογιστής
Μορφή ήχου
. Wav
Μορφή μεταγραφής
. json
ΕΙΜΑΣΤΕ (%)
5
Δημογραφικά στοιχεία συνόλου δεδομένων
Χώρα
Ισραήλ
Γλώσσα
Εβραϊκά
Φύλο
Γυναίκα 414, Άνδρας 399, Άγνωστο 1
Αριθμός ηχείων
814
Ηλικία
18-50
Επισκόπηση
Τίτλος
Εβραϊκά Σύνολο δεδομένων γλώσσας
Τύπος συνόλου δεδομένων
Podcast
Περιγραφή
Αδειοδοτούμενα αρχεία ήχου/βίντεο δημόσιου τομέα, όπως συνεντεύξεις, podcast κ.λπ. – 1 έως 5 άτομα. Περίπου Διάρκεια ήχου (Εύρος) 15-60 λεπτά.
Χρήση θήκης
ASR, Virtual Assistant, Chatbot, Conversational AI, Speech Analytics, TTS, Language Modelling
Λεπτομέρειες συνόλου δεδομένων
Συνολικές ώρες
427
Ρυθμός δειγματοληψίας
16 kHz
Κανάλι ήχου
Mono
Πλατφόρμα ηχογράφησης
Προμήθεια Ιστού
Μορφή ήχου
. Wav
Μορφή μεταγραφής
. json
ΕΙΜΑΣΤΕ (%)
5
Δημογραφικά στοιχεία συνόλου δεδομένων
Χώρα
Ισραήλ
Γλώσσα
Εβραϊκά
Φύλο
Γυναίκα 361, Άνδρας 513, Άγνωστο 13
Αριθμός ηχείων
887
Ηλικία
18-50