Computer Vision

22+ πιο περιζήτητα σύνολα δεδομένων ανοιχτού κώδικα για το Computer Vision

Ένας αλγόριθμος AI είναι τόσο καλός όσο και τα δεδομένα που τον τροφοδοτείτε.

Δεν είναι ούτε τολμηρή ούτε αντισυμβατική δήλωση. Η τεχνητή νοημοσύνη θα μπορούσε να φαινόταν μάλλον τραβηγμένη πριν από μερικές δεκαετίες, αλλά η Τεχνητή Νοημοσύνη και η Μηχανική Μάθηση έχουν προχωρήσει πολύ από τότε.

Οραματισμός υπολογιστών βοηθά τους υπολογιστές να κατανοούν και να ερμηνεύουν ετικέτες και εικόνες. Όταν εκπαιδεύετε τον υπολογιστή σας χρησιμοποιώντας το σωστό είδος εικόνων, μπορεί να αποκτήσει την ικανότητα να ανιχνεύει, να κατανοεί και να αναγνωρίζει διάφορα χαρακτηριστικά του προσώπου, να ανιχνεύει ασθένειες, να οδηγεί αυτόνομα οχήματα και να σώζει ζωές χρησιμοποιώντας πολυδιάστατη σάρωση οργάνων.

Η αγορά Computer Vision προβλέπεται να φτάσει $ 144.46 δισεκατομμύριο έως το 2028 από ένα μέτριο ποσό 7.04 δισεκατομμυρίων δολαρίων το 2020, αυξανόμενο με CAGR 45.64% μεταξύ 2021 και 2028.

Μερικές από τις περιπτώσεις χρήσης της όρασης υπολογιστή είναι:

  • Ιατρική απεικόνιση
  • Αυτόνομο όχημα
  • Αναγνώριση προσώπου και αντικειμένων
  • Αναγνώριση ελαττώματος
  • Ανίχνευση σκηνής

Η σύνολο δεδομένων εικόνας τροφοδοτείτε και εκπαιδεύετε οι εργασίες Μηχανικής Μάθησης και όρασης υπολογιστή είναι ζωτικής σημασίας για την επιτυχία του έργου σας AI. Ένα σύνολο δεδομένων ποιότητας είναι αρκετά δύσκολο να αποκτηθεί. Ανάλογα με την πολυπλοκότητα του έργου σας, μπορεί να χρειαστούν από μερικές ημέρες έως μερικές εβδομάδες για να λάβετε αξιόπιστα και σχετικά σύνολα δεδομένων για σκοπούς υπολογιστικής όρασης.

Εδώ, σας παρέχουμε μια σειρά (κατηγοριοποιημένη για την ευκολία σας) συνόλων δεδομένων ανοιχτού κώδικα που μπορείτε να χρησιμοποιήσετε αμέσως.

Περιεκτική λίστα συνόλων δεδομένων όρασης υπολογιστή

Γενικά:

  1. IMAGEnet (Σύνδεσμος)

    Το ImageNet είναι ένα ευρέως χρησιμοποιούμενο σύνολο δεδομένων και συνοδεύεται από εκπληκτικά 1.2 εκατομμύρια εικόνες που κατηγοριοποιούνται σε 1000 κατηγορίες. Αυτό το σύνολο δεδομένων οργανώνεται σύμφωνα με την ιεραρχία του WorldNet και κατηγοριοποιείται σε τρία μέρη – τα δεδομένα εκπαίδευσης, τις ετικέτες εικόνων και τα δεδομένα επικύρωσης.

  2. Κινητική 700 (Σύνδεσμος)

    Το Kinetics 700 είναι ένα τεράστιο σύνολο δεδομένων υψηλής ποιότητας με περισσότερα από 650,000 κλιπ από 700 διαφορετικές κατηγορίες ανθρώπινης δράσης. Κάθε μια από τις ομαδικές ενέργειες έχει περίπου 700 βίντεο κλιπ. Τα κλιπ στο σύνολο δεδομένων έχουν αλληλεπιδράσεις ανθρώπου-αντικειμένου και ανθρώπου-ανθρώπου, οι οποίες αποδεικνύονται πολύ χρήσιμες όταν αναγνωρίζονται οι ανθρώπινες ενέργειες στα βίντεο.

  3. CIFAR-10 (Σύνδεσμος)

    Το CIFAR 10 είναι ένα από τα μεγαλύτερα σύνολα δεδομένων υπολογιστικής όρασης που διαθέτει 60000 έγχρωμες εικόνες 32 x 32 που αντιπροσωπεύουν δέκα διαφορετικές κατηγορίες. Κάθε τάξη έχει περίπου 6000 εικόνες που χρησιμοποιούνται για την εκπαίδευση αλγορίθμων όρασης υπολογιστών και μηχανικής μάθησης.

Αναγνώριση προσώπου:

Αναγνώριση προσώπου

  1. Με ετικέτα Πρόσωπα στην άγρια ​​φύση (Σύνδεσμος)

    Το Labeled Faced in the Wild είναι ένα τεράστιο σύνολο δεδομένων που περιέχει περισσότερες από 13,230 εικόνες σχεδόν 5,750 ατόμων που εντοπίστηκαν από το Διαδίκτυο. Αυτό το σύνολο δεδομένων προσώπων έχει σχεδιαστεί για να διευκολύνει τη μελέτη της ανίχνευσης χωρίς περιορισμούς.

  2. CASIA WebFace (Σύνδεσμος)

    Το CASIA Web face είναι ένα καλά σχεδιασμένο σύνολο δεδομένων που βοηθά τη μηχανική μάθηση και την επιστημονική έρευνα για την απεριόριστη αναγνώριση προσώπου. Με περισσότερες από 494,000 εικόνες σχεδόν 10,000 πραγματικών ταυτοτήτων, είναι ιδανικό για εργασίες αναγνώρισης προσώπου και επαλήθευσης.

  3. Σύνολο δεδομένων UMD Faces (Σύνδεσμος)

    Το UMD αντιμετωπίζει ένα καλά σχολιασμένο σύνολο δεδομένων που περιέχει δύο μέρη – στατικές εικόνες και καρέ βίντεο. Το σύνολο δεδομένων έχει περισσότερους από 367,800 σχολιασμούς προσώπων και 3.7 εκατομμύρια σχολιασμένα καρέ βίντεο θεμάτων.

Αναγνώριση χειρογράφου:

  1. Βάση δεδομένων MNIST (Σύνδεσμος)

    Το MNIST είναι μια βάση δεδομένων που περιέχει δείγματα χειρόγραφων ψηφίων από το 0 έως το 9 και διαθέτει 60,000 και 10,000 εικόνες εκπαίδευσης και δοκιμής. Το MNIST που κυκλοφόρησε το 1999 διευκολύνει τη δοκιμή συστημάτων επεξεργασίας εικόνας στο Deep Learning.

  2. Σύνολο δεδομένων τεχνητών χαρακτήρων (Σύνδεσμος)

    Το σύνολο δεδομένων τεχνητών χαρακτήρων είναι, όπως υποδηλώνει το όνομα, τεχνητά δημιουργημένα δεδομένα που περιγράφουν τη δομή της αγγλικής γλώσσας με δέκα κεφαλαία γράμματα. Έρχεται με περισσότερες από 6000 εικόνες.

Ας συζητήσουμε σήμερα την απαίτησή σας για δεδομένα εκπαίδευσης AI.

Ανίχνευση αντικειμένων:

  1. MS COCO (Σύνδεσμος)

    Το MS COCO ή Common Objects in Context είναι ένα σύνολο δεδομένων ανίχνευσης αντικειμένων και υποτίτλων.

    Διαθέτει περισσότερες από 328,000 εικόνες με ανίχνευση σημείων κλειδιού, ανίχνευση πολλών αντικειμένων, υπότιτλους και σχολιασμούς μάσκας τμηματοποίησης. Έρχεται με 80 κατηγορίες αντικειμένων και πέντε λεζάντες ανά εικόνα.

  2. LSUN(Σύνδεσμος)

    Το LSUN, συντομογραφία του Large-scale Scene Understanding, έχει περισσότερες από ένα εκατομμύριο ετικέτες εικόνων σε 20 κατηγορίες αντικειμένων και 10 σκηνών. Ορισμένες κατηγορίες έχουν σχεδόν 300,000 εικόνες, με 300 εικόνες ειδικά για επικύρωση και 1000 εικόνες για δεδομένα δοκιμής.

  3. Αρχική Αντικείμενα(Σύνδεσμος)

    Το σύνολο δεδομένων Home Objects περιέχει σχολιασμένες εικόνες τυχαίων αντικειμένων από όλο το σπίτι – κουζίνα, σαλόνι και μπάνιο. Αυτό το σύνολο δεδομένων έχει επίσης μερικά σχολιασμένα βίντεο και 398 μη σχολιασμένες φωτογραφίες σχεδιασμένες για δοκιμή.

Αυτοκίνητο:

  1. Δεδομένα αστικό τοπίο (Σύνδεσμος)

    Το Cityscape είναι το σύνολο δεδομένων στο οποίο μπορείτε να μεταβείτε όταν αναζητάτε διάφορες ακολουθίες βίντεο που έχουν εγγραφεί από σκηνές δρόμου πολλών ανακοινώσεων. Αυτές οι εικόνες τραβήχτηκαν για μεγάλο χρονικό διάστημα και σε διαφορετικές καιρικές συνθήκες και συνθήκες φωτός. Οι σχολιασμοί είναι για 30 κατηγορίες εικόνων χωρισμένες σε οκτώ διαφορετικές κατηγορίες.

  2. Barkley Deep Drive (Σύνδεσμος)

    Το Barkley DeepDrive έχει σχεδιαστεί ειδικά για εκπαίδευση αυτόνομων οχημάτων και έχει περισσότερες από 100 χιλιάδες σχολιασμένες ακολουθίες βίντεο. Είναι ένα από τα πιο χρήσιμα δεδομένα εκπαίδευσης για αυτόνομα οχήματα λόγω των μεταβαλλόμενων συνθηκών δρόμου και οδήγησης.

  3. Μύτιλος (Σύνδεσμος)

    Το Mapillary έχει πάνω από 750 εκατομμύρια σκηνές και σήματα κυκλοφορίας παγκοσμίως, κάτι που είναι πολύ χρήσιμο για την εκπαίδευση μοντέλων οπτικής αντίληψης στη μηχανική μάθηση και στους αλγόριθμους AI. Σας επιτρέπει να αναπτύξετε αυτόνομα οχήματα που καλύπτουν διάφορες συνθήκες φωτισμού και καιρικές συνθήκες και απόψεις.

Ιατρική απεικόνιση:

  1. Σύνολο δεδομένων ανοικτής έρευνας Covid-19 (Σύνδεσμος)

    Αυτό το αρχικό σύνολο δεδομένων έχει περίπου 6500 εικονοστοιχεία πολυγωνικών τμημάτων πνευμόνων σχετικά με τις ακτινογραφίες θώρακα AP/PA. Επιπλέον, είναι διαθέσιμες 517 εικόνες ακτινογραφιών ασθενών με Covid-19 με ετικέτες που περιέχουν το όνομα, την τοποθεσία, τα στοιχεία εισαγωγής, την έκβαση και άλλα.

  2. Βάση δεδομένων NIH 100,000 ακτινογραφιών θώρακος (Σύνδεσμος)

    Η βάση δεδομένων NIH είναι ένα από τα πιο εκτεταμένα δημόσια διαθέσιμα σύνολα δεδομένων που περιέχει 100,000 εικόνες ακτινογραφιών θώρακος και σχετικά δεδομένα χρήσιμα για την επιστημονική και ερευνητική κοινότητα. Έχει ακόμη και εικόνες ασθενών με προχωρημένες πνευμονικές παθήσεις.

  3. Άτλας Ψηφιακής Παθολογίας (Σύνδεσμος)

    Ο Atlas of Digital Pathology προσφέρει πολλές ιστοπαθολογικές εικόνες επιθεμάτων, περισσότερες από 17,000 συνολικά, από σχεδόν 100 σχολιασμένες διαφάνειες διαφορετικών οργάνων. Αυτό το σύνολο δεδομένων είναι χρήσιμο για την ανάπτυξη λογισμικού υπολογιστικής όρασης και αναγνώρισης προτύπων.

Αναγνώριση σκηνής:

Αναγνώριση σκηνής

  1. Αναγνώριση σκηνής εσωτερικού χώρου (Σύνδεσμος)

    Το Indoor Scene Recognition είναι ένα σύνολο δεδομένων υψηλής κατηγοριοποίησης με σχεδόν 15620 εικόνες αντικειμένων και τοπίων εσωτερικών χώρων που θα χρησιμοποιηθούν στη μηχανική εκμάθηση και στην εκπαίδευση δεδομένων. Έρχεται με περισσότερες από 65 κατηγορίες και κάθε κατηγορία έχει τουλάχιστον 100 εικόνες.

  2. xΠροβολή (Σύνδεσμος)

    Ως ένα από τα πιο γνωστά δημόσια διαθέσιμα σύνολα δεδομένων, το xView περιέχει τόνους σχολιασμένων εικόνων από διάφορες σύνθετες και μεγάλες σκηνές. Έχοντας περίπου 60 κλάσεις και περισσότερες από ένα εκατομμύριο περιπτώσεις αντικειμένων, ο σκοπός αυτού του συνόλου δεδομένων είναι να παρέχει καλύτερη ανακούφιση από καταστροφές χρησιμοποιώντας δορυφορικές εικόνες.

  3. Μέρη (Σύνδεσμος)

    Το Places, ένα σύνολο δεδομένων που συνεισφέρει το MIT, έχει πάνω από 1.8 εκατομμύρια εικόνες από 365 διαφορετικές κατηγορίες σκηνών. Υπάρχουν περίπου 50 εικόνες σε καθεμία από αυτές τις κατηγορίες για επικύρωση και 900 εικόνες για δοκιμή. Είναι δυνατή η εκμάθηση χαρακτηριστικών βαθιάς σκηνής για τη δημιουργία εργασιών αναγνώρισης σκηνής ή οπτικής αναγνώρισης.

Διασκέδαση:

  1. Σύνολο δεδομένων IMDB WIKI (Σύνδεσμος)

    IMDB – Το Wiki είναι μια από τις πιο δημοφιλείς δημόσιες βάσεις δεδομένων προσώπων με επαρκείς ετικέτες με ηλικία, φύλο και ονόματα. Έχει επίσης περίπου 20 χιλιάδες πρόσωπα διασημοτήτων και 62 χιλιάδες από τη Wikipedia.

  2. Διάσημα πρόσωπα (Σύνδεσμος)

    Το Celeb Faces είναι μια μεγάλης κλίμακας βάση δεδομένων με 200,000 σχολιασμένες εικόνες διασημοτήτων. Οι εικόνες συνοδεύονται από θόρυβο φόντου και παραλλαγές πόζας, γεγονός που τις καθιστά πολύτιμες για την εκπαίδευση σετ δοκιμών σε εργασίες όρασης υπολογιστή. Είναι εξαιρετικά ωφέλιμο για την επίτευξη υψηλότερης ακρίβειας στην αναγνώριση προσώπου, την επεξεργασία, τον εντοπισμό τμημάτων του προσώπου και πολλά άλλα.

Τώρα που έχετε μια τεράστια λίστα με σύνολα δεδομένων εικόνων ανοιχτού κώδικα για να τροφοδοτήσετε τον μηχανισμό τεχνητής νοημοσύνης σας. Το αποτέλεσμα των μοντέλων τεχνητής νοημοσύνης και μηχανικής εκμάθησης εξαρτάται κυρίως από την ποιότητα των συνόλων δεδομένων που τροφοδοτείτε και τα εκπαιδεύετε. Εάν θέλετε το μοντέλο τεχνητής νοημοσύνης σας να δημιουργεί ακριβείς προβλέψεις, χρειάζεται ποιοτικά σύνολα δεδομένων που συγκεντρώνονται, επισημαίνονται και επισημαίνονται στην εντέλεια. Για να ενισχύσετε την επιτυχία του συστήματος όρασης υπολογιστή σας, πρέπει να χρησιμοποιήσετε ποιοτικές βάσεις δεδομένων εικόνων που σχετίζονται με το όραμα του έργου σας. Αν ψάχνετε για περισσότερα τέτοια σύνολα δεδομένων Click Here

κοινωνική Share

Μπορεί να σου αρέσει επίσης