Τα προγράμματα αναγνώρισης φωνής, όπως το Siri της Apple, βελτιώνονται συνεχώς και ενσωματώνονται όλο και περισσότερο στην καθημερινή χρήση συσκευών.

Ωστόσο, πολλές φορές εξακολουθούν να παρουσιάζουν προβλήματα, καθώς η ανθρώπινη ομιλία είναι κάτι που ακόμα και σήμερα είναι «δύσκολο» να αναγνωριστεί από μία μηχανή, λόγω διαφορετικών προφορών, φράσεων και άλλων παραγόντων. Για αυτό και ο Τζέφρι Μπίγκαμ, επιστήμονας υπολογιστών, συνδύασε τα καλύτερα στοιχεία των ανθρώπων και των μηχανών στο Scribe: ένα σύστημα που «ενισχύει» τους υπολογιστές με ανθρώπινη παρουσία, με σκοπό τη γρήγορη παραγωγή υποτίτλων και αποδόσεων/ αντιγράφων.

Οι άνθρωποι είναι σαφώς καλύτεροι από ό,τι οι υπολογιστές στο να καταλαβαίνουν την ανθρώπινη ομιλία, αλλά είναι πιο αργοί στο να την καταγράφουν σε πραγματικό χρόνο. Το εν λόγω πείραμα χρησιμοποιεί αλγορίθμους οι οποίοι καθοδηγούν/συντονίζουν ανθρώπους- εργαζομένους που ακούνε και πληκτρολογούν τμήματα μίας ομιλίας. Οι αλγόριθμοι είναι αρκετά «έξυπνοι» για να «κόβουν» την ομιλία σε κομμάτια, τα οποία επιβραδύνουν και προωθούν σε πολλαπλούς εργαζομένους.

Στη συνέχεια, το Scribe συνδυάζει τα κομμάτια του «παζλ» και παράγει ένα ενιαίο κείμενο- πιθανά λάθη εντοπίζονται χάρη στη σύγκριση σημείων που είναι κοινά μεταξύ των κομματιών. Όπως αναφέρει ο Μπίγκαμ στο ΜΙΤ Technology Review, το σύστημα είναι ικανό να δημιουργήσει ένα κείμενο/υπότιτλο με καθυστέρηση μέχρι και τριών δευτερολέπτων, χρησιμοποιώντας 3-5 εργαζομένους. Το κόστος τους είναι μικρότερο από ό,τι αυτό ενός, φερʼ ειπείν, στενογράφου.