ΤΕΧΝΟΛΟΓΙΑ

Amazon: Ανοίγει ο δρόμος για τη χρήση φωνητικών βοηθών από την κωφάλαλη κοινότητα

από Επιμέλεια: Μαρία Ψυλλάκη - Δημοσίευση 5 Αυγούστου 2018, 08:18 / Ανανεώθηκε 5 Αυγούστου 2018, 08:57
Amazon: Ανοίγει ο δρόμος για τη χρήση φωνητικών βοηθών από την κωφάλαλη κοινότητα
Facebook Twitter Whatsapp

Αν ο ήχος είναι το μέλλον της τεχνολογίας, τι γίνεται με τους ανθρώπους που δεν έχουν προσβαση σε αυτόν;

Αν ο ήχος είναι το μέλλον της τεχνολογίας, τι γίνεται με τους ανθρώπους που δεν μπορούν να μιλήσουν ή να ακούσουν;

Αυτό σκέφτηκε ο προγραμματιστής Άμπισεκ Σινγκ, ο δημιουργός μιας εφαρμογής που επιτρέπει στην Alexa, την φωνητικό βοηθό της Amazon, να αποκρίνεται στην νοηματική γλώσσα.

Το έργο του κ. Σινγκ χρησιμοποιεί ένα σύστημα με κάμερα που αναγνωρίζει χειρονομίες και τις μεταγλωττίζει σε κείμενο και ομιλία.

Οι μελλοντικές οικιακές συσκευές θα πρέπει να σχεδιάζονται ώστε να εξυπηρετούν και τους κωφούς χρήστες, δηλώνει o προγραμματιστής.

Τα τελευταία χρόνια οι φωνητικοί βοηθοί της Amazon, της Google και της Apple χρησιμοποιούνται όλο και συχνότερα.

Μάλιστα, μελέτη της Smart Audio Report δείχνει ότι η δημοτικότητα έξυπνων ομιλητών (smart speakers) έχει ξεπεράσει στις ΗΠΑ αυτή των έξυπνων τηλεφώνων και των τάμπλετ.

Για την κωφάλαλη κοινότητα όμως, ένα μέλλον όπου η διαχείριση συσκευών γίνεται κυρίως φωνητικά, δημιουργεί προβλήματα.

Η αναγνώριση φωνής σπάνια καταφέρνει να ανιχνεύσει το ρυθμό της φωνής ενός κωφάλαλου χρήστη. Τα προβλήματα ακοής είναι μια ξεκάθαρη πρόκληση για την επικοινωνία μέσω ηχητικών βοηθών.

Το έργο του κ. Σινγκ προσφέρει μια πιθανή λύση, αφού προγραμματίζει την Alexa της Amazon να αποκρίνεται με κείμενο στην Αμερικάνικη Νοηματική Γλώσσα (ASL).

«Αν αυτές οι συσκευές πρόκειται να γίνουν ο βασικός τρόπος αλληλεπίδρασης με το σπίτι μας και εκτέλεσης εργασιών, πρέπει να σκεφτούμε και τους ανθρώπους με προβλήματα ομιλίας και ακοής», δηλώνει ο ίδιος.

 Ο προγραμματιστής εκπαίδευσε ένα σύστημα τεχνητής νοημοσύνης χρησιμοποιώντας το λογισμικό Tensorflow, διαδικασία που περιλάμβανε την εκτέλεση χειρονομιών κατ’ επανάληψη  μπροστά σε μια διαδικτυακή κάμερα για να διδαχθεί το σύστημα τα βασικά της νοηματικής γλώσσας.

Όταν το σύστημα ήταν πλέον σε θέση να αποκρίνεται στις κινήσεις των χεριών του, το συνέδεσε με το λογισμικό της Google που μετατρέπει το κείμενο σε ομιλία, για να διαβάζει τις αντίστοιχες λέξεις φωναχτά.

Το Amazon Echo αντιδρά και η φωνητική του απόκριση αυτόματα μεταγράφεται από τον υπολογιστή σε κείμενο, το οποίο διαβάζεται από τον χρήστη.

Αυτή η λύση είναι μια παράκαμψη, με το λάπτοπ να λειτουργεί ως μεταγλωττιστής μεταξύ του χρήστη και της Alexa.

O κ. Σινγκ όμως λέει ότι «το Amazon Show ή οποιοσδήποτε από τους φωνητικούς βοηθούς που βασίζονται σε κάμερα και οθόνη κάλλιστα μπορούν να ενσωματώσουν αυτή τη λειτουργία».

«Αυτός είναι για ‘μένα ο τελικός στόχος λειτουργίας αυτού του πρωτοτύπου.»

Έχουν υπάρξει, στο παρελθόν, και άλλες προσπάθειες να χρησιμοποιηθεί η τεχνητή νοημοσύνη και η αναγνώριση εικόνας για τη μετάφραση της νοηματικής.

Για παράδειγμα, η Microsoft έχει δοκιμάσει τη χρήση της κάμερας Kinect, που αντιλαμβάνεται την κίνηση, για το σκοπό αυτό, έργο όμως που κατέρρευσε μετά την απόσυρση της Kinect το 2017.

Τρόπους με τους οποίους η τεχνητή νοημοσύνη θα μπορούσε να χρησιμοποιηθεί για να καταγράφει αυτόματα βίντεο χρηστών νοηματικής έχει αναζητήσει και η Nvidia καθώς και η εταιρία λογισμικού μετάφρασης KinTrans.

Η εύρεση όμως ενός κατανοητού τρόπου αυτόματης μεταγραφής της νοηματικής σε κείμενο ή λόγο και το αντίστροφο, διαφεύγει ακόμα από τους ειδικούς.

Ο Τζέφρι Μπίγκαμ, ειδικός στην αλληλεπίδραση ανθρώπου και υπολογιστή από το Πανεπιστήμιο Carnegie Mellon, δηλώνει για το σχέδιο του κ. Σινγκ ότι πρόκειται για μια «εξαιρετική απόδειξη ότι η ιδέα είναι εφικτή», όμως ο σχεδιασμός ενός συστήματος με πλήρη ικανότητα να αναγνωρίζει τη νοηματική είναι δύσκολος «καθώς απαιτεί δυνατότητες όρασης και κατανόησης γλώσσας από τον υπολογιστή που δεν υπάρχουν ακόμα.»

«Η Alexa, βέβαια, ούτε Αγγλικά καταλαβαίνει», προσθέτει, σημειώνοντας ότι οι φωνητικοί βοηθοί καταλαβαίνουν μόνο ένα σχετικά μικρό σύνολο πρότυπων φράσεων.

Η Άιν Τζάκσον του Συνδέσμου Κωφών της Βρετανίας δηλώνει ότι, με την πρόοδο της φωνητικής τεχνολογίας, οι εξελίξεις αφήνουν πίσω τους κωφούς χρήστες νοηματικής.

«Πολλές από αυτές τις εξελίξεις αλλάζουν τον κόσμο και με τις σημαντικές νέες δυνατότητες έχει πλέον οριοθετηθεί πεδίο για πολύ δημιουργικές λύσεις στην πρόσβαση της γλώσσας για τους κωφούς.»

Μιλάει για μια σειρά παρόμοιων έργων, από γάντια ανάγνωσης νοηματικής μέχρι εικονικές αποδόσεις νοηματικής με άβαταρ, αλλά και για τις δυσκολίες να αποδοθεί η γραμματική μιας νοηματικής γλώσσας, που δεν εκφράζεται μόνο με χειρονομίες αλλά και με τη στάση του σώματος και τις κινήσεις του προσώπου.

«Ενθαρρύνουμε τις εταιρίες να κάνουν τις τεχνολογίες τους προσβάσιμες σε όλους και συγχαίρουμε ανθρώπους όπως ο Αμπισεκ Σινγκ που ασχολούνται με αυτό το ζήτημα».

Η Amazon ανακοίνωσε ότι, από σήμερα, περισσότεροι χρήστες της Alexa θα έχουν την επιλογή να ενεργοποιήσουν υπότιτλους σε συσκευές Echo με οθόνη.

Το Alexa Captioning ήταν μέχρι τώρα διαθέσιμο για χρήστες Echo Show και Echo Spot στις ΗΠΑ. H εταιρία διαθέτει τώρα τη λειτουργία σε χρήστες στο HB, καθώς και στη Γερμανία, την Ιαπωνία, την Ινδία, τη Γαλλία, τον Καναδά, την Αυστραλία και τη Νέα Ζηλανδία.

Πηγή: BBC News