Google AI: Ανέπτυξε οπτικοακουστικό μοντέλο για να ξεχωρίζουμε τις φωνές

TELECOM NEWS

Το Facebook έχει δηλώσει στο παρελθόν πως θέλει το Messenger να είναι πολλά περισσότερα από ένα απλό messaging app. Το Messenger μετατρέπεται σε μια πλατφόρμα, η οποία σου δίνει τη δυνατότητα να επικοινωνείς με διάφορους τρόπους, να κάνεις τα δικά σου story, να στέλνεις χρήματα και φυσικά έχει ανοίξει την πόρτα στις διαφημίσεις. Πλέον μέσα από το Messenger οι χρήστες θα μπορούν να παίζουν και παιχνίδια. Το συγκεκριμένο χαρακτηριστικό είχε ανακοινωθεί από τον Νοέμβριο, αλλά ήταν διαθέσιμο μόνο για όσους βρίσκονταν στις ΗΠΑ. Από σήμερα οι 1.2 δισ. χρήστες του Facebook Messenger ανά τον κόσμο θα μπορούν να παίζουν Instant Games. Πλέον υπάρχουν ενσωματωμένα rich gameplay features (όπως turn-based games) και game bots.

PHONEGR ΗΟΤ ΝΕΑ

Η ασύρματη φόρτιση είναι ένα χαρακτηριστικό που έλειπε από τα iPhones, αλλά η Apple την προσέθεσε φέτος σε iPhone X, iPhone 8, iPhone 8 Plus και με το επερχόμενο iOS 11.2 θέλει να κάνει ταχύτερη την διαδικασία φόρτισης. Η ασύρματη φόρτιση μπορεί να είναι πιο βολική από το να χρησιμοποιείς καλώδια αλλά οι χρόνοι είναι μεγαλύτεροι από τους συμβατούς τρόπους φόρτισης. Το νέο χαρακτηριστικό που θα ενεργοποιηθεί στα iPhone X, iPhone 8 και iPhone 8 Plus, είναι βρίσκεται ήδη στο iOS 11.2 beta που είναι διαθέσιμο για τους developers. Οι τρεις συσκευές θα έχουν τη δυνατότητα να υποστηρίζουν Qi wireless chargers έως και 7.5W.

ΝΕΑ ΠΡΟΙΟΝΤΑ

Η Google αποκάλυψε πρόσφατα πληροφορίες για το Pixel Visual Core, ένα μικρό SoC που περιλαμβάνεται στα Pixel 2 και Pixel 2 XL και αναλαμβάνει τη διαδικασία επεξεργασίας φωτογραφιών. Στο πλαίσιο αυτής της ανακοίνωσης, η εταιρεία ανακοίνωσε πως το Android 8.1 Oreo Update και ειδικά η developer preview (MR1) έκδοσή του έρχεται τις επόμενες εβδομάδες. Όπως είναι λογικό, τα Pixel smartphones θα είναι τα πρώτα που θα το υποδεχτούν

ΧΡΗΣΙΜΑ GADGETS

Μπορεί τα νέα μοντέλα iPhone να έχουν κυκλοφορήσει πρόσφατα και η Apple να βρίσκεται στην τελική ευθεία για την κυκλοφορία του iPhone X, ωστόσο δεν ηρεμεί και σε επίπεδο λογισμικού και έτσι έχει δώσει στη διάθεση των χρηστών τη νέα έκδοση του iOS. Ο λόγος για το iOS 11.0.3 update, το οποίο εμφανίζεται ήδη έτοιμο για εγκατάσταση σε iPhone και iPad

Google AI: Ανέπτυξε οπτικοακουστικό μοντέλο για να ξεχωρίζουμε τις φωνές

Η Google αναφέρει πως οι άνθρωποι είναι πολύ καλοί στο να ξεχωρίσουν τη φωνή που θέλουν να ακούσουν με το να στρέψουν την προσοχή τους στην πηγή από την οποία προέρχεται. Η ικανότητα αυτή ονομάζεται “cocktail party effect”, την οποία οι υπολογιστές δε διαθέτουν και για αυτό το λόγο η Google ανέπτυξε ένα τέτοιο οπτικοακουστικό μοντέλο για το διαχωρισμό ομιλίας ανάμεσα σε πολλές στον ίδιο χώρο. Το “cocktail party effect” είναι η ικανότητα του εγκεφάλου να συγκεντρώνεται σε μια ακουστική πηγή σε χώρο που υπάρχουν και άλλες ταυτόχρονα, απομονώνοντας τις υπόλοιπες, όπως όταν βρισκόμαστε σε party και επικεντρώνουμε την προσοχή και την ακουστική μας ικανότητα σε ένα πρόσωπο, αγνοώντας τις ομιλίες των παρευρισκομένων. Ο διαχωρισμός αυτός δεν έχει να κάνει μόνο με το διαχωρισμό της φωνής αλλά και ήχων που ακούγονται ταυτόχρονα και στην ουσία ακούμε αυτόν που επιθυμούμε εμείς. Η Google κατάφερε να παράξει video στο οποίο μπορεί να αυξήσει την ένταση της φωνής σε ορισμένους ανθρώπους που μιλάνε ενώ ταυτόχρονα μειώνει την ένταση σε άλλους που δε θέλουν να ακούγονται.
Η μέθος της Google δουλεύει σε video με το “κανάλι” του ήχου να δίνει τη δυνατότητα στο θεατή του video να επιλέξει ποιόν επιθυμεί να ακούει κατά την αναπαραγωγή του video. Αυτή η μέθοδος μπορεί να έχει εφαρμογή, σύμφωνα με τη Google, σε τηλεδιασκέψεις, στη βελτίωση ανθρώπων με προβλήματα ακοής αλλά και σε περιπτώσεις όπου μιλάνε πολλοί άνθρωποι ταυτόχρονα και πρέπει κάποιος να ακούγεται πιο δυνατά και άλλος πιο χαμηλά.
Η τεχνική αυτή βασίζεται στο συνδιασμό οπτικοακουστικών σημάτων μέσα σε ένα video για να μπορεί να γίνει ο διαχωρισμός της φωνής. Η μέθοδος στη συνέχεια καταγράφει την κίνηση των χειλιών του στόματος και τη συσχετίζει με την ομιλία του, επιτρέποντας να ξεχωρίζει σε ποιόν ομιλητή ανήκει η φωνή που ακούγεται. Για να γίνει η πρακτική αυτής της μεθόδου, η Google χρησιμοποίησε 100.000 υψηλής ποιότητας video με ομιλίες και διαλέξεις από το YouTube και κατάφερε να κάνει “εξαγωγή” καθαρής ομιλίας χωρίς να ακούγεται μουσική και ήχοι από το κοινό που παρακολουθούσε, έτσι ώστε να “εκπαιδεύσει” ένα μοντέλο συνελικτικών νευρωνικών δικτύων για να ξεχωρίσει την ομιλία του καθενός σε ξεχωριστά “κανάλια” ήχου. Αυτά στη συνέχεια αναπαριστώνται με τη μορφή κυματομορφής ήχου και μπορεί ο κάθε χρήστης να δυναμώσει την ένταση της φωνής ενός ομιλητή, απομονώνοντας τους άλλους, όπως εξάλλου φαίνεται και στο παράδειγμα που αναπαριστά το video.

About OMAΔΑ UNWIRED

HOT ΑΡΘΡΑ

phonegr ( 11604 ) news ( 10141 ) tech ( 9423 ) smartphone ( 4428 ) hardware ( 4217 ) τεχνολογία ( 4070 ) ειδήσεις ( 3862 ) gadgets ( 1969 ) mobility ( 1280 ) Android ( 1092 ) apple ( 738 ) LG ( 499 ) HTC ( 476 ) Google ( 423 ) Huawei ( 385 ) internet ( 345 ) microsoft ( 320 ) greece ( 299 ) motorola ( 250 ) fullHD ( 232 ) iphone ( 229 ) tablet ( 210 ) Snapdragon ( 167 ) Lenovo ( 148 ) games ( 137 ) Europe ( 126 ) asus ( 118 ) sonyericsson ( 110 ) Blackberry ( 109 ) Qualcomm ( 106 ) Alcatel ( 105 ) Windowsmobile ( 96 ) facebook ( 96 ) vodafone ( 94 ) HSDPA ( 78 ) 4GLTE ( 71 ) Ελλάδα ( 64 ) Intel ( 63 ) apps ( 60 ) acer ( 59 ) dualSIM ( 59 ) Cosmote ( 58 ) Digitalcamera ( 58 ) CES ( 54 ) amoled ( 49 ) multicpu ( 47 ) multimedia ( 47 ) GPS ( 44 ) Linux ( 38 ) HP ( 32 ) ipad ( 29 ) Dell ( 25 ) hackers ( 25 ) microSD ( 25 ) OLED ( 24 ) wi-fi ( 24 ) 3G ( 22 ) LTE ( 22 ) future ( 19 ) batteries ( 16 ) κινητό ( 16 ) browser ( 15 ) ADSL ( 13 ) toshiba ( 12 ) 3mp ( 10 ) netbooks ( 10 ) AMD ( 9 ) Bluetooth ( 8 ) Computex ( 8 ) microUSB ( 7 ) BT2.0 ( 6 ) MacOS ( 6 ) BTA2DP ( 4 ) INNOV8 ( 3 ) IntelAtom ( 3 ) ipod ( 3 ) mp3player ( 3 ) 900MHZ ( 2 ) CEBIT ( 2 ) iTunes ( 2 ) 3W ( 1 ) 7210 ( 1 ) API ( 1 ) Epixi-907 ( 1 ) IvoryE18 ( 1 )

PHONEGR TECH BLOG

GAMER COMMUNITY

LIVE PHONEGR

FREEGR.GR NETWORK NEA

TELECOM NEWS

ΝΕΑ ΚΙΝΗΤΑ

PHONEGR ΗΟΤ ΝΕΑ

ΝΕΑ ΠΡΟΙΟΝΤΑ

ΧΡΗΣΙΜΑ GADGETS

FACEBOOK PHONEGR

ΜΑΘΕ ΤΟ ΚΑΡΤΟΚΙΝΗΤΟ ΤΩΝ ΦΙΛΩΝ ΣΟΥ

PHONE GR ANDROID APPS

Google AI: Ανέπτυξε οπτικοακουστικό μοντέλο για να ξεχωρίζουμε τις φωνές

About OMAΔΑ UNWIRED

0 σχόλια:

Recent comments

Find Us On Facebook

GAMER COMMUNITY

LIVE PHONEGR

FREEGR.GR NETWORK NEA

TELECOM NEWS

ΝΕΑ ΚΙΝΗΤΑ

PHONEGR ΗΟΤ ΝΕΑ

ΝΕΑ ΠΡΟΙΟΝΤΑ

ΧΡΗΣΙΜΑ GADGETS

FACEBOOK PHONEGR

ΜΑΘΕ ΤΟ ΚΑΡΤΟΚΙΝΗΤΟ ΤΩΝ ΦΙΛΩΝ ΣΟΥ

PHONE GR ANDROID APPS

Google AI: Ανέπτυξε οπτικοακουστικό μοντέλο για να ξεχωρίζουμε τις φωνές

About OMAΔΑ UNWIRED

RELATED POSTS

0 σχόλια:

Find Us On Facebook