Πέρα από την Ομιλία

Blog

Issue #10
20/02/2024

Meta & AI

Η Meta τον τελευταίο μήνα μας ανακοινώνει ένα νέο ΑΙ μοντέλο σχεδόν κάθε βδομάδα!  Η ανακοίνωση αυτής της εβδομάδας αφορούσε τα Massively Multilingual Speech (MMS) models της. Πρόκειται για speech-to-text & vice versa μοντέλα, τα οποία υποστηρίζουν 1,100 γλώσσες!

(Ναι είναι πολλές. Ιδίως αν αναλογιστούμε  πως υπάρχουν 7,000 γλώσσες και τα περισσότερα ΑΙ μοντέλα αυτού του είδους αναγνωρίζουν μόλις 100.)

Πώς τα κατάφεραν; Χρησιμοποίησαν την Καινή Διαθήκη ως training data. Η επιλογή αυτή έγινε, διότι η Καινή Διαθήκη έχει τα περισσότερα δημόσια speech data στον κόσμο και είναι μεταφρασμένη σε 1.800 γλώσσες. Και παρόλο που τα models έχουν εκπαιδευθεί με θρησκευτικό περιεχόμενο, αποδίδουν εξαιρετικά και σε μη-θρησκευτικά domains. Μάλιστα σε σύγκριση με το Whisper της OpenAI κάνουν τα μισά λάθη και καλύπτουν 11x γλώσσες.

Τα μοντέλα αυτά είναι ανοιχτά και διαθέσιμα στο GitHub! Γνωρίζοντας πως open source drives innovation, σύντομα θα δούμε τρομέρή πρόοδο στους χώρους που ασχολούνται με την γλώσσα όπως: υπότιτλισμός, μεταφράσεις, localization περιεχομένου και διεθνείς επικοινωνίες

DragGAN

Την Παρασκεύη που μας πέρασε, μια ομάδα ερευνητών δημοσίευσαν ένα paper όπου μας δείχνουν πως έφτιαξαν το DragGAN, μια ΑΙ που τους επιτρέπει να κάνουν edit φωτογραφίες κάνοντας απλά dragging ένα σημείο με το ποντίκι.

Πχ. μπορείς να κάνεις μια γάτα να χασμουργιέται “τραβώντας” το στόμα της ανοιχτό. Μπορεί να φανταστεί και κρυμένα στοιχεία όπως τα δόντια της γάτας.

Αυτή την στιγμή το DragGAN είναι demo και ο προγραμματίζεται για κυκλοφορία τον Ιούνιο. Πραγματικά ανυπομονούμε να δούμε τι θα φτιάξει η open-source community μόλις το πάρει στα χέρια της.

Resources

AI Insider 📰

  1. Το είδαμε, μας άρεσε και το μοιραζόμαστε μαζί σας. Πρόκειται για διαφήμιση της Coca-Cola που κυκλοφόρησε αρχές Μαρτίου και η παραγωγή της συνδυάζει VFX & AI.
  2. H Microsoft πρόσθεσε νέα features στο Bing, συμπεριλαμβανομένου:
    • chat history
    • γραφήματα & οπτικοποίηση δεδομένων
    • export των απαντήσεων του Bing σε PDF ή Word
  3. Η Intel ανακοίνωσε την δημιουργία του Aurora ΑΙ model, το οποίο θα έχει 1 trillion (!) parameters και θα είναι focused στον επιστημονικό κλάδο.
  4. Η Apple είναι σε hiring spree για machine learning specialists.
  5. Η OpenAI κυκλοφόρησε εφαρμογή για το ChatGPT για iOS συσκευές και έπρεπε να παλέξει με χιλιάδες κλόνους της για να φτάσει στα κορυφαία αποτελέσματα. Η εφαρμογή είναι διαθέσιμη μόνο στις ΗΠΑ προς το παρόν. Σίγα σιγά θα γίνει roll out στον υπόλοιπο κόσμο και αναμένουμε για Android app.

Learning Bytes 🧐

  1. Το Bulimia Project θέλοντας να διερευνήσει το ποια ακριβώς είναι τα “ιδανικά σώματα” που προωθούνται στα social media, έδωσε τα εξής prompts σε Dall-E 2, Stable Diffusion και Midjourney:

    • “The ‘perfect’ female body according to social media in 2023”
    • “The ‘perfect’ male body according to social media in 2023”

    Τα ευρήματά τους αποκάλυψαν ότι ένα σημαντικό μέρος των εικόνων που δημιουργούσε η τεχνητή νοημοσύνη απεικόνιζε μη ρεαλιστικά σώματα, αναδεικνύοντας τις επικρατούσες προκαταλήψεις προς ορισμένα σωματικά χαρακτηριστικά, όπως ξανθά μαλλιά για τις γυναίκες και καστανά μαλλιά, γένια και σταρένιο δέρμα για τους άνδρες.

  2. Έρευνα έδειξε πως συχνά ΑΙ detectors “μαρκάρουν” ως AI-generated περιεχόμενο από μη-φυσικούς ομιλητές Αγγλικών. Ανθρώπους δηλαδή που τα Αγγλικά δεν αποτελούν την μητρική τους γλώσσα.

Cool Finds 🤯

Human or Not? , πρόκειται για ένα Turing Game, συνομιλείς με κάποιον για 2′ και προσπαθείς να καταλάβεις αν είναι άνθρωπος ή όχι.

 

Τα λέμε την επόμενη εβδομάδα!💚

#TogetherWeAI

google-PremierPartner-2024
facebook-pic
workplace-pic
agency-pic
social-media-pic

51

Social Media Awards

evo-pic

226

E-volution Awards

peak-pic

29

Peak Performance Marketing Awards

dime-pic

1

Effie Awards