Blog Ας μιλήσουμε για το Claude

Ας μιλήσουμε για το Claude

Blog

Issue #20

01/08/2023

Let’s talk about Claude

Πριν 2 βδομάδες περίπου αποκτήσαμε πρόσβαση στο Claude, το AI model της Anthropic και έχουμε περάσει αυτό το διάστημα δοκιμάζοντας το. Αυτές είναι οι πρώτες μας εντυπώσεις. Εν συντομία έχει μεγάλο potential.

Ας το δούμε όμως πιο αναλυτικά.

Όταν θες να τεστάρεις ένα AI μοντέλο, πρέπει να εξετάσεις το πως θα ανταποκριθεί σε μια ποικιλία από queries, τα οποία χωρίζοναι στις εξής κατηγορίες (κάθε toggle list έχει μέσα παραδείγματα από τα αντίστοιχα tasks):

Language Understanding → Pass
Reasoning and Logic → Hardly pass
General Knowledge → Pass
Creativity → Pass
Empathy & Sentiment Analysis → Pass
Math & Computations → Pass, αλλά απαιτεί πιο απαιτιτικό testing
Learning & Adaptation → Pass
Ethical & Moral Dilemmas → Pass
Limit Testing → Pass

Θετικά

Περνάει σε όλες τις κατηγορίες.
- Εκεί που δυσκολεύεται είναι το reasoning στα puzzles, πρόκεται όμως για pain point στα περισσότερα LLMs που είναι διαθέσιμα.
Έχει μεγάλο context window, στα 100k tokens. Μπορείς δηλαδή να του δώσεις εξαιρετικά μεγάλα κείμενα για να τους κάνει ανάλυση.

Αρνητικά

Έχει μεγάλη τάση να φλυαρεί, ακόμα και σε prompts που τυπικά δε το χρειάζονται. Για παράδειγμα μπορούμε να δούμε τι απαντάει το ChatGPT στην ερώτηση “Where is the Eiffel Tower located?” και απαντάει το Claude.
Τα outputs του είναι οκει, αλλά όχι και κάτι το εξωπραγματικό.

Που καταλήγουμε;

Το ανταγωνιστικό πλεονέκτημα του Claude βρίσκεται στο context window που έχει. Ωστόσο, για να μπορέσει να μπεί πραγματικά στο παιχνίδι θα πρέπει να βελτιωθούν αρκετά τα outputs που βγάζει. Επίσης, έχουμε σημαντικές αμφιβολίες για το αν θα μπορεί να συντηρήσει αυτό το context window αν αυξηθεί σημαντικά ο όγκος χρηστών.

Οι ανακοινώσεις της Amazon

Η Amazon έκανε διάφορες ανακοινώσεις την περασμένη εβδομάδα, οπότε πάμε να τις δούμε.

Αρχικά ανακοίνωσε πως σκοπεύει να εισάγει AI agents στο Bedrock (την πλατφόρμα που έχει όπου επιχειρήσεις μπορούν να έχουν πρόσβαση σε AI models, όπως το Claude και το SDXL). Στόχος της είναι να προσφέρει στις επιχειρήσεις agents που θα μπορούν να απαντούν ερωτήσεις για τα data τους και να υλοποιούν διάφορα tasks.

Είναι νωρίς ακόμα, αλλά το να βλέπεις οργανισμούς τέτοιου βεληνηκούς να επενδύουν στα AI agents μας επιβεβαιώνει στο ότι υπάρχει πραγματικό potential.

Επιπλέον, ανακοίνωσε όχι ένα, αλλά δύο ΑΙ εργαλεία για τον τομέα της υγείας.

AWS HealthScribe→ μπορεί να κάνει transcribe τις συζητήσεις γιατρών με ασθενείς, κατανοώντας ποιος μιλάει κάθε φορά και ποιες είναι οι σημαντικές ιατρικές λεπτομέρειες.
AWS HealthImaging → αποθηκεύει και μελετά ιατρικές εικόνες σε μεγάλες ποσότητες, μειώνοντας το κόστος της αποθήκευσης κατα 40%.

Resources

AI Insider 📰

Περίπου 1 μήνα μετά την κυκλοφορία του SDXL 0.9, η Stability AI μας ανακοινώνει το SDXL 1. Σύμφωνα με την ίδια, το SDXL 1 διαχειρίζεται καλύτερα tasks που τυπικά δυσκολεύουν όλα τα AI image models, όπως τα χέρια, κείμενο μέσα στην εικόνα και συνθέσεις που έχουν χωρική διάταξη. Το δοκιμάζεις εδω.
Η OpenAI έχει υποβάλει νέα αίτηση εμπορικού σήματος στο USPTO για το GPT-5, ένα “downloadable computer software for using language model”. Την ίδια περιγραφή είχε δώσει και για το GPT-4.
To Netflix δημοσίευσε αγγελία για Product Manager – Machine Learning Platform με μισθό που μπορεί να φτάσει έως και τα $900,000. Κι αυτό όσο η απεργία συγγραφεών και ηθοποιών ακόμα μαίνεται.
Η ElevenLabs (text-to-speech AI εργαλείο) πρόσθεσε:
- νέο εύρος στο στυλ των φωνών, από ψίθυρο μέχρι ουρλιαχτά
- περισσότερες φωνές με προφορές: Βρετανική, Ιρλανιδική, Ιταλική κ.ο.κ.
Η Meta σκοπεύει να χρεώνει large corps, όπως η Amazon και η Google, που μεταπωλούν τα AI models της.
Η Google φτιάχνει αληθινό Wall-E. Συγκεκριμένα ανακοίνωσε το Robotics Transformer 2 (RT-2) ένα vision-language-action model εκπαιδευμένο σε πληροφορίες και εικόνες από το internet, οι οποίες μπορούν να μεταφραστούν σε πράξεις/ δράσεις για το robot.

Learning Bytes 🧐

Github, Hugging Face κ.α. έστειλαν γράμμα στην Ε.Ε. ζητώντας μεγαλύτερη στήριξη των open-source developments στο AI Act.
Το FraudGPT είναι ένα νέο cybercrime gen AI εργαλείο που κυκλοφορεί στον hacking underground κόσμο.
Ερευνητές από το Carnegie Mellon University ανακάλυψαν πως μπορείς να κάνεις jailbreak τα safety measures των ΑΙ chatbots, όπως το ChatGPT και το Bard. Στην ουσία μπορείς να προσθέσεις ειδικούς χαρακτήρες ή long suffixes στο prompt σου και τα chatbots ενδέχεται να παράξουν harmful περιεχόμενο, όπως ρητορική μίσους και παραπληροφόρηση.
Το 2023 Environmental Report της Google δείχνει πως χρειάστηκε 21.2 τρις λίτρα νερού για το ψύξιμο των data centers και των γραφείων της, εξαιτίας της εστίασης στην ΑΙ. Πρόκειται για 20% αύξηση από την προηγούμενη χρονιά. H Google αναγνωρίζει το πρόβλημα και προσπαθεί να το φτιάξει αξιοποιώντας πιο eco-friendly μεθόδους ψύξης. Ωστόσο, το συγκεκριμένο report μας δίνει μια αρκετά ξεκάθαρη εικόνα των περιβαντολλογικών επιπτώσεων της ΑΙ.