AI News KW 10: Telekom droppt KI-Handy, ElevenLabs klont Stimmen perfekt & Alexa wird menschlich!
Shownotes
🎙️ In dieser Episode: Diese Woche ist vollgepackt mit revolutionären Entwicklungen in der Welt der Künstlichen Intelligenz! Nvidia erzielt Rekordumsätze, aber die Aktie fällt – droht eine Blase? Inception Labs präsentiert mit den dLLMs ultraschnelle Diffusions-LLMs, die bis zu 10-mal schneller sind als herkömmliche Modelle.
Amazon startet Alexa+ – mit einer Anthropic-Partnerschaft! Doch wie so oft bleibt die EU außen vor. ElevenLabs setzt mit Voice Cloning 2.0 neue Maßstäbe und lässt uns Stimmen in 30 Sprachen perfekt reproduzieren – inklusive Emotionen und Akzent. Die Telekom stellt ein AI-Phone mit Perplexity AI vor, das komplett ohne Apps auskommt. Und Alibaba überrascht mit einem neuen State-of-the-Art Open-Source Text-to-Video Modell, das bereits jetzt auf Consumer-GPUs läuft.
Und als Bonus: Wie gut sind ChatGPT-4.5 & Claude 3.7 Sonnet beim Pokémon-Spielen? Wir haben es getestet! 🎮🐉
📌 Themen dieser Episode: 📉 Nvidia: Umsatz explodiert – aber was ist mit der Aktie los? Nvidia hat im letzten Quartal seines Geschäftsjahres Rekordumsätze von 39,3 Milliarden Dollar eingefahren – ein Anstieg von 78 % im Vergleich zum Vorjahr. Doch trotz dieses Erfolgs stürzt die Aktie ab. Anleger fürchten eine Überbewertung und mögliche Exportbeschränkungen nach China. Ist die KI-Blase real?
⚡ dLLMs: Das Diffusions-LLM, das alles verändert Inception Labs hat mit der Mercury-Familie von Diffusions-Large-Language-Models (dLLMs) eine neue Ära eingeläutet. Diese Modelle sind bis zu 10-mal schneller als aktuelle LLMs und erreichen auf NVIDIA H100 GPUs eine Geschwindigkeit von über 1000 Tokens pro Sekunde. Besonders bemerkenswert: ✅ Optimiert für Code-Generierung ✅ Schlägt GPT-4o Mini & Claude 3.5 Haiku in Benchmarks ✅ Erzeugt ganze Wortgruppen auf einmal, statt Token für Token
🗣️ Amazon Alexa+: KI wird schlauer – aber nur in den USA Amazon hat Alexa+ vorgestellt, ein verbessertes KI-Erlebnis mit LLM-Integration via Amazon Bedrock. Besonders spannend: ✅ Kostenlos für Prime-Mitglieder, für andere 19,99 USD pro Monat ✅ Anthropic-Partnerschaft für leistungsfähigere KI ✅ Erstmal nur in den USA (wird es jemals nach Europa kommen?)
💰 Anthropic Funding: 3,5 Milliarden für die KI-Revolution Anthropic hat sich eine riesige Finanzierung von 3,5 Milliarden US-Dollar gesichert, wodurch die Unternehmensbewertung auf 61,5 Milliarden US-Dollar steigt. Die Investorenliste liest sich wie das Who’s Who der Tech-Branche: ✅ Lightspeed Venture Partners (Lead) ✅ Bessemer Venture Partners, Cisco, Fidelity, Salesforce Ventures u.v.m.
🎤 ElevenLabs: Perfektes Voice Cloning & AI Dubbing ElevenLabs hat sein neues Multilingual v2 Sprachmodell veröffentlicht, das beeindruckende Features bietet: ✅ Unterstützung für fast 30 Sprachen mit automatischer Erkennung ✅ Voice Cloning: Erstelle eine fast perfekte digitale Kopie deiner Stimme mit nur wenigen Minuten Audio ✅ AI Dubbing: Übersetze Inhalte in andere Sprachen inklusive Emotionen & Intonation – perfekt für internationale Creator
📱 Telekoms KI-Phone: Ein Smartphone ohne Apps? Auf dem MWC in Barcelona hat die Telekom ein KI-Phone mit Perplexity AI vorgestellt. Es verzichtet auf klassische Apps und setzt stattdessen auf eine nahtlose multimodale KI-Interaktion. Integrierte Technologien: ✅ Perplexity AI für schnelle, kontextbasierte Antworten ✅ Google Cloud AI für erweiterte KI-Funktionen ✅ ElevenLabs für nahtlose Sprachsynthese ✅ Picsart für KI-gestützte Bildbearbeitung
Klingt revolutionär – oder einfach nur zu früh für den Massenmarkt?
🎥 Alibaba Wan 2.1: Open-Source Text-to-Video mit Consumer-GPU-Support Alibaba hat mit Wan 2.1 ein State-of-the-Art Text-to-Video-Modell veröffentlicht, das kommerzielle Lösungen in mehreren Benchmarks schlägt. Besonders spannend: ✅ Benötigt nur 8,19 GB VRAM – läuft also auf normalen Consumer-GPUs ✅ Kann ein 5-Sekunden-Video in 480p auf einer RTX 4090 in 4 Minuten generieren ✅ Unterstützt nicht nur Text-zu-Video, sondern auch Bild-zu-Video, Video-Editing, Text-zu-Bild & Video-zu-Audio
💡 Könnte das den Open-Source-Bereich dominieren?
🎮 Bonus: ChatGPT-4.5 & Claude 3.7 Sonnet beim Pokémon-Spielen Wie gut sind die neuen LLMs in Videospielen? Wir haben getestet, wie ChatGPT-4.5 und Claude 3.7 Sonnet sich beim Pokémon-Spielen schlagen. Wer analysiert besser? Wer trifft klügere Entscheidungen?
https://www.inceptionlabs.ai/news
https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence
Neuer Kommentar