AI News KW 10: Telekom droppt KI-Handy, ElevenLabs klont Stimmen perfekt & Alexa wird menschlich!

Shownotes

🎙️ In dieser Episode: Diese Woche ist vollgepackt mit revolutionären Entwicklungen in der Welt der Künstlichen Intelligenz! Nvidia erzielt Rekordumsätze, aber die Aktie fällt – droht eine Blase? Inception Labs präsentiert mit den dLLMs ultraschnelle Diffusions-LLMs, die bis zu 10-mal schneller sind als herkömmliche Modelle.

Amazon startet Alexa+ – mit einer Anthropic-Partnerschaft! Doch wie so oft bleibt die EU außen vor. ElevenLabs setzt mit Voice Cloning 2.0 neue Maßstäbe und lässt uns Stimmen in 30 Sprachen perfekt reproduzieren – inklusive Emotionen und Akzent. Die Telekom stellt ein AI-Phone mit Perplexity AI vor, das komplett ohne Apps auskommt. Und Alibaba überrascht mit einem neuen State-of-the-Art Open-Source Text-to-Video Modell, das bereits jetzt auf Consumer-GPUs läuft.

Und als Bonus: Wie gut sind ChatGPT-4.5 & Claude 3.7 Sonnet beim Pokémon-Spielen? Wir haben es getestet! 🎮🐉

📌 Themen dieser Episode: 📉 Nvidia: Umsatz explodiert – aber was ist mit der Aktie los? Nvidia hat im letzten Quartal seines Geschäftsjahres Rekordumsätze von 39,3 Milliarden Dollar eingefahren – ein Anstieg von 78 % im Vergleich zum Vorjahr. Doch trotz dieses Erfolgs stürzt die Aktie ab. Anleger fürchten eine Überbewertung und mögliche Exportbeschränkungen nach China. Ist die KI-Blase real?

⚡ dLLMs: Das Diffusions-LLM, das alles verändert Inception Labs hat mit der Mercury-Familie von Diffusions-Large-Language-Models (dLLMs) eine neue Ära eingeläutet. Diese Modelle sind bis zu 10-mal schneller als aktuelle LLMs und erreichen auf NVIDIA H100 GPUs eine Geschwindigkeit von über 1000 Tokens pro Sekunde. Besonders bemerkenswert: ✅ Optimiert für Code-Generierung ✅ Schlägt GPT-4o Mini & Claude 3.5 Haiku in Benchmarks ✅ Erzeugt ganze Wortgruppen auf einmal, statt Token für Token

🗣️ Amazon Alexa+: KI wird schlauer – aber nur in den USA Amazon hat Alexa+ vorgestellt, ein verbessertes KI-Erlebnis mit LLM-Integration via Amazon Bedrock. Besonders spannend: ✅ Kostenlos für Prime-Mitglieder, für andere 19,99 USD pro Monat ✅ Anthropic-Partnerschaft für leistungsfähigere KI ✅ Erstmal nur in den USA (wird es jemals nach Europa kommen?)

💰 Anthropic Funding: 3,5 Milliarden für die KI-Revolution Anthropic hat sich eine riesige Finanzierung von 3,5 Milliarden US-Dollar gesichert, wodurch die Unternehmensbewertung auf 61,5 Milliarden US-Dollar steigt. Die Investorenliste liest sich wie das Who’s Who der Tech-Branche: ✅ Lightspeed Venture Partners (Lead) ✅ Bessemer Venture Partners, Cisco, Fidelity, Salesforce Ventures u.v.m.

🎤 ElevenLabs: Perfektes Voice Cloning & AI Dubbing ElevenLabs hat sein neues Multilingual v2 Sprachmodell veröffentlicht, das beeindruckende Features bietet: ✅ Unterstützung für fast 30 Sprachen mit automatischer Erkennung ✅ Voice Cloning: Erstelle eine fast perfekte digitale Kopie deiner Stimme mit nur wenigen Minuten Audio ✅ AI Dubbing: Übersetze Inhalte in andere Sprachen inklusive Emotionen & Intonation – perfekt für internationale Creator

📱 Telekoms KI-Phone: Ein Smartphone ohne Apps? Auf dem MWC in Barcelona hat die Telekom ein KI-Phone mit Perplexity AI vorgestellt. Es verzichtet auf klassische Apps und setzt stattdessen auf eine nahtlose multimodale KI-Interaktion. Integrierte Technologien: ✅ Perplexity AI für schnelle, kontextbasierte Antworten ✅ Google Cloud AI für erweiterte KI-Funktionen ✅ ElevenLabs für nahtlose Sprachsynthese ✅ Picsart für KI-gestützte Bildbearbeitung

Klingt revolutionär – oder einfach nur zu früh für den Massenmarkt?

🎥 Alibaba Wan 2.1: Open-Source Text-to-Video mit Consumer-GPU-Support Alibaba hat mit Wan 2.1 ein State-of-the-Art Text-to-Video-Modell veröffentlicht, das kommerzielle Lösungen in mehreren Benchmarks schlägt. Besonders spannend: ✅ Benötigt nur 8,19 GB VRAM – läuft also auf normalen Consumer-GPUs ✅ Kann ein 5-Sekunden-Video in 480p auf einer RTX 4090 in 4 Minuten generieren ✅ Unterstützt nicht nur Text-zu-Video, sondern auch Bild-zu-Video, Video-Editing, Text-zu-Bild & Video-zu-Audio

💡 Könnte das den Open-Source-Bereich dominieren?

🎮 Bonus: ChatGPT-4.5 & Claude 3.7 Sonnet beim Pokémon-Spielen Wie gut sind die neuen LLMs in Videospielen? Wir haben getestet, wie ChatGPT-4.5 und Claude 3.7 Sonnet sich beim Pokémon-Spielen schlagen. Wer analysiert besser? Wer trifft klügere Entscheidungen?

https://www.wsj.com/business/earnings/nvidia-earnings-report-4q-2024-nvda-9de1a075?st=2hykEe&reflink=article_whatsapp_share

https://www.inceptionlabs.ai/news

https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence

https://www.bloomberg.com/news/newsletters/2025-03-02/apple-siri-compared-with-alexa-m4-macbook-air-and-ipad-air-2025-coming-soon-m7rn2k2y

https://www.computerbase.de/news/smartphones/mit-perplexity-ai-telekom-bringt-ki-phone-dieses-jahr-auf-den-markt.91621/

https://t.co/fci4LlX0Na

https://t.co/YQuGKJhOkM

https://huggingface.co/Wan-AI/Wan2.1-T2V-14B

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.