Changes to LLM pricing: Together
Für die Together-Plattform wurden Modellpreisänderungen festgestellt. Weitere Details zu diesen Anpassungen werden unten bereitgestellt.
Für die Together-Plattform wurden Modellpreisänderungen festgestellt. Weitere Details zu diesen Anpassungen werden unten bereitgestellt.
Dieser Artikel kritisiert proprietäre "Walled Garden"-KI-Modelle und analysiert die Preise und die Leistung verschiedener Modelle wie DeepSeek, Qwen, Kimi und GLM. Er hebt DeepSeek V4 Flash für das beste Preis-Leistungs-Verhältnis und Kimi für die Argumentationsfähigkeiten hervor, während er sich für Freiheit einsetzt und auf Apache/MIT-Lizenzen verweist.
GPU Compass, ein Open-Source-Tool, wurde veröffentlicht und bietet Echtzeit-GPU-Preise von über 20 Cloud-Anbietern. Es katalogisiert 50 GPU-Modelle und über 2.000 Angebote, einschließlich On-Demand- und Spot-Preise sowie historische Trends, wodurch die Rohdaten für jeden zugänglich sind.
GitHub Copilot hat ein neues nutzungsbasiertes Preissystem eingeführt, was zu gemischten Reaktionen unter den Nutzern führt. Diese Änderung wirkt sich direkt auf die Kosten für Entwickler aus, die das KI-gestützte Codierungstool verwenden.
Der Inhalt empfiehlt Nutzern, nach der Entfernung von Claude Code aus dem Claude Pro-Plan auf lokale Modelle wie Kimi K2.6 oder Qwen 3.6 35B A3B umzusteigen. Kimi K2.6 wird als kostengünstige Alternative hervorgehoben, die für 20 $ pro Monat einen vergleichbaren Token-Wert wie teurere Pläne bietet.

NVIDIA bereitet angeblich eine Preiserhöhung für die RTX 5090 und möglicherweise weitere RTX 50 und PRO Serien vor, aufgrund steigender GDDR7-Speicherkosten. Diese Nachricht deutet auf eine potenzielle Erhöhung der Preise für die kommenden Grafikkarten des Unternehmens hin.

Dieser Artikel beschreibt einen umfassenden Benchmarking-Prozess von 184 Large Language Model (LLM) APIs, der sich auf die Preis- und Leistungsanalyse der Modelle ab Mai 2026 konzentriert. Er bietet die Perspektive eines Backend-Ingenieurs auf KI-API-Plattformen, einschließlich Global API, um die Modellauswahl und Kosten zu optimieren.
Dieser Inhalt beschreibt den Global API-Dienst, der Zugang zu 184 KI-Modellen mit wettbewerbsfähigen Preisen bietet, wie DeepSeek V4 Flash für 0.25 $/M und GPT-4o. Er hebt Funktionen wie eine 99.9% SLA, 50 kostenlose Anfragen pro Minute und nie ablaufende Credits hervor, sowie Pro Channel-Optionen für fortgeschrittene Anforderungen.
Der Inhalt hebt hervor, dass Deepseek v4 Flash über seine offizielle API unglaublich kostengünstig ist, insbesondere für seine Gewichtsklasse. Dies deutet darauf hin, dass die wettbewerbsfähige Preisgestaltung ein signifikanter, möglicherweise übersehener Aspekt des Modells ist.

Dieser Inhalt vergleicht die Kosten verschiedener KI-Modelle und hebt günstigere Alternativen zu GPT-4o hervor. Es werden erhebliche Einsparungen durch die Verwendung von Modellen wie GPT-4o-mini, DeepSeek V4 Flash und Qwen3-32B untersucht, die bis zu 40-mal kostengünstiger sein können.
Dieser Digest vom 29. Mai 2026 beleuchtet Änderungen im KI-Modellkatalog, wobei DeepSeek V3.2 Speciale entfernt wurde, was Auswirkungen auf kostenempfindliche Workloads hat. Neue Modelle wie StepFun Step 3.7 Flash und Anthropic Claude Opus 4.8 (Fast) und Claude Opus 4.8 wurden hinzugefügt und bieten unterschiedliche Kosten-, Kontext- und Denkgeschwindigkeitsoptionen für verschiedene Unternehmensanforderungen.
Anthropic hat am 21. April 2026 Claude Code kurzzeitig aus seinem Pro-Plan entfernt, ein Schritt, der als Teil einer Reihe von Experimenten betrachtet wird, die auf die wirtschaftlichen Schwierigkeiten des Unternehmens in der Ära der langlebigen Agenten hindeuten. Dieser Artikel analysiert, wie diese Vorfälle zusammenhängen und welche Signale sie an Teams senden, die KI-Codierungstools einführen.
Der Artikel untersucht die Zugänglichkeit und Kosteneffizienz von Open-Source-KI-Modellen über API, wobei deren Preisstrukturen und Leistungsmetriken detailliert beschrieben werden. Ziel ist es, eine vergleichende Analyse bereitzustellen, um Entwicklern bei der Auswahl der am besten geeigneten KI-Lösung für ihre Anforderungen zu helfen.
Der Artikel untersucht die Verschiebung der Preismodelle von Vektordatenbanken, von nutzungsbasierten Modellen hin zur Einführung von Untergrenzen und Mindestbeträgen. Diese Änderung führte zu unerwarteten Kostensteigerungen bei kleinen Arbeitslasten und spiegelt einen breiteren Trend in der SaaS-Landschaft wider.
Anthropic hat Claude Opus 4.7 veröffentlicht, sein bisher leistungsfähigstes Modell mit verbesserter Argumentation, Codierung und Werkzeugnutzung. Der Inhalt beschreibt die Kosten für den direkten API-Zugriff und den Pro-Plan, wobei auch ein günstigerer Zugangspfad für 2 $ pro Monat erwähnt wird.
Anthropic hat Claude Opus 4.7 veröffentlicht, das erhebliche Leistungsverbesserungen aufweist, insbesondere im Bereich Codierung (87,6 % SWE-bench) und Sehen (98,5 % Sehschärfe). Das Update enthält aggressive, brechende API-Änderungen und eine versteckte Preiserhöhung, entgegen den Behauptungen, die Preise seien unverändert geblieben.
Dieser Preisbericht vom 27. Mai 2026 hebt eine Preissenkung von 50% für Qwen3.7 Max hervor, wodurch sowohl Prompt- als auch Completion-Kosten halbiert werden. Auch andere Qwen- und Xiaomi MiMo-Modelle verzeichneten erhebliche Preissenkungen, die Nutzern unterschiedlicher Größenordnungen erhebliche Einsparungen bieten.
Google hat einen neuen 100-Dollar-AI-Ultra-Plan sowie zusätzliche Funktionen und Vorteile für seine Google AI Plus-, Pro- und Ultra-Abonnenten angekündigt. Diese Nachrichten kommen frisch von der I/O 2026.

DeepSeek V4 Pro wurde am 24. April 2026 mit 1.6T Parametern und 1M Kontext-Tokens eingeführt, charakterisiert durch seine Think/Non-Think-Modi und MIT-Lizenz. Es ist für KI-Agenten-Workloads optimiert und bietet eine verbesserte Mehrschrittplanung sowie zuverlässigere Funktionsaufrufe als frühere Versionen zu einem besseren Preis-Leistungs-Verhältnis im Vergleich zu Claude Sonnet 4.6 und GPT-4o.
Der $20/Monat ChatGPT-Abonnementpreis ist für Entwickler in Ländern wie Südafrika, Ägypten, Pakistan und Bangladesch unerschwinglich, da er mehreren Tagen ihres Mindestlohns entspricht. Diese westlich-zentrierte Preisgestaltung wirkt wie eine "Luxussteuer auf das Lernen" und behindert den Zugang zu essenziellen KI-Tools für Entwickler, die maßgeblich zum Technologie-Ökosystem dieser Regionen beitragen.