🛠️ Tools 🎛️ Die 4 Modi 💰 Preise 🚦 Limits

Kimi K2.5
Research Guide

Technische Spezifikationen, Tools und Limits – nur bestätigte Fakten.

Deep Research Agent Swarm
⚠️ Hinweis zu Preisen: Kimi ändert Preise häufig und sie variieren je nach Region (China vs. International). Die genauen aktuellen Preise für Deutschland findest du nur auf kimi.com oder kimi.moonshot.cn.
💰

Preispläne

🆓 Free Tier (Adagio)

  • Kosten: $0 / 0€
  • Context: 2M Zeichen (~256K tokens)
  • Output: 4,000 Zeichen/Antwort
  • Uploads: 10/Tag
  • Queue: Mögliche Wartezeit bei Peak Hours
  • Reicht für: Die meisten akademischen Aufgaben

⚡ Bezahlpläne (Moderato, Allegretto, Vivace)

  • Namen: Adagio (Free), Moderato, Allegretto, Vivace
  • Vorteile: Keine Wartezeit, mehr Uploads, API-Zugang
  • Zahlung: Kreditkarte oder regionale Methoden
  • Unsicher: Exacte Euro-Preise nicht öffentlich bekannt
Aktion erforderlich: Besuche kimi.com und klicke auf "Pricing" oder "Upgrade" um die aktuellen Preise für deine Region zu sehen.

🎓 Alternative: Self-Hosting

  • Modelle: Open Source auf HuggingFace (Modified MIT License)
  • Kosten: Nur Strom + Hardware
  • Anforderung: GPU oder ausreichend RAM
  • Tools: vLLM, Ollama, llama.cpp
Ollama Beispiel
ollama run kimi-v1
# oder ähnliche Community-Modelle
🛠️

Tools (Bestätigt)

🔬 Deep Research

  • Web-Interface: kimi.com (Chat-basiert)
  • Datenquellen: Web, ArXiv, Google Scholar (bestätigt)
  • Limit: 10 Tool-Aufrufe pro Antwort (Architektur-Limit)
  • Output: Markdown, Charts als PNG
  • Keine Datei-Erstellung: Nur Analyse, keine .docx/.xlsx Generierung hier

🤖 OK Computer (Agent Mode)

  • Separate URL: kimi.com/agent (nicht im Chat)
  • Formate: Word, Excel, PowerPoint, HTML (bestätigt)
  • Limit: ~3 Uses/Tag im Free Tier

💻 Kimi Code CLI

  • Installation: curl -LsSf https://code.kimi.com/install.sh | bash
  • Modelle: k2-instruct, k2.5-thinking, k1.5-long-cot
  • Timeout: 5 Minuten Shell-Ausführung
  • Limit: 100KB File Read, 1000 Lines
🎛️

Die 4 Modi (Bestätigt)

⚡ Instant

  • Kein Tool-Zugriff
  • Schnellste Antwort
  • Für einfache Fragen

🧠 Thinking

  • Chain-of-Thought sichtbar
  • Mathematik & Logik
  • Langsamer, präziser

🤖 Agent

  • Tool-Zugriff aktiviert
  • Web, Python, Search
  • 200-300 Calls möglich

🐝 Swarm Beta

  • Parallele Agents
  • Nur in Bezahlplänen
  • Abhängig von Verfügbarkeit
🚦

Hard Limits (Bestätigt)

⏱️ Timeouts

  • API: 2 Stunden (technisches Limit)
  • Shell: 300 Sekunden (5 Min)
  • Empfohlen: stream=true

🚦 Rate Limits

  • Free: 60 RPM / 150K TPM
  • Paid: 120 RPM / 500K TPM
  • HTTP 429 bei Überschreitung

💾 Files

  • Max: 1,000 Files / User
  • Pro File: 100MB
  • Gesamt: 10GB

👁️ Vision

  • Max: 4K (4096×2160)
  • Formate: PNG, JPG, WebP
  • Max Size: 100MB