Kimi K2.5
Research Guide

Technische Spezifikationen, Tools und Limits – nur bestätigte Fakten.

Deep Research Agent Swarm

⚠️ Hinweis zu Preisen: Kimi ändert Preise häufig und sie variieren je nach Region (China vs. International). Die genauen aktuellen Preise für Deutschland findest du nur auf kimi.com oder kimi.moonshot.cn.

💰

Preispläne

🆓 Free Tier (Adagio)

Kosten: $0 / 0€
Context: 2M Zeichen (~256K tokens)
Output: 4,000 Zeichen/Antwort
Uploads: 10/Tag
Queue: Mögliche Wartezeit bei Peak Hours
Reicht für: Die meisten akademischen Aufgaben

⚡ Bezahlpläne (Moderato, Allegretto, Vivace)

Namen: Adagio (Free), Moderato, Allegretto, Vivace
Vorteile: Keine Wartezeit, mehr Uploads, API-Zugang
Zahlung: Kreditkarte oder regionale Methoden
Unsicher: Exacte Euro-Preise nicht öffentlich bekannt

Aktion erforderlich: Besuche kimi.com und klicke auf "Pricing" oder "Upgrade" um die aktuellen Preise für deine Region zu sehen.

🎓 Alternative: Self-Hosting

Modelle: Open Source auf HuggingFace (Modified MIT License)
Kosten: Nur Strom + Hardware
Anforderung: GPU oder ausreichend RAM
Tools: vLLM, Ollama, llama.cpp

Ollama Beispiel

ollama run kimi-v1
# oder ähnliche Community-Modelle

🛠️

Tools (Bestätigt)

🔬 Deep Research

Web-Interface: kimi.com (Chat-basiert)
Datenquellen: Web, ArXiv, Google Scholar (bestätigt)
Limit: 10 Tool-Aufrufe pro Antwort (Architektur-Limit)
Output: Markdown, Charts als PNG
Keine Datei-Erstellung: Nur Analyse, keine .docx/.xlsx Generierung hier

🤖 OK Computer (Agent Mode)

Separate URL: kimi.com/agent (nicht im Chat)
Formate: Word, Excel, PowerPoint, HTML (bestätigt)
Limit: ~3 Uses/Tag im Free Tier

💻 Kimi Code CLI

Installation: curl -LsSf https://code.kimi.com/install.sh | bash
Modelle: k2-instruct, k2.5-thinking, k1.5-long-cot
Timeout: 5 Minuten Shell-Ausführung
Limit: 100KB File Read, 1000 Lines

🎛️

Die 4 Modi (Bestätigt)

⚡ Instant

Kein Tool-Zugriff
Schnellste Antwort
Für einfache Fragen

🧠 Thinking

Chain-of-Thought sichtbar
Mathematik & Logik
Langsamer, präziser

🤖 Agent

Tool-Zugriff aktiviert
Web, Python, Search
200-300 Calls möglich

🐝 Swarm Beta

Parallele Agents
Nur in Bezahlplänen
Abhängig von Verfügbarkeit

🚦

Hard Limits (Bestätigt)

⏱️ Timeouts

API: 2 Stunden (technisches Limit)
Shell: 300 Sekunden (5 Min)
Empfohlen: stream=true

🚦 Rate Limits

Free: 60 RPM / 150K TPM
Paid: 120 RPM / 500K TPM
HTTP 429 bei Überschreitung

💾 Files

Max: 1,000 Files / User
Pro File: 100MB
Gesamt: 10GB

👁️ Vision

Max: 4K (4096×2160)
Formate: PNG, JPG, WebP
Max Size: 100MB

Kimi K2.5Research Guide