Hosted in Germany · DSGVO-konform

Eine KI-Plattform für Dein Unternehmen — komplett in Deutschland.

Multi-LLM-Chat, RAG, Web-Suche, Texte, Workflows, Meeting-Protokolle und geteilte Projekte. Standardmäßig auf Open-Source-Modellen aus unserem deutschen Rechenzentrum — Frontier-Modelle auf Wunsch, DSGVO-konform in der EU verarbeitet.

Multi-LLM-Chat

Open-Source standardmäßig — Frontier-Modelle auf Wunsch.

Sprich pro Anfrage mit dem Modell, das am besten passt. Standardmäßig läuft alles auf selbst-gehosteten Open-Source-Modellen in unserem deutschen Rechenzentrum. Frontier-Modelle wie Claude oder GPT erreichst Du DSGVO-konform in der EU — gleicher Datenschutz, ein Modell-Picker.

  • Llama 3.3, Gemma 4, Mistral Small — selbst-gehostet in Deutschland
  • Frontier (Claude, GPT, Gemini, Perplexity) optional, DSGVO-konform in der EU
  • Pro Konversation Modell wechseln, Web-Suche pro Turn an/aus
  • Bild-Anhänge für vision-fähige Modelle, Voice-Eingabe via Whisper
Selbst-gehostet · DE
Dokumentenanalyse

Frag deine Dokumente — mit Quellenangaben.

Lade PDFs, Word- oder Excel-Dateien hoch. Kasimir extrahiert den Text, zerlegt ihn in Chunks, embeddet sie mit BAAI/bge-m3 (selbst-gehostet) und beantwortet Fragen mit nummerierten Zitaten — direkt aus der Quelle.

  • PDF, DOCX, XLSX, MD, TXT — bis 25 MB pro Datei
  • Embeddings selbst-gehostet (bge-m3, 1024-dim) — kein Drittland-Transfer
  • Antworten mit klickbaren [1][2]-Zitaten, die zur Original-Stelle springen
  • Optional firmenweit oder auf ein Projekt scoped
PDF
12
Web-Suche

Aktuelle Antworten — DSGVO-konform.

Wenn das Modell keinen Trainings-Knowledge hat, ruft es selbst eine Web-Suche auf. Wir betreiben SearXNG-Instanzen in Deutschland — keine Anfrage geht an Google, Bing oder Tavily. Antworten kommen mit Quellen.

  • SearXNG, selbst-gehostet auf search.kasimir.ai
  • Tool-aufruf-Indikator (Suche läuft, Treffer-Anzahl, Quellen)
  • Page-Fetch für die 1–2 vielversprechendsten URLs
  • Pro Turn an/aus — kein Token-Verbrauch wenn nicht gebraucht
Wie ist die Wettervorhersage für München?
[1]
[2]
[3]
In München wird es heute 18°C und sonnig — laut [1].
Texte

Längere Inhalte landen im Sidebar-Editor.

Wenn der KI-Output länger ist (Brief, Bericht, Stellenanzeige), erscheint er nicht inline im Chat — er landet im eingebetteten TipTap-Editor rechts. Du kannst direkt nachbearbeiten, Versionen sehen und als DOCX exportieren.

  • TipTap-WYSIWYG mit Markdown-Roundtripping
  • Versions-History pro Update (LLM oder User)
  • Export als DOCX (echtes Word, kein HTML-Hack)
  • Cross-Chat-referenzierbar, projekt-scoped teilbar
Schreib eine Kündigung
Kündigung
Sidebar-Editor
Workflows + Agenten

Wiederholbare Prozesse — ohne Code.

Bau form-basierte Multi-Step-Workflows: typisierte Eingaben (Text, Auswahl, Boolean), sequenzielle Schritte mit Variablen-Refs, eigene Wissens-Anbindung pro Schritt. Plus persönliche Agenten — vorkonfigurierte Personas mit System-Prompt und eigener Wissensbasis.

  • Variablen-Typen: Text / Long-Text / Auswahl / Boolean
  • Steps referenzieren Inputs und Vorgänger-Outputs
  • Bibliothek mit Vorlagen — Klick zum Klonen
  • Pro Agent eigene Konversationsstarter & Doku-Anbindung
Empfänger
Anlass
Recherche
Entwurf
Polish
Brief fertig — bereit für DOCX-Export
Meeting-Protokolle

Audio rein, Aktionspunkte raus.

Lade eine Aufnahme hoch oder nimm direkt im Browser auf. Whisper-Transkription läuft selbst-gehostet (faster-whisper auf unserem deutschen Server), dann fasst die KI das Meeting zusammen und extrahiert Aktionspunkte mit Verantwortlichen.

  • Whisper selbst-gehostet — keine US-Cloud
  • Sprecher-Labels (A/B/C) automatisch
  • Strukturiertes Protokoll: Themen, Entscheidungen, Action-Items
  • Audio-Datei wird nach Verarbeitung optional gelöscht
A
B
A
Action Items
Hartmann AG — Folge-Termin Q3 vorbereiten
Müller GmbH — Angebot anpassen, Frist Freitag
Projekte

Geteilter Arbeitsraum für Dein Team.

Manche Themen brauchen Kontext, der über einen einzelnen Mitarbeiter hinausgeht. Projekte sind geteilte Arbeitsräume — mit gemeinsamen Chats, Dokumenten, Texten und Meetings. Jede Nachricht trägt sichtbar den Autor.

  • Mitglieder einladen — Autocomplete aus dem Tenant
  • Projekt-Anweisungen (Claude.md-Style) im System-Prompt
  • Eigene Dokumente pro Projekt, plus firmenweite Doku
  • Privater Modus bleibt Standard — Projekt ist opt-in
Können wir den Q3-Bericht für Hartmann zusammenfassen?
Felix Stürmer
Hier sind die Kernpunkte: Umsatz +12,4 %, drei neue Enterprise-Kunden, EBITDA stabil bei 18 %.
Llama 3.3 70B
Top — kannst Du daraus auch eine Folie für Mittwoch bauen?
Peter Fischer
Klar, ich entwerfe drei Varianten — siehe Sidebar-Editor.
Llama 3.3 70B

Warum Unternehmen sich für Kasimir entscheiden

Hosted in Germany

Daten und Modelle laufen ausschließlich in einem deutschen Rechenzentrum. Kein Drittland-Transfer für selbst-gehostete Modelle.

DSGVO-konform

Auftragsverarbeitungsvertrag, Datenminimierung, Recht auf Löschung — alles vertraglich abgesichert.

Open-Source standardmäßig

Llama, Mistral, Gemma 4, DeepSeek — selbst-gehostet auf unserer GPU. Frontier-Modelle nur wenn Du sie willst.

Bring KI sicher in Dein Unternehmen.

Kasimir ist in der geschlossenen Beta. Bewirb Dich jetzt — wir melden uns bei passenden Use Cases.