← Back to Jobs

Senior AI-Engineer / Agent-Architekt (m/w/d)

Apply to this role
Neurawork GmbH & Co. KGAmpfingFull-time
Posted on January 21, 1970Not specified

<p><strong>NeuraPlox sucht den Engineer, der unsere AI-Agent-Plattform für Enterprise-Kunden in regulierten Branchen baut.</strong><br>

Kein Tutorial-LLM, kein Vibe-Engineering, keine Demo-RAGs, die bei 10k Embeddings auseinanderfallen. Wir bauen explainable AI mit Audit-Lineage, Decision-Provenance und pgvector at scale, weil unsere Kunden ihre KI-Outputs nicht nur erklären wollen, sondern müssen. Investor-backed, München-Region.</p>

<h2>Aufgaben</h2>

<p>Was du bei uns baust</p>

<ul>

<li>Production-grade AI-Agent-Plattform mit PydanticAI, LiteLLM, Langfuse</li>

<li>RAG-Pipelines mit pgvector at scale (Multi-Tenant-Isolation, Index-Rebuild-Strategie, Hybrid Search)</li>

<li>Multi-Tenant Token-Quota-Service plus Eval-Frameworks pro Tenant</li>

<li>MCP (Model Context Protocol) Tool-Integration als First-Class-Citizen</li>

<li>Explainable Outputs, lückenlose Auditierbarkeit von Prompt bis Output für regulierte Branchen</li>

<li>Architektur-Entscheidungen, die im Bank-, Versicherungs- und Pharma-Kontext halten</li>

</ul>

<p>Wie wir arbeiten</p>

<ul>

<li>Eval-driven, nicht Vibe-driven. Jeder Agent-Change geht durch eine Eval-Suite.</li>

<li>ADRs für jede relevante Architektur-Entscheidung, nicht im Slack-Thread vergraben</li>

<li>LLM-Calls werden gemessen, nicht geraten - Langfuse von Tag eins</li>

<li>Re-Ranking, pgvector-Sizing und Retrieval-Quality werden empirisch entschieden</li>

<li>Direkter Draht zum Founding-Team, kein Layer aus Project Managern dazwischen</li>

</ul>

<h2>Qualifikation</h2>

<p>Was wir suchen</p>

<ul>

<li>5+ Jahre Python-Production-Engineering</li>

<li>Echte Production-LLM-Erfahrung mit Tokens, Latenz, Cost und Eval als täglicher Realität</li>

<li>RAG-Engineering mit pgvector-Sizing und Re-Ranking, nicht nur "ich kenne LangChain"</li>

<li>LangGraph, PydanticAI oder vergleichbares Agent-Framework in Produktion eingesetzt</li>

<li>LiteLLM, Langfuse, MCP - oder Bereitschaft, dich in 2 Wochen einzuarbeiten</li>

</ul>

<p>Tech-Stack:<br>

Python, FastAPI, PydanticAI, LangGraph, LiteLLM, Langfuse, pgvector, MCP, Kubernetes-Grundlagen.</p>

<h2>Benefits</h2>

<p>Du willst endlich unter gleichgesinnten, echten Profis an einer richtig performanten Lösung arbeiten - nicht nur was dir von oben aufgedrückt wird. Bei uns arbeitest du nach technischer Best Practices - nicht was im Management gut ankommt. Tolles Team, viel Freiraum bei deiner Arbeit. Du bestimmst, echter Impact!</p>

<p>Was wir bieten</p>

<ul>

<li>VSOP als Investor-backed Startup für Schlüsselpositionen</li>

<li>Voll-remote möglich, Wohnsitz Deutschland - Team-Entwicklungstage ca. 1xMonat im Munich-Office</li>

<li>Du reportest direkt an Christoph Knöll (Founder/CEO) und arbeitest eng mit unserem Head of AI</li>

<li>Senior-Hire für das AI-Layer, du prägst die Agent-Architektur, nicht "tunest Prompts"</li>

</ul>

<p>CV plus 3 Sätze, warum genau diese Rolle. Kein Anschreiben-Template.<br>

Wir lesen jede Bewerbung selbst.</p>

<p>Find <a href="https://www.arbeitnow.com/">Jobs in Germany</a> on Arbeitnow</a>