Finalizado

Prya V2

Python Flask Ollama DeepSeek Coder V2 ChromaDB nomic-embed-text

mai. de 2026 — mai. de 2026

Screenshots em breve.

Assistente de código privado e local. Nenhum dado sai da máquina. Sem API keys, sem custos, sem internet.

Funcionalidades

  • Chat com memória persistente entre sessões (salva em JSON)
  • RAG com ChromaDB — indexa documentação local e injeta contexto nas respostas
  • Embeddings via nomic-embed-text (também local, via Ollama)
  • Geração e análise de código Python com streaming em tempo real
  • Syntax highlight com botão copiar
  • Interface web dark mode com paleta #121212 / #94dd5f
  • Rota /indexar para indexar arquivos da pasta dados/
  • Rota /status para verificar estado da indexação

Arquitetura

app/
├── __init__.py   — factory Flask
├── ollama.py     — chamada ao Ollama + injeção de contexto RAG
├── memoria.py    — histórico com janela de 20 msgs + persistência JSON
├── contexto.py   — RAG com ChromaDB + embeddings nomic-embed-text
└── routes.py     — rotas Flask (/chat, /indexar, /status, /limpar)

Stack

CamadaTecnologia
BackendPython / Flask
LLMOllama — DeepSeek Coder V2 (15.7B Q4_0)
RAGChromaDB 1.5+
Embeddingsnomic-embed-text via Ollama API
InterfaceHTML / CSS / JavaScript

Roadmap

VersãoStatusDescrição
V1.0ConcluídoChat com memória + streaming + syntax highlight
V1.1ConcluídoRedesign minimalista — paleta #121212 / #94dd5f
V2.0ConcluídoRAG com ChromaDB + nomic-embed-text
V2.1ConcluídoPersistência real do histórico entre reinicializações
V3.0Projeto separadoCLI agentic multi-linguagem (ver Prya V3)

Observações

Prya roda exclusivamente local por design — sem deploy online. O modelo DeepSeek Coder V2 ocupa ~9.2GB. Com ChromaDB rodando junto, máquinas com menos de 16GB de RAM precisam forçar CPU para evitar estouro de memória. A pasta dados/ é ignorada pelo Git e serve para documentação privada.