Jina Code Embeddings 1.5B 是一个紧凑而强大的模型,基于 Qwen2.5-Coder-1.5B 构建,专门针对开发者工作流程进行了微调。 与通用文本模型不同,它理解 15 种以上语言中真实代码的结构和意图,使得精确的 NL→Code、Code→Code、Code→NL 和补全检索成为可能,以及技术 QA 任务。 它处理 32k 上下文,使用最后一个 token 池化,并与 FlashAttention-2 或 SDPA 平滑集成,以实现高速推理。 我们发布了一份完整的逐步指南,帮助您从设置到高质量检索结果,在去中心化 GPU 上端到端地运行和评估该模型。