两种方案解决Prompt生命周期中不同阶段的问题:RAGAS回答”如何构建”,LangFuse回答”如何管理”。 核心定位差异 两者解决的是Prompt工程链路上不同抽象层次的问题,不存在直接竞争关系。 维度 RAGAS Prompt LangFuse Prompt 定位 ...
LLM 可观测平台的两条路径:Langfuse 与 MLflow 的架构权衡
从 Observation 抽象、语义富化、评估闭环到 Prompt 管理,剖析两种可观测系统的设计哲学与工程取舍
Azure VM 重启后 MinIO 无法访问:NAT 回环问题排查与 iptables 解决方案
分析 Azure VM 使用 1:1 NAT 架构导致的 NAT 回环问题,通过网络层排查定位故障,使用 iptables DNAT 规则实现公网 IP 到本地回环的流量转发。
VuePress 项目的 GitHub Pages 部署实践
基于 GitHub Actions 的 VuePress 静态站点自动化部署方案,涵盖路径配置、工作流设计与常见问题排查。
Qwen-VL 坐标系统偏差的工程解决方案
在 VLM 控件检测场景中,模型输出坐标与原图像素坐标存在系统性偏差。通过实测数据分析和自适应映射策略,解决了不同分辨率图片的坐标对齐问题。
ZeusAI:当强化学习遇上《七大奇迹:对决》
一篇关于 ZeusAI 的论文解读,探讨如何用 AlphaZero 风格的强化学习训练 AI 玩七大奇迹对决,以及 AI 发现的策略洞察和游戏平衡性分析
Python 异步/同步混合架构的陷阱与治理
在 FastAPI + Celery 技术栈中,async/sync 边界模糊会引发协程未 await、事件循环冲突、跨进程通信失效等问题。本文记录一次完整的架构重构过程,包括错误尝试与最终的职责分离方案。
异步 Python 日志持久化:Structlog Processor 与 Service 层方案的工程比较
基于 SQLAlchemy AsyncSession 与 structlog 的日志写入方案对比,涵盖存储引擎选型、连接池管理、asyncio.Queue 缓冲机制、后台 Worker 实现、AOP 切面与 ContextVars 最佳实践及 Grafana Loki 集成
FastAPI 集成 ADFS OAuth 2.0 鉴权:从协议流程到前后端分离架构
基于 Python 3.10+ 与 FastAPI 实现 AD FS OAuth 2.0 Authorization Code Flow,涵盖 python-jose 与 Authlib 的技术选型对比、REDIRECT_URI 架构决策及 Vue 3 前后端分离模式下的最佳实践
LLM 推理中的上下文缓存:隐式与显式两种模式的工程实践
深入解析大模型推理中的 Context Cache 技术,从 KV Cache 复用机制到Radix Attention 数据结构,对比隐式与显式缓存的命中机制与适用场景