OpenStarry Blog

探索 · 学习 · 实践

60+ 篇精选文章,覆盖大模型 API 选型、接入实战、成本优化、国产模型迁移。搜索关键词,快速找到你需要的答案。

全部选型指南 + 效率实战生成模型AI 基础RLHF/对齐AI 前沿工具教程LLM 评估RAG/检索AI Agent训练优化行业分析IDE 接入教程ChatGPT 国内接入Claude 国内接入技术深度成本优化前沿趋势迁移指南平台接入模型解读接入教程IDE 配置Coding Plan场景对比 · 客观评测平台对比 · 重写版对比评测行业洞察安全指南工具对比效率实战选型指南套餐指南
📌 选型指南 + 效率实战

「为什么你的 AI 编程工具不该只绑一个模型」

好模型谁不想一直用?但宕机、限流、成本翻倍的时候,你手里得有替补——多备几个,该上谁上谁,工作才不卡壳。

📅 2026-06-10
生成模型

变分自编码器(VAE)详解:理解生成模型的数学之美

从自编码器出发,深入理解 VAE 的概率框架、重参数化技巧和 ELBO 目标函数,掌握这种优雅的生成模型。

📅 2026-06-09
AI 基础

深入理解 Self Attention:Transformer 的核心机制

从零开始理解 Self Attention 机制的数学原理、计算流程和直觉解释,掌握 Transformer 模型理解语言的核心方式。

📅 2026-06-09
RLHF/对齐

RLHF 详解:用人类反馈强化学习训练更好的语言模型

全面解析 RLHF 的三阶段训练流程(SFT、奖励模型、PPO),理解为什么大语言模型需要人类反馈来对齐。

📅 2026-06-09
AI 前沿

递归语言模型:突破上下文窗口限制的新思路

理解递归语言模型(RLM)如何通过递归处理机制突破传统 Transformer 的上下文窗口限制,实现对超长文本的高效理解。

📅 2026-06-09
RLHF/对齐

PPO 算法详解:RLHF 中的核心优化器

深入理解 PPO 的裁剪机制和稳定性原理,掌握它在 RLHF 中如何平衡探索与利用,避免训练崩溃。

📅 2026-06-09
工具教程

OpenCode 接入指南:配置 OpenStarry 替代 Claude Code 旗舰开源方案

OpenCode 是 Anthropic 投资的开源 AI 编程终端,原生支持 Claude、GPT、GLM 等 75+ 模型。本文详细讲解如何通过 OpenStarry 接入 OpenCode,使用 GLM-5.1、DeepSeek V4、Kimi K2.6 等国产旗舰模型。

📅 2026-06-09
AI 基础

Multi-Head Attention 在 Transformers 中的工作原理

详解多头注意力机制:为什么需要多个注意力头、如何并行计算、以及它如何让模型同时理解语法、语义和上下文关系。

📅 2026-06-09
LLM 评估

LLM 评估方法论:如何科学衡量大模型能力

系统介绍 LLM 评估的核心方法:自动指标、基准测试、人工评估,以及当前评估面临的主要挑战和前沿方向。

📅 2026-06-09
LLM 评估

用 LLM 评估 LLM:大模型裁判的方法与实践

LLM-as-Judge 用强大的语言模型评估其他模型的输出,是当前最流行的自动化评估方法。深入理解其工作原理、偏见问题和最佳实践。

📅 2026-06-09
AI 前沿

JEPA:Yann LeCun 提出的联合嵌入预测架构

深入理解 JEPA 的核心思想:在隐空间中进行预测而非像素空间,以及它为何被认为是通向世界模型的关键路径。

📅 2026-06-09
RAG/检索

向量数据库工作原理:AI 搜索的基础设施

从 Embedding 到 ANN 搜索算法,全面理解向量数据库的核心原理,掌握 HNSW、IVF 等索引技术以及主流向量数据库的选型。

📅 2026-06-09