众力资讯网

deephub的文章

百亿参数模型的并行训练:节点内张量并行、节点间数据并行

百亿参数模型的并行训练:节点内张量并行、节点间数据并行

百亿参数模型的并行训练:节点内张量并行、节点间数据并行
DiffusionGemma:用离散文本扩散和双向注意力,把推理瓶颈从内存带宽转移到算力

DiffusionGemma:用离散文本扩散和双向注意力,把推理瓶颈从内存带宽转移到算力

DiffusionGemma:用离散文本扩散和双向注意力,把推理瓶颈从内存带宽转移到算力
微调LocateAnything-3B 实现超高密度的目标检测

微调LocateAnything-3B 实现超高密度的目标检测

微调LocateAnything-3B 实现超高密度的目标检测
10 个 AI 工程师必须掌握的 LangChain & LangGraph 概念

10 个 AI 工程师必须掌握的 LangChain & LangGraph 概念

10 个 AI 工程师必须掌握的 LangChain & LangGraph 概念
Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类

Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类

Flash-KMeans:快速且内存高效的精确 K-Means,可在单张 GPU 进行亿级数据的聚类
​AI Agent的三重记忆机制:打造高可用的多维记忆系统

​AI Agent的三重记忆机制:打造高可用的多维记忆系统

​AI Agent的三重记忆机制:打造高可用的多维记忆系统
相关性与因果性:识别伪相关以提升模型在真实环境的可用性

相关性与因果性:识别伪相关以提升模型在真实环境的可用性

相关性与因果性:识别伪相关以提升模型在真实环境的可用性
2026 年开源 Agent 工具包选型指南:延迟、审计、可移植性与语言栈

2026 年开源 Agent 工具包选型指南:延迟、审计、可移植性与语言栈

2026 年开源 Agent 工具包选型指南:延迟、审计、可移植性与语言栈
Pydantic v2 入门教程:模型、字段、验证器

Pydantic v2 入门教程:模型、字段、验证器

Pydantic v2 入门教程:模型、字段、验证器
Orchestrator 为什么比 Agentic Loop 快:LLM 决策与执行分离的架构解析

Orchestrator 为什么比 Agentic Loop 快:LLM 决策与执行分离的架构解析

Orchestrator 为什么比 Agentic Loop 快:LLM 决策与执行分离的架构解析
手写 Triton Softmax Kernel:程序实例、块大小、mask 与指针算术

手写 Triton Softmax Kernel:程序实例、块大小、mask 与指针算术

手写 Triton Softmax Kernel:程序实例、块大小、mask 与指针算术
Claude Code 调优实操:改完这 10 个设置之后输出质量和效率可以翻倍

Claude Code 调优实操:改完这 10 个设置之后输出质量和效率可以翻倍

Claude Code 调优实操:改完这 10 个设置之后输出质量和效率可以翻倍
Prompt Engineering 的本质:角色、任务、上下文、格式、约束

Prompt Engineering 的本质:角色、任务、上下文、格式、约束

Prompt Engineering 的本质:角色、任务、上下文、格式、约束
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法

视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法

视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法
lat.md:将任意项目代码转换为可查询的知识图谱

lat.md:将任意项目代码转换为可查询的知识图谱

lat.md:将任意项目代码转换为可查询的知识图谱