首页
学习
活动
专区
圈层
工具
发布

#配置

大模型微调完全指南:从显存炸裂到优雅落地

悠悠12138

说白了,当下用大模型最大的痛点就是:它太通用了。OpenAI的GPT、Meta的Llama这些开源模型,确实什么都能做,但对你的特定业务场景来说,那就是"什么都...

700

Codex 5.5 用着用着变笨?先看本地这几个文件

程序员NEO

.codex,也就是 Codex 放本地状态、日志和历史会话的目录。它不只是一个配置文件夹。Codex 用久了以后,里面会持续产生 SQLite 数据库、日志文...

1000

Codex 两个工作模式怎么选:别按职业,按任务

程序员NEO

一个不写代码的人,如果让 Codex 帮忙排查软件报错、整理脚本、检查配置,也需要它把过程说清楚。

900

别再用HTTP调用大模型了,大厂都在用Spring AI?

苏三说技术

最近有位小伙伴问了我一个问题:“三哥,我们现在项目中要接入大模型,我看网上很多教程都是直接用RestTemplate调用OpenAI或者DeepSeek的API...

1100

AutoGen 多智能体实战:Coder、Reviewer、Executor 自动跑完一次代码评审

deephub

下面的示例演示一个双智能体的 AutoGen 配置:AssistantAgent 负责编写一段 Python 数据分析脚本,UserProxyAgent 负责执...

800

告别查文档、蹲社区!基于 DeepSeek+Claude Code 搭建 Doris 专属 AI 专家助手

数据极客圈

长上下文支持:128K 超长窗口,能直接喂给它 Doris 完整日志、建表语句、配置文件,无需拆分,一次读懂。

1500

DeepSpeed v0.19.1 版本更新:性能优化、稳定性修复与关键功能增强全解析

福大大架构师每日一题

DeepSpeed v0.19.1 已于 2026 年 5 月 28 日发布。 这一版本虽然不是“大版本重构”,但从更新内容来看,覆盖面非常广,几乎横跨了 分布...

700

DeepSeek官方出手,19个主流AI工具接入指南合集

Ai学习的老章

亮点是 reasoning effort control——你可以告诉 DeepSeek-V4「这个问题给我深想一下」(reasoningEffort: max...

2500

英伟达推理芯片Rubin CPX或已取消:供应链无订单,蓝图已移除

芯智讯

报道指出,英伟达至今未就Rubin CPX下达GDDR7内存或相关基板的采购与开发需求。过去被视为该产品核心配置的GDDR7内存,也未见实质性动作。

800

9天收获 2.4 万收藏!CodeGraph:让 AI 代码助手效率翻倍,成本直降 35%!

开源星探

这会撤销安装程序的操作——从每个配置的 AI 助手中移除 CodeGraph 的 MCP 服务器配置、指令和权限。你的项目索引(.codegraph/)会保留;...

4600

跑 Agent 一定要买服务器?

renhai

618来了,群里天天有人问:“跑 Agent 要什么配置?”“4 核够不够?”"要不要上 GPU?"然后就是一通推荐链接——阿里云轻量 99 一年、腾讯云新用户...

1100

一个用 YAML 训练和微调 AI 模型的框架,12k star

cxuanAI

ludwig-ai/ludwig https://github.com/ludwig-ai/ludwig

900

一个很火的多 Agent 编排框架

cxuanAI

open-multi-agent/open-multi-agent,https://github.com/open-multi-agent/open-multi...

2900

Token Plan 企业版轻享套餐:刊例价 2 元/百万 Tokens、5000 万起步

gavin1024

摘要: 腾讯云 TokenHub 企业版轻享套餐刊例价 2 元/百万 Tokens、5000 万 Tokens 起步、可选 1–12 个月有效期,采用 Auto...

5410

Terraform 基础设施版本控制:从写配置到上线全流程,这些坑我都替你踩过了

悠悠12138

今天这篇文章,我把自己在实际生产环境中用 Terraform 做基础设施版本控制的经验整理出来,从写 HCL 配置到远程状态管理,从模块化拆分到 CI/CD 集...

7410

数值模式 | WRF 批量实验脚本怎么写

用户11172986

为什么每组实验名前面都保留了一个 OLD 作为基线? 这个习惯很重要。批量对比里必须有一组参考基线,一般是你们课题组之前一直在用的默认配置,或者文献里最常见的组...

7810

如何用AI工具快速开发Obsidian插件:从0到1完整实战

程序那些事儿

作为obsidian的笔记使用者,你是否也曾被Obsidian的某个小功能卡住过?想加个自定义功能,却懒得从头搭环境、写TypeScript?2026年,AI已...

12910

SR-IOV、MR-IOV 与 SIOV:PCIe虚拟化技术的过去、现在与未来

霞姐聊IT

SR-IOV、MR-IOV 和 SIOV 是 PCIe 体系中围绕 I/O 虚拟化演进出的三类重要技术。它们的出发点,都是想通过硬件直通的方式,让虚拟机和容器绕...

17110

普通人在等GPT-5,大佬们在抄这三个Claude配置文件

随机比特

腾讯 | 高级前端工程师 (已认证)

不是什么打破跑分纪录的新大模型,也不是什么炫酷的新一代前端框架,而是——配置文件。

11910

别再写用例了:Skills 正在接管测试工程师

AI智享空间

用 Skills 的方式是这样的:你把状态机的定义(可以是文档、可以是代码里的枚举值、可以是流程图截图)喂给配置了“状态机测试 Skill”的 AI,它会:

28110
领券