lansha0916 发表于 2026-6-4 18:53:04

请教一个 训练大模型掌握一个开发工具 的技术路线

工具的文档有几十个 pdf ,上百 M 。我的目标是让大模型能够掌握这个工具,替我使用这个工具进行开发。

是找一个开源模型然后进行微调,还是用 RAG 方式+文档上传到知识库,或者是否还有其他方法。

多谢多谢!

a197751000 发表于 2026-6-4 19:50:04

可以先试着写成 skill ,看看效果。

xiaobin 发表于 2026-6-4 20:07:04

把你的文档整理成 LLM 友好的文本, 扔进 claude code/codex 的工作区里, 完了
别想着微调了, 不着边的事情, 有多少数据用于微调, 微调又有多少效果, 什么级别的模型, 推理需要多少资源

zengyijun99 发表于 2026-6-4 20:35:22

转成文本,给内容建立好索引,**给各个重点内容添加丰富的解释和示例(这一点很重要)**
使用的时候选择 1M 大模型,让 AI 实时检索和判断

lansha0916 发表于 2026-6-5 00:10:14

多谢建议,我先试试看
页: [1]
查看完整版本: 请教一个 训练大模型掌握一个开发工具 的技术路线