人工智能代理(Artificial Intelligence Agent)
定义
感知环境、进行决策和执行动作的智能实体
应用
- ABI/GBI 生成式 BI 或是数据分析
- Code Agent 代码助手
- 基于 RAG 技术的知识问答
Coding Agent
aiXcoder 代码大模型在企业的应用实践
语言模型发展历程
- 深度神经网络
- 预训练模型
- 大语言模型 论文
aiXcoder 构建
训练数据收集与筛选
- Github 数据爬取与过滤
- 删除低质量项目
- 相似算法去重
- 去除敏感数据
- 去除注释数据
- 删除语法错误代码
- 删除静态分析缺陷代码
- 代码文件顺序重排
训练
- 任务 随机 Mask 抽象语法树节点
- 存在问题 项目级代码生成下的长序列依赖
测试 更符合真实场景的测评集
基于 CodeFuse 的下一代研发探索
- 数据来源
- Github
- 预训练&微调
- 推理加速&部署
- 发展
- 仓库级代码
大模型落地到代码助手场景的探索实践
- 提示工程
- 基本原理
- 单个、定义明确的任务或问题上
- 说明明确且详细,最好附带示例
- 简明扼要
- 基本原理