人工智能代理(Artificial Intelligence Agent)

AI Agent 深度解析:潜力与挑战并存的智能新世界

定义

感知环境、进行决策和执行动作的智能实体

应用

  • ABI/GBI 生成式 BI 或是数据分析
  • Code Agent 代码助手
  • 基于 RAG 技术的知识问答

Coding Agent

aiXcoder 代码大模型在企业的应用实践

PPT

  • 语言模型发展历程

    • 深度神经网络
    • 预训练模型
    • 大语言模型 论文
  • aiXcoder 构建

    • 训练数据收集与筛选

      • Github 数据爬取与过滤
      • 删除低质量项目
      • 相似算法去重
      • 去除敏感数据
      • 去除注释数据
      • 删除语法错误代码
      • 删除静态分析缺陷代码
      • 代码文件顺序重排
    • 训练

      • 任务 随机 Mask 抽象语法树节点
      • 存在问题 项目级代码生成下的长序列依赖
    • 测试 更符合真实场景的测评集

基于 CodeFuse 的下一代研发探索

PPT > Github

  • 数据来源
    • Github
  • 预训练&微调
  • 推理加速&部署
  • 发展
    • 仓库级代码

大模型落地到代码助手场景的探索实践

PPT

  • 提示工程
    • 基本原理
      • 单个、定义明确的任务或问题上
      • 说明明确且详细,最好附带示例
      • 简明扼要

百度大模型驱动下的智能代码助手提效实践

PPT

RAG技术

深度解析 RAG 技术在大模型时代的原理与实践

概念

Alt text

分类

Alt text

朴素 RAG

  • 步骤
    • 索引: 直接将输入数据向量化
    • 检索: 对向量数据库进行匹配
    • 生成: 最后将输入数据与向量数据库匹配结果共同放入大模型中生成最终结果

高级 RAG

  • 步骤
    • 增加了对数据的预筛选,围绕预检索和后检索提出了多种优化策略

模块化 RAG

  • 步骤
    • 引入多个特定的功能模块和替换现有模块上。
    • 整个过程不仅限于顺序检索和生成,还包括迭代和自适应检索等方法

RAG for Code

Code Generation

  • REDCODER 摘要和代码双向生成
  • APICoder
  • COCOGEN

p