大疆笔试
基础知识考察
题型分析
- 20230806 题型:10 单选 + 10 多选 + 10 判断
- 2025 题型:一个半小时,20 选择 + 10 多选 + 10 判断
算法
- 数据结构
- 常见排序算法
编程基础
- C++
- Python
- static 的作用
数学原理
对 求导 - 导数:
- 分子布局:
的列向量形式
- 导数:
人工智能神经网络
- CNN
- SVM
- BN
- 池化
- 卷积过程中的乘法次数
- 一个
卷积(step=1,dilation=1) + 2 步长 池化加 卷积(step=1,dilation=1),问等价于步长:8?
模型训练
- Triplet loss 是一种常用于度量学习(metric learning)中的损失函数 Hard triplet 是指那些最难区分的样本对,即正例对之间的距离较大,负例对之间的距离较小。使用全部的 hard triplets 可以帮助模型更有效地学习样本之间的距离关系,从而提高模型的泛化能力和分类性能。在实际应用中,需要注意的是,筛选 hard triplets 会增加计算复杂度,因此在大规模数据集上可能需要使用更高效的筛选策略。
SLAM(Simultaneous Localization and Mapping)
主要任务:定位和构图(机器人所在位置和场景)
LiDAR SLAM:使用激光雷达(LiDAR)数据进行环境感知
LiDAR SLAM 的点线匹配自由度:3 二维空间中的点线匹配,通常考虑的自由度包括平移(x 方向和 y 方向)和旋转(θ),因此总共有 3 个自由度。而在三维空间中,则会增加一个维度的平移和平面外的一个旋转,共6个自由度(三个平移自由度和三个旋转自由度)
LiDAR SLAM 去运动畸变时:利用其他传感器(如 IMU)的同步数据;利用连续几帧点云数据
如何提升重复纹理环境感知能力:(网友答案)我写的是用时域方法以及用更精确的匹配方法
Numpy
a=np.random.randn(3,3)
,b=np.random.randn(3,1)
,c=a*b
,问c
等于:a
形状为(3, 3),b
形状为(3, 1),NumPy 的广播机制将b
扩展到 (3, 3) 形状,然后对a
和b
做逐元素乘法
感受野
- 感受野是指网络中某一层的单个神经元所能够接收到的输入图像区域的大小。在卷积神经网络(CNNs)中,感受野的大小主要由卷积核的大小、步长(stride)、填充(padding)以及网络的深度决定。例如,较大的卷积核或更深的网络会导致更大的感受野,因为每一层都会扩大其对输入图像的感受范围
- ReLu、BN 和 Dropout 不能改变感受野
图像处理基础知识
- 相机知识
- 颜色
- 插值
- 滤波
- 特征提取
- gamma 变换的函数表达式
- 给定一个序列 X 的分布(G(0, 1)),Y 和 X 的关系式,求序列 Y 的方差
- 中值滤波
- 常见边缘提取算子
- 一阶:Sobel 算子、Prewitt 算子、Roberts 算子
- 二阶:Laplacian 算子、Canny 算法
光流估计方法
L-K 光流(Lucas-Kanade 光流)
- 基本假设:相邻帧之间的像素灰度值保持不变(亮度恒定假设)/ 时空和亮度不变性假设
相机
- 图像分辨率缩小一半,内参数发生的变化:除了畸变系数,焦距 fx,fy,和光心 cx,cy 全部减半
- 曝光不变、静止多帧平均是一种技术,用于通过合并多帧相同曝光条件下的图像来减少图像中的噪声。这种方法不能改变图像的动态范围,但它确实有助于提高图像质量,特别是减少噪声
编程考察
题型分析
2025 两道编程(第二题二选一)