1.对深度学习相关神经网络理解深入,如 DNN、CNN、RNN、GAN 等; 2.有深厚的理论研究背景和数据基础,熟悉 EM、MCMC、LR、LDA、PCA、时间序列等数学方法; 4.熟悉一种以上的深度学习的开源框架,如 Caffe、TensorFlow、ARMAILibrary、SNPE、OpenGLES 等。
1.对深度学习相关神经网络理解深入,如 DNN、CNN、RNN、GAN 等; 2.有深厚的理论研究背景和数据基础,熟悉 EM、MCMC、LR、LDA、PCA、时间序列等数学方法; 4.熟悉一种以上的深度学习的开源框架,如 Caffe、TensorFlow、ARMAILibrary、SNPE、OpenGLES 等。
2015 年提出,首次将卷积神经网络应用于像素级分类,开创了端到端语义分割的先河。FCN 将最后几层全连接层替换为卷积层,允许任意大小的输入图像,并通过上采样(反卷积)恢复分割图的分辨率。
特别适用于医学图像分割,其特征是编码器-解码器结构,解码器层与编码器层之间有跳跃连接,用以恢复细节信息。
基于 VGG 网络,改进了 FCN 的上采样部分,使用了编码器-解码器结构,其中解码器的上采样层使用了编码器的池化索引来恢复细节。
DeepLab 系列模型是语义分割领域的另一个重要里程碑。DeepLab V1 首次引入了 Atrous Convolution 模块,弥补了删除池化模块后感受野大小的影响。
引入了金字塔池化模块(Pyramid Pooling Module),捕获不同尺度的信息,增强了模型对不同大小物体的分割能力。
DeepLab V2 在 ResNet 的基础上引入了 ASPP(Atrous Spatial Pyramid Pooling)模块,进一步扩大了感受野并提高了分割精度。
深度可分离卷积的应用
而 DeepLab V3 通过增加 ASPP 模块的宽度,进一步提升了模型的性能。DeepLab V3+是 DeepLab 系列的最新版本,它增加了网络深度,将 Xception 网络作为主干,使用深度可分离卷积 Depthwise Separable Convolution, 结合了解码器模块,以恢复细节信息,进一步提升了多尺度处理能力。
专为实时应用设计,使用了高效的编码-解码结构和跳过连接。
Inverted Residuals 和 Linear Bottleneck
多尺度级联输入,深度监督
结合了两个分支,Spatial 分支和 Context 分支。
维持高分辨率流以捕获更多细节,同时进行多尺度融合。
Spatial Attention 和 Channel Attention
共享下采样权重双分支网络
引入了对象上下文表示,使用注意力机制来建模像素间的关系,增强对局部和全局上下文的理解。
提出了交叉注意机制(Criss-Cross Attention),允许模型以较低的计算成本建模长距离依赖
SE 模块和 Swish
图像块编码,输入纯 Transformer 网络提取特征,reshape 特征后卷积上采样
将分割统一为 Mask 分类任务
一种通用的分割模型,能够处理多种类型的分割任务,包括语义分割、实例分割和全景分割。
AE | VAE | |
---|---|---|
VAE | GAN | Diffusion | |
---|---|---|---|
计算公式
单位:信噪比
计算公式
https://segmentfault.com/a/1190000044071469
1 | [return] type: numpy.ndarray |
1 | image = cv2.imread(path) |
1 | image = image.mul(255).byte() |
1 | b, g, r = cv2.split(image) |
cv2.threshold()
cv2.Canny()
cv2.filter2D()
cv2.blur()
cv2.GaussianBlur()
cv2.erode()
腐蚀cv2.dilate()
膨胀cv2.morphologyEx()
开闭运算、形态学梯度、顶帽、黑帽等https://github.com/DWCTOD/interview/blob/master/detail/%E4%BD%9C%E4%B8%9A%E5%B8%AE%20%E8%A7%86%E8%A7%89%E7%AE%97%E6%B3%95%E5%B7%A5%E7%A8%8B%E5%B8%88%20%E9%9D%A2%E7%BB%8F%EF%BC%882020%E5%B1%8A%EF%BC%89.md
https://github.com/GYee/CV_interviews_Q-A
BN 是怎么做,作用是什么
常见激活函数
特性
特征
1×1 卷积
空洞卷积
分组卷积
将输入与层输出相加
优势
模块结构
Self-Attention
除以
并行化的体现
影响计算量的因素
优势
缺点
已知 softmax 输出概率序列与实际分布概率序列,计算两者交叉熵
在深度学习中,超参数(Hyperparameters)是指在训练开始前设置的模型参数,不是通过训练学习得到的。超参数的选择对模型性能有很大的影响,不同的超参数设置可能导致显著不同的训练结果。
LR 中的连续值特征是如何处理的 为什么 LR 要先对数据进行归一化处理 LR 用了 sigmoid 函数,那么 LR 是线性模型还是非线性模型,为什么
在 AI 领域中,描述模型性能如何随着模型规模(如参数数量、训练数据量、计算资源等)变化而变化的一组经验法则
应用
设计更大规模的模型
指导研究人员如何设计和训练更大规模的模型,以实现更高的性能
优化资源分配
如确定是否应增加模型参数数量、增加训练数据量,还是增加计算资源,以实现最优的性能提升
预测性能
根据现有模型的性能和缩放法则,可以预测更大规模模型的性能
1 | # 加载数据 |
1 | # 设置模型评估模式 |
存储
stride 属性
指定维度中一个元素到下一个元素的步长
维度变换
类型 | 方法 | 描述 |
---|---|---|
维度顺序 | permute | 指定维度重排,返回共享存储区的 tensor |
transpose | 交换维度,返回共享存储区的 tensor | |
形状变换 | view | 返回共享存储区 tensor,要求存储连续,否则调用 contiguous |
contiguous | 开辟新的存储区构建连续 tensor | |
reshape | 若连续则返回原 tensor,否则创建新 tensor | |
广播 | broadcast_to | |
冗余维度 | squeeze | 压缩维度 |
unsqueeze | 展开维度 | |
扩展维度 | expand | 扩展大小为 1 的维度 |
repeat | 按照指定维度重复 tensor | |
展平维度 | flatten | |
ravel | ||
维度剪裁 | narrow | |
维度展开 | unfold |
张量乘法
方法 | 应用 |
---|---|
torch.matmul() |
多维矩阵相乘 |
torch.mm() |
2 维矩阵相乘 |
torch.bmm() |
批矩阵相乘 |
torch.dot() |
点积 |
torch.mv() |
矩阵向量相乘 |
torch.einsum() |
复杂张量运算
torch.einsum('ij,jk->ik', a, b) |
张量合并与拆分
模块基类
线性模块容器
准备通过解决实际问题来展示你的逻辑思维能力和数据分析洞察力,可以是以往项目中的案例分析。
思考并准备实例说明你如何在团队中有效沟通、协作解决问题,以及面对技术挑战时的态度和解决策略。
https://github.com/DWCTOD/interview/blob/master/detail/%E4%BD%9C%E4%B8%9A%E5%B8%AE%20%E8%A7%86%E8%A7%89%E7%AE%97%E6%B3%95%E5%B7%A5%E7%A8%8B%E5%B8%88%20%E9%9D%A2%E7%BB%8F%EF%BC%882020%E5%B1%8A%EF%BC%89.md
https://github.com/GYee/CV_interviews_Q-A
BN 是怎么做,作用是什么
常见激活函数
特性
特征
1×1 卷积
空洞卷积
分组卷积
将输入与层输出相加
优势
模块结构
Self-Attention
除以
并行化的体现
影响计算量的因素
优势
缺点
已知 softmax 输出概率序列与实际分布概率序列,计算两者交叉熵
在深度学习中,超参数(Hyperparameters)是指在训练开始前设置的模型参数,不是通过训练学习得到的。超参数的选择对模型性能有很大的影响,不同的超参数设置可能导致显著不同的训练结果。
LR 中的连续值特征是如何处理的 为什么 LR 要先对数据进行归一化处理 LR 用了 sigmoid 函数,那么 LR 是线性模型还是非线性模型,为什么
在 AI 领域中,描述模型性能如何随着模型规模(如参数数量、训练数据量、计算资源等)变化而变化的一组经验法则
应用
设计更大规模的模型
指导研究人员如何设计和训练更大规模的模型,以实现更高的性能
优化资源分配
如确定是否应增加模型参数数量、增加训练数据量,还是增加计算资源,以实现最优的性能提升
预测性能
根据现有模型的性能和缩放法则,可以预测更大规模模型的性能
存储
stride 属性
指定维度中一个元素到下一个元素的步长
view 方法
返回共享存储区的 tensor
计算图
环境搭建
数据加载
模型定义
训练
验证
保存
加载模型
准备通过解决实际问题来展示你的逻辑思维能力和数据分析洞察力,可以是以往项目中的案例分析。
思考并准备实例说明你如何在团队中有效沟通、协作解决问题,以及面对技术挑战时的态度和解决策略。