百度算法工程师面试题8道含解析.docx
《百度算法工程师面试题8道含解析.docx》由会员分享,可在线阅读,更多相关《百度算法工程师面试题8道含解析.docx(3页珍藏版)》请在第壹文秘上搜索。
1、百度算法工程师面试题8道含解析问题1:讲一下Iora的原理1.ora方法指的是在大型语言模型上对指定参数增加额外的低秩矩阵,也就是在原始PLM旁边增加一个旁路,做一个降维再升维的操作。并在模型训练过程中,固定PLM的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的参数叠加。用随机高斯分布初始化A,用0矩阵初始化B。问题2:讲一下GBDT的原理GBDT(GradientBoostingDecisionTree)是一种集成学习方法,它通过迭代训练决策树,每一次迭代都试图修正前一次迭代的错误。具体而言,GBDT通过拟合残差(目标值与当前模型的预测之差)来逐步改进模
2、型。在每一轮迭代中,新的决策树被训练以捕捉残差中的模式。最终,所有树的预测被组合起来形成最终的预测模型。问题3:翻译任务一般用什么架构翻译任务主要使用的是seq2seq架构,目前主流的翻译架构是基于TranSfOrnler模型的,它采用自注意力机制(self-attention)来捕捉输入序列中不同位置的关联信息,并通过编码器-解码器结构来实现翻译。问题4:encoder-only,decoder-only,encoder-decoder区别Encoder-only:只有编码器,用于将输入序列编码成固定维度的表示,常用于特征提取。Decoder-only:只有解码器,用于从固定维度的表示生成输
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 百度 算法 工程师 试题 解析