智能学习前端团队 自创立以来,团队专注于打破大众对教育的刻板印象,突破固有的教学思维,攻破各类教学屏障。旨在为每一位学生制定最合适的学习方案,予以因材施教,使优质教育随 "触" 可达。
NLP任务的发展有两个明显的阶段,我们以bert模型为区分点,前半段是基础的神经网络阶段(bert模型之前的阶段),后半段是BertTology阶段(bert模型之后的阶段) 参考 https://zhuanlan.zhihu.com/p/148007742
https://zhuanlan.zhihu.com/p/56802149
这是个有点大的概念,本文为了避免冗余繁琐,主要强调两个地方,方便有个大体认知
激活函数作用:加入非线性因素,解决线性模型表达能力的不足,拟合更多的情况
损失函数:计算 输出值、目标值 之间的误差 反向传播:把误差传递给权重,让权重做适当的调整,最终让正向传播的输出结果与标签间误差最小 学习率:反向传播中步长大小,控制调节幅度,在精度和速度之间找到一个平衡 优化器:一般需要反复迭代才能找到适合的权重,比较耗时,所以我们通过 一套策略(优化器)利用算法从而更快、更好的将参数调整到位
具体可以回顾下:前端工程师如何快速使用一个NLP模型
国内也有类似 hugginface平台- 百度paddle,但还是 huggingface使用人最多
之所以选择 这个任务,是因为微调中文模型的文章比较少,而微调完形填空的就基本没有找到..
屏蔽子词:先将句子中的部分词语屏蔽,再令模型去预测被屏蔽的词语
您需要 登录 才可以下载或查看,没有账号?立即注册
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )
GMT+8, 2024-11-24 09:57 , Processed in 0.089675 second(s), 26 queries .
Powered by Discuz! X3.5 Licensed
© 2001-2024 Discuz! Team.