GPT v1论文详解
AI论文助手

GPT v1论文详解

​论文标题:Improving Language Understanding by Generative Pre-Training 论文的引用量不到1000,有点吃惊,这个是比BERT更早的基于Transformer的预训练模型,BERT引用量超过了12000+ GPT是第一个基于Transformer的(使用Transfoermer decoder,BERT使用Transformer encoder)预训练模型,一共发了3个版本,GPT3达到巅峰, 它能做的事情超过想象力,还记得fine-tuning出来的那首诗吗? 《桥上的秋菊》黄花淡淡复丛丛,冷艳霜痕两不同。金蕊斓斑宜向日,素衣零落御秋风。打工人,是不是又被惊呆了? 摘要:自然语言理解包含广泛多样性任务,比如文本蕴含,问答,语义相似度评估,文本分类。然而没有标注的文本语料是非常丰富的,而这些特定任务有标注的数据太少,怎么利用这些丰富的无标记数据训练模型是非常有挑战性的。我们论证了通过在未标注的丰富数据集上生成预训练语言模型,然后在每个指定任务上进行fine-tuning,可以在这些任务中获得巨大的收益。对比之前的方法,我们在fine-tuning的时候使用面向任务的输入转换来达到高效的迁移,仅仅需要最小的模型架构的修改。我们在广泛的自然语言理解的benchmarks上论证了我们方法的有效性。我们通用的不针对任务的模型显著超越了那些针对每个任务精心设计的模型,在12个任务中有9个达到了SOTA。比如,我们在知识推理上达到了8.9%的绝对提升(Stories Cloze Test),问答上提升5.7%(RACE),文本蕴含提升1.5%(MultiNLI)。 1 简介 在NLP中,如何有效地从无标记的原始文本中学习,对于减轻监督学习的依赖至关重要。大部分深度学习的方法需要大量的手工标记的数据,这限制他们在许多缺乏标注数据的领域的适用性。在这样的情况下,模型能够从无标记数据中学习语言信息,为收集更多标注数据提供了一个有价值的替代方法,标注数据既花钱又耗时。即便是那些有大量标注数据的场景,通过无监督的方式从丰富的语料学习一个好的语言表示也能提供一个显著的提升。最有说服力的证据就是到目前为止各种被广泛应用的word Embeddings(word2vec, GloVe ),提升了广泛下游NLP任务的性能。 从无标注文本中利用词级别以外的信息非常具有挑战性,有2个主要的原因。首先,不清楚在学习文本表示的时候什么类型的优化目标是最高效的迁移。近期的研究做过各种不同的目标,比如语言模型,机器翻译,语句一致性,基于每一种方法在不同任务上都超过了其他方法。其次,没有一致性、高效的方法来迁移这些表示学习到目标任务上。已有的技术涉及到联合任务特定的设计修改模型架构,使用复杂的学习规则,添加辅助的学习目标。这些不确定的事情使得开发高效的自然语言处理的半监督学习方法是困难的。 在这篇论文中,我们为自然语言理解任务探索了一个半监督的方法,它由一个非监督的预训练和一个有监督的fine-tuning组成。我们的目标是学习一个全局的表示,做简单的适配来迁移到各种各样的任务上。我们假定可以访问大量的未标注文本语料和一些有手工标记的训练样本的数据集。我们的设定不需要这些目标任务和未标记的语料在相同的领域。采用2段式的训练过程。首先,我们使用LM(语言模型)为目标在未标注的数据上使用神经网络来学习一个初始的参数表示。接下来,我们基于特定任务的监督目标来调整这些参数。 我们的模型架构使用Transformer,已经被证明在不同的任务上有很强的表现,比如机器翻译,文本生成,句法解析。这个模型结构为我们提供了更结构化的内存来处理文本中的长依赖,与传统的循环神经网络相比,在多种任务中表现出了更强的迁移能力。在迁移过程中,我们利用任务特定的派生自traversal-style方法输入改写,将结构化文本输入当做一个连续的tokens序列。我们在实
胆总管结石类毕业论文文献都有哪些?
AI论文助手

胆总管结石类毕业论文文献都有哪些?

本文是为大家整理的胆总管结石主题相关的10篇毕业论文文献,包括5篇期刊论文和5篇学位论文,为胆总管结石选题相关人员撰写毕业论文提供参考。 1.【期刊论文】腹腔镜胆囊切除术结合胆总管探查或内镜下乳头括约肌切开取石术治疗胆囊结石并胆总管结石效果观察 期刊:《包头医学院学报》 | 2021 年第 003 期 摘要:目的:对比腹腔镜胆囊切除术结合胆总管探查或内镜下乳头括约肌切开取石术治疗胆囊结石合并胆总管结石效果.方法:选取2018年6月~2020年6月收治的114例胆囊结石合并胆总管结石患者分为A组和B组,A组给予腹腔镜胆囊切除术联合腹腔镜胆总管探查术(LC+LCBDE)治疗,B组给予腹腔镜胆囊切除术联合内镜下乳头括约肌切开术(LC+EST)治疗,比较两组手术指标、术后指标、并发症发生率及复发率.结果:A、B组手术时间分别为(105.24±10.89)min、(178.49±11.01)min,A组手术时间较B组显著缩短(P<0.05);术中出血量分别为(15.39±2.49)mL、(6.92±2.31)mL,A组术中出血量较B组显著增多(P<0.05);中转开腹率分别为7.02%、5.06%,两组患者中转开腹发生率无显著性差异(P>0.05);随访半年A组患者未发现结石残余;B组患者2例结石残余,再次手术取石后未发现结石残余,A、B组住院时间分别为(12.13±3.78)d、(12.06±3.24)d,治疗费用分别为(32000.56±2341.20)元、(38924.44±2426.37)元,A组治疗费用较B组显著减少(P<0.05),两组结石残余率及住院时间无显著性差异(P>0.05);A、B组并发症发生率分别为3.51%、7.02%,复发率分别为5.06%、3.51%,两组并发症发生率及复发率无显著性差异(P>0.05).结论:LC+LCBDE、LC+EST两种手术方式治疗胆囊结石合并胆总管结石疗效和安全性相当,但两种手术方法的并发症发生种类不同,术后要密切关注,LC+LCBDE易发生胆漏合并感染,LC+EST易发生胰腺炎,要及时对症处理,并且LC+LCBDE治疗胆囊结石合并胆总管结石费用较低,可降低患者的经济负担. 关键词:腹腔镜胆囊切除术;腹腔镜胆总管探查术;内镜下乳头括约肌切开取石术;胆囊结石合并胆总管结石 链接:https://www.zhangqiaokeyan.com/academic-journal-cn_journal-baotou-medical-college_thesis/0201288797663.html ————————————————————————————————— 2.【期刊论文】内镜下乳头大气囊扩张术对并发憩室胆总管结石效果 期刊:《青岛大学学报(医学版)》 | 2021 年第 003 期 摘要:目的探讨内镜下乳头大气囊扩张术(EPLBD)治疗并发壶腹周围憩室(PAD)胆总管结石病人的效果和安全性。方法收集2013年1月—2018年1月行EPLBD治疗胆总管结石508例病人临床资料并进行回顾性分析,比较有憩室组(PAD组)和无憩室组(N-PAD组)病人的一般资料、治疗情况、术后并发症及结石复发情况。结果 N-PAD组病人193例,PAD组病人315例,两组取石成功率、短期并发症(胰腺炎、出血、穿孔、胆管炎)发生率比较差异无统计学意义(P>0.05);N-PAD组结石复发率(17.1%)高于PAD组(9.3%),差异有显著性(χ^(2)=4.423,P<0.05)。按憩室大小分组,小憩室组术后急性胰腺炎的发生率(9.5%)高于大憩室组(0)及中憩室组(3.0%),差异有统计学意义(χ^(2)=9.973,P<0.01);按Boix分型,不同类型的憩室并发症发生率差异无统计学意义(P>
「SCI论文语言润色必知真相?四大策略+老牌机构统计!」
AI提示指令

「SCI论文语言润色必知真相?四大策略+老牌机构统计!」

文章强调润色SCI论文的重要性,指出方法和讨论章节常犯语言错误且影响评价。为应对问题,作者建议遵循时态原则,如描述工作用过去时,他人工作用现在或完成过去时;偏好主动语态,并注意连贯词使用和专业术语准确。选择信誉良好的润色机构如Editage可提高论文质量,增加投稿成功率并节省时间。优惠码ABSJU90可供参考。
如何高效选题与论文实验?20届统计学硕士必读指南
AI论文助手

如何高效选题与论文实验?20届统计学硕士必读指南

本文由一位华东985高校统计学硕士毕业生分享论文准备经验。首先强调选题的重要性,推荐向导师咨询或浏览同门论文寻找研究方向。其次指出实验在应用型课题中的决定性作用,建议提前进行并检查结果。作者提倡充足准备初稿,包括制定详细提纲以遵循学校规范和逻辑清晰的写作。最后提醒修改时重点关注措辞,保证语言流畅。