一、个性化E-mail分类器的设计与实现(论文文献综述)
鹿旭东,宋伟凤,郭伟,崔立真,林岳,姜涛[1](2021)在《大数据驱动的创新方法论与创新服务平台》文中研究说明【目的】本文提出了一种大数据驱动的创新方法论并研制了大数据驱动创新服务平台。【应用背景】针对大众创新过程中,难以应用系统化的创新方法,难以处理信息碎片化等问题。【方法】基于大数据技术和众智汇聚的思想;以多源创新数据的跨界融合为基础,构建创新方法大数据和创新知识图谱;通过社会化公众参与和互动反馈,形成汇聚众智的创新模式;基于创新大数据知识图谱,实现创意自动快速引导生成;基于发明原理等创新方法理论,在大众参与下实现创新方案的形成。【结果】本文研究成果已经在工业制造、互联网产品研发等多个行业中应用,通过大量案例证明了所提出方法论和创新服务平台的有效性。【结论】大数据驱动的创新方法论和创新服务平台为创新提供了思维、方法和工具支持,通过对数据挖掘和众智科学的研究,智能地解决了创新面临的难题,推动创新向着智能化、大众化方向发展。
王磊[2](2021)在《大学生锻炼坚持行为影响因素及促进策略研究》文中研究指明大学生是国家的未来和民族的希望,欲文明其精神,先自野蛮其体魄。大学生的体质健康与锻炼坚持状况,对体育强国建设和中华民族伟大复兴中国梦的实现具有重大意义。锻炼坚持是指个体持续在一段时间内进行规律锻炼并长期保持的行为,是个体通过体育锻炼增强体魄、健康生活、健全人格、锤炼意志的必要条件。《体育强国建设纲要》中明确“要将促进青少年提高身体素养和养成健康生活方式作为学校体育教育的重要内容”。高校体育不但肩负体育教育职能,更兼具促进锻炼坚持、增强学生体质、建设校园体育、建树正确体育观的育人责任。但至今为止,大学生身体活动不足、锻炼坚持困难,依旧是学校体育的突出问题。体育领域学者对大学生锻炼坚持行为的研究由来已久,取得了丰富的研究成果,在梳理时发现,相关研究历经探索与奠基、起步与发展、成熟与融合三个阶段,形成了以健康信念模型、计划行为理论、社会认知理论等为核心的理论框架,但缺乏对决策过程的关注;且近年来信息技术发展赋能大学生锻炼行为虚拟化,虚拟体育社交与用户生成内容知识共享等,改变了传统锻炼坚持行为的研究场域,相关适应性研究稀缺。基于此,提出了大学生锻炼坚持行为影响因素与促进策略的研究问题。本研究综合运用用户生成内容分析与挖掘、文献资料、专家访谈、问卷调查、数理统计、机器学习和逻辑归纳等研究方法,从我国大学生锻炼坚持行为研究历程梳理入手,结合虚拟锻炼社区用户生成内容分析与访谈资料的交互验证,识别大学生锻炼坚持行为的影响因素,理顺大学生锻炼坚持行为的决策过程、建立模型验证影响因素间的作用机制,并细化锻炼坚持行为分类、制定促进策略,通过系统研究得出如下结论:(1)大学生锻炼坚持行为受生活方式自评、健康认知自评、运动认知自评、个人投入、社会支持、锻炼氛围、场地器材、锻炼获益感知、锻炼风险感知、锻炼动机、锻炼自我效能、锻炼坚持时间、锻炼坚持质量等13个因素的影响。这13个因素构成大学生锻炼坚持行为模型的五大因素即健康自我评价、锻炼条件、锻炼效果感知、锻炼内驱力和锻炼坚持行为。(2)大学生锻炼坚持行为模型五大因素之间存在“感知输入-决策-驱动-行为输出”的四层决策逻辑,形成一个链式中介模型,可归纳为具有五因素四层次的“SCeiP”行为模型。该模型是以大学生锻炼坚持行为为研究对象,以促进和优化锻炼坚持相关因素及决策过程为目标,通过不断完善锻炼坚持行为相关因素作用及协同,促进大学生持续做出锻炼坚持决策的行为模型。(3)锻炼内驱力是锻炼坚持行为的动力来源,是“SCeiP”模型中的核心中介变量,且根据个体所处行为阶段不同,影响不同。模型内部两条促进路径和外部两条反馈路径,均遵循“客观-主观-客观”的作用逻辑,说明锻炼坚持是客观因素通过主观因素发挥能动作用的结果,研究既要关注客观影响因素,更要关注主观作用机制。(4)大学生容易受到外界信息的影响,单次锻炼的效果感知与经验总结,会影响后续决策。锻炼坚持实质上是一个动态变化、螺旋发展的系统,是个体针对“是否进行锻炼”做出理性决策的过程。在一段时期内,每次决策及行为输出结果均会反馈至输入层,影响新一轮决策。在虚拟锻炼社区调研中发现锻炼者偏好对锻炼效果进行成本效益分析,只有锻炼获益大于锻炼风险时,个体才会产生足够的锻炼内驱力,选择坚持锻炼。(5)虚拟锻炼社区汇集大学生锻炼坚持及衍生的锻炼知识共享与社交行为,锻炼坚持行为理论在虚拟化锻炼场域中具有一定适应性,但仍需不断拓展。大学生信息化锻炼虚拟社区与平台是新时代锻炼坚持行为叙述规则和价值逻辑建立的主战场,需要着力设计与打造。基于“SCeiP”模型形成了高校大学生锻炼坚持行为线上线下双循环促进的总体思路。根据巴纳姆效应理论,利用信息化平台知识共享塑造科学体育观导向,在尊重学生个体行为差异的前提下,发挥学生体育锻炼坚持价值认同的聚合效应,以促进大学生锻炼坚持。(6)为实现“因人而异”“因材施教”的大学生锻炼坚持行为预测与导向内容推荐,实现分类促进策略,本研究选用PCA-GS-SVM算法训练大学生锻炼坚持行为数据分类器,训练效率高且正确率在训练集及测试集中均高于87%,能够满足大学生锻炼坚持行为信息化平台分类促进策略的应用要求,有效支撑“SCeiP”模型实践应用。将锻炼坚持行为分为八类,针对不同类别行为特点,制定具体分类促进策略。(7)设计实现大学生锻炼坚持行为促进信息化平台,为实现“因人而异”“因材施教”的锻炼坚持促进提供平台策略及保障策略。从应用需求出发设计平台功能,将“SCeiP”行为模型中涉及的理论概念具象化,融合反馈机制、激励体系、粘性强化等,设计锻炼坚持行为信息化促进方法,为“SCeiP”行为模型的应用落地打造良好基础。并针对锻炼坚持行为促进信息化平台的推广应用,从组织保障策略、制度保障策略、监管反馈策略等三个方面,制定保障策略。本研究创新性主要集中于以下三点:第一,研究引入管理学理论拓展锻炼坚持研究理论架构,拓宽现有锻炼行为研究的应用场景;第二,集成大数据研究方法,拓展虚拟锻炼社区用户分类和用户生成内容分析研究路径,丰富了锻炼坚持行为研究的方法论体系;第三,自行发展大学生锻炼坚持行为问卷,为大学生锻炼坚持行为量化研究提供有效量具及实证基础。
岳怡然[3](2021)在《面向知识服务的用户画像构建与应用研究》文中进行了进一步梳理当今时代,互联网的飞速发展革新了知识服务形态,知识传播速度加快,在此背景下,图情领域研究的“第四范式”应运而生,数字图书馆供给侧也从粗放型向精准型服务转变,传统知识服务已不能满足用户日益增长的多元化需求,为用户提供深层次全方位的应用服务是大势所趋。国家农业图书馆为了更好的提供知识服务,搭建了大数据环境下的学术生态圈,其中农业专业知识服务系统构建了多维知识服务产品体系,实现了多个主题的融合,在线提供一站式知识发现服务,但在对用户进行精准个性化服务上还有待进一步完善,需要充分利用其产生的丰富海量的用户数据,全面洞悉用户行为。用户画像作为中间媒介,现已成为各行各业的研究热点,能够充分挖掘用户信息,全面刻画用户偏好和行为特征,为更好地满足用户需求提供了有力依据。已有的面向知识服务的画像构建的相关研究中,针对农业用户群体的并不常见,因此,在此基础上本文以农知系统为例,开展了三个部分的主要研究:(1)从用户画像的相关理论研究出发,分别对数字图书馆用户画像研究中涉及到的数据采集、数据预处理以及数据挖掘的相关技术基础进行梳理。(2)对数字图书馆用户画像的需求、功能进行分析,并针对面向知识服务的农业用户画像构建流程进行详细设计,从数据准备层、数据处理层、可视化层以及应用服务层四个部分出发,描绘了每一层的具体构建思路和技术方法。其中,用户数据挖掘和标签映射是最重要的一个环节,将用户标签体系设计为用户基本属性、用户科研属性、用户活跃度、用户访问偏好以及用户研究兴趣五大类,并分别对显性标签和隐性标签提供了挖掘思路,以更好地挖掘标签信息,进行标签预测和动态管理。(3)基于用户画像构建流程进行初步实现,对数据采集和画像可视化进行展示,并设计了多个应用场景,如用户分群、个性化推荐、智能检索、学科服务、访问分析以及服务检测等,进一步设计了每个场景可以实现的功能以及初步呈现效果。通过上述几个部分的研究,本文形成了基于农业用户群体的面向知识服务的画像模型,基本完成了整个用户画像的流程设计和应用场景的功能构想。本文所提出的面向知识服务的用户画像模型能够有效提高农知系统对用户数据采集、数据处理的效率,进一步洞悉用户需求,为后续提供更好地个性化服务,增强用户粘性,探索更多的应用场景奠定了基础。
盛泳潘[4](2020)在《面向知识图谱的学习算法研究与应用》文中进行了进一步梳理随着认知智能技术的深入发展,知识图谱俨然成为了大数据时代的一种重要的知识表示形式。在多个垂直领域,以数据分析、智慧搜索、智能推荐、自然人机交互为主的实际应用场景中,皆对知识图谱提出了客观的使用需求。与此同时,知识图谱作为实现机器认知智能的重要基石,同样是现阶段人工智能领域的热门研究课题。本文面向知识图谱构建与智能应用中的若干关键理论问题开展学习算法研究与实证分析。其中,从开放域环境中自动获取关系实例是构建大规模知识图谱的基础,精准地识别概念间的上下位关系是在纵向层面上扩展知识层级体系结构的关键,通过知识图谱表示学习可实现知识图谱数值化表示,得以让机器更好地处理并应用知识图谱进行知识计算。立足于文本数据,构建一套完整的领域知识图谱模型是一个极富挑战性的任务。本文的研究内容与主要贡献可总结为:第一,针对开放域场景下的实体关系抽取问题,提出了一个基于句法分析的开放关系抽取模型。该模型采用一种规则增强的句法分析方法,提高了对句子结构的分析能力,从而得到了更多具有高质量关系短语的三元组。再者,通过一种关系强度度量方法,从中进一步筛选出显着且有良好关系强度的三元组作为最终的抽取结果。我们在四个真实世界的开放域数据集上进行了实证研究,实验结果表明:我们的方法具有无监督、自动化的特点,能够适应一定规模的异质文本语料。相比于多个具有代表性的基线方法,我们的模型在开放关系抽取任务上实现了性能的提升。第二,针对知识图谱中概念上下位语义关系的精准识别问题,我们充分利用WordNet和英文版维基百科这两个高质量的外部知识库,赋予候选上下位关系元组中的两个概念以文本定义的证据,提出了一个由概念定义驱动的上下位关系预测模型。一方面,通过引入高价值的文本知识,拓展了概念的语义上下文,弥补了现有方法从特征并不充分的,有着领域独立性的训练语料的上下文中学习概念嵌入表示的局限性。再者,有助于更好的解释领域相关的,或存在歧义的候选上下位关系元组;另一方面,模型能够将(概念,概念的定义)进行联合建模,有助于挖掘两者语义上下文中隐含的上下位关系特征。最后,通过端到端的训练,避免了传统预测模型先学习概念嵌入表示,再学习二元分类器的诸多局限,更为有效地利用了训练数据。在开放域与限定域数据集上的实验结果表明,我们的模型在性能与泛化能力上表现一致,且优于近年来表现较好的基线模型。第三,针对时序知识图谱上缺失链接的补全与纠正问题,我们基于该问题的先领性工作,提出了一个名为TKGFrame的两阶段时序知识图谱补全模型。TKGFrame在以下三个方面进行了扩展:第一方面,提出了一种改进的时序演化矩阵,使其能够更好地刻画同一个时序关系链条上时序顺序关系之间的演化强度。第二方面,基于时序知识图谱的嵌入结果,将其中缺失事实成立的合理性度量建模为一个带约束的优化问题,并采用整数线性规划方法对该问题进行求解,进一步过滤了候选结果中的不合理预测;第三方面,将上述两个模型无缝地整合在TKGFrame框架之下。在三个真实世界的时序知识图谱数据集上的实验结果表明,TKGFrame模型在实体预测和关系预测任务上的性能显着优于目前主流的相关工作。第四,新闻通常产生自特定的事件或者话题,如今已成为人们从互联网上获取信息的重要来源。在现实场景中,用户易于淹没在快速累积的、冗余的、多样的新闻报道之中,而无法有效感知并掌握其中重要的事实知识,从上述真实的用户诉求出发,我们提出了一套名为MuReX的概念知识图谱构建模型,该模型包括一种结合多种抽取器的抽取策略、一种改进自学习框架的两阶段候选关系实例过滤算法、一种关系实例兼容性度量、一种关系实例重要性度量、一种启发式知识图谱构造策略。这些完整且实用的技术被集成到了统一的MuReX框架,经过数据预处理、候选关系实例抽取、主题一致性估计、关系实例兼容性度量和概念知识图谱生成五个重要的建模过程,最终生成了包含显着事实的、高质量的概念知识图谱。据此,用户得以快速地洞察特定主题下的新闻事实、事件的发展脉络,以及探索其中潜在的、新的关系连接。
向平常[5](2020)在《基于集成学习的个性化垃圾邮件过滤技术研究与应用》文中认为随着互联网时代的来临,电子邮件凭借其方便快捷的特点,已经成为人们日常工作学习传递信息不可或缺的一种方式,与此同时垃圾邮件的出现也引起了很多问题。垃圾邮件在传播过程中占用网络资源,分散用户工作学习的注意力,威胁用户隐私安全,给互联网环境带来了消极的影响,因此研究垃圾邮件过滤技术有很大的现实意义,本文针对垃圾邮件过滤技术研究现状中的不足,提出了相关的解决办法,主要工作包括:(1)针对现有的垃圾邮件过滤技术提取邮件特征不完整的问题,本文根据邮件结构化的特点,提出一种基于集成学习的Ada-CK邮件分类方法,该方法主要通过将邮件内容分为邮件头和邮件正文两部分,基于邮件头的邮件行为特征构建CART决策树分类器,基于邮件正文的内容语义特征构建K最近邻分类器,并在K最近邻分类方法中提出一种改进的基于相似度阈值的文本相似度比较方法,将文本相似度比较时的文本关键词划分为近似词语和一般词语,两者分别计算并线性组合得到最终的文本相似度。基于Adaboost的集成学习思想,将邮件头的CART决策树和邮件正文的K最近邻方法作为基分类器,经过多个基分类器对不同样本权重和不同样本特征的训练,集成基分类器的分类结果和话语权,得到最终的邮件分类结果。通过将Ada-CK方法分别与基于单个基分类器的Ada-CART和Ada-KNN方法,以及其它的邮件分类方法Co-PRFC,L1-SVM,TSVM-NB对比,实验表明Ada-CK在邮件分类精度指标上明显优于其它方法,符合邮件应用要求的准确率高的特点。(2)针对不同邮箱用户对垃圾邮件的认知不同的问题,提出一种基于用户个性化的主动学习方法ALUP,通过从邮件的正文文本中引入用户兴趣集的概念,介绍用户兴趣集模型及具体的基于兴趣集的分类方法。同时,在邮件的增量学习过程中,引入主动学习的方法,基于样本的分布密度来选择不确定度高的增量样本进行更新训练,避免将所有增量样本加入到训练集中造成的时间复杂度高的问题。通过将ALUP与其它邮件分类方法ALNSTC,SVM-AL,MFL进行性能上的对比,实验表明ALUP方法在保证较高的邮件分类精度的同时,明显降低了时间消耗,符合邮件在线应用要求的准确率高,速度快,且遵循用户个性化的特点。
姚灿[6](2020)在《基于自适应学习系统的学习资源推荐的研究与实现》文中研究表明随着信息时代的迅速发展,信息过载的问题也日益严重。突出的矛盾迫切需要技术手段的辅助加以解决。在教育领域,学习资源不平衡的问题可以通过互联网的模式加以缓解。然而,面对参差不齐的学习资源,不同的学习者个体如何进行选择成为一大难题。本文以提高学习者的知识水平为目的,研究出一种基于链路预测技术的学习资源推荐模型,可以更好地辅助学习者选择适合自己的学习资源。首先,本文提出一种链路预测模型VirtualLink2vec(VL2v)。链路预测技术在网络演化的挖掘和分析中扮演重要的角色,同时也是许多下游任务的基础,例如生物信息学、电子商务和合着网络。VL2v模型通过两种不同层面的特征来学习目标链路的嵌入表示。在六个真实数据集上与15种方法进行比较,实验证明VL2v模型能够更充分地利用已知信息尤其是正向关系和负向关系信息,在不同结构和特征的网络中持续表现出色。其次,本文基于VL2v提出了一种学习资源推荐模型。该模型通过对学习者和学习资源分别建模,形成可计算的嵌入表示,进而把链路预测技术应用到推荐领域。学习资源推荐与传统的推荐不同,不能以用户评价作为唯一评价标准,本文提出一种针对学习资源推荐的相对客观的评价方法。与5种传统的推荐模型相比,本文提出的模型可以兼顾学习效果与用户满意度。最后,本文基于自适应学习系统实现了学习资源推荐功能,该功能通过学习者与学习资源的互动关系为学习者提供相适应的学习资源。
王斯琴[7](2020)在《改进朴素贝叶斯算法在垃圾邮件过滤中的应用》文中进行了进一步梳理电子邮件伴随着互联网的发展越来越普及,但是电子邮件的可靠性与安全性引起人们的重视,因为各种垃圾邮件、钓鱼岛邮件、骚然邮件极大地影响了人们的生活。同时,根据我国不良网络不垃圾信息举报受理中心的统计,有一半以上的用户因为垃圾邮件而浪费掉了大量的时间、大量的资源信息,还有一半用户因为垃圾邮件遭受到了一定的经济损失。目前被人们认可的垃圾邮件过滤技术有:身份认证、行为模式识别、和白名单和关键字过滤技术等等之类的技术。与此同时,垃圾邮件的误判会给网民造成一定的经济损失与时间损失,加之很多人都不愿打开垃圾邮件这一过滤功能,而且垃圾邮件本身也携带各种病毒,或多或少给人们带来了一定的困惑。随着科学技术的发展,朴素贝叶斯分类算法已成为现在最流行的技术之一,正是因为传统朴素贝叶斯分类算法良好的邮件分类效果,受到了广大研究者的关注。但是朴素贝叶斯受到自身条件属性需得相互独立的限制,实际上很多样本却不符合属性条件间相互独立等要求导致分类准确率很低,为了提高垃圾邮件分类的准确性,本文提出了结合主动学习的K-近邻局部加权朴素贝叶斯算法,为的是能够在一定程度上提高邮件分类的精确度和效率。本文主要研究工作如下:(1)如果样本本身一旦错分,那么,在训练过程中不断地更新、迭代,会导致错误不断地累积,继而得到一个易误分的分类器。因此,本文采取结合主动学习的K-近邻局部加权朴素贝叶斯算法(K-Locally Weighted Naive Bayes,K-LWNB),即人工选取一些最具有价值的样本进行标注,以此来提高样本本身的准确性,从而降低分类器的误分率。其中K-近邻局部加权朴素贝叶斯算法对垃圾邮件分类,能够让垃圾邮件的分类效果相对于传统的朴素贝叶斯算法来说,能够更有效地提高邮件的分类准确率和精确度。(2)本文采用ham(正常邮件)和spam(垃圾邮件)作为数据样本集,同时将文本内容解析成词向量,去停用词并提取出关键特征词,继而检查细条并保证解析的正确性,同时计算出不同独立特征关键词的条件概率,然后判断是否属于垃圾邮件。
路永鑫[8](2020)在《基于卷积神经网络的邮件管理系统的设计与实现》文中指出随着信息技术的发展,电子邮件服务以其高性价比的通信优势,迅速在网络用户中普及,成为人们信息交流的重要工具。但是,电子邮件便利的同时也带来了垃圾邮件泛滥的问题,垃圾邮件不仅占用互联网资源,更是对用户和企业造成严重困扰,耗费时间和精力,导致经济损失。因此,垃圾邮件过滤技术变得越来越重要,使用一款具有垃圾邮件过滤功能的邮件管理系统成为人们的需求。论文根据当前主要垃圾邮件过滤技术的特点与适用场景,基于卷积神经网络算法构建了一种中文垃圾邮件过滤模型。在模型构建前,论文对邮件内容进行了文本预处理和word2vec词向量生成等工作,然后依据卷积神经网络的结构和算法原理,完成了基础模型构建。为了提高模型的速度和准确率,论文依据卷积神经网络算法的结构特点,提出了 Dropout和L2正则化的优化方案。依据正常邮件和垃圾邮件的文本特征,提出了变步长卷积和带权池化的改进方案。然后通过实验,观察优化和改进方案对模型产生的影响。实验结果表明,经过优化和改进的中文垃圾邮件过滤算法,较未优化改进的中文垃圾邮件过滤算法,准确率提高4.43%,精确率提高4.91%,召回率提高6.10%,F1值提高5.50%,且模型较算法改进之前各指标在更快地提升。说明通过Dropout和L2正则化方案来优化算法,以变步长卷积和带权池化方案来改进算法,在提高模型分类速度和准确率方面,取得了一定效果。在对卷积神经网络中文垃圾邮件过滤算法改进后,论文采用JavaMail框架和vue-cli脚手架对邮件管理系统进行了设计与实现,并将基于改进算法构建的中文垃圾邮件过滤模型应用在系统中,使邮件管理系统能够提供用户登录,收发邮件,保存草稿,查看收件箱、发件箱、草稿箱和垃圾箱、管理通讯录、过滤垃圾邮件等主要功能。
王铭[9](2020)在《运动健康云平台系统软件的设计与实现》文中进行了进一步梳理随着信息技术的发展,在体育运动领域出现了智能运动设备和软件采集人体的运动和体征数据并进行直观的展示,辅助专业的运动人员规划运动策略。但是对于缺乏专业知识的普通大众来说,直观的数据并不能帮助他们做出正确的运动规划。因此,有效地利用采集的运动和体征数据分析出用户的个人体质情况,生成合理的运动建议成为智能运动健康领域的研究方向。基于以上问题,本文旨在设计与实现一个可以收集用户运动和体征数据,为用户生成个性化运动处方的云平台。主要研究内容包括运动健康云平台系统软件的设计与实现和个性化运动处方生成算法的设计与实现。本文主要工作如下:在运动健康云平台系统软件的设计与实现上,本文通过分析需求,模块化设计等方法设计了云平台系统的总体结构,然后经过技术方案选型,采用Springboot+Nginx+tomcat+Mysql+Redis组合的方案设计如实现了云平台系统的软件部分,在功能上实现了云平台接收存储用户数据,生成个性化运动处方,历史数据展示,运动处方展示等功能;在性能上可以满足480万pv/天的高流量稳定访问需求。在核心功能运动处方生成算法的设计与实现上,本文通过查阅文献的方法,比较研究随机森林与ANN,SVM,KNN等常用分类算法的性能,发现随机森林具有最高的准确度和最好的ROC以及F1-score性能指标,然后用本文使用的体测数据集和对对应的运动处方标签进行运动处方生成性能测试,结果显示随机森林相较于以上常用分类算法具有最好的准确度,Recall和F1-score值,因此,本文选择随机森林作为功能实现的算法。然后,针对随机森林算法在投票机制上存在忽略子树分类能力差异的不足和在非平衡集上的性能上还有提升空间的现状,本文通过查阅文献,理论论证和实验测试的方法得出AUC值可以作为投票权重参数改进随机森林算法的投票机制的结论,经过测试,该方法能提高算法在平衡集中的准确度,精准度,召回率等各项指标性能,提高幅度最大达到7.6%;也能提高算法在非平衡集中的召回率,特异度,G-mean等指标性能,其中少数类分类性能指标特异度的提升幅度最高可以达到33.3%。最后经过运动处方生成的测试实验,得出的结果显示改进型随机森林算法和原始随机森林,准确度加权随机森林在处方生成上的性能相比较,改进的算法在准确度上综合提升幅度分别为9.03%,2.71%;在召回率上分别提升7.31%和2.69%。
栗文真[10](2020)在《恶意邮件检测技术研究》文中提出电子邮件目前仍然是政府、企业、社会组织和个人使用最频繁的工作业务联系和交流的工具之一。随着个人隐私信息的大量泄露,攻击者可以通过收集攻击目标的相关信息制作出信息关联度极高的精准钓鱼邮件,此类邮件成为当前APT攻击和传播勒索软件的重要手段。本文针对恶意邮件的新威胁和检测存在的问题,提出了基于多特征的静态恶意邮件检测技术以及基于虚拟化平台的动态恶意邮件检测技术。为了进一步提升检测精度和效率,提出了一种静动结合的新型恶意邮件复合检测技术。检测方法均使用了Ada Boost集成学习算法和Voting组合策略构建分类模型,有效地提升了整体分类模型的检测精度和泛化能力。实验结果表明,本文所提出的恶意邮件检测方法与已有检测方法相比较,准确率和效率达到了均衡最优,也优于主流杀毒引擎。综上,本文主要研究成果如下:(1)提出了一种基于多特征的静态恶意邮件检测技术。基于快速静态分析,一次性的从邮件头部、正文和附件提取了大量可靠的、有区分度的静态特征用于静态分类检测模型的构建,实现对恶意邮件的快速准确的检测。(2)提出了一种基于虚拟化平台的动态恶意邮件检测技术。模拟用户打开邮件,利用虚拟机自省(Virtual Machine Introspection,VMI)技术和内存取证分析(Memory Forensics Analysis,MFA)技术捕获邮件动态行为特征,有效避免了针对传统沙箱的规避技术问题,从而获取更加真实可靠的邮件动态特征信息,提升了检测精准钓鱼邮件的能力。(3)提出了一种高效的静动结合的新型恶意邮件复合检测技术。首先采用静态检测方法进行检测过滤掉常规垃圾邮件和钓鱼邮件,对于发现的难于判定的可疑邮件再使用动态检测方法进行检测,进而发现高危精准钓鱼邮件,整体提升检测方法的精度和效率。(4)本文在静态和动态检测方法中,分别找出了最优的机器学习算法模型,借助Ada Boost集成学习方法和Voting组合策略,有效的提升了整体分类器的分类精度和泛化能力。总之,本文提出的恶意邮件检测技术可以提升对精准钓鱼邮件的检测发现能力,对保障网络空间安全具有积极意义。
二、个性化E-mail分类器的设计与实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、个性化E-mail分类器的设计与实现(论文提纲范文)
(1)大数据驱动的创新方法论与创新服务平台(论文提纲范文)
引 言 |
1 大数据驱动的创新方法论 |
1.1 知识融合 |
1.2 创意引导 |
1.3 方案研发 |
1.4 原型测试 |
1.5 众包反馈 |
1.6 众智众创 |
2 大数据驱动创新服务平台关键技术 |
2.1 基于创新知识图谱的创意智能引导 |
2.1.1 创新知识图谱数据获取与构建 |
2.1.2 创新知识图谱的可视化 |
2.2 基于发明原理的创新方案智能推荐 |
2.3 基于 PageRank 的创客匹配 |
2.3.1对社区的用户进行权威性分析 |
2.3.2 将用户提出的待解决问题与社区的用户进行匹配度计算 |
3 大数据驱动创新服务平台 |
3.1 数据跨界融合公共支撑系统 |
3.2 大数据驱动的创意引导系统 |
3.3 大数据驱动的方案推荐系统 |
3.4 众智众创反馈评价系统 |
4 大数据驱动的创新方法论和创新服务平台示范案例 |
4.1 板材下料自动拾取系统创新应用 |
4.1.1 基于数据融合跨界系统获取领域数据 |
4.1.2 基于大数据驱动的方案推荐系统匹配 TRIZ 原理 |
4.1.3 基于众智众创评价系统选择最优方案 |
4.2 证书打印机创新应用 |
4.2.1 基于创新服务平台的创意描述与方案推荐 |
5 结语 |
利益冲突声明 |
(2)大学生锻炼坚持行为影响因素及促进策略研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与研究问题 |
1.1.1 研究背景 |
1.1.2 研究问题 |
1.2 研究意义 |
1.2.1 理论意义 |
1.2.2 实践意义 |
1.3 研究内容与方法 |
1.3.1 研究思路 |
1.3.2 研究内容 |
1.3.3 研究方法 |
1.4 创新性 |
第二章 文献综述及理论基础 |
2.1 文献综述 |
2.1.1 相关概念的研究 |
2.1.2 锻炼坚持行为影响因素的研究 |
2.1.3 锻炼坚持行为促进的相关理论 |
2.1.4 文献述评 |
2.2 锻炼坚持行为促进的相关管理理论基础 |
2.2.1 社会交换理论 |
2.2.2 健康自我管理与行为决策 |
2.2.3 综合集成思想与TEI@I方法论 |
2.3 大数据分析的相关理论与技术 |
2.3.1 大数据支持体育行为记录与干预 |
2.3.2 用户生成内容的自然语言处理与主题发现 |
2.3.3 行为特征的聚类 |
2.3.4 基于有监督机器学习的行为特征分类器 |
2.4 本章小结 |
第三章 大学生锻炼坚持行为因素与结构 |
3.1 大学生锻炼坚持行为因素研究设计 |
3.1.1 因素筛选方法 |
3.1.2 研究过程 |
3.1.3 资料收集与处理 |
3.1.4 资料初步分析结果 |
3.2 因素界定 |
3.2.1 基于文献的相关关键词界定 |
3.2.2 基于UGC内容的因素提取 |
3.3 模型因素一致性检验 |
3.3.1 回访专家过程及数据选择 |
3.3.2 权重计算与一致性检验 |
3.4 因素结构分析 |
3.4.1 锻炼坚持行为五因素 |
3.4.2 锻炼效果感知双向作用拆分 |
3.5 本章小结 |
第四章 大学生锻炼坚持行为模型假设与验证 |
4.1 锻炼坚持行为分析框架 |
4.2 研究假设 |
4.2.1 健康行为自评、锻炼效果感知和锻炼内驱力 |
4.2.2 锻炼条件、锻炼效果感知和锻炼内驱力 |
4.2.3 锻炼效果感知、锻炼内驱力和锻炼行为 |
4.2.4 锻炼行为模型中的链式中介 |
4.2.5 锻炼行为模型中的调节变量 |
4.3 问卷设计原则与题目类型 |
4.3.1 问卷题目类型 |
4.3.2 问卷设计原则 |
4.3.3 问卷题目设计 |
4.4 大学生锻炼坚持行为模型验证 |
4.4.1 预调研 |
4.4.2 正式调研 |
4.4.3 结果分析 |
4.5 大学生锻炼坚持行为促进的“SCeiP”模型 |
4.5.1 “SCeiP”模型逻辑与特征 |
4.5.2 “SCeiP”模型内部促进双路径 |
4.5.3 “SCeiP”模型外部反馈双路径 |
4.6 本章小结 |
第五章 大学生锻炼坚持行为分类促进策略 |
5.1 大学生锻炼坚持行为分类促进思路、指导原则与目标 |
5.1.1 大学生锻炼坚持行为分类促进的总体思路 |
5.1.2 大学生锻炼坚持行为分类促进的指导原则 |
5.1.3 大学生锻炼坚持行为分类促进的目标 |
5.2 大学生锻炼坚持行为分类与结果 |
5.2.1 大学生锻炼坚持行为分类需求分析及过程 |
5.2.2 大学生锻炼坚持行为分类结果 |
5.3 大学生锻炼坚持行为分类特点 |
5.3.1 锻炼行为数据分类偏差分析 |
5.3.2 不同类别特点形成原因分析 |
5.4 大学生锻炼坚持行为分类促进的“因材施教”策略 |
5.4.1 大学生锻炼坚持行为分类促进方式 |
5.4.2 不同大学生锻炼坚持行为类别促进策略 |
5.5 本章小结 |
第六章 大学生锻炼坚持行为促进平台及保障策略 |
6.1 大学生锻炼坚持行为促进平台设计与实现 |
6.1.1 大学生锻炼坚持行为促进平台的设计 |
6.1.2 大学生锻炼坚持行为促进平台的实现 |
6.2 大学生锻炼坚持行为促进保障策略 |
6.2.1 大学生锻炼坚持行为促进组织保障策略 |
6.2.2 大学生锻炼坚持行为促进制度保障策略 |
6.2.3 大学生锻炼坚持行为促进监督反馈策略 |
6.3 本章小结 |
第七章 结论与展望 |
7.1 结论 |
7.2 研究不足与展望 |
参考文献 |
附录 |
附录1 大学生锻炼坚持行为管理因素构成专家意见调查表 |
附录2 大学生锻炼坚持行为影响因素权重专家调查表 |
附录3 预调研问卷独立样本T检验结果汇总 |
附录4 大学生锻炼坚持行为调查问卷 |
附录5 移动应用爬虫程序展示(部分) |
附录6 用户生成内容话题识别程序展示(部分) |
附录7 Mplus程序部分展示(部分) |
附录8 大学生锻炼坚持行为促进平台与应用关键代码(部分) |
图目录 |
表目录 |
攻读期间发表学术论文 |
致谢 |
附件 |
学位论文评阅及答辩情况表 |
(3)面向知识服务的用户画像构建与应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 选题背景及研究意义 |
1.1.1 用户画像的产生背景 |
1.1.2 农业专业知识服务系统 |
1.2 国内外研究现状 |
1.2.1 知识服务研究现状 |
1.2.2 用户画像研究现状 |
1.2.3 小结 |
1.3 研究内容与研究方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 技术路线 |
第二章 相关理论与技术基础 |
2.1 数据采集 |
2.1.1 WEB日志文件分析 |
2.1.2 Java Script埋点 |
2.1.3 爬虫或包嗅探器 |
2.2 数据预处理 |
2.2.1 数据清洗 |
2.2.2 数据集成 |
2.2.3 数据转换 |
2.2.4 数据归约 |
2.2.5 常用ETL工具 |
2.3 数据挖掘 |
2.3.1 聚类分析 |
2.3.2 相似度计算 |
2.3.3 词频分析 |
2.3.4 概率主题模型 |
2.3.5 命名实体识别 |
2.4 本章小结 |
第三章 面向知识服务的用户画像构建 |
3.1 用户画像模型研究 |
3.1.1 用户画像需求分析 |
3.1.2 用户画像功能分析 |
3.1.3 用户画像模型 |
3.2 实验环境与数据来源 |
3.3 用户画像数据准备 |
3.3.1 数据采集 |
3.3.2 数据预处理 |
3.3.3 数据存储 |
3.4 用户画像数据处理 |
3.4.1 跨渠道用户标识打通 |
3.4.2 研究领域识别 |
3.4.3 研究兴趣识别 |
3.4.4 用户活跃度划分 |
3.4.5 标签体系 |
3.5 用户画像可视化 |
3.6 用户画像验证 |
3.7 本章小结 |
第四章 面向知识服务的用户画像实现与应用研究 |
4.1 总体设计 |
4.2 数据库设计 |
4.3 用户画像数据采集 |
4.3.1 数据采集模块 |
4.3.2 埋点分析 |
4.4 用户画像结果展示 |
4.4.1 全局用户 |
4.4.2 标签词云 |
4.5 基于用户画像的应用场景 |
4.5.1 基于画像的用户分群 |
4.5.2 基于内容的个性化推荐 |
4.5.3 精准智能检索 |
4.5.4 合作关系网络分析 |
4.5.5 服务监测与参考决策 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
致谢 |
作者简历 |
(4)面向知识图谱的学习算法研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究难点与挑战 |
1.2.1 实体关系抽取 |
1.2.2 概念上下位关系识别 |
1.2.3 基于时序知识图谱的表示学习 |
1.2.4 基于新闻文本语料的概念知识图谱构建 |
1.3 本文研究内容与贡献 |
1.4 本文组织结构 |
第二章 开放域实体关系抽取方法研究 |
2.1 引言 |
2.2 预备知识 |
2.2.1 依存句法树 |
2.2.2 最短依存路径 |
2.2.3 开放关系抽取的任务定义 |
2.3 相关工作 |
2.3.1 基于无监督学习的抽取方法 |
2.3.2 基于深度学习的抽取方法 |
2.4 基于句法分析的开放关系抽取方法 |
2.4.1 生成依存句法树 |
2.4.2 候选三元组抽取 |
2.4.3 实体关系强度度量 |
2.5 实验与分析 |
2.5.1 数据集 |
2.5.2 对比方法 |
2.5.3 评估指标 |
2.5.4 实验结果 |
2.6 本章小结 |
第三章 概念上下位关系识别方法研究 |
3.1 引言 |
3.2 任务定义 |
3.3 相关工作 |
3.3.1 基于语言模式的匹配方法 |
3.3.2 基于分布式表示的识别方法 |
3.4 概念定义驱动的上下位关系识别方法 |
3.4.1 语句输入层 |
3.4.2 语句编码层 |
3.4.3 交互层 |
3.4.4 上下位关系分类层 |
3.5 实验与分析 |
3.5.1 数据集构建 |
3.5.2 对比方法 |
3.5.3 评估指标 |
3.5.4 实现细节 |
3.5.5 实验结果 |
3.6 本章小结 |
第四章 时序知识图谱补全方法研究 |
4.1 引言 |
4.2 预备知识 |
4.2.1 静态知识图谱 |
4.2.2 时序知识图谱 |
4.2.3 时序知识图谱补全的任务定义 |
4.3 相关工作 |
4.3.1 基于静态知识图谱的表示学习模型 |
4.3.2 基于时序知识图谱的表示学习模型 |
4.4 基于两阶段框架的时序知识图谱补全方法 |
4.4.1 阶段一:时序演化增强的表示学习模型 |
4.4.2 阶段二:精细分析模型 |
4.5 实验与分析 |
4.5.1 数据集 |
4.5.2 对比方法 |
4.5.3 评估指标 |
4.5.4 实现细节 |
4.5.5 实验结果 |
4.6 本章小结 |
第五章 基于新闻数据的概念知识图谱构建方法研究 |
5.1 引言 |
5.2 任务定义 |
5.3 相关工作 |
5.3.1 新闻表示 |
5.3.2 主题检测与追踪 |
5.3.3 开放域关系抽取 |
5.3.4 抽取式文档摘要 |
5.3.5 基于多文档的语义挖掘系统 |
5.4 概念知识图谱构建模型 |
5.4.1 数据预处理 |
5.4.2 候选关系实例抽取 |
5.4.3 主题一致性估计 |
5.4.4 关系实例兼容性度量 |
5.4.5 生成概念知识图谱 |
5.5 实验与分析 |
5.5.1 数据集 |
5.5.2 实验准备工作 |
5.5.3 实验结果分析 |
5.6 系统概况 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(5)基于集成学习的个性化垃圾邮件过滤技术研究与应用(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 基于发送方特征的过滤技术 |
1.2.2 基于邮件内容的过滤技术 |
1.3 本文主要工作 |
1.4 本文组织结构 |
2 垃圾邮件过滤技术概述 |
2.1 垃圾邮件过滤步骤概述 |
2.1.1 邮件结构及工作原理 |
2.1.2 预处理 |
2.1.3 邮件文本特征选择 |
2.1.4 邮件文本特征表示 |
2.2 垃圾邮件过滤方法概述 |
2.2.1 增量学习 |
2.2.2 主动学习 |
2.2.3 集成学习 |
2.2.4 半监督学习 |
2.3 本章小结 |
3 基于邮件结构化文本的集成学习 |
3.1 研究背景与动机 |
3.2 邮件结构化文本集成学习框架 |
3.3 基于邮件头的决策树分类方法 |
3.3.1 邮件头特征表示 |
3.3.2 基于邮件头特征的CART决策树分类算法 |
3.4 基于邮件正文的K最近邻分类方法 |
3.4.1 word2vec词向量生成 |
3.4.2 TF-IDF加权的文本向量表示 |
3.4.3 基于相似度阈值的K最近邻分类算法 |
3.5 Ada-CK集成学习方法 |
3.5.1 Adaboost算法介绍 |
3.5.2 Ada-CK算法介绍 |
3.6 实验设计与结果分析 |
3.6.1 实验环境与数据 |
3.6.2 实验评估指标 |
3.6.3 实验方法与过程 |
3.6.4 参数分析 |
3.6.5 内部算法比较 |
3.6.6 外部算法比较 |
3.7 本章小结 |
4 基于用户个性化特征的主动学习 |
4.1 研究背景与动机 |
4.2 用户个性化垃圾邮件过滤框架 |
4.3 基于用户兴趣集的分类方法 |
4.3.1 兴趣集相关定义 |
4.3.2 兴趣集模型 |
4.3.3 基于兴趣集的邮件分类方法 |
4.4 基于主动学习的样本选择 |
4.5 兴趣集和训练集更新 |
4.6 实验设计与结果分析 |
4.6.1 实验环境及数据 |
4.6.2 实验方法与过程 |
4.6.3 参数分析 |
4.6.4 算法性能比较 |
4.7 本章小结 |
5 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(6)基于自适应学习系统的学习资源推荐的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 自适应学习系统 |
1.2.2 学习资源的推荐策略 |
1.2.3 链路预测 |
1.3 研究内容 |
1.4 论文的组织结构 |
第二章 相关理论与相关技术 |
2.1 个性化推荐策略 |
2.1.1 传统模型的推荐 |
2.1.2 基于深度模型的推荐 |
2.2 链路预测 |
2.2.1 基于图结构特征的链路预测 |
2.2.2 基于隐性特征的链路预测 |
2.2.3 基于显性特征的链路预测 |
2.3 Skip-gram模型 |
2.3.1 Skip-gram模型结构 |
2.3.2 Skip-gram模型优化 |
2.4 梯度下降法 |
2.4.1 算法的相关概念 |
2.4.2 算法的代数描述 |
2.4.3 算法的分类比较 |
2.5 评价指标 |
第三章 VirtualLink2vec链路预测模型 |
3.1 引言 |
3.2 形式化 |
3.3 VirtualLink2vec模型 |
3.3.1 Node2vec模型 |
3.3.2 RPE模型 |
3.3.3 虚拟链路嵌入 |
3.4 实验 |
3.4.1 数据集 |
3.4.2 基线模型 |
3.4.3 实验设置 |
3.4.4 实验结果 |
3.4.5 参数灵敏度 |
3.4.6 正向关系和负向关系 |
第四章 基于VirtualLink2vec的学习资源推荐模型 |
4.1 学习者模型 |
4.1.1 学习者建模标准 |
4.1.2 学习者模型的关键点 |
4.1.3 学习者模型的构建 |
4.2 学习资源模型 |
4.3 学习资源推荐模型 |
4.4 实验 |
4.4.1 基线模型 |
4.4.2 评价标准 |
4.4.3 实验结果 |
第五章 学习资源推荐功能的设计与实现 |
5.1 需求分析 |
5.2 系统设计 |
5.3 系统功能测试 |
第六章 总结与展望 |
参考文献 |
致谢 |
攻读学位期间取得的研究成果 |
(7)改进朴素贝叶斯算法在垃圾邮件过滤中的应用(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 朴素贝叶斯的研究现状 |
1.2.2 垃圾邮件的研究现状 |
1.3 研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
2 邮件过滤相关技术 |
2.1 文本分类技术 |
2.1.1 原始文本获取 |
2.1.2 分词 |
2.1.3 文本清洗 |
2.1.4 特征提取 |
2.2 主动学习的概念 |
2.2.1 主动学习模型 |
2.2.2 主动学习算法 |
2.2.3 主动学习的应用领域 |
2.3 朴素贝叶斯 |
2.3.1 贝叶斯算法 |
2.3.2 朴素贝叶斯算法 |
2.3.3 朴素贝叶斯算法的优缺点 |
2.3.4 朴素贝叶斯算法的应用 |
2.4 KNN分类算法 |
2.4.1 KNN分类算法定义 |
2.4.2 KNN算法流程描述 |
2.4.3 关于K值的选取 |
2.4.4 关于距离的选取 |
2.4.5 数据特征的量化 |
2.4.6 加权KNN算法 |
2.4.7 KNN算法的优缺点 |
2.4.8 KNN算法的主要应用领域 |
2.5 本章小结 |
3 基于K-近邻加权朴素贝叶斯改进算法在垃圾邮件过滤中的应用. |
3.1 基于k-近邻局部加权朴素贝叶斯改进算法 |
3.1.1 基于K-近邻局部加权朴素贝叶斯改进算法思想 |
3.1.2 基于K-近邻局部加权朴素贝叶斯改进算法步骤 |
3.2 实验测试 |
3.2.1 数据集介绍 |
3.2.2 评价指标 |
3.2.3 实验结果与结果分析 |
4 垃圾邮件过滤系统的设计 |
4.1 系统总体设计 |
4.1.1 需求分析 |
4.1.2 系统概要设计 |
4.1.3 数据库设计 |
4.2 系统详细设计 |
4.2.1 原始邮件预处理模块 |
4.2.2 改进朴素贝叶斯分类器模块 |
4.3 本章小结 |
5 垃圾邮件过滤系统的实现 |
5.1 垃圾邮件系统环境搭建 |
5.2 垃圾邮件过滤系统的实现 |
5.3 本章小结 |
6 总结与展望 |
6.1 论文工作总结 |
6.2 工作展望 |
参考文献 |
附录 :作者攻读硕士学位期间发表论文及科研情况 |
致谢 |
(8)基于卷积神经网络的邮件管理系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 垃圾邮件过滤技术分析 |
1.3 基于统计的垃圾邮件过滤研究现状 |
1.3.1 朴素贝叶斯 |
1.3.2 K-近邻算法 |
1.3.3 支持向量机 |
1.3.4 垃圾邮件过滤算法评估 |
1.4 论文主要内容和结构安排 |
第二章 卷积神经网络相关技术概述 |
2.1 卷积神经网络 |
2.1.1 卷积层 |
2.1.2 激活函数 |
2.1.3 池化层 |
2.1.4 全连接层和softmax分类器 |
2.2 文本预处理 |
2.2.1 字符过滤 |
2.2.2 中文分词 |
2.2.3 停用词处理 |
2.3 word2vec |
2.3.1 独热编码 |
2.3.2 分布式词向量 |
2.3.3 word2vec |
2.3.4 词向量生成 |
2.4 基础卷积神经网络中文垃圾邮件过滤模型构建 |
2.5 本章小结 |
第三章 一种改进的卷积神经网络中文垃圾邮件过滤算法 |
3.1 改进方案 |
3.1.1 Dopout方案 |
3.1.2 L2正则化方案 |
3.1.3 变步长卷积方案 |
3.1.4 带权池化方案 |
3.2 实验设计 |
3.2.1 实验环境 |
3.2.2 实验数据集 |
3.2.3 评价指标 |
3.2.4 实验流程 |
3.3 实验结果分析 |
3.3.1 Dropout的影响 |
3.3.2 L2正则化的影响 |
3.3.3 变步长卷积的影响 |
3.3.4 带权池化的影响 |
3.3.5 实验结论 |
3.4 本章小结 |
第四章 邮件管理系统的设计与实现 |
4.1 技术支持 |
4.1.1 电子邮件格式协议 |
4.1.2 电子邮件工作原理 |
4.1.3 JavaMail框架 |
4.2 邮件管理系统需求分析 |
4.2.1 系统功能性需求 |
4.2.2 系统非功能性需求 |
4.3 后端设计与实现 |
4.3.1 系统结构 |
4.3.2 用户登录 |
4.3.3 接收邮件 |
4.3.4 发送邮件 |
4.3.5 管理通讯录 |
4.4 前端设计与实现 |
4.4.1 Vue.js |
4.4.2 页面实现 |
4.5 系统功能测试 |
4.5.1 用户登录测试 |
4.5.2 接收邮件测试 |
4.5.3 发送邮件测试 |
4.5.4 管理通讯录测试 |
4.6 本章小结 |
第五章 总结与展望 |
参考文献 |
致谢 |
(9)运动健康云平台系统软件的设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 云平台国内外研究现状 |
1.2.2 运动健康应用研究现状 |
1.2.3 运动处方推荐算法研究进展 |
1.3 论文的主要贡献和创新点 |
1.4 论文的结构安排 |
第二章 云平台技术基础知识 |
2.1 云平台基础知识 |
2.2 云平台技术 |
2.2.1 云平台基础技术 |
2.2.2 云平台软件技术选型方案 |
2.2.3 云平台通信协议 |
2.3 信息处理和算法 |
2.3.1 数据预处理 |
2.3.2 算法基础 |
2.4 本章小结 |
第三章 运动健康云平台系统软件方案设计 |
3.1 功能需求与性能指标分析 |
3.2.1 功能需求 |
3.2.2 性能指标 |
3.2.3 开发环境 |
3.2 云平台系统软件总体设计方案 |
3.3 云平台系统软件关键组件设计方案 |
3.3.1 数据库设计方案 |
3.3.2 Nginx负载均衡设计方案 |
3.4 本章小结 |
第四章 运动健康云平台系统软件详细设计与实现 |
4.1 登录/注册模块 |
4.2 数据通信模块 |
4.3 数据库模块 |
4.3.1 功能和工作流程 |
4.3.2 MySQL库表设计 |
4.3.3 MySQL主从模式配置 |
4.3.4 Redis哨兵模式配置 |
4.4 用户当前处方展示模块 |
4.5 用户历史数据展示模块 |
4.6 新运动处方生成模块 |
4.6.1 处方生成流程 |
4.6.2 处方库实现 |
4.7 管理员模块 |
4.8 本章小结 |
第五章 基于云平台的智能运动健康核心功能算法研究 |
5.1 随机森林算法研究 |
5.1.1 算法优势 |
5.1.2 算法不足 |
5.2 改进型随机森林算法研究 |
5.2.1 改进方向的研究 |
5.2.2 投票权重因子改进的研究 |
5.2.3 改进型随机森林算法 |
5.3 改进型随机森林算法基础性能测试与分析 |
5.3.1 性能指标 |
5.3.2 测试环境,实验数据和来源 |
5.3.3 实验设计与结果 |
5.3.4 结果分析 |
5.4 改进型随机森林算法运动处方生成性能测试与分析 |
5.4.1 性能指标 |
5.4.2 测试环境,实验数据和来源 |
5.4.3 实验设计与结果 |
5.4.4 结果分析 |
5.5 改进型随机森林算法的不足 |
5.6 本章小结 |
第六章 运动健康云平台系统软件功能和性能测试 |
6.1 功能与性能测试方案 |
6.1.1 功能测试方案 |
6.1.2 性能测试方案 |
6.2 功能测试结果与分析 |
6.3 性能测试结果与分析 |
6.4 本章小结 |
第七章 总结和展望 |
7.1 全文总结 |
7.2 后续工作与展望 |
致谢 |
参考文献 |
(10)恶意邮件检测技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.3 论文主要内容 |
1.4 论文章节安排 |
第二章 恶意邮件分类与相关检测技术 |
2.1 恶意邮件分类 |
2.1.1 垃圾邮件 |
2.1.2 精准钓鱼邮件 |
2.2 静态恶意邮件检测技术 |
2.2.1 基于来源的检测技术 |
2.2.2 基于规则的检测技术 |
2.2.3 基于内容的检测技术 |
2.3 动态恶意邮件检测技术 |
2.4 集成分类算法 |
2.4.1 Ada Boost集成模型 |
2.4.2 Voting组合策略 |
2.5 本章小结 |
第三章 基于多特征的静态恶意邮件检测技术研究 |
3.1 基于多特征的静态恶意邮件检测技术概述 |
3.2 静态多特征提取模块 |
3.2.1 头部特征 |
3.2.2 正文特征 |
3.2.3 附件特征 |
3.3 静态分类模块 |
3.4 本章小结 |
第四章 基于虚拟化平台的动态恶意邮件检测技术研究 |
4.1 基于虚拟化平台的动态恶意邮件检测技术概述 |
4.2 相关技术介绍 |
4.2.1 虚拟机自省技术 |
4.2.2 内存取证技术 |
4.3 动态特征提取模块 |
4.4 动态分类模块 |
4.5 本章小结 |
第五章 新型恶意邮件复合检测技术设计与实验分析 |
5.1 静动结合的新型恶意邮件复合检测技术设计 |
5.1.1 设计目标 |
5.1.2 检测架构 |
5.2 实验环境 |
5.3 实验数据集 |
5.4 评测指标 |
5.5 实验结果对比与分析 |
5.5.1 基于多特征的静态恶意邮件检测技术 |
5.5.2 基于虚拟化平台的动态恶意邮件检测技术 |
5.5.3 静动结合的新型恶意邮件复合检测技术 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
在学期间取得的科研成果和科研情况说明 |
致谢 |
四、个性化E-mail分类器的设计与实现(论文参考文献)
- [1]大数据驱动的创新方法论与创新服务平台[J]. 鹿旭东,宋伟凤,郭伟,崔立真,林岳,姜涛. 数据与计算发展前沿, 2021(05)
- [2]大学生锻炼坚持行为影响因素及促进策略研究[D]. 王磊. 山东大学, 2021(10)
- [3]面向知识服务的用户画像构建与应用研究[D]. 岳怡然. 中国农业科学院, 2021(09)
- [4]面向知识图谱的学习算法研究与应用[D]. 盛泳潘. 电子科技大学, 2020(01)
- [5]基于集成学习的个性化垃圾邮件过滤技术研究与应用[D]. 向平常. 北京交通大学, 2020(03)
- [6]基于自适应学习系统的学习资源推荐的研究与实现[D]. 姚灿. 北京邮电大学, 2020(05)
- [7]改进朴素贝叶斯算法在垃圾邮件过滤中的应用[D]. 王斯琴. 重庆师范大学, 2020(05)
- [8]基于卷积神经网络的邮件管理系统的设计与实现[D]. 路永鑫. 华中师范大学, 2020(12)
- [9]运动健康云平台系统软件的设计与实现[D]. 王铭. 电子科技大学, 2020(07)
- [10]恶意邮件检测技术研究[D]. 栗文真. 天津理工大学, 2020(05)