一、互联网、网站与种子(论文文献综述)
罗毅夫[1](2021)在《基于深度学习的昆明市旅游路线推荐算法研究》文中指出随着经济的进步,大众生活水平不断提高,传统旅游出行方式也在逐渐朝信息化方向转变。旅行社规划旅行路线的传统出行方式已经不是人们旅游的首要选择。一方面,互联网飞速发展给人们带来便利的同时,另一方面也为公众带来了大量的信息,人们从海量的信息中挑选出有价值并且适合自己的旅游资讯需要花费大量的时间精力,规划一份精细且个性化的旅游攻略成为了自由行中一个必不可少的工作。因此,智慧旅游路线的规划也需要跟随旅游产业的发展而发展,为游客规划出一份详细且精准的旅游路线,不仅仅可以提升游客的旅游体验,还可以增加游客对推荐系统的用户黏性,因此,无论从企业层面还是从用户层面,这项工作都是具有价值的。本文以短途旅游为出发点,将研究范围限定在一个旅游城市,假定游客一天内游览的景点数量有限,通过对旅游大数据的挖掘,建立时下流行的深度学习模型,调用互联网地图服务数据,提取相关因子,同时以游客大数据信息为实验样本,设计出一种基于神经网络和游客收益函数的旅游路线规划算法。为用户规划出符合用户自身情况,预算成本,时间和兴趣偏好的旅游路线,同时为游客提供多种次优路线以供决策。本文的研究工作如下:马蜂窝是国内大型旅游门户网站,在平台上游客可以撰写游记,交流体验,分享心得,定制旅游等,因此将研究的实验数据来源选为马蜂窝。利用爬虫工具首先获取马蜂窝上等级30级以上的资深用户的游记,旅游日志,用户特征等信息,经过数据清洗,组合,按照统一格式存储,这些信息包括游客旅游的人口统计学特征,旅游历史轨迹,收入,兴趣偏好等等。旅游景点信息从专业旅游网站上获取,选取热门旅游城市昆明市城区内最受游客欢迎的31个景点为研究对象。涵盖了自然风景,名山大川,名胜古迹,游乐场,购物中心等7类旅游景区分类。从专业的互联网旅游网站,当地旅游信息网提取旅游景点信息,主要包括旅游景点的经纬度,热度指数,交通信息等。对用户数据和旅游信息数据进行建模,首先将获取到的用户数据与旅游景点数据进行组合,形成用户兴趣样本。这是建立基于卷积神经网络兴趣挖掘模型的基础,也是核心部分。将组合的数据按照统一格式存储在文本中。接下来设计一个卷积神经网络模型,本文设计了15个卷积层,2个池化层,2个全连接层的卷积神经网络模型,将20000个数据样本按照9:1的比例分别用作训练样本和测试样本。通过对训练样本20期训练得到模型,并存储,以便预测时调用。设计最优旅游景点挖掘算法。神经网络预测模块输出游客最感兴趣旅游景点分类降序向量,根据实际情况,游客一天内访问的旅游景点数量是有限的,因此根据兴趣分类降序向量设计旅游景点分类和旅游景点数量分布矩阵,论文中称之为旅游景点分类分布矩阵。推荐系统会重点推荐矩阵行中靠前的规划方案,游客也可以自主选择。当游客选择矩阵中某一行时,根据设计的游客收益函数计算每个旅游景点区间的游客旅游体验收益值,在符合游客兴趣,时间等安排下,收益值越大,表明旅行体验越好。通过基于收益函数目标最大值计算,挖掘出游客最感兴趣的种子旅游景点,存储为感兴趣的旅游景点集合。挖掘出的最优旅游景点集合在地理位置上是离散的,根据排列组合原理,可以将这些旅游景点组合成多条路线,即先访问哪个景点后访问哪个景点对于游客来说的旅行体验是不一样的,只从距离的角度来划分过于机械。因为考虑到影响游客旅行体验的不仅仅包括距离,还有交通等待时间,预算成本等因数,因此,引入收益函数正向与负向影响因子进行迭代计算,分别计算每一条景点组合成的旅游路线的游客收益迭代函数值,最后选择函数值最小的一条路线作为最优旅游路线,对游客进行推荐,同时也将次优路线提供给游客决策。文章最后,对实验部分进行更加详细的分析。阐述了本文提出的方案的应用价值。同时,对基于神经网络的旅游路线规划算法存在的缺陷和有待改进的部分进行分析总结,对未来的工作做出展望。
杨俊蓉[2](2021)在《PCOT教学模式在生物学七年级上册教学中的实践研究》文中研究说明昆明市盘龙区H中学生物教研组基于学校现实情况和学生学情,对适于该校学生发展的初中生物学PCOT教学模式进行了探索。笔者作为该校生物代课教师,共同探索初中生物学PCOT教学模式,并承担生物学七年级上册新授课课型的实践研究工作。PCOT教学模式(P,Person,个体;C,Community,学习共同体;O,Online Learning,线上学习;T,Traditional Learning,传统学习)是以特定的教育思想和教学理论作为指导,在教学实践中将个人自学和学习共同体交互学习、线上学习和传统线下学习相融合的四维一体的教学模式。旨在实现传统课堂面授和线上学习的优势互补,同时满足学生个人自学和学习共同体协作学习的不同需求。实践研究结果表明:PCOT教学模式有效地提升了学生的生物学习成绩;有助于培养学生的自主学习能力、协作学习能力和现代化信息素养;同时促进了学习共同体成员间的情感交流。实践研究的创新和特色:PCOT教学模式建设了多元化的学生活动评价体系;搭建了具有特色的线上资源库;切实地将学校资源与生物学习进行有机整合。PCOT教学模式在生物学七年级上册教学中的成功实践,为后来的“停课不停学”新冠疫情防控期间,提供了切实可行的实践方案,推广应用到了实践学校的其他学科,PCOT教学模式展现出了具有实践性的可持续发展态势。
张擎天[3](2021)在《网络文件下载信息搜索及追踪系统》文中研究指明互联网兴起至今不过30年,已经发展成为一个庞然大物,互联网提供的服务从最初的文本浏览到今天的各种纷繁的功能业务,其核心都避不开文件的传输即下载,文件下载在为用户带来便利的同时也带来了在线盗版文件下载。而且近年来随着我国网络基础设施的快速发展,网速出现了飞跃性的进步,盗版文件的传播也变得更加快速,盗版文件的下载出现了传播量大、有效时间短的特点。基于以上因素,本文提出了一种主要面向盗版下载文件的下载信息搜索和下载来源追踪的系统(ISTS-NDF Information Searching and Tracking System of Network Downloading File)。针对盗版文件相关问题,本文将系统功能拆分,实现了三个不同功能的子系统。本文中:1.实现了一系列爬虫,将网页爬取的过程拆分成不同阶段和功能,分别实现了遍历、解析、登录、回复等功能的爬虫,解决了人机验证保护下的深层网页的信息收集问题。2.本文针对网页正文提取的多种特征,分离了爬虫与爬虫分析网页的代码,实现了基于平均采样的爬虫代码与网站的动态匹配算法和动态代码加载,可对同类型的网站进行爬虫代码匹配,减少人工编写代码的工作量。3.为了收集大量的盗版文件信息,本文在单机爬虫基础上设计了一种分布式爬虫系统方案。该方案实现了一种基于爬虫历史爬取性能数据的权重轮询任务规划算法,解决分布式系统中节点任务规划问题。实现了基于布隆过滤器算法的大规模网页去重与增量爬取功能,使用Docker虚拟化技术实现了节点的自动部署、自动代码更新,基于Scrapyd技术实现了节点的状态监控,冗余备份,节点失效的自愈功能,完成了一个工业化的分布式爬虫系统,为大规模的网络信息收集提供了可能性。4.在收集下载文件信息的基础上,本文设计实现了一种下载文件的追踪子系统,可对直接下载、网盘分享、P2P下载的三种文件分享形式进行不同程度上的有效性的确认和来源追踪,可以为执法者和相关研究者提供数据上的支持。5.本文设计实现了一个简洁的系统数据展示和系统功能管理的子系统,使用流行的前后端技术实现该子系统,做到了前后端分离。
广州市人民政府[4](2021)在《广州市人民政府关于取消和重心下移一批市级行政权力事项的决定》文中提出广州市人民政府文件穗府[2021]1号各区人民政府,市政府各部门、各直属机构:为深化"放管服" 改革,进一步转变政府职能,市政府决定取消和重心下移2597项市级行政权力事项,其中取消269项,实行重心下移、改由区(含功能区,下同)就近实施2328项。各区、市有关部门要做好落实和衔接工作,细化监管措施,提高监管效能,推进政府管理科学化、规范化、法治化。
任雪娇[5](2021)在《面向领域数据的高效数据获取方法研究与应用》文中研究说明大数据背景下,数据挖掘与充分利用已成为企业提升竞争力的核心要素。当前,Web数据获取的主要手段是网络爬虫,针对大规模Web数据获取,传统网络爬虫存在爬取效率低,工作难度大,安全性等问题。因此,本文构建了一种基于Scrapy-redis分布式爬虫框架的数据获取方法。提出了优化后的布隆过滤器去重算法,采用Docker容器进行项目管理;面向农业领域搭建了一个Web数据高效获取实验平台。具体研究成果如下:(1)搭建了面向Web领域数据的高效获取框架。改进了Scrapy-redis分布式爬虫框架以支持多节点并行爬取,该方法使用yaml文件实现爬虫可配置化,采用GNE进行网站正文抽取以提高数据准确率,利用Docker容器和Rancher平台管理分布式爬虫。(2)提出了一种海量URL去重方法。针对传统的基于磁盘或内存的URL去重方法带来的空间占用率过高等问题,通过调用布隆过滤器算法,利用多个哈希函数对元素集合进行映射,降低了内存空间的占用,从而大大提高了判重效率。(3)开发了Web数据高效获取的实验系统。面向农业领域,综合应用了ajax方法、Flask框架、html、css、js等技术工具,开发了Web数据高效获取的验证系统。通过输入检索关键词匹配对应资源的URL,利用任务管理控制台启动或停止爬虫进程,获取到相应数据并进行数据展示和保存。
林振宇[6](2020)在《基于多主题情感词典的旅游信息挖掘及其应用 ——以海南省A级景点为例》文中研究说明随着移动互联网在人们日常生活中的广泛应用,用户使用社交媒体记录的旅游信息以数字化的形式存储在网络平台之上,这些旅游信息中多包含了丰富的关于景区不同主题的评价信息,通过对这些信息进行处理与挖掘,从中探索蕴含的规律,能够快速的为游客提供符合个人喜好的旅游信息从而满足其个性化出游的需求,同时也能够为景区管理人员对整个旅游管理对象提供全方位监控及决策分析的数据支持。社交媒体数据以其非结构化的特征使得他们很难被直接使用,丰富的主题评价信息隐藏在非结构化且数量庞大的文本语料之中,在目前研究中,挖掘旅游信息通常使用用于情感计算的通用词典,但通用词典挖掘维度单一,不能满足多主题旅游评价信息的挖掘标准。为此,本文结合了自然语言处理、机器学习等算法构建了一套自动化挖掘旅游多主题评价情感信息的流程。主要的工作及成果包括了以下几个方面:(1)本文构建了自动化采集与处理社交媒体数据的程序,在数据采集中,针对不同的旅游网站制定采集程序,在数据处理过程中,根据旅游领域的数据特殊性,改良目前的数据处理方式,提高数据处理的精度。(2)本文基于旅游领域特征并结合国家A级景区评价标准制定了景区主题分类,基于目前通用的情感词典并综合了多种机器学习模型,设计了一套基于旅游领域的网络评论构建多主题情感词典的方法。(3)根据本文构建的多主题情感词典识别语料中游客评论的主题及对应的情感态度,识别出游客对景区不同主题的好评与差评。本文集成了所使用的算法构建了面向旅游领域的旅游信息挖掘与分析系统,该系统实现了数据获取、数据管理、情感分析、景点对比分析等功能,具有较好的应用分析效果。(4)本文首先以宏观角度,总结了景区网络关注度的时空格局,再根据游客评论数据量的年际变化探索景区网络关注度时空格局演变规律,选择五个具有代表性的景点探索其受到游客高关注的主题类型。其次从微观角度,通过深入分析各项主题细粒度情感的变化,为游客及景区管理者提供具有针对性的意见,能够为游客及景区管理者节省大量人力成本和时间。
孙畅[7](2020)在《面向BT论坛的搜索引擎及移动端应用技术》文中研究指明随着近年来互联网相关技术与行业的飞速发展,网络上信息和数据增长趋势呈指数型上升。在如此大量级的数据包围之下,传统的通用搜索引擎很难再满足用户的使用需求,用户想要在这些内容中找到自己需要的信息变得越来越困难,这一现状促使了垂直搜索引擎的进一步发展。相较于通用搜索引擎,垂直搜索引擎只关注某一特定领域的数据和信息,为需求该领域信息的用户提供更加精确的服务,增强了这部分用户的使用体验。在此背景之下,许多的垂直搜索引擎出现在人们的视野中。另外,BitTorrent协议发展至今,受到了大量想要从互联网中下载大文件,尤其是多媒体文件的用户的欢迎,只需要使用支持BT(BitTorrent)协议的客户端软件以及与资源对应的种子文件就可以执行下载任务。然而,现在互联网上缺乏针对BT种子文件的垂直搜索引擎,更多的则是面向DHT(Distributed Hash Table)网络的磁力搜索引擎。基于此,本文设计并实现了一种面向互联网的BT种子垂直搜索引擎系统。在搜索引擎方面,本文使用Nutch和Solr框架搭建了一个分布式的垂直搜索引擎。在该结构中,Nutch主要负责对网页的抓取工作,以及对网页进行解析并提取关键信息。本文提出并实现了一种对互联网中包含BT种子下载链接的网页的筛选方案,并只对筛选过后的网页数据进行解析和保存,以此将Nutch爬虫程序打造成一个面向BT网页的主题爬虫。另外,Solr则主要负责搜索引擎中索引的建立以及作为索引服务器响应用户的查询请求。结合本系统的使用场景,本文对Solr默认的排序方式加以改进,提出了一种基于半衰期的种子下载热度计算方法,并以此来对搜索的结果进行排序。在客户端方面,本文设计并实现了一个Android app作为该搜索引擎的客户端。在该app中,封装了搜索引擎的查询接口,用户通过该接口,即可访问Solr服务器,然后在app中获取搜索结果并下载种子文件。除此之外,针对互联网中的一些BT论坛,本文提出了一套让用户在这些论坛中快速搜索并下载种子文件的解决方案。该方案主要基于Android中WebView与JavaScript的交互机制,使得用户可以在app中十分方便快速地执行论坛操作,然后完成种子的下载。最后,本文通过实验对系统的功能和性能进行了测试,并对测试结果进行分析。
庄旭[8](2020)在《反垃圾网页作弊技术的研究》文中研究表明垃圾网页指通过作弊技术欺骗搜索引擎排序算法,以提高自身搜索引擎排名的网页。垃圾网页不仅严重影响了搜索引擎用户体验,给搜索引擎公司造成了巨大经济损失,同时也阻碍了Web健康、有序的发展。反垃圾网页作弊技术通常分为垃圾网页降级技术和垃圾网页检测技术。垃圾网页降级技术基于Web图链接结构,使用分值传播算法计算Web图中每个节点为“垃圾”或“正常”的概率,并以此概率作为评分值对网页排序,以使正常网页能获得比垃圾网页更高的排名。垃圾网页检测技术一般采用机器学习算法,使用网页特征构建二分类模型以实现对垃圾网页的检测。基于分值传播模型的垃圾网页降级算法(Score Propagation Based Web Spam Demotion Algorithm,SPB-WSDA)主要基于Page Rank模型,使用经人工标注的种子集合向Web图中其它节点传播“信任值”或“不信任值”。不同SPB-WSDA的主要区别体现在传播规则的不同。传统SPB-WSDA主要存在三点不足:1)缺少统一的分析框架以及研究的理论方法;2)只依赖于网页间的链接拓扑结构,无法识别采用了其它非链接作弊手段的垃圾网页;3)算法改进以经验式为主,缺少基于数据驱动的分析手段和方法。针对上述SPB-WSDA存在的问题,本文针对性地进行了三项研究工作。首先,本文提出了统一分值传播模型(Unified Score Propagation Model,USPM)。USPM从更加抽象的层次定义了通用化SPB-WSDA计算模型,并总结和提出了一系列各不同算法模块可使用的算法策略。在USPM模型框架下,SPB-WSDA由前向传播函数(Forward Score Propagation Function,FSPF)和后向传播函数(Backward Score Propagation Function,BSPF)构成,而FSPF和BSPF又进一步拆分为三个子函数:分裂函数、接受函数和组合函数。因此,不同SPB-WSDA算法的区别体现在它们所使用的子函数的区别上。基于USPM,本文提出了有监督前后向排序算法(Supervised Forward and Backward Ranking,SFBR)。SFBR有两点重要改进:1)使用非对称FSPF和BSPF的设计方法;2)使用分值归一化技术来避免静态分布概率效用增强和减弱的现象。在三个公开数据集上的实验表明SFBR优于其它主流SPB-WSDA算法。其次,本文提出了基于深度排序学习的垃圾网页降级算法(Deep Learning to Rank based Web Spam Demotion Algorithm,DLR-WSDA)。DLR-WSDA使用深度置信网络(Deep Belief Network,DBN)构建优先函数,以判断任意样本对之间的优先关系。基于样本对间的两两优先关系,文本进一步提出了基于样本最高排名概率的数据聚合算法(Top-Ranking Probability based Algorithm,TRPA)。DLR-WSDA不但能够使用网页的非链接特征,同时因为TRPA的局部性质使得算法计算效率大大提升。实验结果表明,DLR-WSDA优于主流SPB-WSDA算法。第三,本文提出了一种有监督Page Rank算法:Learning Rank。与传统SPB-WSDA采用人工定义分值传播规则的方式不同,Learning Rank使用深度置信网络直接从数据中学习分值传播规则。为此,本文设计了Learning Rank的学习目标函数和基于梯度优化的训练算法。在垃圾网页降级和推荐系统两个真实任务上的实验结果验证了Learning Rank的有效性。在垃圾网页检测方面,本文针对决策树算法无法处理特征间组关系的问题提出了动态特征绑定决策树算法(Dynamic Feature Bundling Decision Tree,DFBDT)。DFBDT将C4.5对单个特征的信息增益和信息增益率的概念延伸至了一组特征。DFBDT设计了三种算法来寻找具有组关系的特征簇的最优分割点:抽象最优绑定法、抽象贪心绑定法和局部贪心绑定法。基于DFBDT,文本进一步提出了动态特征绑定随机森林算法(Dynamic Feature Bundling Random Forest,DFBRF)。在垃圾网页检测任务上,实验结果表明:1)DFBDT相较于C4.5算法有明显提升;2)DFBRF优于其它主流垃圾网页检测算法。
洪伟[9](2020)在《分布式网络爬虫系统设计与实现》文中研究说明当前伴随着社会繁荣发展与大数据科学技术的飞跃式发展,现代互联网技术与移动端技术发展也是呈现出今非昔比的景象,目前人们在生活和工作中对移动互联网中的信息需求也是越来越多,当下搜索引擎技术重要性也越来越更加明显。移动互联网信息在社会的各个方面都有非常多的应用,现代搜索引擎技术己经深入人们的心中,也融入到了人们的日常生活中,它对人们的日常生活的影响也越来越多,网络搜索引擎中非常重要的一个技术就是网络爬虫。对于以往的单机爬虫在性能上已经难以满足发展日新月异的呈现爆炸式增长的互联网数据,为了解决这种窘迫的情况就诞生了新一代的网络爬虫,其就是基于分布式的网络爬虫。详细的来说就是在诸多的电脑上搭建分布式集群系统与诸多电脑集群高效的分工合作,把爬虫部署在这个集群上就可以提升爬虫的抓取数据效率,使之满足了抓取巨量数据的需求。目前运用了分布式存储系统,对整个爬虫系统数据存储的能力也能大大提升了。针对分布式系统的优势特点本文在Hadoop环境下设计并实现了分布式网络爬虫系统,开始详细的分析叙述了什么才是分布式系统与什么才是网络爬虫,并在这各基础上实现了这个分布式的网络爬虫系统,此系统有望去缓解传统网络爬虫抓取速度慢和效率低等情况。此次文中的主要的内容是:(1)在本文中首先介绍了网络搜索引擎技术,分布式网络爬虫的关键技术以及工作的原理,分析了分布式网络爬虫系统的整体架构设计,然后详细分析了爬虫的URL功能模块、爬虫的网页抓取功能模块、爬虫的网页解析功能模块、爬虫的数据存储功能模块等原理,并通过MapReduce实现了各个功能模块。(2)在传统的网络爬虫中网页抓取功能是影响系统工作效率的重要原因,所以就针对这一功能模块深入学习,仔细分析并对URL链接的权重算法进行优化。影响系统效率的另外一点就是URL链接的去重功能,为了避免大量的重复工作就对URL链接队列去重算法进行优化,通过这两点的改进,与望去解决网络爬虫系统的抓取速度慢和效率低的情况,以提升网络爬虫的抓取速度和精确度。(3)在系统代码编写完功能实现之后,在实验电脑机器上搭建Hadoop分布式系统,并配置相关的环境与节点和IP地址,然后在实验电脑上测试爬虫系统的各个功能模块并针对URL链接权重算法进行测试和记录分析、对URL链接去重算法进行测试和记录分析,最后进行总结归纳数据信息进行比较分析。本文的主要意义在于设计与实现了分布式网络爬虫系统,其在一定的程度上解决了传统单机网络爬虫速度慢、效率低、可扩展性差的问题,提升了网络爬虫抓取信息、网页抓取数据的速度和效率。
刘勇[10](2019)在《互联网环境下的涉烟情报辅助研判系统设计与实现》文中认为随着互联网的广泛发展,地下制售假烟团伙在网络中发布大量非法从事烟草经营、走私的信息,我们将这些信息称之为涉烟情报。互联网涉烟情报的收集、甄别和研判是烟草专卖执法人员在打击互联网涉烟违法活动中赖以决策的基础。面对网络涉烟违法活动现状,本文提出了互联网环境下的涉烟情报辅助研判系统方案。整个方案通过如下步骤完成:(1)结合现有数据爬取工具以及本文设计的python爬虫工具对出现涉烟情报的网站、论坛、贴吧等抓取所需文本及图像数据。数据清洗后进行分词、词性标注、命名实体识别、依存句法分析等自然语言底层处理,并对数据进行人工标注,构建涉烟数据集。(2)将文本和图像一起作为涉烟数据筛查模型的输入,模型的输出是与烟草相关的文本及图像。使用基于词频-逆向文件频率方法(Term frequency-inverse document frequency,Tf-idf)将文本语义特征向量化,另外构建了一种简化的卷积神经网络模型,用分类概率值表征配图语义特征,将文本及图像特征融合后进行分类。实验表明,对于涉烟数据筛查,本文提出的基于融合特征的分类准确率较基于单一文本特征的分类准确率提高了2.65%。进一步证明了文本及配图的融合特征对比单一的文本特征,融合了更多的语义信息,填补了文本特征信息的不完整性。(3)将涉烟文本作为涉烟情报事件抽取模型的输入,把涉烟情报抽取任务转化为涉烟事件抽取任务,模型的输出是从事烟草经营、走私的涉烟情报信息。提出了一种改进的基于Word2vec句子语义相似度计算的事件种子聚类算法,事件抽取模式经过泛化和过滤后,在ACE语料和本文的涉烟数据集上事件抽取F值分别提高了0.9%、3.7%。实验表明,本文提出的方法能够完成涉烟情报的抽取任务。(4)设计并实现了互联网环境下的涉烟情报辅助研判系统。主要功能模块包括:数据收集模块、数据预处理模块、涉烟数据筛查模块及涉烟情报抽取模块。经过烟草部门试用,证明本文提出的互联网环境下的涉烟情报辅助研判系统方案的可行性和有效性。
二、互联网、网站与种子(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、互联网、网站与种子(论文提纲范文)
(1)基于深度学习的昆明市旅游路线推荐算法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
第一节 研究背景 |
第二节 研究意义 |
第三节 文献综述 |
第四节 研究内容 |
第五节 本章小结 |
第二章 消费者旅游存在问题及个性化需求分析 |
第一节 问题的提出及分析 |
一、平台信息问题 |
二、路线规划困难 |
第二节 消费者个性化需求分析 |
一、游客消费心理角度 |
二、游客消费行为角度 |
第三节 当地旅游业发展需求分析 |
第四节 本章小结 |
第三章 神经网络兴趣挖掘模型 |
第一节 深度学习模块相关技术和概念 |
第二节 神经网络兴趣挖掘模型设计和建模 |
第三节 本章小结 |
第四章 最优旅游景点挖掘算法建模 |
第一节 设计游客收益函数 |
第二节 挖掘最优旅游景点 |
第三节 本章小结 |
第五章 最优旅游路线规划算法 |
第一节 收益迭代函数指标设计 |
第二节 规划最优旅游路线 |
第三节 本章小结 |
第六章 实验与结果分析 |
第一节 研究范围和数据获取 |
一、研究范围 |
二、旅游景点基础数据 |
第二节 兴趣挖掘深度学习模型训练 |
第三节 样本实验及结果分析 |
一、准备样品的实验 |
二、输出兴趣分类降序向量 |
第四节 挖掘最优种子旅游节点 |
第五节 最优旅游路线规划 |
第六节 实验步骤分析与讨论 |
一、实验数据分析 |
二、兴趣挖掘模块分析 |
三、最优旅游景点挖掘结果分析 |
四、最优旅游路线搜索结果分析 |
第七节 应用价值分析 |
一、目前推荐方式存在的不足 |
二、解决方案及应用价值 |
第八节 本章小结 |
第七章 结论与未来工作 |
第一节 结论 |
第二节 未来的工作 |
参考文献 |
附录 |
致谢 |
在读期间的研究成果 |
(2)PCOT教学模式在生物学七年级上册教学中的实践研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
第一节 选题缘由 |
一、研究背景 |
二、研究目的 |
三、研究意义 |
第二节 国内外研究现状 |
一、P-C学习方式的研究现状 |
二、O-T学习方式的研究现状 |
第三节 研究方法 |
一、文献资料法 |
二、问卷调查法 |
三、实验研究法 |
四、行为量规测试法 |
五、统计分析法 |
第四节 研究过程 |
一、研究过程 |
二、研究思路 |
第五节 研究工具 |
第二章 概念界定和理论基础 |
第一节 相关概念界定 |
一、教学模式 |
二、P-C学习方式 |
三、O-T学习方式 |
四、PCOT教学模式 |
第二节 PCOT教学模式的理论基础 |
一、佐藤学的学习共同体理论 |
二、建构主义理论 |
三、人本主义学习理论 |
四、最近发展区理论 |
五、教学传播理论 |
第三章 初中生物学应用PCOT模式进行教学的条件调查 |
第一节 初中生物教师教学情况访谈 |
第二节 初中生生物学习情况的调查 |
一、实验前测问卷信度和效度分析 |
二、实验前测问卷各题项分析 |
第三节 初中生PCOT学习能力及需求的调查 |
第四节 初中生物学应用PCOT模式进行教学的可行性分析 |
第四章 初中生物学PCOT教学模式的探索 |
第一节 初中生物学PCOT教学模式的构成要素 |
第二节 初中生物学PCOT教学模式的设计原则 |
一、适度性原则 |
二、反馈性原则 |
三、可操作性原则 |
第三节 初中生物学PCOT教学模式的探索过程 |
一、PCOT教学模式的活动主体——学习共同体的构建 |
二、前端分析 |
三、学习支持设计 |
四、学习过程设计 |
五、教学实施 |
六、学习评价 |
第五章 PCOT教学模式在生物学七年级上册教学中的实施 |
第一节 实验方案设计 |
一、实验对象 |
二、实验变量 |
三、实验方案 |
四、前测成绩分析 |
五、实验前准备 |
第二节 “动物细胞”教学设计 |
一、学习内容分析 |
二、学习者分析 |
三、教学目标分析 |
四、教学重点和难点分析 |
五、教学过程 |
第三节 “种子植物”第1 课时教学设计 |
一、学习内容分析 |
二、学习者分析 |
三、教学目标分析 |
四、教学重点和难点分析 |
五、教学过程 |
第四节 “种子植物”第2 课时教学设计 |
一、学习内容分析 |
二、学习者分析 |
三、教学目标分析 |
四、教学重点和难点分析 |
五、教学过程 |
第五节 “绿色植物是生物圈中有机物的制造者”教学设计 |
一、学习内容分析 |
二、学习者分析 |
三、教学目标分析 |
四、教学重点和难点分析 |
五、教学过程 |
第六章 实践研究结果及数据分析 |
第一节 学生后测问卷结果统计与分析 |
一、实验后测问卷各题项分析 |
二、后测问卷调查结果 |
第二节 PCOT教学模式和传统教学模式成绩对比分析 |
一、实验后测成绩统计分析 |
二、实验前测和后测学生成绩对比分析 |
三、实践研究结果 |
第七章 总结与反思 |
第一节 结论 |
一、PCOT教学模式有效地提升了学生的生物学习成绩 |
二、PCOT教学模式有助于培养学生的自主学习能力、协作学习能力和现代化信息素养 |
三、PCOT教学模式促进了学习共同体成员间的情感交流 |
第二节 创新和特色 |
一、建设多元化的学生活动评价体系 |
二、搭建具有特色的线上资源库 |
三、切实地将学校资源与生物学习进行有机整合 |
第三节 反思 |
一、PCOT教学模式中“度”的问题 |
二、PCOT教学模式中“时”的问题 |
三、PCOT教学模式中“量”的问题 |
第四节 展望 |
参考文献 |
附录 |
附录 A 调查活动分析性量规 |
附录 B “观察人的口腔上皮细胞”实验评价量规 |
附录 C 生物模型制作评价量规 |
附录 D 初中生物教师教学情况访谈提纲 |
附录 E 前测问卷一 |
附录 F 前测问卷二 |
附录 G 后测问卷 |
附录 H 学生前测试卷 |
附录 I 学生后测试卷 |
附录 J 部分模拟实验操作展示的二维码 |
附录 K 学生线上学习活动 |
附录 L 实践研究过程中的部分剪影 |
攻读学位期间发表的学术论文和研究成果 |
致谢 |
(3)网络文件下载信息搜索及追踪系统(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 本文的研究工作概述 |
1.3 搜索引擎相关技术的国内外研究历史与现状 |
1.4 本文的主要贡献与技术特色 |
1.5 本论文的结构安排 |
1.6 本章小结 |
第二章 关键技术研究及相关技术介绍 |
2.1 关键技术研究 |
2.2 相关技术介绍 |
2.2.1 Scrapy爬虫框架 |
2.2.2 Redis数据库 |
2.2.3 Solr全文检索引擎 |
2.2.4 Bootstrap前端框架 |
2.3 本章小结 |
第三章 ISTS-NDF系统需求分析与系统划分 |
3.1 ISTS-NDF系统整体目标分析 |
3.2 系统业务功能需求分析 |
3.2.1 信息采集子系统需求分析 |
3.2.2 文件追踪子系统需求分析 |
3.2.3 服务与展示子系统需求分析 |
3.3 分布式爬虫需求分析 |
3.4 本章小结 |
第四章 ISTS-NDF系统详细设计 |
4.1 系统架构分析 |
4.2 信息采集子系统中的爬虫设计 |
4.2.1 基于网页特征的目录树式网页遍历与网页解析 |
4.2.2 基于布隆过滤器算法的网页去重与增量更新 |
4.2.3 基于平均采样的爬虫代码匹配算法模块设计 |
4.2.4 分布式爬虫设计 |
4.3 系统其他业务功能设计 |
4.3.1 信息采集子系统 |
4.3.2 文件追踪子系统设计 |
4.3.3 服务与展示子系统设计 |
4.4 本章小结 |
第五章 ISTS-NDF系统功能实现 |
5.1 系统技术架构 |
5.2 信息采集子系统实现 |
5.2.1 爬虫模块 |
5.2.2 人机验证模块 |
5.2.3 代码匹配算法模块 |
5.2.4 分布式爬虫实现 |
5.3 文件追踪子系统实现 |
5.4 服务与展示子系统实现 |
5.5 本章小结 |
第六章 系统测试 |
6.1 系统单元模块测试 |
6.2 系统集成功能测试 |
6.3 系统性能测试 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 问题与展望 |
致谢 |
参考文献 |
(5)面向领域数据的高效数据获取方法研究与应用(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究工作 |
1.4 论文的组织结构 |
第二章 相关理论与技术方法 |
2.1 数据获取 |
2.2 网络爬虫 |
2.3 分布式爬虫 |
2.4 本章小结 |
第三章 数据的高效获取方法 |
3.1 方法模型 |
3.2 领域数据的高效获取算法 |
3.3 海量URL去重方法 |
3.4 数据管理 |
3.5 本章小结 |
第四章 面向领域数据的分布式爬虫技术 |
4.1 技术框架 |
4.2 爬取流程 |
4.3 关键模块方法实现 |
4.4 使用Docker的分布式爬虫 |
4.5 方法验证 |
4.6 本章小结 |
第五章 Web数据获取的实验系统设计与实现 |
5.1 系统总体架构设计 |
5.2 数据库设计 |
5.3 系统功能设计 |
5.4 系统实现 |
5.5 系统测试 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
个人简介 |
(6)基于多主题情感词典的旅游信息挖掘及其应用 ——以海南省A级景点为例(论文提纲范文)
致谢 |
摘要 |
abstract |
1 引言 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 社交媒体数据相关研究 |
1.2.2 主题词抽取相关研究 |
1.2.3 情感词典构建相关研究 |
1.2.4 旅游景区网络关注度相关研究 |
1.3 研究内容及技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 论文框架与章节安排 |
2 关键技术与方法 |
2.1 数据采集与处理方法 |
2.1.1 网络爬虫技术 |
2.1.2 中文分词 |
2.2 构建多主题情感词典方法 |
2.2.1 LDA模型 |
2.2.2 Word2vec工具 |
2.2.3 词共现模型 |
2.3 网络关注度变化分析方法 |
2.3.1 旅游网络关注度 |
2.3.2 核密度分析法 |
2.3.3 均值比率法 |
2.4 本章小结 |
3 研究区及数据处理 |
3.1 研究区概况 |
3.2 旅游评论数据的采集 |
3.3 景区评论数据的预处理 |
3.4 本章小结 |
4 基于社交媒体数据的旅游信息挖掘算法 |
4.1 多主题情感词典的构建 |
4.1.1 旅游主题划分 |
4.1.2 筛选种子主题词 |
4.1.3 扩展种子主题词 |
4.1.4 构建主题词情感词搭配对 |
4.2 评论文本的主题情感识别 |
4.3 准确率检验 |
4.4 本章小结 |
5 旅游信息挖掘与分析系统 |
5.1 系统结构 |
5.2 系统工作机制 |
5.2.1 工作流程 |
5.2.2 数据获取 |
5.2.3 数据管理 |
5.2.4 情感分析 |
5.2.5 景点对比分析 |
5.3 本章小结 |
6 海南省A级景区网络关注度及游客情感分析 |
6.1 海南省A级景区网络关注度时空格局变化分析 |
6.1.1 总体网络关注度时空格局 |
6.1.2 网络关注度时空格局变化 |
6.1.3 景区各主题网络关注度 |
6.2 游客情感变化分析 |
6.2.1 景区间游客情感对比 |
6.2.2 各景区游客情感逐年变化对比 |
6.3 本章小结 |
7 结论与展望 |
7.1 主要研究成果 |
7.2 创新点 |
7.3 不足与展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(7)面向BT论坛的搜索引擎及移动端应用技术(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究历史与现状 |
1.3 本文的主要内容与创新 |
1.4 论文的结构安排 |
1.5 本章小结 |
第二章 相关技术介绍 |
2.1 搜索引擎工作原理 |
2.1.1 搜索引擎的结构 |
2.1.2 BT网页垂直搜索引擎的特征 |
2.2 分布式爬虫相关技术 |
2.2.1 Hadoop分布式框架 |
2.2.2 Nutch搜索引擎框架 |
2.3 Solr全文检索框架 |
2.4 移动端应用技术 |
2.4.1 Android WebView的应用 |
2.4.2 Android与 JavaScript的交互 |
2.5 本章小结 |
第三章 系统架构设计 |
3.1 系统架构选型设计 |
3.1.1 网络爬虫框架选型设计 |
3.1.2 全文检索框架选型设计 |
3.1.3 系统整体架构 |
3.2 子系统划分 |
3.2.1 分布式爬虫子系统 |
3.2.2 索引子系统 |
3.2.3 移动客户端子系统 |
3.3 本章小结 |
第四章 分布式爬虫的设计及实现 |
4.1 分布式爬虫子系统架构 |
4.2 分布式集群的设计与搭建 |
4.2.1 分布式集群的设计 |
4.2.2 分布式集群搭建 |
4.3 爬虫模块的设计与实现 |
4.3.1 Nutch插件机制 |
4.3.2 Nutch爬虫程序的执行流程 |
4.3.3 网页抓取模块 |
4.3.4 网页解析模块 |
4.3.5 BT网站筛选策略 |
4.4 本章小结 |
第五章 索引子系统的设计及实现 |
5.1 索引子系统整体架构 |
5.2 创建Solr Core |
5.3 配置中文分词器 |
5.3.1 Solr分词器 |
5.3.2 配置IK分词器 |
5.4 建立索引 |
5.4.1 索引建立流程 |
5.4.2 Nutch索引模块 |
5.4.3 添加索引字段 |
5.4.4 上传索引文档 |
5.5 查询结果排序策略 |
5.5.1 排序算法设计 |
5.5.2 Solr自定义函数 |
5.6 本章小结 |
第六章 移动客户端的设计及实现 |
6.1 客户端子系统整体架构 |
6.2 登录模块设计及实现 |
6.2.1 登录模块的工作流程 |
6.2.2 登录模块的类结构分析 |
6.2.3 临时账号登录组件的实现 |
6.2.4 个人账号登录组件的实现 |
6.3 搜索模块设计及实现 |
6.3.1 搜索模块的工作流程 |
6.3.2 搜索模块的类结构分析 |
6.3.3 BT网页搜索组件的实现 |
6.3.4 BT论坛搜索组件的实现 |
6.4 下载模块设计及实现 |
6.4.1 下载模块的工作流程 |
6.4.2 下载模块的类结构分析 |
6.4.3 网页下载组件的实现 |
6.4.4 论坛下载组件的实现 |
6.5 本章小结 |
第七章 系统测试及分析 |
7.1 系统功能测试 |
7.1.1 分布式爬虫功能测试 |
7.1.2 索引服务器功能测试 |
7.1.3 移动客户端功能测试 |
7.2 系统性能测试 |
7.2.1 性能指标 |
7.2.2 性能测试与分析 |
7.3 本章小结 |
第八章 总结与展望 |
8.1 论文工作总结 |
8.2 问题与展望 |
致谢 |
参考文献 |
(8)反垃圾网页作弊技术的研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 反垃圾网页作弊技术的背景及其研究意义 |
1.2 反垃圾网页作弊技术国内外研究现状 |
1.2.1 垃圾网页检测技术的国内外研究现状 |
1.2.2 垃圾网页降级技术的国内外研究现状 |
1.3 本文研究的主要内容 |
1.4 本文的组织结构 |
第2章 垃圾网页作弊及反作弊技术概述 |
2.1 垃圾网页作弊技术概述 |
2.1.1 基于网页内容的垃圾网页作弊技术 |
2.1.2 基于网页链接的垃圾网页作弊技术 |
2.1.3 基于隐藏和重定向的垃圾网页作弊技术 |
2.2 反垃圾网页作弊技术概述 |
2.2.1 垃圾网页检测技术 |
2.2.2 垃圾网页降级技术 |
第3章 基于分值传播模型的垃圾网页降级算法 |
3.1 USPM设计思想 |
3.2 USPM模型设计 |
3.2.1 种子集合选择方法 |
3.2.2 算法初始化 |
3.2.3 前向传播函数和后向传播函数 |
3.2.4 跳转概率 |
3.2.5 节点FS与BS值的归一化 |
3.3 USPM模型的收敛性 |
3.4 经典SPB-WSDA回顾 |
3.5 有监督前后向排序算法 |
3.6 算法评估与分析 |
3.6.1 数据集介绍 |
3.6.2 SPB-WSDA算法评测指标 |
3.6.3 实验设计方案 |
3.6.4 实验结果与分析 |
3.7 USPM模型的其它应用 |
3.8 USPM模型的扩展 |
3.9 本章小结 |
第4章 基于深度排序学习的垃圾网页降级算法 |
4.1 排序学习 |
4.1.1 基于样本点的排序学习算法 |
4.1.2 基于样本列表的排序学习算法 |
4.1.3 基于样本对的排序学习算法 |
4.2 深度排序学习算法 |
4.2.1 受限玻尔兹曼机 |
4.2.2 深度置信网络 |
4.2.3 基于DBN的优先函数 |
4.2.4 数据聚合算法TRPA |
4.3 实验结果与分析 |
4.3.1 实验一:无监督预训练的有效性 |
4.3.2 实验二:参照样本数量对算法效果的影响 |
4.3.3 实验三:TRPA与 GOA对比实验 |
4.3.4 实验四:WSDA算法对比实验 |
4.4 本章小结 |
第5章 Learning Rank算法 |
5.1 Web图节点与边的向量表征 |
5.2 Learning Rank |
5.2.1 算法概述 |
5.2.2 梯度推导 |
5.2.3 DBN网络设计和训练方法 |
5.3 实验结果与分析 |
5.3.1 垃圾网页降级 |
5.3.2 推荐算法 |
5.4 本章小结 |
第6章 基于决策树的垃圾网页检测算法 |
6.1 C4.5决策树算法 |
6.1.1 C4.5生长算法 |
6.1.2 C4.5剪枝算法 |
6.2 动态特征绑定决策树 |
6.2.1 静态特征绑定 |
6.2.2 DFBDT |
6.3 动态特征绑定随机森林 |
6.4 实验结果及分析 |
6.4.1 DFBDT与C4.5对比实验 |
6.4.2 与其它算法的对比实验 |
6.5 本章小结 |
结论 |
致谢 |
参考文献 |
攻读博士学位期间发表的论文及科研成果 |
(9)分布式网络爬虫系统设计与实现(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题的研究背景与目的意义 |
1.2 国内外研究现状 |
1.3 论文的主要工作 |
1.4 论文的组织结构 |
第2章 相关理论及技术 |
2.1 分布式系统与计算 |
2.1.1 分布式系统的特点和结构 |
2.1.2 大数据和分布式架构的发展状况 |
2.2 网络爬虫相关理论 |
2.2.1 网络爬虫的基本结构及工作流程 |
2.2.2 通用型与主题型爬虫 |
2.2.3 抓取策略 |
2.2.4 常见的网页分析算法 |
2.3 本章小结 |
第3章 分布式爬虫系统分析设计 |
3.1 Hadoop分布式技术 |
3.1.1 MapReduce分布式计算模型 |
3.1.2 Hadoop分布式文件系统 |
3.1.3 HBase数据库 |
3.2 分布式爬虫需求分析 |
3.3 分布式爬虫设计 |
3.3.1 分布式爬虫总体结构设计 |
3.3.2 分布式爬虫工作流程设计 |
3.3.3 URL初始化功能模块设计 |
3.3.4 网页抓取模块 |
3.3.5 网页解析模块 |
3.3.6 URL去重建模块 |
3.3.7 数据存储模块 |
3.4 本章小结 |
第4章 关键技术及系统实现 |
4.1 分布式的URL队列设计与去重 |
4.1.1 URL队列分配 |
4.1.2 URL队列去重 |
4.2 Html网页解析和文档提取 |
4.2.1 在JS中提取网页内容 |
4.2.2 网页内嵌文档提取 |
4.3 网页的陷阱与更新 |
4.3.1 爬虫陷阱 |
4.3.2 网页更新 |
4.4 插入URL列表模块实现 |
4.5 网页抓取模块实现 |
4.5.1 网页抓取模块的实现 |
4.5.2 URL权重算法的优化 |
4.6 网页解析模块实现 |
4.6.1 HTML页面解析 |
4.6.2 非HTML页面解析 |
4.7 URL链接去重模块实现 |
4.8 网页存储模块实现 |
4.9 本章小结 |
第5章 实验与性能分析 |
5.1 实验环境 |
5.2 系统环境安装 |
5.2.1 Hadoop环境安装 |
5.2.2 Java环境安装 |
5.2.3 配置SSH |
5.3 爬虫系统测试方案 |
5.3.1 功能测试方案 |
5.3.2 性能测试方案 |
5.3.3 扩展测试方案 |
5.4 测试数据及分析 |
5.4.1 功能测试分析结果 |
5.4.2 性能测试分析结果 |
5.4.3 扩展性测试分析结果 |
5.5 URL权重算法比较测试分析 |
5.6 URL去重策略比较测试分析 |
5.7 本章小结 |
总结 |
参考文献 |
攻读硕士学位期间发表的论文和获得的科研成果 |
致谢 |
(10)互联网环境下的涉烟情报辅助研判系统设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景及研究意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 情报研判系统研究现状 |
1.2.2 涉烟情报辅助研判系统相关技术研究现状 |
1.3 本文主要研究内容及创新点 |
1.4 文章组织结构安排 |
第二章 互联网环境下的涉烟情报辅助研判系统需求分析与整体设计 |
2.1 涉烟情报辅助研判系统功能需求分析 |
2.2 涉烟情报辅助研判系统功能设计 |
2.2.1 系统设计目标 |
2.2.2 系统整体设计及各模块功能 |
2.2.3 互联网环境下的数据收集模块功能设计 |
2.2.4 数据预处理模块功能设计 |
2.2.5 涉烟数据筛查模块功能设计 |
2.2.6 涉烟情报抽取模块功能设计 |
2.3 涉烟情报辅助研判系统数据库设计 |
2.4 本章小结 |
第三章 面向涉烟文本及配图的融合特征分类模型设计 |
3.1 文本特征提取 |
3.2 配图特征提取 |
3.2.1 基于卷积神经网络的配图抽象特征提取 |
3.2.2 配图语义特征提取 |
3.3 面向涉烟文本及配图融合特征的分类模型构建 |
3.4 实验结果及分析 |
3.4.1 实验数据及评价指标 |
3.4.2 实验分析 |
3.5 本章小节 |
第四章 互联网环境下的涉烟情报事件抽取模型设计 |
4.1 互联网环境下的涉烟情报定义 |
4.2 一种改进的事件抽取算法 |
4.2.1 事件定义 |
4.2.2 事件种子构建 |
4.2.3 事件种子聚类算法 |
4.3 互联网环境下的涉烟情报抽取模型构建 |
4.3.1 涉烟情报抽取模式学习 |
4.3.2 涉烟情报抽取模式泛化及过滤 |
4.4 实验结果及分析 |
4.4.1 实验数据 |
4.4.2 事件种子聚类实验 |
4.4.3 涉烟情报抽取模型实验 |
4.5 本章小结 |
第五章 互联网环境下的涉烟情报辅助研判系统实现 |
5.1 涉烟情报辅助研判系统整体架构 |
5.2 涉烟情报辅助研判系统开发环境约束 |
5.3 互联网环境下的数据收集模块实现 |
5.4 数据预处理模块实现 |
5.5 涉烟数据筛查模块实现 |
5.6 涉烟情报抽取模块实现 |
5.7 本章小结 |
总结与展望 |
本文总结 |
未来工作展望 |
参考文献 |
攻读硕士学位期间取得的科研成果 |
致谢 |
四、互联网、网站与种子(论文参考文献)
- [1]基于深度学习的昆明市旅游路线推荐算法研究[D]. 罗毅夫. 云南财经大学, 2021(09)
- [2]PCOT教学模式在生物学七年级上册教学中的实践研究[D]. 杨俊蓉. 云南师范大学, 2021(08)
- [3]网络文件下载信息搜索及追踪系统[D]. 张擎天. 电子科技大学, 2021(01)
- [4]广州市人民政府关于取消和重心下移一批市级行政权力事项的决定[J]. 广州市人民政府. 广州市人民政府公报, 2021(S1)
- [5]面向领域数据的高效数据获取方法研究与应用[D]. 任雪娇. 北方民族大学, 2021(08)
- [6]基于多主题情感词典的旅游信息挖掘及其应用 ——以海南省A级景点为例[D]. 林振宇. 河南理工大学, 2020(01)
- [7]面向BT论坛的搜索引擎及移动端应用技术[D]. 孙畅. 电子科技大学, 2020(07)
- [8]反垃圾网页作弊技术的研究[D]. 庄旭. 西南交通大学, 2020(07)
- [9]分布式网络爬虫系统设计与实现[D]. 洪伟. 沈阳理工大学, 2020(08)
- [10]互联网环境下的涉烟情报辅助研判系统设计与实现[D]. 刘勇. 西北大学, 2019(01)