学科分类
/ 1
3 个结果
  • 简介:随着“互联网+”概念的普及,网络上的资源随之成倍增长.面对庞大的数据资源,传统的搜索引擎Baidu、Google等已经不能满足人们对于特定信息的获取需求.作为搜索引擎抓取数据的重要组成部分,网络爬虫的作用非常重要.本文主要介绍了网络爬虫的概念、组成模块以及工作流程,在通用爬虫的基础上提出一种聚焦型网络爬虫系统,以python和相应的第三方库为主要工具,通过定义采集函数和给定豆瓣网最新上映电影的网址,快速搜索该网址某电影的影评信息,对页面内链接和外链接进行有效爬取.然后,再对获取到的数据进行分词处理,根据关键词的出现频率生成词云.实验结果表明,该聚焦型爬虫系统能够将所有影评信息以JSON格式存储到本地,并通过词云直观的展示出来.

  • 标签: 搜索引擎 网络爬虫 Jieba分词 正则表达式 词云
  • 简介:针对高重频激光测距中探测回波信噪比低、探测虚警率高等问题,提出了基于多脉冲信号迭加、脉宽匹配差分和平滑滤波以及三阶累积量谱估计的探测回波综合处理方法.实验及仿真结果表明,采用该方法处理后,可有效抑制探测回波中的噪声,提高探测回波的信噪比,从而提高了高重频脉冲激光测距的探测性能.

  • 标签: 高重频 激光测距 信号迭加 平滑滤波 三阶累积量
  • 简介:基因组重排作为一种快速改良细胞表型的方法,不仅能有效提高微生物合成活性产物的能力,也能提高微生物的耐受性和对底物的利用率,还能激活沉默基因的表达产生新的化合物.本文综合论述了基因组重排的概况和基因组重排的过程,并讨论了基因组重排对微生物表型改良的应用以及对基因组重排的展望.

  • 标签: 基因组重排 遗传多样性 耐受性 表型改良 原生质体融合