• 2015-04-14
    微信公共平台开发(一):服务器配置
    微信开发 java 服务器配置
    文档介绍了如何开启自己的微信开发之旅,如何利用java实现微信公共平台服务器有效性的验证
  • 2015-04-10
    文本聚类算法介绍
    文本聚类 聚类 java 算法
    本博客通过对当前比较成熟的聚类算法分析,介绍如何对非结构的数据(文档)做聚类算法;如何利用搜索引擎的相关知识来解决文本聚类问题等
  • 2015-04-08
    基于lucene的案例开发:纵横小说阅读页采集
    lucene java 纵横小说 网络爬虫 爬虫
    本文介绍了如何通过CrawlBase来实现纵横小说阅读页信息的采集,加上之前的三篇博客就完成了对纵横小说的信息采集,之后会给出具体的main方法,来实现整个流程的运行~
  • 2015-04-03
    基于lucene的案例开发:纵横小说章节列表采集
    网络爬虫 lucene java 纵横小说 爬虫
    本文介绍了如何通过CrawlBase来实现纵横小说章节列表页信息的采集,同时提供了对于无法右键查看网页源代码网页的信息采集方案
  • 2015-04-03
    基于lucene的案例开发:纵横小说简介页采集
    java lucene 纵横小说 爬虫 网络爬虫
    本文通过对纵横小说简介页源代码的分析,介绍了如何通过CrawlBase来采集相关信息
  • 2015-04-02
    基于lucene的案例开发:纵横小说更新列表页抓取
    HttpClient 爬虫 java 纵横小说 网络爬虫
    本文以纵横中文小说网的更新列表页为例,详细的介绍了如何通过HttpClient去采集更新列表页的内容,介绍如何使用自建类CrawlListPageBase以及如何处理非预期BUG
  • 2015-03-26
    基于lucene的案例开发:查询语句创建PackQuery
    lucene java query
    提供了lucene中的query对象的多种创建方法,如单词单域、单词多域、模糊查询、范围查询、距离查询等
  • 2015-03-18
    关于HttpClient模拟浏览器请求的参数乱码问题解决方案
    java HttpClient 中文 乱码 postget
    利用HttpClient模拟浏览器行为获取网页内容时,当参数中有中文,在服务器端解析出的参数值中的中文都是“?”,这里就给你完美的解决方案
  • 2015-03-17
    程序员实习过程中应该掌握的问问题技巧
    程序员 实习 问问题 技巧
    在工作过程中,我们会遇到各种各样的问题,面对这些问题,我们该如何解决?又该如何向别人提问?这里给你答案
  • 2015-03-15
    基于lucene的案例开发:实时索引的修改
    lucene java 实时索引 增删改 索引操作
    实时索引中的IndexWriter的操作都是委托给TrackingIndexWriter来操作,这里就对实时索引中的增删改操作进行进一步的封装,实现实时索引的基本操作
  • 我的名片
  • 网名:xiaojimanman | 小鸡慢慢
  • 职业:搜狗搜索事业部全栈工程师
  • 微信:xiaojimanman
  • Q Q:425627233
  • 邮箱:xiaojimanman@foxmail.com
  • 捐赠方式
  • 赠人玫瑰,手有余香。
  • 感谢捐赠者对我博客的支持!
  • 最新评论

 ©2015-2017 陆雷 | xiaojimanman 工作空间 -京ICP备15007871号