正文内容加载中...
posted @ 2014-05-21 20:47 xingoo 阅读(5840) 评论(44) 编辑
摘要: 先想一下,正常我们想要创建一个web服务,首先需要下载tomcat,创建web工程,配置各种web.xml,引入spring的配置,各种配置文件一顿倒腾.....下载有了spring boot,你创建一个web工程只需要一个java类,甚至都不需要下载tomcat,直接右键执行就能启动一个web服务阅读全文
posted @ 2017-07-22 00:02 xingoo 阅读(122) 评论(0) 编辑
摘要: 最初想要读这本书,也是出于对台湾的好奇。而这本书以作者的视角讲述了从1977到2009年,台湾发生的大事;也从一个小市民的角度,讲述了台湾政治生活发生的变化。 关于政治 从蒋介石到蒋经国,再到李登辉、陈水扁;从原来类似独裁的政治到真正实现民主;从国民党一党专政到新党、民进党多党竞争;从满心回归大陆,阅读全文
posted @ 2017-07-16 21:16 xingoo 阅读(96) 评论(0) 编辑
摘要: 由于最近再做推荐系统的特征处理,需要借助一些工具来筛选特征。最初使用了R,R的安装很简单,而且API也很容易使用,直接就能出图。后来,发现很多人在python和R之间做选择,所以我也在两个工具间摇摆不定。后来,发现Tensorflow里面有很多python的代码,而且python可以做爬虫写web,阅读全文
posted @ 2017-07-13 21:16 xingoo 阅读(119) 评论(0) 编辑
摘要: 在机器学习中,一般都会按照下面几个步骤:特征提取、数据预处理、特征选择、模型训练、检验优化。那么特征的选择就很关键了,一般模型最后效果的好坏往往都是跟特征的选择有关系的,因为模型本身的参数并没有太多优化的点,反而特征这边有时候多加一个或者少加一个,最终的结果都会差别很大。 在SparkMLlib中为阅读全文
posted @ 2017-07-11 22:24 xingoo 阅读(381) 评论(0) 编辑
摘要: 用户画像在大数据分析中是一种很有用的系统,它可以各种不同的系统中,起到很关键的作用。比如搜索引擎、推荐系统、内容系统等等,可以帮助应用实现千人千面、个性化、精准等的效果。 下面将从几个方面来说一下,什么是用户画像,主要的内容来自《用户网络行为画像分析与内容推荐应用》这本书。 应用场景 数据来源 特性阅读全文
posted @ 2017-07-06 21:21 xingoo 阅读(672) 评论(2) 编辑
摘要: 在机器学习中,线性回归和逻辑回归算是最基础入门的算法,很多书籍都把他们作为第一个入门算法进行介绍。除了本身的公式之外,逻辑回归和线性回归还有一些必须要了解的内容。一个很常用的知识点就是虚拟变量(也叫做哑变量)—— 用于表示一些无法直接应用到线性公式中的变量(特征)。 举个例子: 通过身高来预测体重,阅读全文
posted @ 2017-07-04 21:09 xingoo 阅读(49) 评论(0) 编辑
摘要: Hbase是基于HDFS的NOsql数据库,它很多地方跟数据库差不多,也有很多不同的地方。这里就不一一列举了,不过Hbase有个版本控制的特性,这个特性在很多场景下都会发挥很大的作用。本篇就介绍下基于 和`Java API`的Hbase多版本的读写。 为了更好的理解多版本,我们可以把普通的数据存储理阅读全文
posted @ 2017-07-03 21:40 xingoo 阅读(267) 评论(0) 编辑
摘要: 今天在看MLlib的源码时,看到Vector的声明是 ,很好奇这个 有什么作用,与是搜到了这个文章: /rollenholt/p/4192758.html 试验了下,这个sealed就是保证你在match的时候需要把所有可能出现的情况都写出来。如果漏掉一个阅读全文
posted @ 2017-06-28 19:13 xingoo 阅读(59) 评论(0) 编辑
摘要: ![](http://images2015.cnblogs.com/blog/449064/201706/449064-20170625221848007-1697165949.png)阅读全文
posted @ 2017-06-25 22:19 xingoo 阅读(68) 评论(0) 编辑
摘要: ![](http://images2015.cnblogs.com/blog/449064/201706/449064-20170623224930788-52065101.png)阅读全文
posted @ 2017-06-23 22:50 xingoo 阅读(40) 评论(0) 编辑