网站首页 > 学习心得> 文章内容

智递科技:分享推荐业内顶尖的 Java 机器学习库

※发布时间:2017-3-25 10:56:14   ※发布作者:habao   ※出自何处: 

  根据相关的招聘统计数据, Python 语言目前已经超越 Java 成为雇主最亟须的机器学习编程技能。但事实上, Java 在项目开发中仍然发挥着不可替代的作用,并且许多流行的机器学习框架本身就是由 Java 写成的。鉴于此前有关 Python 的已经很多,而鲜见 Java 的,因此,今天智递科技就在这里为广大的 JAVA 从业者推荐三个业内顶尖的 Java 机器学习库。根据相关的招聘统计数据, Python 语言目前已经超越 Java 成为雇主最亟须的机器学习编程技能。但事实上, Java 在项目开发中仍然发挥着不可替代的作用,并且许多流行的机器学习框架本身就是由 Java 写成的。鉴于此前有关 Python 的已经很多,而鲜见 Java 的,因此,今天智递科技就在这里为广大的 JAVA 从业者推荐三个业内顶尖的 Java 机器学习库。

  它由怀卡托大学( University of Waikato )的机器学习项目组研发。其命名来源于一种特有的不会飞的鸟——秧鸡,秧鸡的英文名称就是 Weka 。按照官网描述, Weka 吸收了许多目前常用的机器学习算法,并且完全基于 Java ,开源,免费,具有易于使用的图形界面,适合于数据挖掘,数据分析和预测建模等多种应用场景。

  来自怀卡托大学的计算机科学教授 Eibe Frank 表示:“ Weka 最大的优势在于分类,因此需要自动数据分类的应用程序可以从中获益。但同时它也支持数据预处理、聚类、关联规则挖掘、时间序列预测、特征选择、和异常检测等场景。”

  开发者可以直接通过 Weka 软件处理目标数据集,同时也支持用户在自己编写的代码中调用,将 Weka 视为一个灵活的组件。更贴心的是,怀卡托大学还提供了许多免费的基于 Weka 的数据挖掘和机器学习视频教程,感兴趣的朋友可以在 Weka 官网点击查看。

  和 Weka 一脉相承, MOA 的命名也是来源于一种特有的无翼大鸟——恐鸟(目前已)。 MOA 也是基于 Java ,开源,免费,在面对复杂问题时, MOA 还能和 Weka 协同工作。

  MOA 在运算效率和内存占用方面都做了特殊优化,通过提供易于扩展的底层结构、可复用的数据流分析设置以及一系列内部实现好机器学习算法, MOA 为实时数据流分析提供了一个非常优秀的基准框架,因此在实时数据流挖掘领域的应用非常广泛。其内部实现的机器学习算法包括:分类、回归、聚类、孤立点检测、概念漂移检测和推荐系统等。此外, MOA 还提供了多种评估工具,以及活跃的社区讨论、博客等配套资源。

  Deeplearning4j 旨在为工作在 Hadoop 框架下的 Java 、 Scala 和 Clojure 程序员提供一个可以灵活 DIY 的机器学习工具。团队在官网表示,他们希望通过一些机器学习算法的开发,将商业带入智能化数据的时代。也正是为了实现这一理想,惠及更多的用户,因此选择了移植性更好的 Java 来实现这些算法。目前, Deeplearning4j 在模式识别、时间序列检测和基于语音、文本的情感识别方面应用广泛,包括谷歌、 Facebook 和微软等巨头公司都是它的用户。

推荐:

相关阅读
  • 没有资料