首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏钱塘大数据

    “别再问我什么是大数据了”一个单身程序汪的自白

    技术:Hadoop和Hive、Pig、Cascading、Cascalog、mrjob、Caffeine、S4、MapR、Acunu、Flume、Kafka、Azkaban、Oozie、Greenplum

    95590发布于 2018-03-01
  • 来自专栏猿天地

    Netty-整合kryo高性能数据传输

    distributed stream computing) Storm (distributed realtime computation system, in turn used by many others) Cascalog

    2.4K120发布于 2018-04-03
  • 来自专栏PPV课数据科学社区

    【观点】大数据对于数据分析师意味着什么?

    “ 技术: Hadoop和Hive、Pig、Cascading、Cascalog、mrjob、Caffeine、S4、MapR、Acunu、Flume、 Kafka、Azkaban、Oozie、Greenplum

    87130发布于 2018-04-18
  • 来自专栏云计算D1net

    大数据对于数据分析师的意义

    “ 技术: Hadoop和Hive、Pig、Cascading、Cascalog、mrjob、Caffeine、S4、MapR、Acunu、Flume、Kafka、Azkaban、Oozie、Greenplum

    1.6K70发布于 2018-03-16
  • 来自专栏CodingToDie

    今日分享: 常用工具集

    MongoDB、Apache CouchDB、Redis、BigTable、HBase、Hypertable、Voldemort、 Neo4j MapReduce相关:Hive、Pig、Cascading、Cascalog

    1.4K41发布于 2019-06-03
  • 来自专栏挖掘大数据

    超详细的大数据学习资源推荐(上)

    的流处理框架; Apache Tez :基于YARN,用于执行任务中的复杂DAG(有向无环图); Apache Twill :基于YARN的抽象概念,用于减少开发分布式应用程序的复杂度; Cascalog

    2.7K80发布于 2018-01-12
  • 来自专栏DT乱“码”

    整理的程序员使用利器(工具)

    MongoDB、Apache CouchDB、Redis、BigTable、HBase、Hypertable、Voldemort、Neo4j MapReduce相关:Hive、Pig、Cascading、Cascalog

    2.4K11发布于 2019-05-26
  • 来自专栏web全栈潮流

    coder看看应该有用

    MongoDB、Apache CouchDB、Redis、BigTable、HBase、Hypertable、Voldemort、Neo4j MapReduce相关:Hive、Pig、Cascading、Cascalog

    1.4K41发布于 2019-11-04
  • 来自专栏数据饕餮

    Hadoop专业解决方案-第13章 Hadoop的发展趋势

    虽然Cascading是一个JAVA API,但是APIs当前允许使用其他的语言,列表包括Scala的Scalding, Clojure的Cascalog, Python的PyCascading以及其他 例如,Cascalog增加了基于数据日志的逻辑查询功能,而Scalding增加了有关遍历问题以及许多机器算法的数学模型。

    89530发布于 2019-01-14
  • 来自专栏公众号:懒时小窝

    《数据密集型应用系统设计》 - 数据模型和查询语言

    实际案例: Datomic系统的查询语言 Cascalog 主要是查询大数据集的Datalog实现。

    1.4K30编辑于 2022-12-06
  • 来自专栏机器学习算法与Python学习

    干货|谷歌大规模机器学习:模型训练、特征工程和算法选择

    流行的框架有强大的社区支持 缺点:人力投入多(需要一个开发者/数据科学家的团队) 数据处理框架: Map / Reduce + Hadoop——分布式存储和处理系统 M / R——处理大量数据的范式 Pig,Hive,Cascalog

    3.5K50发布于 2018-04-08
  • 来自专栏PPV课数据科学社区

    32页ppt干货|谷歌大规模机器学习:模型训练、特征工程和算法选择

    流行的框架有强大的社区支持 缺点:人力投入多(需要一个开发者/数据科学家的团队) 数据处理框架: Map / Reduce + Hadoop——分布式存储和处理系统 M / R——处理大量数据的范式 Pig,Hive,Cascalog

    2.5K100发布于 2018-04-23
  • 来自专栏新智元

    谷歌大规模机器学习:模型训练、特征工程和算法选择 (32PPT下载)

    数据处理框架: Map / Reduce + Hadoop——分布式存储和处理系统 M / R——处理大量数据的范式 Pig,Hive,Cascalog——在Map / Reduce 上的框架 Spark

    1.5K100发布于 2018-03-27
  • 来自专栏逸鹏说道

    大数据学习资源汇总

    YARN的流处理框架; Apache Tez :基于YARN,用于执行任务中的复杂DAG(有向无环图); Apache Twill :基于YARN的抽象概念,用于减少开发分布式应用程序的复杂度; Cascalog

    2.5K110发布于 2018-04-10
  • 来自专栏用户2133719的专栏

    《数据密集型应用系统设计》读书笔记(二)

    在实践中,Datalog 语言被应用在多个数据系统中,例如 Datomic 系统将其作为查询语言;Hadoop 则基于 Datalog 实现了 Cascalog 用于大数据集的查询。

    2.1K30发布于 2021-09-09
  • 来自专栏风火数据

    大数据学习资源最全版本(收藏)

    Kafka和YARN的流处理框架; Apache Tez:基于YARN,用于执行任务中的复杂DAG(有向无环图); Apache Twill:基于YARN的抽象概念,用于减少开发分布式应用程序的复杂度; Cascalog

    4.1K40发布于 2018-08-23
  • 来自专栏Elasticsearch专栏

    【Java那些年系列-启航篇 02】Java的诞生:从默默无名的Oak到全球化的Java

    大数据处理框架: 除了上述提到的项目,Java还有许多其他的大数据处理框架,如Cascalog、Samza和Akka等。这些框架提供了不同的数据处理模式和抽象,以满足不同的应用场景需求。

    97610编辑于 2024-04-25
领券