小言_互联网的博客

过往记忆大数据,2019年原创精选69篇

343人阅读  评论(0)

这是一份迟来的年终报告,本来昨天就要发出来的,实在是没忙开,今天我就把它当作新年礼物送给各位看官,以下文章都是我结合日常工作、学习,每当“夜深人静"的时候写出来的一些小总结,希望能给大家一些技术上的帮助。

关注我的朋友都知道,我在今年八月份发了一篇文章,里面整理了我五年来写在这个公众号上面的原创文章。这篇文章几乎可以当作一份资料集,这里再把它放出来,需要的可以收藏一下五年总结:过往记忆大数据原创精选(点击进入)

废话不多说,上干货。69篇2019年原创文章请收好~

点击标题可直达对应文章,这只是我分享的一部分,完整版欢迎访问我的博客:https://www.iteblog.com/

  1. 盘点2019年晋升为Apache TLP以及进去Apache孵化器的大数据相关项目

  2. Apache Kafka 2.4 正式发布,重要功能详细介绍

  3. Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比

  4. 60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践

  5. Delta Lake 0.5.0 正式发布,支持包括 Hive/Presto 等多种查询引擎

  6. Apache Spark 中编写可伸缩代码的4个技巧

  7. Apache Hudi: Uber 开源的大数据增量处理框架

  8. 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)的使用

  9. Apache Spark 3.0 预览版正式发布,多项重大功能发布

  10. 一文了解 Apache Spark 3.0 动态分区裁剪(Dynamic Partition Pruning)

  11. 使用 Spark 和 Delta Lake 构建近实时数据仓库

  12. Spark+AI Summit Europe 2019 超清视频&PPT下载

  13. Apache Cassandra 在 Facebook 的应用

  14. 重磅|Spark Delta Lake 现在由Linux基金会托管,将成为数据湖的开放标准

  15. Spark Delta Lake 0.4.0 发布,支持 Python API 和部分 SQL

  16. 一文了解 Apache Cassandra 是什么

  17. 云栖大会 | Apache Spark 3.0 和 Koalas 最新进展

  18. 原创干货 | 史上最全的大数据学习资源(Awesome Big Data)

  19. Apache Spark Delta Lake 写数据使用及实现原理代码解析

  20. 如何为Kafka集群选择合适的Topics/Partitions数量

  21. 你还在使用 JDK 7?JDK 13 都已经来了!五大新特性你最喜欢哪个 ?

  22. 32 道常见的 Kafka 面试题你都会吗?附答案

  23. 这可能是学习 Spark Delta Lake 最全的资料

  24. 深入理解 Apache Spark Delta Lake 的事务日志

  25. MongoDB 4.2 发布,支持分布式事务

  26. 一文理解 Apache Spark DataSource V2 诞生背景及入门实战

  27. 图文了解 Kafka 的副本复制机制

  28. 深入理解 Spark SQL 查询引擎

  29. Spark & Alluxio在网易严选架构演进中的实践和探索

  30. 重磅 | HPE 宣布收购 MapR!

  31. Uber 大数据平台的演进(2014~2019)

  32. Apache Hadoop 的 HDFS federation 前世今生

  33. Apache Hive JdbcStorageHandler 编程入门指南

  34. 深入理解 Spark Delta Lake 的诞生及其工作原理

  35. Spark-SQL 在字节跳动的应用实践

  36. Apache Kafka 2.3 发布,新特性讲解

  37. 砖厂 CEO Ali 对 Hadoop 的最新评价

  38. Apache Hive 联邦查询(Query Federation)

  39. Hadoop 气数已尽?

  40. 一条 SQL 在 Apache Spark 之旅(下)

  41. 一条 SQL 在 Apache Spark 之旅(中)

  42. 一条 SQL 在 Apache Spark 之旅(上)

  43. Kafka 是如何保证数据可靠性和一致性

  44. 深入理解 Spark SQL 查询引擎

  45. 通过 Spark Streaming Listener 监控程序

  46. 图文了解 Kafka 的副本复制机制

  47. 分布式原理:一致性哈希算法简介

  48. Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的

  49. Koalas: 让 pandas 开发者轻松过渡到 Apache Spark

  50. .NET for Apache Spark 预览版正式发布

  51. 重磅 | Apache Spark 社区期待的 Delta Lake 开源了

  52. Flink Forward 201904 PPT资料下载

  53. Apache Spark 2.4 回顾以及 3.0 展望

  54. SHC:使用 Spark SQL 高效地读写 HBase

  55. Apache Spark 未来:Spark 3.0 预览

  56. Open Distro for Elasticsearch:AWS 自家版本的开源 ElasticSearch

  57. Apache Spark 3.0 将内置支持 GPU 调度

  58. HBase 中加盐之后的表如何读取:Spark 篇

  59. HBase 中加盐之后的表如何读取:协处理器篇

  60. HBase 协处理器入门及实战

  61. 分布式原理:一致性哈希算法简介

  62. 分布式原理:一文了解 Gossip 协议

  63. Kafka创建Topic时如何将分区放置到不同的Broker中

  64. HBase 入门之数据刷写(Memstore Flush)详细说明

  65. Apache Arrow:一个跨平台的内存数据交换格式

  66. 为什么不建议在 HBase 中使用过多的列族

  67. 为了让你更全面的了解Apache HBase,我们做了这本专刊

  68. {Submarine} 在 Apache Hadoop 中运行深度学习框架

  69. 盘点2018年晋升为Apache TLP的大数据相关项目

点击标题可直达对应文章,这只是我分享的一部分,完整版欢迎访问我的博客:https://www.iteblog.com/

2020年,希望继续得到大家的支持,同时祝大家2020年幸福快乐,升职加薪,出任CEO,迎娶白富美,走上人生巅峰!!


转载:https://blog.csdn.net/w397090770/article/details/103798230
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场