数据处理
数据处理
纵腾湖仓全链路落地实践
数据湖作为一个统一存储池,可接入多种方式的数据输入,无缝对接多种计算分析引擎,进行高效的数据处理与分
24    2023-10-30
数据处理单元:什么是DPU,为什么需要它们?
在本文中,我们将基本了解什么是DPU、DPU的工作原理、DPU的优势、如何选择合适的DPU供应商以及
20    2023-05-08
如何为你的数据选择合适的流处理器?
数据已经成为大多数组织不可或缺的一部分。因此,流处理成为大数据栈的关键部分也就不足为奇了。因为流处理
人工智能与大数据的完美结合
人工智能(AI)已经存在几十年了。然而,最近随着“大数据”的出现,它得到了越来越多的关注。那么,大数
基于Storm构建分布式实时处理应用初探
本文我不会具体阐述Storm集群和Zookeeper集群如何部署的问题,这里想通过一个实际的案例切入
Apache Spark常见的三大误解
最近几年关于Apache Spark框架的声音是越来越多,大家通过Google搜索更多关于Spark
不平衡数据的数据处理方法
在机器学习中,不平衡数据是常见场景。不平衡数据一般指正样本数量远远小于负样本数量。如果数据不平衡,那
1