当前位置:首页 > 大数据

DolphinScheduler JavaTask动态传参秘籍:轻松完成使命间数据活动

邻居的猫1个月前 (12-09)288
DolphinScheduler JavaTask动态传参秘籍:轻松完成使命间数据活动
Apache DolphinScheduler的JavaTask可以通过在任务执行日志中输出特定格式的参数来支持OUT参数的下游传输,通过捕捉日志并将其作为参数传递给下游任务。这种机制允许任务间的数据流动和通信,增强了工作流的灵活性和动态性。 那具体要怎么做呢?本文将进行详细的讲解。 0 修改一行源...

VTS:根据Apache SeaTunnel的开源向量数据搬迁东西

邻居的猫1个月前 (12-09)1219
VTS:根据Apache SeaTunnel的开源向量数据搬迁东西
引言 VTS(Vector Transport Service),全称向量传输服务,是一个由Zilliz开发的专注于向量和非结构化数据迁移的开源工具。VTS的核心特点在于其基于Apache SeaTunnel开发,这一事实使其在数据处理和迁移方面具有显著的优势。Apache SeaTunnel作为一...

新式数据仓库规划与实践手册:从分层架构到实践使用(三)

邻居的猫1个月前 (12-09)1195
新式数据仓库规划与实践手册:从分层架构到实践使用(三)
本手册将分为三部分发布,以帮助读者逐步深入理解数据仓库的设计与实践。 第一部分介绍数据仓库的整体架构概述; 第二部分深入讨论ETL在数仓中的应用理论,ODS层的具体实现与应用; 第三部分将围绕DW数据仓库层、ADS层和数据仓库的整体趋势展开; 通过这样的结构,您可以系统地学习每一层次的内容和设计原则...

海港企业数据财物消费实践,系统化整理数据财物、深度开释数据要素潜力

邻居的猫1个月前 (12-09)1772
海港企业数据财物消费实践,系统化整理数据财物、深度开释数据要素潜力
港口企业作为交通运输枢纽,需要借助数字化手段提升管理水平、优化生产流程、提高运营效率,以适应日益增长的业务量和竞争压力。为了指导各地智慧港口的建设工作,交通运输部等多部门联合发布了《智慧港口建设指南》,明确了智慧港口建设的目标、原则、路径及重点任务,为港口的数据化、智能化提供了具体指导。随着物联网、...

【金猿人物展】白鲸开源CEO郭炜:未来数据范畴的PK是大模型Transformer vs 大数据Transform

邻居的猫1个月前 (12-09)1390
【金猿人物展】白鲸开源CEO郭炜:未来数据范畴的PK是大模型Transformer vs 大数据Transform
本文由白鲸开源CEO郭炜撰写并投递参与“数据猿年度金猿策划活动——2024大数据产业年度趋势人物榜单及奖项”评选。 去年是大模型蓬勃兴起的一年,热度席卷全球,仿佛AI已经可以解决一切问题。今年随着热潮退去,大模型开始进入深水区,试图深入改造各行各业的底层逻辑。而在大数据处理领域,大模型与传统ETL的...

动力出资工程VS智能驾驭,DolphinScheduler怎么当好传统职业与前沿科技的桥梁?

邻居的猫1个月前 (12-09)1041
动力出资工程VS智能驾驭,DolphinScheduler怎么当好传统职业与前沿科技的桥梁?
在数字化转型的浪潮中,Apache DolphinScheduler以其强大的调度能力,成为连接传统行业与前沿科技的桥梁。2024年12月17日14:00, Apache DolphinScheduler社区将举办一场线上用户交流活动,届时将邀请来自能源投资工程和智能驾驶领域的专家,分享Dolphi...

Dolphinscheduler DAG中心源码分析

邻居的猫1个月前 (12-09)1351
Dolphinscheduler DAG中心源码分析
背景描述 注意 : 在 Dolphinscheduler 中,离线任务是有完整的声明周期的,比如说停止、暂停、暂停恢复、重跑等等,都是以DAG(有向无环图的形式进行任务组织)T+1离线任务的。 Dolphinscheduler DAG实现 org.apache.dolphinscheduler.co...

11月 | Apache SeaTunnel月度发展总结

邻居的猫1个月前 (12-09)1397
11月 | Apache SeaTunnel月度发展总结
各位热爱 Apache SeaTunnel 的小伙伴们,社区10月份月报更新啦!这里将记录 SeaTunnel 社区每月的重要更新,欢迎关注! 月度Merge之星 感谢以下小伙伴 11 月份为 Apache SeaTunnel 所做的精彩贡献(排名不分先后): 用户名 用户名 用户名 用户名 用户名...

【技巧帖】 DolphinScheduler 使命数据整理与备份战略,保证页面不卡顿

邻居的猫1个月前 (12-09)2132
【技巧帖】 DolphinScheduler 使命数据整理与备份战略,保证页面不卡顿
问题描述 由于 Apache DolphinScheduler 长期运行,任务数量不断增加,相关任务数据主要存储在数据库中的 t_ds_task_instance 和 t_ds_process_instance 两张表中。 随着这两张表数据量的持续增长,导致系统页面出现卡顿现象。 解决方案 为解决上...

spark机器学习:运用ALS完结产品引荐

邻居的猫1个月前 (12-09)606
spark机器学习:运用ALS完结产品引荐
ALS(Alternating Least Squares)是一种广泛使用的推荐系统算法,特别用于协同过滤(Collaborative Filtering)任务。在 Apache Spark 中,ALS 被实现为 org.apache.spark.ml.recommendation.ALS 类,适用...