SPL培训数据外置提速查询

时间:2025年6月6日 14:00-17:00
地点:北京市海淀区上地 街道宏达党群服务中心 查看地图
线上:直播链接后续在培训群内通知

传统交易(TP)数据库不擅长分析计算,而专业OLAP数据库又过于沉重,经常需要集群,会让系统架构变得非常复杂。

把不再变化的历史数据存储成轻量级的SPL列存文件,可以利用SPL的强大计算能力,跑出远超传统数据库的查询性能。SPL很轻,直接嵌入应用就可以运行,在实现数据外置提速的同时,也不会让整个系统架构变得很复杂。

我们精心设计了这门培训课程,聚焦六大典型性能难题,提供从理论到实践的完整解决方案,助您彻底突破数据库查询性能瓶颈!

适合人群

  1. 有查询、报表性能痛点,需要SPL为常规数据库分析计算提速的同学。
  2. 了解SPL基本概念,掌握SPL基础编程的同学。

课程内容

  • 01常规过滤及分组汇总

    从连接数据库开始,把数据库表转储成高性能二进制文件,用游标过滤并行计算手段大幅提升一般计算性能。
  • 02COUNT DISTINCT

    去重本质上是分组运算,SPL有序去重可以大大降低复杂度。
  • 03外键维表的关联

    SQL实现外键关联性能差,SPL用序号关联破解这个难题。
  • 04大主子表关联

    主子表数据量巨大,还随时间增长,大表关联很慢。SPL有序归并从原理上解决老大难问题。
  • 05主子表关联时的EXISTS

    大主子表关联慢,加上EXISTS更慢。用SPL有序归并两个问题一并解决。
  • 06枚举字段条件过滤

    过滤条件中有in,慢的无法忍受?SPL神奇的对位序列消除过滤时的比较计算!

课程安排(半天)

13:40 - 13:55 线下签到;线上发直播链接
14:00 - 15:00 常规过滤及分组汇总、COUNT DISTINCT
15:00 - 16:00 外键维表的关联、大主子表关联提速
16:00 - 17:00 主子表关联时的EXISTS提速、枚举字段条件过滤

课程收益

通过本课程的集中学习,您将能够:

  1. 掌握SPL在数据处理与分析中的多项核心优化技术。
  2. 独立编写中高阶的 SPL 程序,解决实际工作中遇到的数据分析计算性能问题,显著提升计算效率。
  3. 提升在数据分析计算方面的能力,增强在团队中的技术竞争力。

讲师简介

陈虎 润乾售前技术咨询总监

长期致力于计算引擎和大数据技术应用领域。

他拥有超过 20 年商业智能、数据挖掘方面的工作经验,专注于大数据相关的性能优化工作,能够从原理层面深度剖析各类系统运行缓慢的问题,并积累了丰富的性能优化实战经验,屡次刷新系统提速的记录。

曾在短短数日之内,在未增加硬件投入的情况下,成功将保险公司核心查询速度提升 2000 多倍,将银行跑批任务提速 150 多倍,将银行用户画像客群交集计算提速 200 多倍。

实战经验