(二)集算器是什么

那么,集算器到底/是什么呢?能不能一两句话说清楚。

确实,营销讲究要快速让用户理解产品的定位和特点,也有不少朋友和客户问过我们能不能在一分钟内说清楚集算器是什么东西?

仔细想下来,到现在为止,这个答案还是“不能”!

人们一般只会用已经熟知的概念来类比一个新东西,比如电动车是用电而不是烧油的汽车。而要是找不到这个对标概念时,理解新产品时就不那么容易了。比如在智能手机还没发明的时代,你也很难解释清楚iPhone是个什么东西,电话?便携影音播放器?数码相机?游戏机?手持工作设备?都是又都不是,功能太多时反而说不清了。

集算器是类似的,它能干的事有点多:报表数据源、ETL、大数据计算、文本分析、Excel处理、Java计算中间件、数据网关、….。每个应用场景都足够讲个十分钟到半小时的。如果正好和用户的痛点匹配上,那会听得津津有味,而如果匹配不上,那就索然无味。


不过,即使一下子说不清,那还是得说:

简单来讲,集算器是个用来做数据计算的软件,主要针对(半)结构化数据。从技术上看,可以被理解为这么三种东西:

程序设计语言:集算器提供了独特的程序语言(SPL,Structured Process Language)和数据对象,用于编写结构化数据计算更为简捷方便,而且在多数场合能有更好的运算性能,特别适合复杂的过程式运算。在这方面的对标技术大概是SQL、Java和Python。

数据计算中间件:集算器提供了不依赖于数据库的计算能力,能够独立完成各类结构化数据计算,而且特别强调集成性,易于嵌入到应用程序内部,适合于没有数据库或多个数据库场景下的计算。这方面的对标技术主要是数据库和ETL工具。

大数据计算平台:集算器还有自己的集群体系,可用于实施大数据量的计算任务,集算器集群为程序员提供可灵活控制任务分配的分布式计算环境,籍以实现最合理高效的算法。这方面的对标技术主要是Hadoop和MPP数据库。

这些描述中充斥着技术术语,这说明集算器是一个技术产品,它的使用人群是程序员,或者至少是有程序设计能力的分析人员,而不是不会编程的行业业务人员。


要了解一个产品是什么,最重要的是要知道它能干什么,也就是应用场景。但是,如上所述,集算器的应用场景非常多,每个场景都不是一两句话能解释清楚的,短篇幅内全面解释更不现实。这个话题,我们将为每种场景专门撰写文章来阐述。

然后,除了知道它是什么,还要知道它不是什么,也就是不能干什么。

集算器不是报表和BI工具:集算器虽然来源是报表开发,但它本身并不是报表和BI工具,它几乎没有格式化呈现能力。用作数据分析工具时,它是要编程的,而不是由业务人员简单拖拽就能形成一个报表。集算器和报表工具之间是配合关系,不是竞争关系。

集算器不能替代数据库:作为计算中间件,集算器能够提供数据库拥有所有的计算能力甚至更强,但它不强调存储能力,它有自己的数据文件格式,但主要是用于做高速访问缓存,而不象数据库那样有完整的数据模式。集算器是个单纯的计算引擎,能部分替代数据库的功能,但不能彻底取代数据库。

集算器不提供数据挖掘和人工智能算法:集算器面对的计算场景是结构化数据计算,主要是常规的分组、汇总及关联运算,目前它没有提供数据挖掘和机器学习算法包,不能用于这个用途,也许未来会逐步发展这些能力。