本课程中基于 Presto 的搭建,基础操作,实现 Presto 的分析查询,对 Hive 进行性能对比,并使用真实企业级项目进行验证,实现 Presto 的高性能开发,自定义 UDF 和 UDAF 的使用,分析针对性的模型,学完本课程后,对于 Hive 和 Presto 有清洗认知,可以独立开发自定义函数等。
Presto 支持在线数据查询,包括 Hive, Cassandra, 关系数据库以及专有数据存储。 一条 Presto 查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。
Presto 以分析师的需求作为目标,他们期望响应时间小于1秒到几分钟。 Presto 终结了数据分析的两难选择,要么使用速度快的昂贵的商业方案,要么使用消耗大量硬件的慢速的“免费”方案。
Facebook 使用 Presto 进行交互式查询,用于多个内部数据存储,包括 300PB 的数据仓库。 每天有 1000 多名 Facebook 员工使用 Presto,执行查询次数超过 30000 次,扫描数据总量超过 1PB。
领先的互联网公司包括 Airbnb 和 Dropbox 都在使用 Presto。