欢迎光临散文网 会员登陆 & 注册

CnosDB 2.0 Arrow Flight SQL使用指北

2023-07-10 20:29 作者:CnosDB  | 我要投稿


随着新版本的发布,细心的小伙伴们想必已经发现CnosDB 2.0已经全面支持了Arrow Flight SQL。易用高效,数据访问不再难!Arrow Flight SQL让CnosDB 2.0 十亿行数据查询秒级响应成为可能!本篇文章详细介绍了Arrow Flight SQL及使用Arrow Flight SQL的优势及各种语言的使用方法,方便大家快速上手使用Arrow Flight SQL。


Arrow Flight SQL

Arrow Flight SQL 是一种使用 Arrow 内存格式和 Flight RPC 框架与 SQL 数据库交互的协议,其结合Arrow内存中的列式格式(Columnar Format)以及Flight RPC框架,来加速SQL数据库操作。通过使用Arrow Flight SQL,用户访问数据时,不仅可以使用原生SQL的标准语法,而且可以大幅度地提升数据访问性能,让十亿行数据查询秒级响应成为可能!

目前我们支持Arrow Flight SQL 客户端的环境有

• C++

• Go

• Java

• Rust

• 基于Arrow Flight SQL 的JDBC

Arrow Flight SQL 的优势

Arrow Flight SQL具有的优势:

1. 功能强大:功能与JDBC和ODBC等API类似,包括执行查询,创建准备好的语句。

2. 安全:使用 Flight,支持开箱即用的加密和身份验证等功能。

3. 性能:与实现Arrow Flight 的客户端和服务端通信,无需进行数据转化,同时允许进一步优化,如并行数据访问,从而大幅度提升数据访问性能。

Arrow Flight 与 JDBC/ODBC性能的比较:

1. Arrow Flight 在客户端和服务端通信传输数据时,无需进行数据转化,而ODBC的实现通常需要自定义在线二进制协议。

2. Arrow Flight 可以并行传输数据,先获取数据的访问计划,数据可以分布在不同的服务器上,客户端可以并行从不同服务器上拉取数据。

3. Arrow Flight 采用 Arrow Columnar Format 格式,该格式获取数据的复杂度是O(1),对向量化计算友好。

虽然它可以直接用于数据库访问,但它不能直接替代 JDBC/ODBC。 但是,Arrow Flight SQL 可以用作具体的有线协议/驱动程序实现,支持 JDBC/ODBC 驱动程序,并减少数据库的实现负担。


客户端使用Arrow Flight SQL与数据库连接,查询数据,执行SQL的流程大致如下:

1. 创建Flight SQL客户端

2. 验证用户名,密码

3. 执行SQL,获取FlightInfo结构体

4. 通过FlightInfo结构体中的FlightEndPoint获取到FlightData数据流

FlightInfo中包含有关数据所在位置的详细信息,客户端可以从适当的服务器获取数据。服务器信息被编码为 FlightInfo 中的一系列 FlightEndpoint 消息。 每个Endpoint代表包含响应数据子集的某个位置。

一个FlightEndpoint包含一个服务器地址列表,一个Ticket,一个服务器用来识别请求数据的二进制Token。FlightEndPoint 没有定义顺序,如果数据集是排序的,只会在一个FlightEndPoint中返回数据。

流程图如下:


C++

1.安装Apache Arrow 你可以去官方文档(
https://arrow.apache.org/install/)找到详细的安装教程。在Mac系统下,使用brew命令就可以简单安装。

2. 配置CMakeLists.txt

3. C++ Arrow库的用法arrow的函数大多数是返回arrow::Result<T>类型,因此需要把代码写在返回值为 arrow::Result<T>的类型的函数中,如下

ARROW_ASSIGN_OR_RAISE宏的效果是,先对右边返回值为arrow::Result<T>类型的表达式求值,如果出现异常,则提前return,赋上相应的Status值

为了方便,示例代码均写在lambda函数中

4. 执行身份验证,并创建一个FlightSqlClient

5. 执行SQL取得FlightInfo

6. 通过FlightEndPoint取回数据

7.整体代码

GO

1. 添加依赖

在go.mod中写入依赖

2. 创建Flight SQL客户端

3. 设置连接凭证,并取得已经验证的上下文

4. 在已经验证的上下文中执行SQL,取得FlightInfo

5. 根据FlightInfo取得数据Reader

6. 操作Reader打印数据

JAVA

1. 添加依赖

• 如果你使用maven构建Java项目,在pom.xml中写入依赖

• 再写入

• 添加环境变量

2. 建FlightSqlClient

3. 配置认证

4. 执行SQL,取得FlightInfo

5. 取得数据

6. 全部代码

JDBC

1. 添加依赖

添加环境变量

_JAVA_OPTIONS="--add-opens=java.base/java.nio=ALL-UNNAMED"

2. 设置属性并查询

3.设置属性并执行SQL

Rust

代码运行在异步环境下

1. 添加依赖

2. 创建FlightServerClient

3. 进行验证

4. 执行SQL

5. 取得数据并打印

6. 完整代码

ODBC

目前仅支持x86_64架构的系统,Linux仅支持CentOS和RedHat系列发行版。

更多关于Arrow Flight SQL ODBC的内容,请查看Dremio文档(
https://docs.dremio.com/software/drivers/arrow-flight-sql-odbc-driver/)。

以下步骤基于CentOS 7。

安装ODBC管理器

在Linux下安装unixODBC

  1. 安装arrow-flight-odbc驱动

2. 修改配置文件修改位于/etc/odbc.ini的配置文件

其中 UID是用户名,PWD是密码

测试是否连接

如果出现如下内容,说明连接成功

下面进入代码测试

1. 编写cmak

2. 编写c语言代码 main.c

总结

CnosDB 2.0的原生Arrow架构,提供了基于Arrow Flight SQL 接口,通过使用Arrow Flight SQL,可以用多种语言连接CnosDB 2.0 时序数据库,高效地写入数据与查询数据,更能支持十亿行数据查询秒级响应。

关于更多的细节,可以在CnosDB2.0 使用手册|连接器(https://docs.cnosdb.com/zh/guide/reference/connector.html)中查看相关使用方法,如果有需求或者建议,也请在GitHub(https://github.com/cnosdb/cnosdb)上给我们提issue。


CnosDB简介

CnosDB是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。

欢迎关注我们的社区网站:https://cn.cnosdb.com

CnosDB 2.0 Arrow Flight SQL使用指北的评论 (共 条)

分享到微博请遵守国家法律