做一事恒心 成一事辉煌

当前位置: 首页> 产品介绍> 恒辉分析型数据库

HHADB

恒辉分析型数据库

一、引言

       现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者所构成的生态系统,该生态系统由终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、数据服务零售商等等一系列的参与者共同构建而成。
       所谓大数据,最为核心的就要看对于大量数据的核心分析能力。但是,大数据核心分析能力的影响不仅存在于数据管理策略、数据可视化与分析能力等方面,从根本上也对数据中心IT基础设施架构甚至机房设计原则等提出了更高的要求。为了达到快速高效的处理大量数据的能力,整个IT基础设施需要进行整体优化设计,应充分考量后台数据中心的高节能性、高稳定性、高安全性、高可扩展性、高度冗余,基础设施建设这五个方面。
       面对上述挑战,将多个服务器组成一组集群是前提条件,这样一来就可以充分利用每一台服务器的资源并将客户端负载分发到不同服务器上,随着应用程序负载的增加,只需要将新的服务器添加到集群即可。
       “恒辉信达有限公司”(简称为“恒辉”)为了适应大数据时代的需求,结合多年数据库研发积累的经验,成功研发出具有完全自主知识产权的“恒辉分析数据库”(简称为“HHADB”),可以帮助客户快速搭建数据分析集群,让企业在大数据时代抓住商机,展望未来。

二、产品概述

       HHADB可以帮助用户解决数据库所面临的挑战如下:
       •当数据库性能遇到问题时,是否能够横向扩展,通过添加服务器的方式达到更高的吞吐量,从而充分利用现有的硬件实现更好的投资回报率。
       •数据库的横向扩展是否对应用程序透明,如果数据库的横向扩展需要应用程序端进行大量修改,则所带来的后果不仅仅是高昂的开发成本,同时也会带来很多潜在和非潜在的风险。
       •是否拥有实时同步的副本,当数据库面临灾难时,可以短时间内通过故障转移的方式保证数据库的可用性。此外,当数据丢失或损坏时,能否通过所谓的实时副本(热备)实现数据的零损失。

三、HHADB体系架构

1、模块组成

▶数据节点

HHADB数据节点包括数据解析引擎和数据存储引擎两个部分。

图:数据节点

       解析引擎 -- 接收客户端传入的SQL,把SQL转化成对象树,然后把对象树提交给文件引擎。
       文件引擎 -- 根据解析引擎传入的对象树进行数据文件的读写,把产生的结果数据结合返回给客户端。从存储方式上, 恒辉文件引擎支持列式存储、行式存储、ZIP压缩存储。

▶协调节点

       协调节点是数据节点与应用程序之间的接口,协调节点并不物理上存储表数据,协调节点接受应用的指令,通过运算,分发或者汇集数据节点的数据。当应用程序发起SQL语句时,会先到达协调节点,然后协调节点将 SQL语句分发到各个数据节点,汇总数据。
       HHADB的MPP采用的是完全对等的无共享架构,每个数据库服务器都称为一个节点,每个节点都是一个独立的数据库。各个节点的功能完全一样,每个节点部署在一个独立主机上,用户可以通过连接任何一个节点实现相关操作。数据节点物理上存储表数据,同一个表的数据可以分布在不同的节点上,最后通过数据驱动或者协调节点,把结果集进行合并。

图:双控多节点管理

       M&R代表Map和Reduce的过程,就是数据文件到数据集合的映射过程。


▶管理工具

HHADB图形查询工具的特点如下:
· 全中文操作界面
· Web 浏览器访问方式
· 支持多个节点的管理
· 支持每个节点所有数据库对象的浏览
    √模式(Schema)
    √表格
    √表格中的列
    √内存表
    √视图
    √函数
· 支持SQL的输入输出窗口
· 支持SQL高亮显示
· 支持主机性能的监控
    √CPU
    √内存
    √磁盘
    √网络
· 支持告警和配置管理

图:管理工具

功能列表

· SQL标准
    √全部SQL92
    √SQL2003
· 存储方式
    √行存储
    √列存储
    √zip存储
    √支持多种数据编码
· 数据库对象
    √数据库(Database)
    √表空间 (Table Space)
    √表模式(Schema)
    √用户 (User, Role)
    √索引(Index)
    √主键(Primary key)
    √外键 (Foreign key)
    √表格(Table)
    √内存表(MEM Table)
    √视图(View)
    √函数(Function)
    √过程语言(Procedure Language)
· 连接访问方式
    √JBDC
    √ODBC
    √CLI
· 安全
    √SSL访问控制
    √物理IP访问控制
    √物理MAC地址访问控制
    √数据库历史操作安全分析
    √多租户控制
· 管理工具
    √字符管理工具
    √图形管理工具

数据类型

 分类  类型  别名  描述
 字符类型  VARCHAR  CHARACTER VARYING  变长字段
 CHAR[]    定长字符
 数字类型  INT2  SMALLINT  定长,2字节
 INT4  INT  定长,4字节
 INT8  BIGINT  定长,8字节
 REAL  FLOAT4  定长,4字节
 DOUBLE PRECISION  FLOAT8  定长,8字节
 布尔类型  BOOL  BOOLEAN  定长,1字节
 时间类型  TIMESTAMP  TIMESTAMP
 WITH
 TIME ZONE
 定长,8字节
 DATE  DATE  定长,4字节
 二进制类型  BIT[]    定长二进制
 BIT VARYING    变长二进制

注意:HHADB可以根据以上数据类型建立复合类型,也可以通过API添加个性化的类型。

支持操作系统