如何在腾讯云上安装 MapD 的 GPU 可视化数据库

前言

2017/5/8, MapD Technologies将MapD Core数据库进行开源啦。MapD是使用图形处理单元(GPU)以毫秒为单位分析数十亿行数据的先驱,比传统的基于CPU的数据库快几个数量级。MapD Core数据库及其可视化库开源让每个人都可以使用这个世界上最快的分析平台。

今天,笔者就要教大家如何在腾讯云上安装这个“新玩意”。

本文安装目录就直接选择了/home/mapd

这里创建了一个mapd用户。

准备工具

  1. 腾讯云服务器 系统为: CentOS 7.2 64位
  2. SSH登陆工具

系统准备

下面全部在root用户下执行,需要切换用户的地方会指明

一、安装JDK

这个网上教程一大堆,在这我就快速安装了。

执行以下代码:

1
yum install java-1.8.0-openjdk-headless

然后

1
vi /etc/profile.d/java.sh

在该文件里面输入

1
export LD_LIBRARY_PATH=/usr/lib/jvm/jre-1.8.0-openjdk/lib/amd64/server:$LD_LIBRARY_PATH

二、安装Enterprise Linux(EPEL)存储库额外的包

1
yum install epel-release

三、更新并重启

1
2
yum update
reboot

时间太长,看会皮卡丘再回来。:)

四、创建mapd用户并更新密码

1
2
useradd -U mapd
passwd mapd

五、安装CUDA驱动

1
2
3
4
curl -O -u mapd http://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-8.0.61-1.x86_64.rpm
rpm --install cuda-repo-rhel7-8.0.61-1.x86_64.rpm
yum clean expire-cache
yum install cuda-drivers

上面第一条命令的版本可以修改 “8.0.61-1.x86_64” 就是这一部分可以改成你想要的版本,现在最新版本为 8.0.61

要想安装其它版本或者是Windows的可以点击这里下载相应的CUDA驱动。

安装完成后在 “/usr/lib64/“ 下检查是否存在”libcuda.so”这个东西,如果不存在的话,请重新执行第五步操作

安装中途提示输入密码,记下此密码,后面要用。

六、设置防火墙

1
2
sudo firewall-cmd --zone=public --add-port=9092/tcp --permanent
sudo firewall-cmd --reload

开始安装系统

一、先去MapD的官网下载安装包

这是他们官网地址。

点击Download按钮,然后点击按图所示的Download按钮。

然后把弹出的窗口的信息填好,邮箱一定要真,之后你的邮箱会收到一封邮件。

点击如图所示的GPU会自动下载,可以复制下载链接到SSH中,然后用wget命令下载:

1
wget http://go3.mapd.com/e/298412/l-298412-2017-05-07-6c98/6c9d/15747147

下载下来的文件名为”15747147”,通过mv命令把其改为”mapd.tar.gz”并移动到 mapd 用户的目录下,然后解压安装

1
2
3
mv 15747147 /home/mapd/mapd.tar.gz
cd /home/mapd
tar -xvf mapd.tar.gz

然后将解压出来的文件夹改名为 mapd,为了方便:

1
mv mapd-ce-3.0.0-20170507-7626e30-Linux-x86_64-render mapd

安装目录可以自选,在这笔者为了方便就安装在/home/mapd里了

二、配置MapD

输入下面命令,修改环境变量:

1
vi /etc/profile

环境变量里面添加如下内容:

1
2
3
4
5
export MAPD_PATH=/home/mapd/mapd
export MAPD_STORAGE=/var/lib/mapd
export MAPD_USER=mapd
export MAPD_GROUP=mapd
export LD_LIBRARY_PATH=/usr/lib/jvm/jre-1.8.0-openjdk/lib/amd64/server

然后

1
source /etc/profile

使得环境变量生效

1.创建数据目录并修改目录权限

1
2
sudo mkdir -p $MAPD_STORAGE
sudo chown -R $MAPD_USER $MAPD_STORAGE

2.初始化数据库

1
$MAPD_PATH/bin/initdb $MAPD_STORAGE

3.安装

1
2
cd $MAPD_PATH/systemd
./install_mapd_systemd.sh

三、 启动

1.启动MapD Core

1
2
sudo systemctl start mapd_server
sudo systemctl start mapd_web_serve

2.设置MapD Core随系统启动

1
2
sudo systemctl enable mapd_server
sudo systemctl enable mapd_web_server

四、验证

验证系统是否启动成功,加载一些数据,然后执行mapdql查询。

首先进入mapd的安装目录:

1
2
cd $MAPD_PATH
$MAPD_PATH/insert_sample_data

然后你会看到下面的提示:

1:里面有7亿行数据

2:里面有1万行数据

这里笔者选择10K的。

然后执行:

1
$MAPD_PATH/bin/mapdql

MapD默认的密码为: HyperInteractive,下面输入的密码为:HyperInteractive。

至于如何更改密码可参照MapD的官网文档,在这里笔者就不说了

然后输入查询语句开始查询:

1
2
3
SELECT origin_city AS "Origin", dest_city AS "Destination", AVG(airtime) AS
"Average Airtime" FROM flights_2008_10k WHERE distance < 175 GROUP BY origin_city,
dest_city;

如果看到以下内容说明成功:

这个数据库还有一个好处,就是提供了一个可视化的平台。在浏览器中输入你服务器的公网 ip:9092,如图所示:

然后创建一个新的仪表盘和点图,验证是否正常工作。

在这里笔者就随便创建了,然后得到下面的图,说明成功了。

别说,这图很好看:)

如果安装中途出现问题,或者是最终安装出来没有此效果,请小伙伴们重新安装一篇,仔细仔细再仔细,实在不行在评论区联系我。