内部资料,注意保管
面向对象多模态AI数据平台V1.0 系统安装部署手册 V1.5.2
唯简科技(北京)有限公司
本文档主要介绍唯简科技面向对象多模态AI数据平台的具体实施方法。通过阅读本文档,用户可以自行安装部署该产品。
本文档主要面向系统实施人员,包括:
本文档的编写目的是描述北京唯简科技科技有限公司(简称:唯简科技)面向对象多模态AI数据平台的安装部署介绍,帮助开发、测试、管理各环节角色了解、搭建产品测试环境和生产环境。
唯简科技面向对象多模态AI数据平台主要由多模图数据存储引擎、统一数据治理、统一作业调度和企业小应用开发与发布框架四部分组成。
唯简科技面向对象多模态AI数据平台具有如下特点:
| 功能 | 组件名称 | 说明 |
|---|---|---|
| 分布式存储组件 | cassandra | 数据存储组件,可以根据需求进行横向扩展提高入库速度和存储容量,支持集群部署 |
| 分布式配置组件 | etcd | 配置服务,支持集群部署 |
| 分布式消息队列组件 | nats | 消息队列,支持集群部署 |
| 分布式数据管理组件 | odbserver | 数据管理组件,支持集群部署 |
| 分布式数据处理组件 | parser | 规则数据流式处理组件,支持横向扩展提高数据处理能力,支持集群部署 |
| 分布式作业调度组件 | sched | 定时任务进行平台数据处理,支持集群部署 |
| 分布式数据接入组件 | toe | 集成接入第三方数据采集 |
| 分布式Web服务组件 | web | web容器组件,支持横向扩展提高并发访问能力,支持集群部署 |
面向对象多模态AI数据平台支持Linux系统,企业级部署建议操作系统为RedHat、Centos7以上版本,或者Suse10以上版本。对信创操作系统支持为麒麟V10操作系统。
| 配置 | CPU | 内存 | 硬盘 |
|---|---|---|---|
| 推荐配置 | 8 Core * 2.0GHz以上 | 32G以上 | 100G以上,根据需求增加 |
| 最小配置 | 4 Core * 2.0GHz以上 | 16G以上 | 100G以上,根据需求增加 |
| 测试配置 | 2 Core * 2.0GHz以上 | 8G以上 | 100G以上,根据需求增加 |
注:支持使用虚拟机,存储必须使用San存储或本地存储。
| 软件 | 版本 |
|---|---|
| git | 操作系统相应版本,用于自动化脚本和文档的版本管理 |
| python | 2.7,用于底层数据访问和维护 |
| 编译工具链 | build-essential, gcc, g++, cmake, make |
| 数学库 | libopenblas-dev, liblapack-dev |
| 主机名设置 | 要求执行hostname输出主机名为真实主机名,而非localhost |
| 模块名称 | 内部端口 | 服务端口 |
|---|---|---|
| cassandra | 9160/7000/7001 | 9042 |
| etcd | 2380 | 2379 |
| nats | 4244 | 4222/8222 |
| odbserver | 11009 | 11001 |
| parser | - | - |
| sched | - | - |
| web | - | 8080/8443 |
| toe | - | - |
唯简科技面向对象多模态AI数据平台各服务组件都是分布式集群部署,各节点以统一、同步的标准时间用于记录各种数据的产生时序,如:文件创建和访问时间、数据库处理时间等。所以,网络时间同步协议(NTP)是系统安装部署的基础要求。
注:如现场无法提供NTP服务地址,可通过指定集群内某节点为NTP服务器。
此处使用root用户。
bash
# 创建临时目录,并上传介质到该目录
$ cd /opt
$ mkdir soft
此处使用root用户。
bash
$ unzip matrix_install_Vx.xx.zip
$ cd matrix_install_Vx.xx
此处使用root用户。
bash
$ ./mxtui
注:执行的时候,确认mxtui有执行权限。
./media/image1.png
控制键说明:
| 控制按键 | 功能 |
|---|---|
| Enter | 选择/执行 |
| Esc | 返回上一级 |
| F6 | 切换输出窗口 |
| Tab 或者 下方向键 | 下一个输入项 |
| Shift+Tab 或者 上方向键 | 上一个输入项 |
| 左右方向键 | 切换下拉选项 |
| 空格键 | 复选框选择 或 取消 |
依次将安装节点信息填写后,选择 Save 后,按回车。
选择 Start/Stop Maintenance:
选择 Start component:
选择 All hosts:
选择 foundation、nats、etcd、odbserver:
查看基础组件启动情况:
选择 Start/Stop Maintenance -> Status component
选择 Install Configuration -> Init system
点击 Execute 按钮
参考 3.1.8 描述,启动其他组件(parser、sched、toe、watchcat)。
bash
# 使用集群命令启动(root用户)
# ./mxtool cluster exec '/opt/matrix/web/bleve-explorer/bleve-explorer.sh start' --host <主机名>
See the /opt/soft/mxtool.log file for debug information.
# 注意:/opt 根据设定安装路径进行修改
# 单独机器启动脚本命令(matrix用户)
$ su - matrix
$ /opt/matrix/web/bleve-explorer/bleve-explorer.sh start
# 注意:/opt 根据设定安装路径进行修改
系统的默认租户名称为 unio。打开浏览器,在url地址栏输入登录地址 http://ip:8080/unio。username默认为 admin,password默认为 admin。
考虑到兼容性及效果,建议使用Chrome内核浏览器(80版本以上)。
bash
# 使用集群命令启动(root用户)
# ./mxtool cluster remove
See the /opt/soft/mxtool.log file for debug information.
bash
# 使用(root用户)
# 上传组件到服务器/tmp下
# 更新web组件
# ./mxtool cluster update --source /tmp/web --dest $MATRIXHOME/web --concurrent --force web
# 更新odbserver组件
# ./mxtool cluster update --source /tmp/odbserver --dest $MATRIXHOME/odbserver --concurrent --force odbserver
See the /opt/soft/mxtool.log file for debug information.
在安装目录的 sbin 下执行:
bash
$ ./matrix.sh status # 查看启动状态
cassandra running 6775 matrix
etcd running 7016 matrix
nats running 7051 matrix
odbserver running 3165 matrix
parser stopped 2125 matrix
sched stopped 1205 matrix
web stopped 1795 matrix
toe stopped 3195 matrix
bash
# ssh matrix@ipaddress -p port
# cassandra运行日志
$ cd $MATRIXROOT/cassandra/log
cat debug.log
cat system.log
# etcd运行日志
$ cd $MATRIXROOT/var/logs/etcd
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# nats运行日志
$ cd $MATRIXROOT/var/logs/nats
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# parser运行日志
$ cd $MATRIXROOT/var/logs/parser
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# toe运行日志
$ cd $MATRIXROOT/var/logs/toe
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# odbserver运行日志
$ cd $MATRIXROOT/var/logs/odbserver
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# sched运行日志
$ cd $MATRIXROOT/var/logs/sched
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# web运行日志
$ cd $MATRIXROOT/var/logs/web
$ cat log.log # 消息日志
$ cat out.log # 错误日志
# bleve运行日志
$ cd $MATRIXROOT/var/logs/bleve
$ cat out.log # 错误日志
matrix -- etc -- web - <主机名> - app.ini 修改按钮将 HTTP_PORT、MASTER_PORT 修改为需要的端口(1000以上)
工具路径:$MATRIXROOT/bin
文件名:odbtool
帮助文档:
bash
./odbtool -help
NAME:
odbtool - The odb tool
USAGE:
odbtool [global options] command [command options] [arguments...]
VERSION:
1.0.17
COMMANDS:
mql Execute mql
cql Execute cql
export Export data to mql file or xlsx file
import Import data from mql file or xlsx file
help, h Shows a list of commands or help for one command
GLOBAL OPTIONS:
--keyspace value, -k value Select keyspace (default: "matrix")
--addr value, -a value ODB address or Cassandra address
--user value, -u value ODB or Cassandra username
--pass value, -p value ODB or Cassandra password
--help, -h show help
--version, -v print the version
bash
./odbtool -k oootest -u admin -p admin import -help
NAME:
odbtool import - Import data from mql file or xlsx file
USAGE:
odbtool import [command options] [arguments...]
OPTIONS:
--file value Import file path (.mql or .xlsx)
导入举例:
bash
./odbtool -k oootest -u admin -p admin import --file /opt/matrix/var/test/entity.mql
# -k oootest keyspace名称
# -u admin odb用户名
# -p admin odb密码
# import 导入命令
# --file mql文件
断点续传:
bash
# 第一次执行时:-c 表示导入出错,立即停止
/opt/matrix/agent/bin/odbtool -k icbctest import --file ./testinsert.mql -c
# Import file ./testinsert.mql.
# Import data success: 80, failure: 0.redis: 2026/04/21 18:44:01 pubsub.go:168: redis: discarding bad PubSub connection: read tcp 172.26.38.247:38536->172.26.38.247:11001: read: connection reset by peer
# 2026-04-21 18:44:31.407 No client available
# Import data success: 80, failure: 1.
# Import mql (报错信息......error: [Unsure]
# Error position index: 81
# 第二次执行:-s 81 表示导入从81行开始
/opt/matrix/agent/bin/odbtool -k icbctest import --file ./testinsert.mql -c -s 81
# Import file ./testinsert.mql.
# Continue from position: 81
# Import data success: 594, failure: 0.
bash
./odbtool -k oootest -u admin -p admin export -help
NAME:
odbtool export - Export data to mql file or xlsx file
USAGE:
odbtool export [command options] [arguments...]
OPTIONS:
--ftype value Export file type (mql or xlsx) (default: "mql")
--class value Export class
--recursive, -r Recursive subclass
--limit value Data limit size (default: -1)
--where value Query where conditions
--template, -t Export template
--ignf value Ignore fields
--ignc value Ignore classes
--reldef Export relation defined
--out value Output file
导出举例:
bash
./odbtool -k oootest -u admin -p admin export --class /m3event -r --out /opt/matrix/var/test/entity1.mql
# Export class /m3event
# Class /m3event size 0
# Export class /m3event/entity
# Class /m3event/entity size 0
# Export class /m3event/entity/component
# Class /m3event/entity/component size 1
# Class /m3event/entity/component size 0
# Export class /m3event/entity/link
# Class /m3event/entity/link size 1
# Class /m3event/entity/link size 0
# Export class /m3event/entity/node
# Class /m3event/entity/node size 1
# Class /m3event/entity/node size 0
# Export file to /opt/matrix/var/test/entity1.mql
# -k oootest keyspace名称
# -u admin odb用户名
# -p admin odb密码
# export /m3event 导出命令
# --class 导出的class
# -r 循环向下导出
# --file 输出mql文件路径
导入脚本使用方法: ./odbtool.sh 用法: 导出: ./odbtool.sh export --keyspace --username --password --class [--recursive] [--host ] 导入: ./odbtool.sh import --keyspace --zip [--concurrent ]
选项说明: --keyspace keyspace 名称 (默认: matrix) --username 用户名 (默认: admin) --password 密码 (默认: admin) --class 根类名称 (如 /m3event) --recursive 是否递归导出所有子类 (默认: 只导出指定类) --host Matrix API 主机地址 (默认: localhost:8080) --zip 导入时指定 ZIP 包路径 --concurrent 导入数据时的并发线程数 (默认: CPU 核心数 * 2)
示例:
**导出: **
./odbtool.sh export --keyspace oktest --class /m3event --recursive --host 172.26.38.247:8080
**导入: **
./odbtool.sh import --keyspace oootest --zip ./matrix_export.zip --concurrent 8
修改文件:$MATRIXROOT/cassandra/conf/cassandra.yaml
concurrent_writes 修改为 128file_cache_size_in_mb 修改为 4096修改文件:$MATRIXROOT/cassandra/conf/jvm-servers.options
-Xms 改为 22G-Xmx 改为 22G修改文件:$MATRIXROOT/cassandra/conf/cassandra.yaml
concurrent_writes 修改为 356file_cache_size_in_mb 修改为 8192修改文件:$MATRIXROOT/cassandra/conf/jvm-servers.options
-Xms 改为 44G-Xmx 改为 44G注:修改以上配置后,需要重启 cassandra 组件(参考 3.1 章)