5154

Good Luck To You!

如何在centos7.3系统上快速部署并配置calamari监控服务?

在构建和管理大规模分布式存储系统时,Ceph 凭借其高可扩展性、高可靠性和高性能特性,成为了众多企业的首选,Ceph 集群的复杂性也带来了管理上的挑战,为了简化这一过程,Calamari 应运而生,它是一个专门为 Ceph 设计的管理与监控平台,本文将深入探讨如何在稳定可靠的 CentOS 7.3 操作系统上部署和使用 Calamari,以实现对 Ceph 集群的可视化管理和精细化监控。

如何在centos7.3系统上快速部署并配置calamari监控服务?

理解 Calamari 的核心价值

Calamari 不仅仅是一个简单的监控工具,它是一个集成了数据收集、分析和可视化呈现的综合管理套件,其核心价值在于将 Ceph 集群内部复杂的状态、性能指标和健康度,以直观的图形化界面展现给管理员,从而极大地降低了运维门槛。

Calamari 主要由以下几个关键组件构成:

  • Calamari Server:这是整个平台的核心,它运行一个 Web 服务器,提供用户界面,并负责处理来自所有被监控节点的数据,它还包含一个时序数据库,用于存储历史性能数据。
  • Calamari Agent:需要安装在每一个 Ceph 节点(包括 Monitor、OSD、Metadata Server 等)上,它负责收集本地的 Ceph 集群状态和系统性能指标,并将这些数据发送给 Calamari Server。
  • Diamond:一个轻量级的指标收集器,作为 Calamari Agent 的一部分,负责收集 CPU、内存、磁盘、网络等系统级别的性能数据。
  • Salt Stack:Calamari 利用 Salt 进行配置管理和远程执行,Server 作为 Salt Master,而每个安装了 Agent 的节点则作为 Salt Minion,这使得 Calamari 能够自动发现节点、分发配置并执行管理命令。

通过这些组件的协同工作,Calamari 能够提供一个集中式的视图,让管理员对整个 Ceph 集群的运行状况了如指掌。

在 CentOS 7.3 上部署 Calamari 的准备工作

CentOS 7.3 是一个成熟且稳定的 Linux 发行版,非常适合作为承载关键基础设施服务的平台,在安装 Calamari 之前,必须对系统进行一系列的准备和配置,以确保部署过程顺利无误。

以下是在 CentOS 7.3 系统上进行准备工作的关键步骤:

  1. 系统更新:确保所有系统软件包都是最新的,这可以修复潜在的安全漏洞和兼容性问题。
    sudo yum update -y
  2. 网络配置:确保 Calamari Server 与所有 Ceph 节点之间的网络连接是通畅的,主机名和 IP 地址的解析(通过 /etc/hosts 或 DNS)必须正确配置,因为 Salt 通信依赖于主机名。
  3. 时间同步:分布式存储系统对时间同步极为敏感,必须安装并配置 NTP 服务,确保所有节点(包括 Calamari Server)的时间保持一致。
    sudo yum install -y ntp
    sudo systemctl start ntpd
    sudo systemctl enable ntpd
  4. 防火墙与 SELinux:为了简化初次安装过程,可以临时关闭防火墙和 SELinux,但在生产环境中,强烈建议配置相应的防火墙规则以允许必要的服务端口(如 Salt 的 4505/4506 端口和 Calamari Web 界面的端口)。
    sudo systemctl stop firewalld
    sudo systemctl disable firewalld
    sudo setenforce 0
    sudo sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config

Calamari 的安装与配置流程

准备工作完成后,便可以开始安装 Calamari,我们会选择一台独立的服务器(或虚拟机)作为 Calamari Server,该服务器不需要是 Ceph 集群的一部分。

安装 Calamari Server

Calamari 的官方软件包托管在特定的仓库中,需要添加这个仓库配置文件。

sudo rpm -Uvh https://download.ceph.com/keys/release.asc
sudoyum install -y yum-utils
sudo yum-config-manager --add-repo https://download.ceph.com/rpm-hammer/el7/noarch
sudo yum install -y calamari-server

安装完成后,需要进行初始化,这个过程会设置数据库、创建管理员用户并启动所有相关服务。

如何在centos7.3系统上快速部署并配置calamari监控服务?

sudo calamari-ctl initialize

在初始化过程中,系统会提示设置管理员密码,请务必记住这个密码,它将用于登录 Web UI。

配置 Ceph 节点

在每一个需要被监控的 Ceph 节点上,需要安装 Calamari Agent 和 Salt Minion。

# 在每个 Ceph 节点上执行
sudo yum install -y calamari-clients

安装后,需要配置 Salt Minion,使其指向 Calamari Server 的地址,编辑 /etc/salt/minion 文件,找到 master 这一行,修改为:

master: <your_calamari_server_hostname>

然后启动 Salt Minion 服务并设置开机自启。

sudo systemctl start salt-minion
sudo systemctl enable salt-minion

接受节点密钥并同步数据

当所有 Ceph 节点的 Salt Minion 启动后,它们会向 Calamari Server(Salt Master)发送密钥请求,需要在 Server 上接受这些密钥,才能建立管理关系。

# 在 Calamari Server 上执行
sudo salt-key -L  # 列出所有待接受的密钥
sudo salt-key -A  # 接受所有密钥

接受密钥后,Calamari Server 会自动连接到这些节点,拉取 Ceph 的配置文件和集群信息,这个过程可能需要几分钟,可以通过以下命令检查连接状态:

sudo salt '*' test.ping

访问和使用 Calamari

如何在centos7.3系统上快速部署并配置calamari监控服务?

一切就绪后,打开浏览器,访问 http://<your_calamari_server_ip>/,使用初始化时设置的管理员账户登录。

登录后,你将看到一个功能丰富的仪表盘,Calamari 的核心功能模块可以概括如下表:

功能模块 描述
集群概览 提供整个 Ceph 集群的健康状态、存储容量、IOPS 等关键指标的宏观视图。
服务器监控 展示集群中每个物理服务器的硬件状态,包括 CPU、内存、网络和磁盘利用率。
OSD 状态 详细列出每个 OSD(对象存储设备)的状态(up/in)、权重、存储使用情况以及读写性能。
性能图表 提供丰富的历史性能图表,允许用户自定义时间范围,深入分析集群的 I/O 模式和性能瓶颈。

通过这些界面,管理员可以快速定位问题节点,分析性能趋势,并根据需要进行调整,从而实现对 Ceph 集群的精细化、数据驱动的管理。

相关问答FAQs

我已经按照步骤安装了 Calamari Server 和 Agent,但在 Web 界面上看不到任何 Ceph 节点,这是什么原因?

解答:这是最常见的问题之一,通常由以下几个原因导致:

  1. 网络或防火墙问题:请确保 Calamari Server 与所有 Ceph 节点之间的防火墙允许了 Salt 的通信端口(TCP 4505 和 4506)。
  2. Salt Minion 密钥未接受:在 Calamari Server 上运行 salt-key -L,检查是否有未接受的密钥,如果有,需要使用 salt-key -Asalt-key -a <hostname> 来接受。
  3. 主机名解析错误:Salt Minion 需要能够通过主机名解析到 Calamari Server 的 IP 地址,请检查 /etc/hosts 文件或 DNS 配置是否正确。
  4. 时间不同步:Server 和 Minion 的时间差异过大,Salt 通信可能会失败,请确保所有节点都已正确配置 NTP。

Calamari 和 Ceph 自带的 Dashboard 有什么区别?我应该选择哪一个?

解答:Calamari 和 Ceph Dashboard 都是用于管理和监控 Ceph 集群的工具,但它们有显著的区别:

  • 架构与历史:Calamari 是一个相对独立的外部项目,在 Ceph Luminous 版本之前非常流行,而 Ceph Dashboard 是从 Ceph 版本开始内置的功能,与 Ceph Manager (ceph-mgr) 紧密集成。
  • 功能与集成度:Ceph Dashboard 是现代 Ceph 集群的原生管理界面,功能更全面,与 Ceph 的集成度更高,能够管理 RGW、iSCSI 等更多组件,并且功能更新迭代更快,Calamari 的功能则相对传统,主要专注于集群和 OSD 的监控。
  • 维护与社区:Ceph 社区的主要开发重心已经完全转向了内置的 Ceph Dashboard,Calamari 的开发已基本停止。

对于新部署的 Ceph 集群(特别是 Mimic 及之后的版本),强烈推荐使用功能更强大、更现代的 Ceph Dashboard,如果你正在维护一个使用旧版 Ceph(如 Hammer/Jewel)的遗留系统,并且已经部署了 Calamari,那么继续使用它也是可行的,但在规划新系统时,Ceph Dashboard 是不二之选。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2025年11月    »
12
3456789
10111213141516
17181920212223
24252627282930
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
    网站收藏
    友情链接

    Powered By Z-BlogPHP 1.7.3

    Copyright Your WebSite.Some Rights Reserved.