最近在学习 kubernetest 但是 Google 上有非常多的教程关于如何部署 kubernetes。
原本是想在自己买的 JD 和 HUAWEI 的 ECS 上面部署的,但是折腾了很久无果。无奈还是选用同一个云服务商提供的 ECS,在同一个 VPC 的条件下部署会更方便。
本文中的所有脚本均可以在这里找到 https://gist.github.com/elfgzp/02485648297823060a7d8ddbafebf140。
由于只是学习,笔者就不部署高可用的 k8s 集群了,所以准备一台 Master 和 Node 节点。
由于 Master 至少需要 2 个 CPU 核心。这里选择了 Vultr 上 2 核 4G 内存 配置的 ECS。

Node 节点配置当然是内存越大越好,当然只是处于学习的目的,这里就选择与 Master 相同的配置。
国外的云服务厂商一般是没有带宽限制的,一般是按照流量计算的,这个配置有 3T 的流量是肯定够的。
然后他的收费模式是按小时计算的这个配置 0.03 $ / h 相当于 0.21 ¥ / h,也就是每小时两毛钱!就算你用一天也就四块钱。
笔者打算在学习 k8s 的时候在部署两个实例,不用了直接销毁,岂不美哉。
新用户的话还能免费到账 100 $ ,这里是邀请的连接 Vultr Give $100,要是觉得还不错的话可以试试,笔者是真的觉得他们的服务还不错,所以给他们打个广告。
这里选择两个 CentOS 7 Without SELinux 的实例。
SELinux 是 Linux 下的一个安全相关的软件,为了方便学习和部署,我们直接关闭它,所以选择 Without SELinux 就准备开始部署了。
注意在 Additional Features 处勾选 Enable Private Networking,让 Vultr 为你的服务器分配内网 IP。
设置好两个节点的 HostName 防止待会节点名称冲突。

在 Deploy Now 之前将 Servers Qty 增加为 2 ,这样就不用反复打开部署页面了,直接部署两个实例。
别被这 $20.00 /mo 吓到了,这是每月 $20,我们只需要用完了及时销毁就好,而且新用户赠送的 100$ 可以用很久了。
部署完成两个实例后,就可以在 Instances 列表找到他们。 (考虑到没有使用过云服务的读者,这里笔者讲详细一点。)

在点进这个实例可以在 Overview 找到他的登录账号密码,默认用户是 root。
然后在 Settings 可以看到这两个实例的内网 IP。
这里笔者的两个实例的内网如下:
| 实例 | 核心数 | 内存 | 内网 IP |
|---|---|---|---|
| Master | 2 | 4G | 10.24.96.3 |
| Node | 2 | 4G | 10.24.96.4 |
接下来就正式开始了,不过 ssh 进入系统后还需要做一些准备工作。
首先避免不必要的麻烦,先关闭 CentOS 7 的防火墙,因为本身云服务厂商会有安全组,我们也可以通过配置安全组来实现网络安全防护。
systemctl disable firewalld && systemctl stop firewalld
若是前面在部署实例的时候没有选择 Without SELinux 这里则需要让容器可以访问主机文件,需要输入以下命令。
# 将 SELinux 设置为 permissive 模式(相当于将其禁用)
setenforce 0
sed -i 's/^SELINUX=enforcing$/SELINUX=permissive/' /etc/selinux/config
我们还需要关闭 swap,至于为什么感兴趣可以去搜一下。
swapoff -a
确保在 sysctl 配置中的 net.bridge.bridge-nf-call-iptables 被设置为 1。
cat <<EOF > /etc/sysctl.d/k8s.conf
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
sysctl --system
确保已加载了 br_netfilter 模块。这可以通过运行 lsmod | grep br_netfilter 来完成。要显示加载它,请调用 modprobe br_netfilter。
modprobe br_netfilter
lsmod | grep br_netfilter
安装 docker:
yum install -y docker
systemctl enable docker && systemctl start docker
笔者已经将上述步骤做成了脚本,可以查看 https://gist.github.com/elfgzp/02485648297823060a7d8ddbafebf140#file-vultr_k8s_prepare-sh。 为了快速进入下一步可以执行以下命令直接跳过准备操作。
curl https://gist.githubusercontent.com/elfgzp/02485648297823060a7d8ddbafebf140/raw/781c2cd7e6dba8f099e2b6b1aba9bb91d9f60fe2/vultr_k8s_prepare.sh | sh
接下来的步骤可以完全参考官方文档来了,官方文档链接。
# 配置 yum 源
cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://packages.cloud.google.com/yum/repos/kubernetes-el7-x86_64
enabled=1
gpgcheck=1
repo_gpgcheck=1
gpgkey=https://packages.cloud.google.com/yum/doc/yum-key.gpg https://packages.cloud.google.com/yum/doc/rpm-package-key.gpg
EOF
# 安装 kubelet kubeadm kubectl
yum install -y kubelet kubeadm kubectl --disableexcludes=kubernetes
# 启动 kubelet
systemctl enable --now kubelet
由于 Vultr 是国外的云主机,所以我们根本不用考虑 Google 的访问问题,但是如果是国内的主机需要将 yum 源的 repo 修改为以下配置。
cat << EOF > /etc/yum.repos.d/kubernetes.repo
[kuebrnetes]
name=KubernetesRepository
baseurl=http://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=0
EOF
上述操作的脚本,https://gist.github.com/elfgzp/02485648297823060a7d8ddbafebf140#file-vultr_k8s_install_kubeadm-sh。
curl https://gist.githubusercontent.com/elfgzp/02485648297823060a7d8ddbafebf140/raw/#/vultr_k8s_prepare.sh | sh
我们首先要在 Master 的实例上执行 kubeadm。但是我们先使用 kubeadm config print init-defaults 来看看它的默认初始化文件。
kubeadm config print init-defaults
接下来直接执行 kubeadm init 进行初始化。
kubeadm init
当然你也可以生成一个配置文件后,指定配置文件进行初始化:
kubeadm config print init-defaults > kubeadm.yaml
# 修改 kubeadm.yml
kubeadm init --config kubeadm.yaml
国内的主机可能需要修改 imageRepository 的配置,来修改 k8s 的镜像仓库。
cat <<EOF > kubeadm.yaml
apiVersion: kubeadm.k8s.io/v1beta2
kind: ClusterConfiguration
apiServer:
extraArgs:
runtime-config: "api/all=true"
kubernetesVersion: "v1.18.1"
imageRepository: registry.aliyuncs.com/google_containers
EOF
kubeadm init --config kubeadm.yaml
如果初始化失败可以执行以下命令,进行重制:
kubeadm reset
rm -rf $HOME/.kube/config
rm -rf /var/lib/cni/
rm -rf /etc/kubernetes/
rm -rf /etc/cni/
ifconfig cni0 down
ip link delete cni0
执行完成后,我们会得到以下输出:
Your Kubernetes control-plane has initialized successfully!
To start using your cluster, you need to run the following as a regular user:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
https://kubernetes.io/docs/concepts/cluster-administration/addons/
Then you can join any number of worker nodes by running the following on each as root:
kubeadm join {你的IP}:6443 --token 3prn7r.iavgjxcmrlh3ust3 \
--discovery-token-ca-cert-hash sha256:95283a2e81464ba5290bf4aeffc4376b6d708f506fcee278cd2a647f704ed55d
按照他的提示,我们将 kubectl 的配置放到 $HOME/.kube/config 下,注意每次执行完成 kubeadm init 之后,配置文件都会变化,所以需要重新复制。kubeadm 还会输出 join 命令的配置信息,用于 Node 加入集群。
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config
如果你们是使用 root 用户的话,可以直接利用环境变量指定配置文件:
echo 'export KUBECONFIG=/etc/kubernetes/admin.conf' >> ~/.bashrc
. ~/.bashrc
接下来使用 kubectl get nodes 来查看节点的状态:
NAME STATUS ROLES AGE VERSION
master1 NotReady master 6m52s v1.18.1
此时的状态为 NotReady 当然这个状态是对的,因为我们还没有安装网络插件。接下来安装网络插件,这里是用的是 Weave 网络插件:
kubectl apply -f "https://cloud.weave.works/k8s/net?k8s-version=$(kubectl version | base64 | tr -d '\n')"
还有其他的网络插件可以参考官方文档,Installing a Pod network add-on。
可以通过查看 Pods 状态查看是否安装成功:
kubectl get pods -A
NAMESPACE NAME READY STATUS RESTARTS AGE
kube-system coredns-66bff467f8-br94l 1/1 Running 0 14m
kube-system coredns-66bff467f8-pvsfn 1/1 Running 0 14m
kube-system kube-proxy-b2phr 1/1 Running 0 14m
kube-system weave-net-8wv4k 2/2 Running 0 2m2s
如果发现 STATUS 不是 Running 可以通过,kubectl logs 和 kubectl describe 命令查看详细的错误信息。
kubectl logs weave-net-8wv4k -n kube-system weave
kubectl logs weave-net-8wv4k -n kube-system weave-npc
kubectl describe pods weave-net-8wv4k -n kube-system
此时的 Master 节点状态就变为 Ready 了。
NAME STATUS ROLES AGE VERSION
master1 Ready master 6m52s v1.18.1
Node 节点部署 Node 节点同样需要「准备阶段」的工作,这里就不一一讲解了,直接执行脚本:
curl https://gist.githubusercontent.com/elfgzp/02485648297823060a7d8ddbafebf140/raw/781c2cd7e6dba8f099e2b6b1aba9bb91d9f60fe2/vultr_k8s_prepare.sh | sh
curl https://gist.githubusercontent.com/elfgzp/02485648297823060a7d8ddbafebf140/raw/781c2cd7e6dba8f099e2b6b1aba9bb91d9f60fe2/vultr_k8s_install_kubeadm.sh | sh
我们需要执行 kubeadm 在 Master 节点初始化后输出的 join 命令。如果不记得了,可以通过在 Master 执行以下命令重新获得 join 命令。
kubeadm token create --print-join-command
kubeadm join {你的IP}:6443 --token m239ha.ot52q6goyq0pcadx --discovery-token-ca-cert-hash sha256:95283a2e81464ba5290bf4aeffc4376b6d708f506fcee278cd2a647f704ed55d
若加入时出现问题同样可以使用 kubeadm rest 来重置。
kubeadm reset
当然 join 命令也是可以提供配置文件的,我们只需要在 Node 上执行以下命令就可以生成默认配置文件了。
kubeadm config print join-defaults > kubeadm-join.yaml
kubeadm join --config kubeadm-join.yaml
然后再次通过 kubectl 查看 nodes 状态,如果希望在 Node 节点上执行的话,需要将 Master 上的 /etc/kubernetes/admin.conf 复制到 Node 节点上。
接下来我们验证 Node 的状态为 Ready 则加入成功:
kubectl get nodes
NAME STATUS ROLES AGE VERSION
master1 Ready master 6m52s v1.18.1
node1 Ready <none> 29s v1.18.1
以上就是在 Vultr 上使用 kubeadm 部署 k8s 集群的所有过程啦,当然也是踩了很多坑。特别是想在不同的云主机上部署,最终还是选择使用同一个云服务商的 ECS。