K3s存储插件使用笔记

2023-06-12 2025-10-16 约 2700 字预计阅读 6 分钟

原理

k8s存储主要依赖PV和PVC的机制，前者由运维人员声明可用的存储，如：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
apiVersion: v1
kind: PersistentVolume
metadata:
  name: nfs
spec:
  storageClassName: manual
  capacity:
    storage: 10Gi
  accessModes:
    - ReadWriteMany
  nfs:
    server: 10.244.1.4
    path: "/"

后者是用户（开发人员）声明的需求：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: nfs
spec:
  accessModes:
    - ReadWriteMany
  storageClassName: manual
  resources:
    requests:
      storage: 1Gi

两者的匹配机制：

存储要求的容量必须满足需求；
spec.storageClassName必须完全匹配；
权限要求能够匹配上；

绑定成功之后，在Pod里面就可以正常使用这个PVC了：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
apiVersion: v1
kind: pod
metadata:
  labels:
    role: web-frontend
spec:
  containers:
    - name: web
      image: nginx
      ports:
        - name: web
          containerPort: 80
      volumeMounts:
        - name: nfs
          mountPath: /usr/share/nginx/html
  volumes:
    - name: nfs
      persistentVolumeClaim:
        claimName: nfs

spec.containers.volumeMounts这里将卷名为nfs的卷挂载到容器中的指定目录；
spec.volumes中声明了上面用的名为nfs的volume；
上面那个volume实际上对应了persistentVolumeClaim.claimName；

k8s中内置了一个循环调度器，会定期检查并绑定PV和PVC，即使Pod启动的时候PVC还没有成功绑定PV，等到有合适可用的磁盘时也会自动绑定成功。

PV的实现方式非常多，主要包括块存储和文件存储两类，两者的区别是前者类似是磁盘，需要格式化成文件系统之后才能使用，后者则可以直接使用（如NFS）；

Dynamic Provisioning

上面那种手动声明PV的方式，被称为Static Provisioning. 一般只有服务规模比较小的时候使用，大型集群里面有成千上万个pod，每个需要成百上千的PV，人工创建PV的成本太高，所以一般并不使用。

StorageClass是创建PV的模板，主要包括：

PV的属性，如存储类型、Volume的大小等；
创建PV需要的插件，如Ceph等；

例如：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
apiVersion: ceph.rook.io/v1beta1
kind: Pool
metadata:
  name: replicapool
  namespace: rook-ceph
spec:
  replicated:
    size: 3
---
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: block-service
provisioner: ceph.rook.io/block
parametes:
  pool: replicapool
  clusterNamespace: rook-ceph

使用这个StorageClass:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: example
spec:
  accessModes:
    - ReadWriteOnce
  storageClassName: block-service
  resources:
    requests:
      storage: 30Gi

这里核心的就是spec.storageClassName这个字段，使用kubectl apply -f pvc.yaml，就可以看到对应的pvc了。

使用kubectl describe pv <pvc-volume>可以看到对应的PV.

需要注意的是，使用静态供应的时候，storageClassName是名称匹配的，并不是模板匹配。

LocalPV

考虑到资源隔离和可用性等问题，不应直接把host-path用作LocalPV，一般情况下，一个LocalPV对应一个外挂磁盘。

LocalPV的格式很简单：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
apiVersion: v1
kind: PersistentVolume
metadata:
  name: example
spec:
  capacity:
    storage: 10Gi
  volumeMode: Filesystem
  accessModes:
    - ReadWriteOnce
  persistentVolumeReclaimPolicy: Delete
  storageClassName: local-storage
  local:
    path: /mnt/disks/vol1
  nodeAffinity:
    required:
      nodeSelectorTerms:
        - matchExpressions:
          - key: kubernetes.io/hostname
            operator: In
            values:
              - node-1

显然上面的local-path指定了本地路径，下面的节点亲和性需求上强制要求了使用这个PV的Pod只能在node-1上运行。

如果将LocalPV声明为一个StorageClass，其格式如下：

1
2
3
4
5
6
apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: local-path
provisioner: rancher.io/local-path
volumeBindingMode: WaitForFirstConsumer

上面其实就是k3s内置的LocalPV的格式（移除了metadata中的大部分内容），这里值得注意的是volumeBindingMode的延迟绑定设计。

通过WaitForFirstConsumer的声明，PV和PVC的绑定会被延迟到调度Pod的时候，而不是在声明PVC之后立刻绑定。这是由于节点亲和性的需求导致的。

使用这个StorageClass的PVC格式和普通的PVC并无二致：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: example-local-claim
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 5Gi
  storageClassName: local-path

移除PV

移除PV的流程和创建PV正好相反，如果是静态声明的LocalPV，流程是：

删除使用PV的Pod；
从宿主机移除挂载；
删除PVC；
删除PV；

静态创建/删除PV的流程都比较繁琐，可以使用k8s提供的External Provisioner中的某个静态Provisioner自动扫描磁盘完成PV声明。

CSI

k8s中除了kubelet等几个核心组件之外，大部分组件都是插件化的，存储也不例外，可以自己根据CSI接口自行创建。

k3s默认的StorageClass local-path就是通过CSI自己实现的，metadata.annotations.storageclass.kubernetes.io/is-default-class设为"true"即可设置为默认StorageClass.

k3s默认配置

刚说了k3s默认的local-path是一个LocalPV，他的默认数据路径其实在安装的时候可以修改，有个--default-local-storage-path的参数指明，如果不改的话默认是/var/lib/rancher/k3s/storage.

在k3s安装好之后，也可以通过修改/var/lib/rancher/k3s/server/manifests/local-storage.yaml中的configmap，将nodePathMap中的paths改为需要的路径。

k3s删除了k8s自带的大部分存储插件，如果是分布式文件存储，推荐使用Longhorn.

Longhorn

官方文档见：https://longhorn.io/docs/1.4.2/，目前还是沙箱阶段。

安装使用helm3即可：

1
2
3
4
helm repo add longhorn https://charts.longhorn.io
helm repo update
helm install longhorn longhorn/longhorn --namespace longhorn-system --create-namespace --version $LONGHORN_VERSION
kubectl patch sc longhorn -p '{"metadata": {"annotations":{"storageclass.kubernetes.io/is-default-class":"false"}}}'

其中最后是将longhorn的default StorageClass配置取消掉，因为k3s默认是使用local-path的，没必要改成默认longhorn.

longhorn默认的配置可以在安装时修改，见这里，大部分时候使用默认配置即可。如果有很多node，但是只有部分node想充当分布式存储服务器（建议最少3个），可以通过NodeSelector进行修改。

安装完成之后可以通过ingress将其前端页面暴露出来，不过这个页面没有认证机制，有一定的安全风险：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: longhorn-ingress
  namespace: longhorn-system
spec:
  rules:
  - http:
      paths:
      - path: /
        pathType: Prefix
        backend:
          service:
            name: longhorn-frontend
            port:
              number: 80

上面的配置直接占用了ingress的根path，虽然github上说longhorn支持通过subpath访问，但是我实际测试的时候是一片空白页…

longhorn默认使用的磁盘路径是/var/lib/longhorn，一般我们会将数据盘直接挂载到这个路径下；或者你也可以根据这里的提示修改路径或者添加多磁盘支持。

longhorn需要配置的东西其实很少，直接创建PVC时指定StorageClass为longhorn即可。其他备份、快照等功能使用可以参考这篇博客。