kubectl memcache.go:265 couldn’t get current server API group list

问题描述

在使用 Kubernetes 集群时，执行 kubectl get pods 命令后出现如下错误：

text

E0805 09:59:45.750534  234576 memcache.go:265] couldn’t get current server API group list: Get "http://localhost:3334/api?timeout=32s": EOF

该问题通常发生在 Ubuntu 系统更新后，导致无法从本地环境连接到 Kubernetes 集群。常见环境：

Kubernetes 1.27+
裸金属部署（bare-metal）
Ubuntu 20.04/22.04
Docker 或 Containerd 容器运行时

该错误表明 kubectl 无法与 Kubernetes API 服务器正常通信，原因多种多样，下面将列出最常见解决方案。

kubectl API 连接错误示意图

常见解决方案

优先尝试基础步骤

检查 Kubernetes 组件状态

bash

sudo systemctl status kubelet containerd docker

验证当前集群上下文
bash
```
kubectl config get-contexts
```
确保集群可用性
bash
```
minikube status || k3s check-config
```

解决方案 1: 禁用 Swap 并重启 kubelet

高发场景启用 Swap 会导致 Kubelet 无法启动

bash

# 立即禁用 Swap
sudo swapoff -a

# 永久禁用 Swap (编辑 /etc/fstab 注释掉 swap 行)
sudo sed -i '/swap/s/^/#/' /etc/fstab

# 重启 kubelet
sudo systemctl restart kubelet

解决方案 2: 正确配置 KUBECONFIG

新集群常见问题管理员配置未正确加载

bash

# 创建 kube 配置目录
mkdir -p $HOME/.kube

# 复制管理员配置
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config

# 设置权限
sudo chown $(id -u):$(id -g) $HOME/.kube/config

# 验证配置生效
export KUBECONFIG=$HOME/.kube/config
kubectl config view

永久生效

将以下内容添加到 ~/.bashrc 或 ~/.zshrc

bash

export KUBECONFIG=$HOME/.kube/config

解决方案 3: 上下文切换问题

多集群环境专属 docker-desktop/minikube/AWS 上下文冲突

查看所有可用上下文
bash
```
kubectl config get-contexts
```

切换到正确上下文

bash

kubectl config use-context docker-desktop  # 或 minikube/eks

解决方案 4: 修复 sudo 环境变量

当 kubectl 需要 sudo 运行时需保留环境变量

编辑 sudoers 配置
bash
```
sudo visudo
```
添加如下内容
text
```
Defaults env_keep += "KUBECONFIG"
```
测试带环境变量的 sudo
bash
```
sudo -E kubectl get nodes
```

特定场景解决方案

场景 A: AWS/Azure 私有集群连接问题

bash

# 更新 AWS EKS 配置 (替换 region 和名称)
aws eks update-kubeconfig --region us-east-1 --name myCluster

# Azure Private AKS 需手动添加 hosts
sudo nano /etc/hosts
# 添加: 10.0.1.11 aks-xxx-test-dns-xxxxxx.privatelink.eastus.azmk8s.io

场景 B: Minikube/K3s 启动异常

bash

# 启动 minikube (指定容器运行时)
minikube start --container-runtime=containerd

# K3s 指定代理端口
kubectl proxy --port=8001
export KUBECONFIG=kubeconfig:8001

场景 C: 证书和缓存故障

bash

# 清除 kubectl 缓存
rm -rf ~/.kube/cache  

# 重启容器运行时
sudo systemctl restart containerd docker

其他潜在原因排查

网络与防火墙

检查 API 服务器端口

bash

nc -zv localhost 6443  # 默认 API 端口

确保安全组开放端口

text

* 控制平面: 6443, 2379-2380
* 工作节点: 10250, 30000-32767

企业防火墙/NAT 设备检查

系统级故障

时间不同步

bash

timedatectl status  # 确保时间误差 <2s

容器运行时配置错误
编辑 /etc/containerd/config.toml 确保:

toml

[plugins."io.containerd.grpc.v1.cri"]
  SystemdCgroup = true  # 启用 systemd cgroups

节点 IP 权限限制
确保当前 IP 在集群访问白名单中

总结排查流程

在排除该问题时：

优先检查基础服务状态（kubelet, containerd）
验证 KUBECONFIG 配置和上下文
检查 Swap/Firewall/DNS 等系统级因素
最后排查网络策略和环境变量问题

相关文章

kubectl memcache.go:265 couldn’t get current server API group list ​

问题描述 ​

常见解决方案 ​

解决方案 1: 禁用 Swap 并重启 kubelet ​

解决方案 2: 正确配置 KUBECONFIG ​

解决方案 3: 上下文切换问题 ​

解决方案 4: 修复 sudo 环境变量 ​

特定场景解决方案 ​

场景 A: AWS/Azure 私有集群连接问题 ​

场景 B: Minikube/K3s 启动异常 ​

场景 C: 证书和缓存故障 ​

其他潜在原因排查 ​

总结排查流程 ​

kubectl memcache.go:265 couldn’t get current server API group list

问题描述

常见解决方案

解决方案 1: 禁用 Swap 并重启 kubelet

解决方案 2: 正确配置 KUBECONFIG

解决方案 3: 上下文切换问题

解决方案 4: 修复 sudo 环境变量

特定场景解决方案

场景 A: AWS/Azure 私有集群连接问题

场景 B: Minikube/K3s 启动异常

场景 C: 证书和缓存故障

其他潜在原因排查

总结排查流程