診斷修復 TiDB Operator 在 K8s 測試中遇到的 Linux 內核問題

作者：張文博

Kubernetes（K8s）是一個開源容器編排系統，可自動執行應用程序部署、擴展和管理。它是雲原生世界的操作系統。 K8s 或操作系統中的任何缺陷都可能使用戶進程存在風險。作為 PingCAP EE（效率工程）團隊，我們在 K8s 中測試 TiDB Operator（一個創建和管理 TiDB 集羣的工具）時，發現了兩個 Linux 內核錯誤。這些錯誤已經困擾我們很長一段時間，並沒有在整個 K8s 社區中徹底修復。

經過廣泛的調查和診斷，我們已經確定了處理這些問題的方法。在這篇文章中，我們將與大家分享這些解決方法。不過，儘管這些方法很有用，但我們認為這只是權宜之策，相信未來會有更優雅的解決方案，也期望 K8s 社區、RHEL 和 CentOS 可以在不久的將來徹底修復這些問題。

Bug #1: 診斷修復不穩定的 Kmem Accounting

關鍵詞：SLUB: Unable to allocate memory on node -1

社區相關 Issue:

https://github.com/kubernetes/kubernetes/issues/61937
https://github.com/opencontainers/runc/issues/1725
https://support.mesosphere.com/s/article/Critical-Issue-KMEM-MSPH-2018-0006

問題起源

薛定諤平臺是我司開發的基於 K8s 建立的一套自動化測試框架，提供各種 Chaos 能力，同時也提供自動化的 Bench 測試，各類異常監控、告警以及自動輸出測試報告等功能。我們發現 TiKV 在薛定諤平臺上做 OLTP 測試時偶爾會發生 I/O 性能抖動，但從下面幾項來看未發現異常：

TiKV 和 RocksDB 的日誌
CPU 使用率
內存和磁碟等負載信息

只能偶爾看到 dmesg 命令執行的結果中包含一些「SLUB: Unable to allocate memory on node -1」信息。

問題分析

我們使用 perf-tools 中的 funcslower trace 來執行較慢的內核函數並調整內核參數 hung_task_timeout_secs 閾值，抓取到了一些 TiKV 執行寫操作時的內核路徑信息：

診斷修復 TiDB Operator 在 K8s 測試中遇到的 Linux 內核問題

Bug #1: 診斷修復不穩定的 Kmem Accounting

問題起源

問題分析

解決方案

操作步驟

Bug #2：診斷修復網路設備引用計數泄漏問題

問題起源

問題分析

解決方案

操作步驟

總結

熱門新聞

週熱門

診斷修復 TiDB Operator 在 K8s 測試中遇到的 Linux 內核問題

Bug #1: 診斷修復不穩定的 Kmem Accounting

問題起源

問題分析

解決方案

操作步驟

Bug #2：診斷修復網路設備引用計數泄漏問題

問題起源

問題分析

解決方案

操作步驟

總結

在win10上學習docker和k8s該如何搭建環境？

能不能具體的說說kubernetes有哪些功能，對於docker服務部署有哪些幫助？

學習k8s要學習哪些知識點？

docker Swarm與k8s改如何選擇？

基於Kubernetes來搭建生產用的Hadoop、Spark集羣合理嗎？會不會有什麼坑？

K8S會替代Hadoop嗎？

為什麼 Kubernetes 現在如此火熱？

kubernetes的安裝不能簡單點嗎？

Kubernetes(K8s) 解決了哪些問題？

k8s容器環境多個Pod寫日誌永久保存到物理磁碟，日誌名稱重複問題？ Flexvolume是否能完成我的需求？

k8s怎麼部署？

kubernetes大概的工作原理是什麼？

請問kubernetes中的幾個概念問題？

運維開發和k8s運維如何選擇，請各位大神指導一下?

kubernetes有了deployment，為什麼還有pod定義？

熱門新聞

週熱門