如何利用shell脚本和client-go实现自己的k8s调度器
調度器介紹
scheduler 是k8s master的一部分,作為插件存在于k8s生態體系。
自定義調度器方式
?
- 添加功能重新編譯
- 實現自己的調度器(multi-scheduler)
- scheduler調用擴展程序實現最終調度(Kubernetes scheduler extender)
添加調度功能
k8s中的調度算法介紹
預選?優選
實現自己的調度器(配置多個scheduler)
scheduler以插件形式存在,集群中可以存在多個scheduler,可以顯式指定scheduler
配置pod使用自己的調度器
下面pod顯式指定使用my-scheduler調度器
apiVersion: v1 kind: Pod metadata:name: nginxlabels:app: nginx spec:schedulerName: my-schedulercontainers:- name: nginximage: nginx:1.10官方給出的shell版本scheduler示例
#!/bin/bash SERVER='localhost:8001' while true; dofor PODNAME in $(kubectl --server $SERVER get pods -o json | jq '.items[] | select(.spec.schedulerName == "my-scheduler") | select(.spec.nodeName == null) | .metadata.name' | tr -d '"') ;doNODES=($(kubectl --server $SERVER get nodes -o json | jq '.items[].metadata.name' | tr -d '"'))NUMNODES=${#NODES[@]}CHOSEN=${NODES[$[ $RANDOM % $NUMNODES ]]}curl --header "Content-Type:application/json" --request POST --data '{"apiVersion":"v1", "kind": "Binding", "metadata": {"name": "'$PODNAME'"}, "target": {"apiVersion": "v1", "kind" : "Node", "name": "'$CHOSEN'"}}' http://$SERVER/api/v1/namespaces/default/pods/$PODNAME/binding/echo "Assigned $PODNAME to $CHOSEN"donesleep 1 done影響pod調度的因素
https://kubernetes.io/docs/concepts/configuration/pod-priority-preemption/
預選
過濾不符合運行條件的node
優選
對node進行打分
搶占
Kubernetes 1.8 及其以后的版本中可以指定 Pod 的優先級。優先級表明了一個 Pod 相對于其它 Pod 的重要性。
當 Pod 無法被調度時,scheduler 會嘗試搶占(驅逐)低優先級的 Pod,使得這些掛起的 pod 可以被調度。
在 Kubernetes 未來的發布版本中,優先級也會影響節點上資源回收的排序。
1.9+支持pdb,優先支持PDB策略,但在無法搶占其他pod的情況下,配置pdb策略的pod依舊會被搶占
Kubernetes scheduler extender
scheduler策略配置
{"kind" : "Policy","apiVersion" : "v1","predicates" : [{"name" : "PodFitsHostPorts"},{"name" : "PodFitsResources"},{"name" : "NoDiskConflict"},{"name" : "MatchNodeSelector"},{"name" : "HostName"}],"priorities" : [{"name" : "LeastRequestedPriority", "weight" : 1},{"name" : "BalancedResourceAllocation", "weight" : 1},{"name" : "ServiceSpreadingPriority", "weight" : 1},{"name" : "EqualPriority", "weight" : 1}],"extenders" : [{"urlPrefix": "http://localhost/scheduler","apiVersion": "v1beta1","filterVerb": "predicates/always_true","bindVerb": "","prioritizeVerb": "priorities/zero_score","weight": 1,"enableHttps": false,"nodeCacheCapable": false"httpTimeout": 10000000000}],"hardPodAffinitySymmetricWeight" : 10}包含extender的配置
// ExtenderConfig保存用于與擴展器通信的參數。如果動詞是未指定/空的即認為該擴展器選擇不提供該擴展。 type ExtenderConfig struct {// 訪問該extender的url前綴URLPrefix string `json:"urlPrefix"`//過濾器調用的動詞,如果不支持則為空。當向擴展程序發出過濾器調用時,此謂詞將附加到URLPrefixFilterVerb string `json:"filterVerb,omitempty"`//prioritize調用的動詞,如果不支持則為空。當向擴展程序發出優先級調用時,此謂詞被附加到URLPrefix。PrioritizeVerb string `json:"prioritizeVerb,omitempty"`//優先級調用生成的節點分數的數字乘數,權重應該是一個正整數Weight int `json:"weight,omitempty"`//綁定調用的動詞,如果不支持則為空。在向擴展器發出綁定調用時,此謂詞會附加到URLPrefix。//如果此方法由擴展器實現,則將pod綁定動作將由擴展器返回給apiserver。只有一個擴展可以實現這個功能BindVerb string// EnableHTTPS指定是否應使用https與擴展器進行通信EnableHTTPS bool `json:"enableHttps,omitempty"`// TLSConfig指定傳輸層安全配置TLSConfig *restclient.TLSClientConfig `json:"tlsConfig,omitempty"`// HTTPTimeout指定對擴展器的調用的超時持續時間,過濾器超時無法調度pod。Prioritize超時被忽略//k8s或其他擴展器優先級被用來選擇節點HTTPTimeout time.Duration `json:"httpTimeout,omitempty"`//NodeCacheCapable指定擴展器能夠緩存節點信息//所以調度器應該只發送關于合格節點的最少信息//假定擴展器已經緩存了群集中所有節點的完整詳細信息NodeCacheCapable bool `json:"nodeCacheCapable,omitempty"`// ManagedResources是由擴展器管理的擴展資源列表.// - 如果pod請求此列表中的至少一個擴展資源,則將在Filter,Prioritize和Bind(如果擴展程序是活頁夾)//階段將一個窗格發送到擴展程序。如果空或未指定,所有pod將被發送到這個擴展器。// 如果pod請求此列表中的至少一個擴展資源,則將在Filter,Prioritize和Bind(如果擴展程序是活頁夾)階段將一個pod發送到擴展程序。如果空或未指定,所有pod將被發送到這個擴展器。ManagedResources []ExtenderManagedResource `json:"managedResources,omitempty"` }通過k8s predicates和pod過濾的節點集傳遞給擴展器上的FilterVerb端點的參數。
通過k8s predicates和擴展predicates以及pod過濾的節點集傳遞給擴展器上的PrioritizeVerb端點的參數。
"filter"被調用時返回節點列表(schedulerapi.ExtenderFilterResult),
"prioritize"返回節點的優先級(schedulerapi.HostPriorityList).
"filter"可以根據對應動作對節點列表進行剪裁,"prioritize"返回的分數將添加到k8s最終分數(通過其優先函數進行計算),用于最終宿主選擇。
“bind”調用用于將pod綁定到節點的代理綁定到擴展器。它可以選擇由擴展器實現。當它被實現時,
它是向apiserver發出綁定調用的擴展器的響應。 Pod名稱,名稱空間,UID和節點名稱被傳遞給擴展器
ExtenderBindingArgs表示將pod綁定到節點的擴展器的參數
type ExtenderBindingArgs struct {// 將被綁定的podPodName string// 將被綁定的namespacePodNamespace string// poduidPodUID types.UID// 最終調度到的podNode string }實現
package mainimport ("bytes""encoding/json""io""k8s.io/api/core/v1"metav1 "k8s.io/apimachinery/pkg/apis/meta/v1""k8s.io/client-go/kubernetes""k8s.io/client-go/tools/clientcmd"schedulerapi "k8s.io/kubernetes/pkg/scheduler/api/v1""log""net/http" )var (kubeconfig string = "xxx" )func main() {http.HandleFunc("/", func(w http.ResponseWriter, _ *http.Request) {w.Write([]byte("hellowrold"))})http.HandleFunc("/predicates/test", testPredicateHandler)http.HandleFunc("/prioritize/test", testPrioritizeHandler)http.HandleFunc("/bind/test", BindHandler)http.ListenAndServe(":8880", nil) }func testPredicateHandler(w http.ResponseWriter, r *http.Request) {var buf bytes.Bufferbody := io.TeeReader(r.Body, &buf)log.Println(buf.String())var extenderArgs schedulerapi.ExtenderArgsvar extenderFilterResult *schedulerapi.ExtenderFilterResultif err := json.NewDecoder(body).Decode(&extenderArgs); err != nil {extenderFilterResult = &schedulerapi.ExtenderFilterResult{Nodes: nil,FailedNodes: nil,Error: err.Error(),}} else {extenderFilterResult = predicateFunc(extenderArgs)}if resultBody, err := json.Marshal(extenderFilterResult); err != nil {panic(err)} else {w.Header().Set("Content-Type", "application/json")w.WriteHeader(http.StatusOK)w.Write(resultBody)}}func testPrioritizeHandler(w http.ResponseWriter, r *http.Request) {var buf bytes.Bufferbody := io.TeeReader(r.Body, &buf)var extenderArgs schedulerapi.ExtenderArgsvar hostPriorityList *schedulerapi.HostPriorityListif err := json.NewDecoder(body).Decode(&extenderArgs); err != nil {panic(err)}if list, err := prioritizeFunc(extenderArgs); err != nil {panic(err)} else {hostPriorityList = list}if resultBody, err := json.Marshal(hostPriorityList); err != nil {panic(err)} else {w.Header().Set("Content-Type", "application/json")w.WriteHeader(http.StatusOK)w.Write(resultBody)} }func predicateFunc(args schedulerapi.ExtenderArgs) *schedulerapi.ExtenderFilterResult {pod := args.PodcanSchedule := make([]v1.Node, 0, len(args.Nodes.Items))canNotSchedule := make(map[string]string)for _, node := range args.Nodes.Items {result, err := func(pod v1.Pod, node v1.Node) (bool, error) {return true, nil}(pod, node)if err != nil {canNotSchedule[node.Name] = err.Error()} else {if result {canSchedule = append(canSchedule, node)}}}result := schedulerapi.ExtenderFilterResult{Nodes: &v1.NodeList{Items: canSchedule,},FailedNodes: canNotSchedule,Error: "",}return &result }func prioritizeFunc(args schedulerapi.ExtenderArgs) (*schedulerapi.HostPriorityList, error) {nodes := args.Nodes.Itemsvar priorityList schedulerapi.HostPriorityListpriorityList = make([]schedulerapi.HostPriority, len(nodes))for i, node := range nodes {priorityList[i] = schedulerapi.HostPriority{Host: node.Name,Score: 0,}}return &priorityList, nil }func BindHandler(w http.ResponseWriter, r *http.Request) {var buf bytes.Bufferbody := io.TeeReader(r.Body, &buf)var extenderBindingArgs schedulerapi.ExtenderBindingArgsif err := json.NewDecoder(body).Decode(&extenderBindingArgs); err != nil {panic(err)}b := &v1.Binding{ObjectMeta: metav1.ObjectMeta{Namespace: extenderBindingArgs.PodNamespace, Name: extenderBindingArgs.PodName, UID: extenderBindingArgs.PodUID},Target: v1.ObjectReference{Kind: "Node",Name: extenderBindingArgs.Node,},}bind(b)}func bind(b *v1.Binding) error {config, err := clientcmd.BuildConfigFromFlags("", kubeconfig)if err != nil {panic(err)}clientset, err := kubernetes.NewForConfig(config)if err != nil {panic(err)}return clientset.CoreV1().Pods(b.Namespace).Bind(b) }參考:
https://github.com/kubernetes/community/blob/master/contributors/devel/scheduler.md
https://github.com/kubernetes/community/blob/master/contributors/design-proposals/scheduling/scheduler_extender.md
https://kubernetes.io/docs/concepts/configuration/pod-priority-preemption/
https://github.com/kubernetes/kubernetes-docs-cn/blob/master/docs/concepts/overview/extending.md
歡迎加入QQ群:k8s開發與實踐
創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎總結
以上是生活随笔為你收集整理的如何利用shell脚本和client-go实现自己的k8s调度器的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++中友元函数,友元类数详解
- 下一篇: Android JSON数据与实体类之间