Azure'da OpenShift Container Platform 3.11 dağıtımı sorunlarını giderme

Şunlar için geçerlidir: ✔️ Linux VM'leri ✔️ Esnek ölçek kümeleri

OpenShift kümesi başarıyla dağıtılamazsa, Azure portal hata çıkışı sağlar. Çıktıyı okumak zor olabilir ve bu da sorunu belirlemeyi zorlaştırır. Çıkış kodu 3, 4 veya 5 için bu çıkışı hızla tarayın. Aşağıdakiler bu üç çıkış kodu hakkında bilgi sağlar:

  • Çıkış kodu 3: Red Hat Aboneliğinizin Kullanıcı Adı / Parola veya Kuruluş Kimliği / Etkinleştirme Anahtarı yanlış
  • Çıkış kodu 4: Red Hat Havuz Kimliğiniz yanlış veya kullanılabilir yetkilendirme yok
  • Çıkış kodu 5: Docker İnce Havuz Birimi sağlanamıyor

Diğer tüm çıkış kodları için, günlük dosyalarını görüntülemek için ssh aracılığıyla konaklara bağlanın.

OpenShift Kapsayıcı Platformu 3.11

Ansible playbook konağına SSH. Şablon veya Market teklifi için savunma ana bilgisayarını kullanın. Savunmadan kümedeki diğer tüm düğümlere (ana, altyapı, CNS, işlem) SSH yapabilirsiniz. Günlük dosyalarını görüntülemek için kök olmanız gerekir. Kök, SSH erişimi için varsayılan olarak devre dışı bırakılmıştır, bu nedenle diğer düğümlerde SSH'ye kök kullanmayın.

OKD

Ansible playbook konağına SSH. OKD şablonu (sürüm 3.9 ve öncesi) için master-0 ana bilgisayarını kullanın. OKD şablonu (sürüm 3.10 ve üzeri) için savunma ana bilgisayarını kullanın. Ansible playbook konağından kümedeki diğer tüm düğümlere (ana, altyapı, CNS, işlem) SSH yapabilirsiniz. Günlük dosyalarını görüntülemek için kök (sudo su -) olmanız gerekir. Kök, SSH erişimi için varsayılan olarak devre dışı bırakılmıştır, bu nedenle diğer düğümlerde SSH'ye kök kullanmayın.

Günlük dosyaları

Konak hazırlama betikleri için günlük dosyaları (stderr ve stdout) tüm konaklarda /var/lib/waagent/custom-script/download/0 bulunur. Konağın hazırlanması sırasında bir hata oluştuysa, hatayı belirlemek için bu günlük dosyalarını görüntüleyin.

Hazırlık betikleri başarıyla çalıştırıldıysa, ansible playbook konağı dizinindeki /var/lib/waagent/custom-script/download/1 günlük dosyalarının incelenmesi gerekir. Hata, OpenShift'in gerçek yüklemesi sırasında oluştuysa, stdout dosyası hatayı görüntüler. Daha fazla yardım için Desteğe başvurmak için bu bilgileri kullanın.

Örnek çıkış

TASK [openshift_storage_glusterfs : Load heketi topology] **********************
fatal: [mycluster-master-0]: FAILED! => {"changed": true, "cmd": ["oc", "--config=/tmp/openshift-glusterfs-ansible-IbhnUM/admin.kubeconfig", "rsh", "--namespace=glusterfs", "deploy-heketi-storage-1-d9xl5", "heketi-cli", "-s", "http://localhost:8080", "--user", "admin", "--secret", "VuoJURT0/96E42Vv8+XHfsFpSS8R20rH1OiMs3OqARQ=", "topology", "load", "--json=/tmp/openshift-glusterfs-ansible-IbhnUM/topology.json", "2>&1"], "delta": "0:00:21.477831", "end": "2018-05-20 02:49:11.912899", "failed": true, "failed_when_result": true, "rc": 0, "start": "2018-05-20 02:48:50.435068", "stderr": "", "stderr_lines": [], "stdout": "Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2\n\tAllowing file volumes on cluster.\n\tAllowing block volumes on cluster.\n\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4\n\t\tAdding device /dev/sdd ... OK\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131\n\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdd ... OK\n\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f\n\t\tAdding device /dev/sde ... OK\n\t\tAdding device /dev/sdf ... OK\n\t\tAdding device /dev/sdd ... OK", "stdout_lines": ["Creating cluster ... ID: 794b285745b1c5d7089e1c5729ec7cd2", "\tAllowing file volumes on cluster.", "\tAllowing block volumes on cluster.", "\tCreating node mycluster-cns-0 ... ID: 45f1a3bfc20a4196e59ebb567e0e02b4", "\t\tAdding device /dev/sdd ... OK", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\tCreating node mycluster-cns-1 ... ID: 596f80d7bbd78a1ea548930f23135131", "\t\tAdding device /dev/sdc ... Unable to add device: Unable to execute command on glusterfs-storage-4zc42:   Device /dev/sdc excluded by a filter.", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdd ... OK", "\tCreating node mycluster-cns-2 ... ID: 42c0170aa2799559747622acceba2e3f", "\t\tAdding device /dev/sde ... OK", "\t\tAdding device /dev/sdf ... OK", "\t\tAdding device /dev/sdd ... OK"]}

PLAY RECAP *********************************************************************
mycluster-cns-0       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-1       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-cns-2       : ok=146  changed=57   unreachable=0    failed=0   
mycluster-infra-0     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-1     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-infra-2     : ok=143  changed=55   unreachable=0    failed=0   
mycluster-master-0    : ok=502  changed=198  unreachable=0    failed=1   
mycluster-master-1    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-master-2    : ok=348  changed=140  unreachable=0    failed=0   
mycluster-node-0      : ok=143  changed=55   unreachable=0    failed=0   
mycluster-node-1      : ok=143  changed=55   unreachable=0    failed=0   
localhost                  : ok=13   changed=0    unreachable=0    failed=0   

INSTALLER STATUS ***************************************************************
Initialization             : Complete (0:00:39)
Health Check               : Complete (0:00:24)
etcd Install               : Complete (0:01:24)
Master Install             : Complete (0:14:59)
Master Additional Install  : Complete (0:01:10)
Node Install               : Complete (0:10:58)
GlusterFS Install          : In Progress (0:03:33)
	This phase can be restarted by running: playbooks/openshift-glusterfs/config.yml

Failure summary:

  1. Hosts:    mycluster-master-0
     Play:     Configure GlusterFS
     Task:     Load heketi topology
     Message:  Failed without returning a message.

Yükleme sırasında en yaygın hatalar şunlardır:

  1. Özel anahtarın parolası vardır
  2. Özel anahtarla anahtar kasası gizli dizisi doğru oluşturulmadı
  3. Hizmet sorumlusu kimlik bilgileri yanlış girildi
  4. Hizmet sorumlusunun kaynak grubuna katkıda bulunan erişimi yok

Özel Anahtarın parolası vardır

ssh için iznin reddedildiğini belirten bir hata görürsünüz. özel anahtarda parola olup olmadığını denetlemek için ansible playbook konağına ssh.

Özel anahtarla anahtar kasası gizli dizisi doğru oluşturulmadı

Özel anahtar, ansible playbook konağına kopyalanır - ~/.ssh/id_rsa. Bu dosyanın doğru olduğunu onaylayın. Ansible playbook konağından küme düğümlerinden birine SSH oturumu açarak test edin.

Hizmet sorumlusu kimlik bilgileri yanlış girildi

Şablona veya Market teklifine giriş sağlanırken yanlış bilgi sağlandı. Hizmet sorumlusu için doğru appId (clientId) ve parolayı (clientSecret) kullandığınızdan emin olun. Aşağıdaki azure cli komutunu vererek doğrulayın.

az login --service-principal -u <client id> -p <client secret> -t <tenant id>

Hizmet sorumlusunun kaynak grubuna katkıda bulunan erişimi yok

Azure bulut sağlayıcısı etkinleştirildiyse, kullanılan hizmet sorumlusunun kaynak grubuna katkıda bulunan erişimi olmalıdır. Aşağıdaki azure cli komutunu vererek doğrulayın.

az group update -g <openshift resource group> --set tags.sptest=test

Ek araçlar

Bazı hatalar için, daha fazla bilgi edinmek için aşağıdaki komutları da kullanabilirsiniz:

  1. systemctl durum <hizmeti>
  2. journalctl -xe